Guia de Cerca

El motor de cerca d'aquest sistema tracta d'oferir la tecnologia més actual de cerca web, desenvolupada per cercadors tant populars com Google . La naturalesa d'una cerca bibliogràfica, però, difereix considerablement de la d'una página Web. L'alternativa proposada és la de proporcionar nombroses extensions que permetin cerques d'estructura complexa i precisa, inclosa la combinació de metadades, text complet i referències bibliogràfiques a una mateixa cerca. Aquesta pàgina ofereix una sèrie de consells útils per aconseguir una cerca més eficaç.

    Cerca simple versus avançada
    Cerca guiada
    Cerca per paraules versus cerca per frases
    Consultes booleanes
    Parentheses
    Caracters especials i puntuació
    Caracters internacionals
    Truncaments i cercques per arrel
    Cerca por metadadess estructurades
    Expressions regulars
    Consultes per rang
    Refersto/citedby search operators
    Combinació de metadades/text complet/referència bibliogràfica
    Preguntes freqüents
        Escollir correctament els térmes de cerca (speed-wise)
        Com localitzar publicacions a partir de l'autor?
        Com ordenar d'acord a un patró d'ordenació?
        Com obtenir documents d'altres servidors? (Google, SPIRES, KEK)
        Cómo cercar a fitxers a text complet?
        Cómo cercar referències bibliogàfiques?

Cerca simple versus avançada

La cerca per defecte és la cerca simple, que fonamentalment permet escriure la consulta dins un camp de text, seguit de la possibilitat d'escollir un dels índexs comuns sobre els que realitzar la consulta. S'introdueixen les paraules clau a buscar i s'acciona la consulta mitjançant la tecla de retorn (intro). Per exemple, si interessa recuperar documents sobre models estàndard que han estat escrits per (o que fan esment a) Ellis, haurem d'escriure:

i a la pàgina dels resultats de la cerca podem tornar a afegir o treure paraules clau per tal d'obtenir més precisió als resultats, tal i com s'especifica més endavant.

La interficie de cerca avançada ofereix eines específiques amb les que configurar la cerca: podem canviar el tipus de cerca a realitzar per defecte (d'alguna paraula a totes les paraules, cerca per frase exacta, per expressió regular, etc.); ens permet emprar la combinació booleana a nombrosos índexs, etc. Per exemple, per localitzar tots els documents escrits per Ellis, J -transcrit exactament d'aquesta manera- i també les paraules muon o neutrino al títol de la publicació i 2001 a l'any, escriurem:

 

Observis que si fem servir una sintaxi especial, la Cerca Simple ofereix pràcticament la mateixa funcionalitat que l'avançada, tal i com s'explica a les següents seccions d'aquesta guia. Aquest apartat de cerca simple-versus-avançada no es refereix tant a les funcionalitats disponibles, com a la forma de cerca que podem configurar mitjançant petites modificacions. El sistema s'ha adaptat a l'ús comú dels termes simple/avançat que podem trobar a altres motors de cerca.

En realitat, gran part de l'explicació que segueix a continuació, respòn a la qüestió de "com un usuari avançat pot utilitzar la interficie de cerca simple". Recordem que en qualsevol moment és posible recòrrer a l'ajuda de la cerca avanzada per aconseguir més assistència.

Cerca guiada

Gràcies al sistema de cerca en múltiples etapes i a l'ajuda que es va proporcionant a cadascuna d'aquestes etapes, pel general resulta suficient teclejar l'objetcte de cerca i observar que ens retorna el sistema. Si no quedem satisfets, podem afegir/treure paraules de la nostra consulta fins aconseguir uns resultats satisfactoris.

Després de rebre una consulta, el motor de cerca l'analizarà i tractarà sempre de guiar a l'usuari en cas de que no localitzi cap coincidència a la base de dades. Un exemple d'això son les llistes dels termes indexats que es troben més propers al terme introduït a la consulta en cas que no es trobin coincidències per errors ortogràfics o de transcripció:

Les opcions alternatives es mostren en vermell. El motor de cerca avisa de forma similar quan detecta que els termes de cerca no es troben, o quan detecta que si que existeixen però la fórmula de consulta booleana emprada no aconsegueix localitzar-los. Així mateix, el motor de cerca també realitza de forma oculta accions alternatives per a millorar els resultat,s com, per exemple, eliminar puntuació, etc.

Cerca per paraules versus cerca per frases

El mode de cerca per defecte es la cerca per paraules. Aquest mode implica s'ignorian els espais en blanc, però també que el motor de cerca els interpreti per defecte com a "afegeis automàticament una I booleana entre les paraules introduïdes", de la mateixa forma que fa Google. Per exemple, per recuperar tots els registres que continguin tant la paraula ellis com muon a qualsevol part del registre, haurem d'escriure:

Si volem que l'espai en blanc sigui significatiu, hem d'escriure la sentència entre cometes. Existeixen dues formes de cerca per frase:
  1. La introducció de cometes dobles indica al motor de cerca cerca la frase exacta. Aquesta forma de cerca per frase retornara resultats només en el cas que els camps de metadades localitzats siguin exactament igual al patró sol·licitat. Per exemple, per recuperar tots els documents escrits per Ellis, J escrit exactament d'aquesta manera, hem d'escriure:
  2. La introducció de comentes simples indica al motor de cerca l'acció de cercar a alguna part de la frase. A diferència de la cerca per frase exacta aquest mètode permet que existeixi text abans/desprès del patró sol•licitat. Aquest métode és similar al de "cerca per frase" que utilitzen Google i altres motors de cerca quan cerquen expressions dins del text complet de les pàgines web. Per exemple, per localitzar tots els títols que continguin l'expressió muon decay independentment de la posició que aquesta ocupi dins el títol, escriurem:
    Observem como s’introduiria la cerca d’un autor que de vegades apareix escrit com Ellis, J y altres com Ellis, Jonathan Richard (incloent altres autors com De Lellis, Jim) en una mateixa acció de cerca:
    (Per més informació, es recomana veure també la cerca específica per autor.)

La diferència entre cercar per frase exacta o cercar per part de la frase Pot semblar poc evident a primera vista. Ara bé, mentre que la cerca per part de la frase s’equipara a la cerca per frase que acostuma a aplicar-se dins el context dels cercadors web, l’ús de la cerca per frase exacta resulta molt més efectiva i ràpida com més es coneguin i especifiquin els valors a recuperar.

Un altra interessant forma de cerca apart de la cerca per paraula o frase, és l’ús de la expressió regular de cerca, que es realitza a partir del ús de barres inclinades en lloc de cometes. Per exemple, la cerca anterior segons el mode de ‘part de la frase’ de l’expressió 'muon decay' és equivalent a l’expressió regular/muon decay/. La sintaxi de les expressions regulars és molt potent, i permet construir cerques molt complexes. Per obtenir més informació, recomanem la consulta de la secció expressió regular d’aquesta guia.

Cerques booleanes

Hem vist com la inclusió d’un espai en blanc és equivalent a l’adició d’un operador booleà a la cerca per paraules. La resta d’operadors booleans són:
+
AND
ellis +muon Recupera tots els registres que contenen ambdues paraules: ellis i la paraula muon
ellis muon ídem, "syntactic sugar" (*veure nota)
ellis and muon ídem, "syntactic sugar"
-
NOT
ellis -muon recupera tots els registres que contenen la paraula ellis però que no contenen la paraula muon
ellis not muon ídem, "syntactic sugar"
|
OR
ellis |muon recupera tots els registres que contenen, com a mínim, una de les dues paraules
ellis or muon ídem, "syntactic sugar"
(*)Nota de la traducció catalana: syntactic sugar es una espressió emprada en anglès per a descriure "altre forma similar de cridar una funció"

Els operadors lògics es disposen de forma automàtica d’esquerre a dreta. Per exemple, si es volen recuperar documents escrits per Ellis sobre muon o kaon, escriurem:

es realitzarà una cerca equivalent a (muon OR kaon) AND ellis. Notis també que s’obtenen resultats diferents si s’introdueix
que si s’introdueix (ellis AND muon) OR kaon.

La disposició dels elements d’esquerre a dreta permet refinar fàcilment una cerca afegint o traient paraules utilitzant els operadors AND/NOT +/-. Per exemple, per excloure els documents sobre desintegració a la cerca anterior, només cal afegir -decay:

Amb el que s’obtindria una llista més filtrada. Es poden afegir o traure tants elements com sigui convenient, fins aconseguir més precisió a la cerca.

Parentheses

You can also use parentheses in your queries to group boolean expressions together:

This query returns records containing either gravity or supergravity, and either ellis or perelstein anywhere in the record.

Note that you can use any number of parentheses in the query. Nested parentheses, such as foo AND (bar OR (fuux NOT quux)), are also supported.

Caracters especials i puntuació

Quan s’indexen les paraules, es posa especial atenció en que siguin indexades amb i sense puntuació. Això fa possible la cerca de termes que contenen caràcters especials, com per exemple C++, textualment:

Per exemple, per recuperar registres que contenen l’expresió LaTeX $e^{+}e^{-}$ al títol, cal escriure:
Per exemple, per recuperar un document amb número d'informe hep-ph/0204133, cal escriure:
Observis que aquesta cerca és sensible a les majúscules:

Caràcters internacionals

El motor de cerca es basa en l’estàndard Unicode UTF-8, lo que fa possible introduir cadenes de cerca en qualsevol llengua que es trobi a la base de dades. Per exemple, per recuperar documents escrits per (o sobre) Пушкин, cal escriure:

Notis que no és necessari introduir accents per aconseguir registres que contenen paraules accentuades. Per exemple, escriurem Lemaitre para recuperar articles de Lemaître:

Truncaments i cerques per arrel

El truncament d’una paraula es realitza a través de l’ús del símbol asterisc (*). Aquest comodí indica al motor de cerca que retorni qualsevol número de caràcters en el seu lloc. Per exemple, per recuperar registres que continguin les paraules astronomia, astrònoms, astronòmics etc, cal escriure:

La cerca por comodí pot utilitzar-se tant en posició de prefix com de sufix. Per exemple, per recuperar totes les paraules que comencin per CERN-TH i acabin amb 31, cal escriure:
Notis que el comodí s’ignora si es tracta d’utilitzar-lo amb paraules massa curtes, com per exemple a*:
El caràcter comodí també pot utilitzar-se al mode de cerca per frase. Per exemple, per recuperar tots els documents el títol dels quals comenci per "Neutrino mass", cal escriure:
Recordem que a aquesta cerca hem introduït les formes de 'frase exacta' i 'part de la frase'. En realitat, el mode de cerca per 'part de la frase' ens llençarà una cerca exacta sense necessitat de fer servir els comodins: tant podem utilitzar 'foo bar baz' com "*foo bar baz*". Això ajuda a comprendre perquè la cerca de paraules a una part de la frase és lenta: degut a l’ús de dos asteriscs davant i darrera del text, tots i cadascun dels registres de la base de dades es comproven per determinar si es corresponen o no amb la cerca introduïda. Actualment no hi ha cap índex de cerca que indexi parts de frase.

Structured metadata search

La cerca realitzada utilitzant diversos camps bibliogràfics (Tals com títol, autor) es realitza a través d’una sintaxi similar a l’emprada per Google en les Seves cerques tipus "site:". Si un terme de cerca es precedit per un nom de camp seguit per dos punts aquest terme es cerca únicament dins el camp especificat. Per exemple, per recuperar documents que contenen la paraula ellis dins l’índex d’autors, cal escriure:

Per recuperar documents escrits per Ellis que continguin paraules tals com muon, muonic, muons dins el títol, cal escriure:
Per recuperar documents escrits per l’experiment NA60 de l’any 2001, cal escriure:
Els camps d’ús comú amb aquesta tècnica són: author, title, reportnumber, abstract, keyword, year, experiment, fulltext, and reference.

Expressions regulars

L’ ús del mode de cerca per expressió regular està dirigida sobretot a usuaris avançats que coneixen la sintaxi tradicional Unix/POSIX regexp. A l’interficie de consulta simple es pot forçar aquest mode utilitzant les Barres inclinades enlloc de comentes:

Al mode de cerca Avançada es pot seleccionar explícitament aquest mode de cerca seleccionant-lo al menú desplegable. a l’exemple anterior es recuperarien tots els títols que comencen per la lletra E, seguida de qualsevol número o qualsevol caràcter, i que acabin per la lletra s.

Un altre exemple similar és el de la cerca per autor d’un autor que ha estat introduït a la base de dades com Ellis, J o bé com Ellis, John:

La cerca per expressió regular permet formular consultes de paraules Molt específiques per proximitat. Per exemple, permet recuperar registres Els títols dels quals contenen les paraules dense i matter i que estiguin separades, al menys, per una paraula que no contingui la lletra l:

Observis que també poden emprar-se caràcters d’interval com [a-k] i contadors de concurrència com {3}. Per ejemple, podem recuperar tots els pre-prints que no es corresponguin amb la política de catalogació AAAA per descriure anys, opcionalment seguida per ? o per altre -AAAA:

També poden emprar-se altres classe de caràcters com [:alnum:], que a l’exemple anterior seria equivalent a:

Per conèixer més sobre les expressions regulars POSIX, es recomana la Consulta de Wikipedia regexp article i MySQL regexp documentation.

Consultes per rang

La consulta por rang es realitza a través del signe ->. Per exemple, per recuperar tots els documents sobre par motor publicats entre 1983 i 1992, cal escriure:

Per recuperar tots els documents d’autors els noms dels quals estiguin dins El rang que va des de Ellis, J fins Ellis, Qqq, cal escriure:

Refersto and citedby search operators

It is possible to search in citation network by means of citedby and refersto search operators. For example, to find out who cites hep-th/0201100, you can type:

For example, to find out which papers are cited by Klebanov, you can type:

To set up a cite alert for new papers citing author I. Klebanov, you can type:

Note that refersto and citedby search operators work on any regular query. For example, to find all papers that cite papers that are tagged with the gravitino keyword, type:

Note also that these operators can be freely combined with regular metadata search. For example, to find papers authored by Klebanov that are cited by Papadimitriou but that do not cite any of Papadimitriou's papers themselves, you can type:

Finally, you can make use of regexp-style quoting or phrase-style quoting to combine search expressions in the same refersto/citedby operand. For example, to find papers that are referring to only those I. Klebanov's papers that mention O(N) in the title, you can type:

Combinació de metadades/text complet/referència bibliogràfica

Tota la sintaxi mencionada anteriorment es pot combinar en una mateixa consulta. Per exemple, per recuperar documents que contenen la paraula ellis dins el camp d’autor, i que no contenen paraules com muon, 'muonic', etc., a cap altre camp, i que contenen la frase (o subcadena de paraules, per ser més precisos) ‘dense quark matter’ dins el camp de resum, i que han estat publicats dins els anys que comencen pels dígits '200', cal escriure:

Observis que l’opció d’índex global “qualsevol camp” per defecte conté només els termes de metadades, no del text complet ni de les referències bibliogràfiques. Cal especificar explícitament les opcions de cercar a l’índex text complet o de referència bibliogràfica si volem cercar per aquests camps. Per exemple, per recuperar el terme Higgs tant dins les metadades, les referències o el text complet, cal escriure:
Això permet una interessant combinació de metadades, text complet i referències dins una mateixe cerca. Per exemple, per recuperar tots els documents escrits per Lin que en el text complet continguin les paraules Schwarzschild and AdS, que citi la revista Adv. Theor. Math. Phys., cal escriure:

Preguentes freqüents

Escollir correctament els térmes de cerca (speed-wise)

Com localitzar publicacions a partir de l'autor?

La cerca per autor es pot realitzar de diverses formes, cadascuna de les quals presenta els seus avantatges i les seves desavantatges.

  1. En primer lloc, cal notar que el mode de cerca per paraules no és el més adient en aquests casos. Si es selecciona la cerca per paraules Ellis J dins l’índex d’autors, s’interpretarà como a dues consultes (per a les paraules Ellis i J) que es realitzaran en primer lloc, i una booleana I que es realitzarà després.

    La consulta realitzada d’aquesta forma recuperarà també un document que tingui com a primer autor a Ellis, R i com a segon autor a Finch, A J, fet que, probablement, no es el desitjat. La cerca s’ha realitzat amb molta rapidesa i s’han recuperat registres sobre l’autor requerit, ara bé, els resultats obtinguts seguint aquest métode poden no ser pertinents, tal i com passa a l’exemple citat anteriorment. En lloc de cercar per paraules, la tècnica més convenient que s’ha d’aplicar en aquests casos és la cerca per frase, que permet aconseguir major grau de precisió.

  2. Es habitual que els noms d’autors que s’introdueixen a través dels formularis continguin únicament la inicial del nom, com per exemple, Ellis, J. Per obtenir un llistat de les publicacions de tal autor amb el nom escrit exactament d’aquesta manera, cal escriure:

    Aquesta tècnica de cerca confereix major grau de precisió i evita falsos resultats aparentement positius. (La presumpció de que no existeixen altres autores els noms dels quals s’escrigui com Ellis, J, en ocasions pot no ser certa*.) La cerca es realitzarà con amb molta rapidesa.

  3. Algunes vegadess, en alguns documents, el nom propi d’un autor s’escriu de forma abreujada, (com Ellis, J) i altres de forma completa (com Ellis, John; i en altres ocasions també amb el nom compost:Ellis, John Rolfe). Per obtenir una llista de publicacions de l’autor amb totes les seves formes en una mateixa cerca, es pot utilitzar l’operador booleà O:

    Aquest mode de cerca ens ofereix encara major grau de precisió i evita falsos resultats positius (o no pertinents). (La presumpció de que no hi ha més autors que s’escriguin com Ellis, J O Ellis, John, en ocasions pot no ser certa *.) La cerca és molt ràpida.

  4. Per localitzar totes les formes introduïdes a l’exemple anterior amb un únic terme de cerca, podem provar d’emprar una cerca amb comodí:

    Això recuperarà tots els noms d’autor que comencen amb el text Ellis, J, no només amb les formes requerides a l’exemple Ellis, J i Ellis, John, sinó també Ellis, Jim, o Ellis, John Rolfe, o Ellis,Jonathan Richard.

    Aquesta cerca retornarà molts més resultats, però pot resultar convenient en el cas que es desconegui la forma d’introducció dels noms a la base de dades. Ara bé, augmenta el risc d’obtenir resultats poc pertinents. La cerca és relativament ràpida.

  5. Apart d’aquesta darrera, l’alternativa general més emprada és la cerca per part de la frase:

    Aquesta cerca recupera no només tots els autors mencionats, sinó també tots aquells els noms dels quals continguin l’expresió Ellis, J a qualsevol part del seu nom, com per exemple De Lellis, Jim. Això augmenta enormement les possibilitats d’obtenir registres amb un alt risc de ser poc pertinents. La cerca és relativament lenta.

    (Observis que aquest mode de cerca pot resultar molt pràctic per a cognoms compostos, tals com Pepe-Altarelli, M o 't Hooft, G en els que una consulta d’una consulta puntual de usuario por Hooft, G recuperarà l’autor requerit, a diferència dels mètodes mencionats anteriorment.)

  6. Finalment, anotar que es possible emprar la sintaxi de expressió regular per construir consultes complexes per fer cerques per autor. Un exemple senzill és la cerca d’un autor introduït a la base de dades tant per Ellis, J com per Ellis, John:
    Es recomana la consulta de cerca per expressions regulars per conèixer més sobre les possibilitats d’aquest mode de cerca.

*NOTA: Si es autor de la seva pròpia llista de publicacions i detecta que algunes vegades el seu nom s’escriu de forma abreujada i de vegades complet, o si desitja identificar les seves publicacions entre diversos autors amb la mateixa forma abreujada, sis plau, contacti amb els administradors de Repositorio Digital que tractaran de treballar-hi conjuntament per implementar una forma consistent i normalitzada d’introducció del seu nom a tota la base de dades. Només una base de dades amb contingut consistent pot garantir una cerca per autors exitosa.

Com ordenar d'acord a cert patró d'ordenació?

Es possible seleccionar un camp determinat en funció del tipus d’ordenació dels resultats de la cerca, per exemple per ordenar els resultats pel títol principal. D’aquesta forma, en ocasions pot passar que es desitgi ordenar els documents pel codi de referència i que un mateix document en tingui més d’un. Per exemple, els codis hep-ph/0204140, CERN-TH-2002-069 i RM3-TH-02-4 apunten tots al mateix document. Si s’ordena el conjunt de resultats de cerca que conté el document, el sistema tindrà en consideració el primer número d’informe, que pot ser qualsevol dels tres. En ocasions es desitja classificar un document segons un determinat codi de referència hep-ph , o altre CERN> segons si ha estat publicat a una col•lecció de publicacions CERN o hep-ph. Com es pot influir en el motor de cerca per prioritzar un codi abans de l’altre?

En altres paraules, el motor de cerca respon per defecte a una pregunta semblant a “ordena pel primer autor” o “ordena pel primer codi d’informe”, però en ocasions es pot desitjar instar al cercador per tal que ordeni pel “primer codi d’informe que comenci pel text CERN-". Aquesta darrera opció és possible a través d’un paràmetre d’ordenació “invisible” denominat sp (per a "ordenar segons un patró") que permet ordenar segons un patró de preferència donat. Aquest paràmetre és “invisible” des del punt de vista que no és present a l’interfície de cerca, sinó que ha d’afegir-se manualment a la URL de cerca. Per exemple, per recuperar totes les publicacions del CERN-TH de l’any 2001 ordenats pel seu codi, cal cercar per CERN-TH-2001* dins l’índex de códi d’informe, i a la pàgina de resultats de cerca, quan s’estigui satisfet amb els resultats obtinguts, afegir &sp=CERN-TH a la URL per tal d’ordenar els resultats segons els codis d’informe CERN-TH, i aconseguir una correcta ordenació de la llista de totes les publicacions CERN-TH del 2001.

Com obtenir documents d'altres servidors? (Google, SPIRES, KEK)

A la pàgina de resultats de cerca, s'ofereixen automàticament enllaços a altres servidors com Google, SPIRES o KEK sota el nom de "Proveu la vostra cerca a...". Amb un simple clic sobre els enllaços proposats es pot enviar la cerca realitzada en aquests cercadors.

Observis que els enllaços a altres cercadors no es mostren si el cercador no suporta la cerca. Per exemple, SPIRES o KEK no poden cercar termes dintre del camp "qualsevol camp", de forma que en aquests casos, el sistema no els enllaçarà.

Com cercar a fitxers a text complet?

Si un registre de metadades té arxius a text complet associats Repositorio Digital tractarà de extraure la informació textual dels arxius e indexar-la a un índex de text completseparat. Per recuperar tots els documents que contenen el terme e-al text complet dels seus documents associats, cal escriure:

Recordem que les paraules del text complet no s'inclouen a l'índex global 'qualsevol camp' predeterminat, però és possible realitzar una combinació lliure de text complet i metadades dins una mateixa cerca. Per exemple, per recuperar tots els articles escrits per Ellis que continguin la paraula muon tant a les metadades como all text complet, cal escriure:

Cómo cercar referències bibliogàfiques

Si un registre de metadades conté un fitxer de text associat, Repositorio Digital tracta de extraure les referències automàticament del fitxer e indexar-les a un índex separat de referències. Para recuperar tots els registres que citen a Ellis en els seus llistats de referències bibliogràfiques, escriurem:

Per recuperar tots els registres que citen el pre-print hep-ph/0103062en els seus llistats de referències bibliogràfiques, escriurem:
Per recuperar tots els documents que citen un article de Giddings i Rosspublicat a Physical Review D volum 61 i a l’any 2000, escriurem:
Recordi que els termes de les referències no estan inclosos dins l’índex “qualsevol camp” a la cerca global predeterminada, però pot realitzar una combinació lliure entre cerca por referència i per metadades. Per exemple, per recuperar tots els articles sobre model estàndar que no han estat escrits per Ellis però el citen, escriurem: