visitant ::
identificació
|
|||||||||||
Cerca | Lliura | Ajuda |
Pàgina inicial > Centre d'ajuda > Guia de Cerca |
El motor de cerca d'aquest sistema tracta d'oferir la tecnologia més actual de cerca web, desenvolupada per cercadors tant populars com Google . La naturalesa d'una cerca bibliogràfica, però, difereix considerablement de la d'una página Web. L'alternativa proposada és la de proporcionar nombroses extensions que permetin cerques d'estructura complexa i precisa, inclosa la combinació de metadades, text complet i referències bibliogràfiques a una mateixa cerca. Aquesta pàgina ofereix una sèrie de consells útils per aconseguir una cerca més eficaç.
La cerca per defecte és la cerca simple, que fonamentalment permet escriure la consulta dins un camp de text, seguit de la possibilitat d'escollir un dels índexs comuns sobre els que realitzar la consulta. S'introdueixen les paraules clau a buscar i s'acciona la consulta mitjançant la tecla de retorn (intro). Per exemple, si interessa recuperar documents sobre models estàndard que han estat escrits per (o que fan esment a) Ellis, haurem d'escriure:
i a la pàgina dels resultats de la cerca podem tornar a afegir o treure paraules clau per tal d'obtenir més precisió als resultats, tal i com s'especifica més endavant.
La interficie de cerca avançada ofereix eines específiques amb les que configurar la cerca: podem canviar el tipus de cerca a realitzar per defecte (d'alguna paraula a totes les paraules, cerca per frase exacta, per expressió regular, etc.); ens permet emprar la combinació booleana a nombrosos índexs, etc. Per exemple, per localitzar tots els documents escrits per Ellis, J -transcrit exactament d'aquesta manera- i també les paraules muon o neutrino al títol de la publicació i 2001 a l'any, escriurem:
Observis que si fem servir una sintaxi especial, la Cerca Simple ofereix pràcticament la mateixa funcionalitat que l'avançada, tal i com s'explica a les següents seccions d'aquesta guia. Aquest apartat de cerca simple-versus-avançada no es refereix tant a les funcionalitats disponibles, com a la forma de cerca que podem configurar mitjançant petites modificacions. El sistema s'ha adaptat a l'ús comú dels termes simple/avançat que podem trobar a altres motors de cerca.
En realitat, gran part de l'explicació que segueix a continuació, respòn a la qüestió de "com un usuari avançat pot utilitzar la interficie de cerca simple". Recordem que en qualsevol moment és posible recòrrer a l'ajuda de la cerca avanzada per aconseguir més assistència.
Gràcies al sistema de cerca en múltiples etapes i a l'ajuda que es va proporcionant a cadascuna d'aquestes etapes, pel general resulta suficient teclejar l'objetcte de cerca i observar que ens retorna el sistema. Si no quedem satisfets, podem afegir/treure paraules de la nostra consulta fins aconseguir uns resultats satisfactoris.
Després de rebre una consulta, el motor de cerca l'analizarà i tractarà sempre de guiar a l'usuari en cas de que no localitzi cap coincidència a la base de dades. Un exemple d'això son les llistes dels termes indexats que es troben més propers al terme introduït a la consulta en cas que no es trobin coincidències per errors ortogràfics o de transcripció:
Les opcions alternatives es mostren en vermell. El motor de cerca avisa de forma similar quan detecta que els termes de cerca no es troben, o quan detecta que si que existeixen però la fórmula de consulta booleana emprada no aconsegueix localitzar-los. Així mateix, el motor de cerca també realitza de forma oculta accions alternatives per a millorar els resultat,s com, per exemple, eliminar puntuació, etc.
El mode de cerca per defecte es la cerca per paraules. Aquest mode implica s'ignorian els espais en blanc, però també que el motor de cerca els interpreti per defecte com a "afegeis automàticament una I booleana entre les paraules introduïdes", de la mateixa forma que fa Google. Per exemple, per recuperar tots els registres que continguin tant la paraula ellis com muon a qualsevol part del registre, haurem d'escriure:
Si volem que l'espai en blanc sigui significatiu, hem d'escriure la sentència entre cometes. Existeixen dues formes de cerca per frase:La diferència entre cercar per frase exacta o cercar per part de la frase Pot semblar poc evident a primera vista. Ara bé, mentre que la cerca per part de la frase s’equipara a la cerca per frase que acostuma a aplicar-se dins el context dels cercadors web, l’ús de la cerca per frase exacta resulta molt més efectiva i ràpida com més es coneguin i especifiquin els valors a recuperar.
Un altra interessant forma de cerca apart de la cerca per paraula o
frase, és l’ús de la expressió regular de cerca, que
es realitza a partir del ús de barres inclinades en lloc de cometes.
Per exemple, la cerca anterior segons el mode de ‘part de la frase’ de
l’expressió 'muon decay'
és equivalent a l’expressió
regular/muon decay/
. La sintaxi de les expressions
regulars és molt potent, i permet construir cerques molt complexes.
Per obtenir més informació, recomanem la consulta de la secció expressió regular d’aquesta guia.
+
ANDellis +muon
Recupera tots els registres que contenen ambdues paraules: ellis i la paraula muon ellis muon
ídem, "syntactic sugar" (*veure nota) ellis and muon
ídem, "syntactic sugar" -
NOTellis -muon
recupera tots els registres que contenen la paraula ellis però que no contenen la paraula muon ellis not muon
ídem, "syntactic sugar" |
ORellis |muon
recupera tots els registres que contenen, com a mínim, una de les dues paraules ellis or muon
ídem, "syntactic sugar" (*)Nota de la traducció catalana: syntactic sugar es una espressió emprada en anglès per a descriure "altre forma similar de cridar una funció"
Els operadors lògics es disposen de forma automàtica d’esquerre a dreta. Per exemple, si es volen recuperar documents escrits per Ellis sobre muon o kaon, escriurem:
es realitzarà una cerca equivalent a(muon OR kaon)
AND ellis
. Notis també que s’obtenen resultats diferents si
s’introdueix
que si s’introdueix (ellis AND muon) OR kaon
.
La disposició dels elements d’esquerre a dreta permet refinar
fàcilment una cerca afegint o traient paraules utilitzant els
operadors AND/NOT +/-.
Per exemple, per excloure els documents sobre desintegració a la cerca
anterior, només cal afegir -decay
:
This query returns records containing either gravity or supergravity, and either ellis or perelstein anywhere in the record.
Note that you can use any number of parentheses in the query. Nested
parentheses, such as foo AND (bar OR (fuux NOT quux))
, are also supported.
Quan s’indexen les paraules, es posa especial atenció en que siguin indexades amb i sense puntuació. Això fa possible la cerca de termes que contenen caràcters especials, com per exemple C++, textualment:
Per exemple, per recuperar registres que contenen l’expresió LaTeX$e^{+}e^{-}$
al títol, cal escriure:
Per exemple, per recuperar un document amb número d'informe
hep-ph/0204133, cal escriure:
Observis que aquesta cerca és sensible a les majúscules:
El motor de cerca es basa en l’estàndard Unicode UTF-8, lo que fa possible introduir cadenes de cerca en qualsevol llengua que es trobi a la base de dades. Per exemple, per recuperar documents escrits per (o sobre) Пушкин, cal escriure:
Notis que no és necessari introduir accents per aconseguir registres que contenen paraules accentuades. Per exemple, escriuremLemaitre
para recuperar articles de Lemaître:
El truncament d’una paraula es realitza a través de l’ús del símbol asterisc (*). Aquest comodí indica al motor de cerca que retorni qualsevol número de caràcters en el seu lloc. Per exemple, per recuperar registres que continguin les paraules astronomia, astrònoms, astronòmics etc, cal escriure:
La cerca por comodí pot utilitzar-se tant en posició de prefix com de sufix. Per exemple, per recuperar totes les paraules que comencin per CERN-TH i acabin amb 31, cal escriure: Notis que el comodí s’ignora si es tracta d’utilitzar-lo amb paraules massa curtes, com per exemple a*: El caràcter comodí també pot utilitzar-se al mode de cerca per frase. Per exemple, per recuperar tots els documents el títol dels quals comenci per "Neutrino mass", cal escriure: Recordem que a aquesta cerca hem introduït les formes de 'frase exacta' i 'part de la frase'. En realitat, el mode de cerca per 'part de la frase' ens llençarà una cerca exacta sense necessitat de fer servir els comodins: tant podem utilitzar'foo bar
baz'
com "*foo bar baz*"
.
Això ajuda a comprendre perquè la cerca de
paraules a una part de la frase és lenta: degut a l’ús de dos
asteriscs davant i darrera del text, tots i cadascun dels registres
de la base de dades es comproven per determinar si es corresponen o
no amb la cerca introduïda. Actualment no hi ha cap índex de cerca
que indexi parts de frase.
La cerca realitzada utilitzant diversos camps bibliogràfics (Tals
com títol, autor) es realitza a través d’una sintaxi similar a
l’emprada per Google en les Seves cerques tipus "site:"
.
Si un terme de cerca es precedit per un nom de camp seguit per dos
punts aquest terme es cerca únicament dins el camp especificat. Per
exemple, per recuperar documents que contenen la paraula
ellis dins l’índex d’autors, cal escriure:
author
, title
,
reportnumber
, abstract
,
keyword
, year
, experiment
,
fulltext
, and reference
.
L’ ús del mode de cerca per expressió regular està dirigida sobretot a usuaris avançats que coneixen la sintaxi tradicional Unix/POSIX regexp. A l’interficie de consulta simple es pot forçar aquest mode utilitzant les Barres inclinades enlloc de comentes:
Al mode de cerca Avançada es pot seleccionar explícitament aquest mode de cerca seleccionant-lo al menú desplegable. a l’exemple anterior es recuperarien tots els títols que comencen per la lletra E, seguida de qualsevol número o qualsevol caràcter, i que acabin per la lletra s.Un altre exemple similar és el de la cerca per autor d’un autor que ha estat introduït a la base de dades com Ellis, J o bé com Ellis, John:
La cerca per expressió regular permet formular consultes de paraules Molt específiques per proximitat. Per exemple, permet recuperar registres Els títols dels quals contenen les paraules dense i matter i que estiguin separades, al menys, per una paraula que no contingui la lletra l:
Observis que també poden emprar-se caràcters d’interval com
[a-k]
i contadors de concurrència com {3}
.
Per ejemple, podem recuperar tots els pre-prints que no es
corresponguin amb la política de catalogació AAAA per
descriure anys, opcionalment seguida per ? o per altre
-AAAA:
[:alnum:]
, que a l’exemple anterior seria
equivalent a:
Per conèixer més sobre les expressions regulars POSIX, es recomana la Consulta de Wikipedia regexp article i MySQL regexp documentation.
La consulta por rang es realitza a través del signe
->
. Per exemple, per recuperar tots els documents sobre
par motor publicats entre 1983 i 1992, cal
escriure:
It is possible to search in citation network by means
of citedby
and refersto
search operators.
For example, to find out who cites hep-th/0201100, you can type:
For example, to find out which papers are cited by Klebanov, you can type:
To set up a cite alert for new papers citing author I. Klebanov, you can type:
Note that refersto
and citedby
search
operators work on any regular query. For example, to find all
papers that cite papers that are tagged with the gravitino keyword,
type:
Note also that these operators can be freely combined with regular metadata search. For example, to find papers authored by Klebanov that are cited by Papadimitriou but that do not cite any of Papadimitriou's papers themselves, you can type:
Finally, you can make use of regexp-style quoting or phrase-style quoting to combine search expressions in the same refersto/citedby operand. For example, to find papers that are referring to only those I. Klebanov's papers that mention O(N) in the title, you can type:
Tota la sintaxi mencionada anteriorment es pot combinar en una mateixa consulta. Per exemple, per recuperar documents que contenen la paraula ellis dins el camp d’autor, i que no contenen paraules com muon, 'muonic', etc., a cap altre camp, i que contenen la frase (o subcadena de paraules, per ser més precisos) ‘dense quark matter’ dins el camp de resum, i que han estat publicats dins els anys que comencen pels dígits '200', cal escriure:
Observis que l’opció d’índex global “qualsevol camp” per defecte conté només els termes de metadades, no del text complet ni de les referències bibliogràfiques. Cal especificar explícitament les opcions de cercar a l’índextext complet
o de
referència bibliogràfica
si volem cercar per aquests
camps. Per exemple, per recuperar el terme Higgs tant dins
les metadades, les referències o el text complet, cal escriure:
Això permet una interessant combinació de metadades, text complet i
referències dins una mateixe cerca. Per exemple, per recuperar
tots els documents escrits per Lin que en el text complet
continguin les paraules Schwarzschild and AdS,
que citi la revista Adv. Theor. Math. Phys., cal escriure:
forat
negre
que per "forat negre"
.i
, de
, o sigles com
CERN
.La cerca per autor es pot realitzar de diverses formes, cadascuna de les quals presenta els seus avantatges i les seves desavantatges.
Ellis J
dins l’índex d’autors, s’interpretarà como a dues
consultes (per a les paraules Ellis
i J
) que
es realitzaran en primer lloc, i una booleana I que es realitzarà
després.
La consulta realitzada d’aquesta forma recuperarà també un document que tingui com a primer autor a Ellis, R i com a segon autor a Finch, A J, fet que, probablement, no es el desitjat. La cerca s’ha realitzat amb molta rapidesa i s’han recuperat registres sobre l’autor requerit, ara bé, els resultats obtinguts seguint aquest métode poden no ser pertinents, tal i com passa a l’exemple citat anteriorment. En lloc de cercar per paraules, la tècnica més convenient que s’ha d’aplicar en aquests casos és la cerca per frase, que permet aconseguir major grau de precisió.
Aquesta tècnica de cerca confereix major grau de precisió i evita falsos resultats aparentement positius. (La presumpció de que no existeixen altres autores els noms dels quals s’escrigui com Ellis, J, en ocasions pot no ser certa*.) La cerca es realitzarà con amb molta rapidesa.
Aquest mode de cerca ens ofereix encara major grau de precisió i evita falsos resultats positius (o no pertinents). (La presumpció de que no hi ha més autors que s’escriguin com Ellis, J O Ellis, John, en ocasions pot no ser certa *.) La cerca és molt ràpida.
Això recuperarà tots els noms d’autor que comencen amb el text
Ellis, J
, no només amb les formes requerides a l’exemple
Ellis, J i Ellis, John, sinó també Ellis,
Jim, o Ellis, John Rolfe, o Ellis,Jonathan
Richard.
Aquesta cerca retornarà molts més resultats, però pot resultar convenient en el cas que es desconegui la forma d’introducció dels noms a la base de dades. Ara bé, augmenta el risc d’obtenir resultats poc pertinents. La cerca és relativament ràpida.
Aquesta cerca recupera no només tots els autors mencionats, sinó
també tots aquells els noms dels quals continguin l’expresió
Ellis, J
a qualsevol part del seu nom, com per exemple
De Lellis, Jim. Això augmenta enormement les possibilitats
d’obtenir registres amb un alt risc de ser poc pertinents. La cerca
és relativament lenta.
(Observis que aquest mode de cerca pot resultar molt pràctic per a cognoms compostos, tals com Pepe-Altarelli, M o 't Hooft, G en els que una consulta d’una consulta puntual de usuario por Hooft, G recuperarà l’autor requerit, a diferència dels mètodes mencionats anteriorment.)
*NOTA: Si es autor de la seva pròpia llista de publicacions i detecta que algunes vegades el seu nom s’escriu de forma abreujada i de vegades complet, o si desitja identificar les seves publicacions entre diversos autors amb la mateixa forma abreujada, sis plau, contacti amb els administradors de Repositorio Digital que tractaran de treballar-hi conjuntament per implementar una forma consistent i normalitzada d’introducció del seu nom a tota la base de dades. Només una base de dades amb contingut consistent pot garantir una cerca per autors exitosa.
Es possible seleccionar un camp determinat en funció del tipus d’ordenació dels resultats de la cerca, per exemple per ordenar els resultats pel títol principal. D’aquesta forma, en ocasions pot passar que es desitgi ordenar els documents pel codi de referència i que un mateix document en tingui més d’un. Per exemple, els codis hep-ph/0204140, CERN-TH-2002-069 i RM3-TH-02-4 apunten tots al mateix document. Si s’ordena el conjunt de resultats de cerca que conté el document, el sistema tindrà en consideració el primer número d’informe, que pot ser qualsevol dels tres. En ocasions es desitja classificar un document segons un determinat codi de referència hep-ph , o altre CERN> segons si ha estat publicat a una col•lecció de publicacions CERN o hep-ph. Com es pot influir en el motor de cerca per prioritzar un codi abans de l’altre?
En altres paraules, el motor de cerca respon per defecte a una
pregunta semblant a “ordena pel primer autor” o “ordena pel primer
codi d’informe”, però en ocasions es pot desitjar instar al
cercador per tal que ordeni pel “primer codi d’informe que comenci
pel text CERN-". Aquesta darrera opció és possible a
través d’un paràmetre d’ordenació “invisible” denominat
sp
(per a "ordenar segons un patró") que permet
ordenar segons un patró de preferència donat. Aquest paràmetre és
“invisible” des del punt de vista que no és present a l’interfície
de cerca, sinó que ha d’afegir-se manualment a la URL de cerca.
Per exemple, per recuperar totes les publicacions del CERN-TH de
l’any 2001 ordenats pel seu codi, cal cercar per
CERN-TH-2001*
dins l’índex de códi
d’informe
, i a la pàgina de resultats de cerca, quan
s’estigui satisfet amb els resultats obtinguts, afegir
&sp=CERN-TH
a la URL per tal d’ordenar els resultats
segons els codis d’informe CERN-TH, i aconseguir una correcta
ordenació de la llista de totes les publicacions CERN-TH del
2001.
A la pàgina de resultats de cerca, s'ofereixen automàticament enllaços a altres servidors com Google, SPIRES o KEK sota el nom de "Proveu la vostra cerca a...". Amb un simple clic sobre els enllaços proposats es pot enviar la cerca realitzada en aquests cercadors.
Observis que els enllaços a altres cercadors no es mostren si el cercador no suporta la cerca. Per exemple, SPIRES o KEK no poden cercar termes dintre del camp "qualsevol camp", de forma que en aquests casos, el sistema no els enllaçarà.
Si un registre de metadades té arxius a text complet associats
Repositorio Digital tractarà de extraure la informació textual dels arxius e
indexar-la a un índex de text complet
separat. Per
recuperar tots els documents que contenen el terme e-al text
complet dels seus documents associats, cal escriure:
Si un registre de metadades conté un fitxer de text associat,
Repositorio Digital tracta de extraure les referències automàticament del
fitxer e indexar-les a un índex separat de referències
.
Para recuperar tots els registres que citen a Ellis en els
seus llistats de referències bibliogràfiques, escriurem: