El motor de búsqueda de este sistema trata de ofrecer la tecnología más actual de búsqueda web, desarrollada por buscadores tan populares como Google . Sin embargo, la naturaleza de una búsqueda bibliográfica difiere considerablemente de la de una página Web. La alternativa propuesta es la de proporcionar numerosas extensiones que hagan posible búsquedas de estructura compleja y precisa, incluso combinando metadatos, texto completo y citas bibliográficas en una misma consulta. Esta página ofrece una serie consejos útiles para conseguir una búsqueda más eficaz.
El modo de búsqueda por defecto es la búsqueda simple que permite, en términos generales, escribir una consulta en el campo de texto, acompañado de la posibilidad de seleccionar uno de los índices comunes sobre los que efectuar la consulta. Se introducen las palabras clave a buscar y se acciona la consulta mediante la tecla de retorno (o intro). Por ejemplo, si interesa recuperar documentos sobre modelos estándar que han sido escritos por (o que mencionan a) Ellis, debemos escribir:
y en la página de resultados de la búsqueda podemos volver a añadir o quitar palabras clave para obtener mayor precisión en los resultados, tal y como se especifica en más adelante.
El interfaz de búsqueda avanzada ofrece herramientas específicas con las que configurar la búsqueda: podemos cambiar el tipo de búsqueda por defecto (de alguna palabra a todas, buscar por frase exacta, por expresión regular, etc.); nos permite utilizar las expresiones booleanas combinando varios índices, etc. Por ejemplo, para recuperar todos los documentos escritos por Ellis, J -transcrito exactamente de ese modo- y también las palabras muons o neutrino en el título de la publicación y 2001 en el año, escribiremos lo siguiente:
Obsérvese que si utilizamos una sintaxis especial, la Búsqueda Simple ofrece prácticamente la misma funcionalidad que la avanzada, tal y como se indica en las siguientes secciones de esta guía. Este apartado de búsqueda simple-versus-avanzada no se refiere tanto a las funcionalidades disponibles, sino a la forma de búsqueda que podemos configurar mediante pequeñas modificaciones. El sistema se ha adaptado al uso común de los términos de simple/avanzado que podemos encontrar en otros motores de búsqueda.
En realidad, gran parte de la explicación que sigue a continuación, responde a la cuestión de "cómo un usuario avanzado puede utilizar la interficie de búsqueda simple". Recordamos que en cualquier momento es posible recurrir a la ayuda de la búsqueda avanzada para conseguir más asistencia.
Gracias al sistema de búsqueda en múltiples etapas y a la ayuda que se proporciona en cada una de estas etapas, por lo general resulta suficiente escribir la palabra de búsqueda y revisar los resultados qué nos devuelve el sistema. Si los resultados no son pertinentes, o son excesivos o insuficientes, es posible añadir o quitar palabras de la consulta hasta conseguir resultados más satisfactorios.
Después de recibir una consulta, el motor de búsqueda la analiza y, en caso de no localizar ninguna coincidencia en la base de datos, el sistema tratará de guiar al usuario. Un ejemplo de ello son las listas de los términos indexados que se encuentran más cercanos al término introducido, en caso de que se produzacan errores ortográficos o de transcripción al efectuar la consulta:
Las opciones alternativas se muestran en rojo. El motor de búsqueda avisa de forma similar cuando detecta que los términos de búsqueda no se encuentran, o cuando detecta que sí que existen pero la fórmula de consulta booleana utilizada no puede localizarlos. Así mismo, el motor de búsqueda también realiza de forma oculta acciones alternativas para mejorar los resultados, como por ejemplo eliminar puntuación, etc.
El modo de búsqueda por defecto es la búsqueda por palabras. Ello significa que se ignoran los espacios en blanco, pero también que el motor de búsqueda lo interpreta por defecto como "añade automáticamente una Y booleana entre las palabras introducidas", del mismo modo que hace Google. Por ejemplo, para recuperar todos los registros que contengan tanto la palabra ellis como muon en cualquier parte del registro, debemos escribir:
Si queremos que el espacio en blanco sea significativo, debemos escribir la sentencia entrecomillada. Existen dos formas de búsqueda por frases:La diferencia entre buscar por frase exacta o buscar en parte de la frase puede parecer poco obvia en un primer momento. Sin embargo, mientras que la búsqueda en parte de la frase se asemeja a la búsqueda por frase que suele utilizarse en el contexto de los buscadores web, el uso de la búsqueda por frase exacta resulta mucho más efectiva y rápida cuanto más se conocen y especifican los valores a recuperar.
Otro interesante modo de búsqueda aparte de la búsqueda por palabra
o por frase es el uso de la expresión regular de
búsqueda, que se efectúa a partir del uso de parentesis en
lugar de entrecomillado. Por ejemplo, la búsqueda anterior según el
modo de en parte de la frase 'muon decay'
es equivalente a
la expresión regular/muon decay/
. La sintaxis de las
expresiones regulares es muy potente, y permite construir búsquedas
muy complejas. Para obtener más información, recomendamos la consulta
de la sección expresión regular de esta guia.
+
ANDellis +muon
recupera todos los registros que contengan ambas palabras: ellis y la palabra muon ellis muon
ídem, "syntactic sugar"(*ver nota) ellis and muon
ídem, "syntactic sugar" -
NOTellis -muon
recupera todos los registros que contengan la palabra ellis pero que no contenga la palabra muon ellis not muon
ditto, "syntactic sugar" |
ORellis |acelerador
recupera todos los registros que contengan al menos, una de las dos palabras ellis or muon
ídem, "syntactic sugar" (*)Nota de la traducción española: syntactic sugar es una espresión utilizada en inglés para describir "otra forma similar de llamar a una función"
Los operadores lógicos se disponen de forma automática de izquierda a derecha. Logical operations are automatically chained from left to right. Por ejemplo, si queremos buscar documentos escritos por Ellis sobre muon o kaon, escribiremos:
ello nos realizará una búsqueda equivalente a(muon O
kaon) Y ellis
. Nótese también que se obtienen
resultados diferentes si introducimos
que si introducimos (ellis AND muon) OR kaon
.
La disposición de los elementos de izquierda a derecha permite
refinar fácilmente una búsqueda añadiendo o quitando palabras
utilizanto los operadores AND/NOT +/-.
Por ejemplo, para excluir los documentos sobre desintegración en la
búsqueda anterior, sólo hay que añadir -decay
:
This query returns records containing either gravity or supergravity, and either ellis or perelstein anywhere in the record.
Note that you can use any number of parentheses in the query. Nested
parentheses, such as foo AND (bar OR (fuux NOT quux))
, are also supported.
Cuando se indexan las palabras, se pone especial atención en indexarlas con y sin puntuación. Ello hace posible la búsqueda de términos que contienen caracteres especiales, como por ejemplo C++, textualmente:
Por ejemplo, para recuperar registros que contengan la expresión LaTeX$e^{+}e^{-}$
en el título, debemos escribir:
Por ejemplo, para recuperar un documento con el número de informe
hep-ph/0204133, debemos escribir:
Nótese que esta búsqueda es sensible a las mayúsculas:
El motor de búsqueda se basa en el estandar Unicode UTF-8, lo que hace posible introducir cadenas de búsqueda en cualquier idioma que se encuentre en la base de datos. Por ejemplo, para recuperar documentos escritos por (o sobre) Пушкин, debemos escribir:
Obsérvese que no es necesario introducir acentos para conseguir registros que contienen palabras acentuadas. Por ejemplo, escribiremosLemaitre
para buscar artículos de Lemaître:
El truncamiento de una palabra se efectua a través del uso del asterisco (*). Este comodín indica al motor de búsqueda que retorne cualquier número de carácteres en su lugar. Por ejemplo, para recuperar registros que contengan las palabras muon, muonic, muons etc, debemos escribir:
La búsqueda por comodín puede utilizarse tanto en posición de prefijo como de sufijo. Por ejemplo, para recuperar todas las palabras que comiencen por CERN-TH y acaben con 31, debemos escribir: Obsérvese que el comodín se ignorará si tratamos de utilizarlo en palabras demasiado cortas, como por ejemplo a*: El carácter comodín también puede usarse en el modo de búsqueda por frase. Por ejemplo, para recuperar todos los documentos cuyo título comience con "Neutrino mass", debemos escribir: Recordamos que en esta búsqueda hemos introducido las formas de 'frase exacta' y 'parte de la frase'. En realidad, el modo de búsqueda de 'parte de la frase' lanzará una búsqueda exacta sin necesidad de utilizar los comodines: tanto podemos utilizar'foo bar baz'
como "*foo bar baz*"
.
Esto ayuda a comprender porqué la búsqueda de
palabras en una parte de la frase es lenta: debido al uso de dos
asteriscos delante y detrás del texto, todos y cada de los
registros de la base de datos son comprobados para determinar si se
corresponden a la búsqueda o no. Actualmente no hay ningún índice
de búsqueda que indexe partes de frase.
La búsqueda realizada utilizando varios campos bibliográficos
(tales como título, autor) se realiza a través de una sintaxis
similar a la que utiliza Google en sus búsquedas tipo
"site:"
. Si un término de búsqueda es precedido por
un nombre de campo seguido por dos puntos este término se buscará
únicamente en el campo especificado. Por ejemplo, para recuperar
documentos que contienen la palabra ellis dentro del
índice de autores, debemos escribir:
author
, title
,
reportnumber
, abstract
,
keyword
, year
, experiment
,
fulltext
, and reference
.
El uso del modo de búsqueda por expresión regular está dirigida sobre todo a usuarios avanzados que conocen la sintaxis tradicional Unix/POSIX regexp. En el interfaz de consulta simple se puede forzar este modo usando barras inclinadas en lugar de comillas:
mientras que en el modo de búsqueda Avanzado se puede seleccionar explícitamente este modo de búsqueda seleccionandolo en el menú desplegable. En el ejemplo anterior se recuperarían todos los títulos que comienzan por la letra E, seguida de cualquier número o cualquier carácter, y que terminen por la letra s.Otro ejemplo similar es el de la búsqueda por autor de un autor que se ha introducido en la base de datos como Ellis, J o bien como Ellis, John:
La búsqueda por expresión regular permite formular consultas de palabras muy específicas por su proximidad. Por ejemplo, permite recuperar registros cuyos títulos contienen las palabras dense y matter y que estén separadas al menos por una palabra que no contenga la letra l:
Obsérvese que también pueden utilizarse carácteres de intervalo
como [a-k]
y contadores de ocurrencia como
{3}
. Por ejemplo, podemos recuperar todos los pre-prints
que no se corresponden con la política de catalogación AAAA
para describir los años, opcionalmente seguida por ? o por
otro -AAAA:
[:alnum:]
, el cual en el ejemplo anterior sería
equivalente a:
Para conocer más acerca de las expresiones regulares POSIX, se recomienda la consulta de Wikipedia regexp article y MySQL regexp documentation.
La consulta por rango se realiza a través del signo
->
. Por ejemplo, para recuperar todos los documentos
sobre par motor publicados entre 1983 y
1992, debemos escribir:
It is possible to search in citation network by means
of citedby
and refersto
search operators.
For example, to find out who cites hep-th/0201100, you can type:
For example, to find out which papers are cited by Klebanov, you can type:
To set up a cite alert for new papers citing author I. Klebanov, you can type:
Note that refersto
and citedby
search
operators work on any regular query. For example, to find all
papers that cite papers that are tagged with the gravitino keyword,
type:
Note also that these operators can be freely combined with regular metadata search. For example, to find papers authored by Klebanov that are cited by Papadimitriou but that do not cite any of Papadimitriou's papers themselves, you can type:
Finally, you can make use of regexp-style quoting or phrase-style quoting to combine search expressions in the same refersto/citedby operand. For example, to find papers that are referring to only those I. Klebanov's papers that mention O(N) in the title, you can type:
Toda la sintaxis mencionada anteriormente se puede combinar en una misma consulta. Por ejemplo, para recuperar documentos que contienen la palabra ellis dentro del campo autor, y que no contienen palabras como muon, 'muonic', etc., en ningún otro campo, y que contienen (o subcadena de palabras, para ser más precisos) ‘dense quark matter’ dentro del campo de resumen, y que han sido publicados dentro de los años que comienzan por los dígitos '200', debe escribirse:
Obsérvese que la opción de índice global “cualquier campo” por defecto contiene únicamente términos de metadatos, no del texto completo ni de las citas bibliográficass. Es necesario especificar explícitamente las opciones de buscar en el índicetexto completo
o de
cita bibliográfica
si se desea buscar en estos campos.
Por ejemplo, para recuperar el término Higgs tanto dentro de
los metadatos, las citas o el texto completo, debe escribirse:
Ello permite una interesante combinación de metadatos, texto completo
y citas dentro de una misma búsqueda. Por ejemplo, para recuperar
todos los documentos escritos por Lin que en el texto
completo contengan las palabras Schwarzschild y AdS,
que citen la revista Adv. Theor. Math. Phys., debe
escribirse:
agujero
negro
que por "agujero negro"
.y
,
de
, o siglas como CERN
.La búsqueda por autor puede realizarse de diversas formas, cada una de las cuales presenta sus ventajas y desventajas.
Ellis J
dentro del
índice de autores, ello se interpretará como dos consultas (para las
palabras Ellis
y J
) que se efectuarán en
primer lugar, y una booleana Y que se realizará después.
La consulta realizada de este modo recuperará también un documento que presenta como primer autor a Ellis, R y como segundo autor Finch, A J, lo cual, probablemente, no es lo deseado. La búsqueda se ha realizado muy rápidamente y se han recuperado registros sobre el autor requerido, sin embargo, los resultados recuperados siguiendo este método pueden no ser pertinentes, tal y como ocurre en el ejemplo citado anteriormente. En lugar de buscar por palabras, la técnica más conveniente que debe aplicarse en este caso es la búsquda por frase, que permite conseguir mayor precisión.
Esta técnica de búsqueda confiere mayor precisión y evita falsos resultados aparentemente positivos. (La presunción de que no existen otros autores cuyo nombre se escriba como Ellis, J, en ocasiones puede no ser cierta*.) La búsqueda se realizará con mucha rapidez.
Este modo de búsqueda nos ofrece aún mayor precisión y evita falsos resultados positivos (o no pertinentes). (La presunción de que no hay más autores que se escriban como Ellis, J O Ellis, John, en ocasiones puede no ser cierta *.) La búsqueda es muy rápida.
Ello recuperará todos los nombres de autor que comienzan con el
texto Ellis, J
, no sólo con las formas requeridas en el
ejemplo Ellis, J y Ellis, John, sino también
Ellis, Jim, o Ellis, John Rolfe, o Ellis,
Jonathan Richard.
Esta búsqueda retornará muchos más resultados, pero puede resultar conveniente en el caso en que se desconozca la forma de introducción de los nombres en la base de datos. Sin embargo, aumenta el riesgo de obtener resultados poco pertinentes. La búsqueda es relativamente rápida.
Esta búsqueda recupera no sólo todos los autores mencionados, sino
también todos aquellos cuyos nombres contengan la expresión
Ellis, J
en cualquier parte de su nombre, como por
ejemplo De Lellis, Jim. Ello aumenta enormemente las
posibilidades de obtener registros con un alto riesgo de ser poco
pertinentes. La búsqueda es relativamente lenta.
(Obsérvese que este modo de búsqueda puede resultar muy práctico para apellidos compuestos tales como Pepe-Altarelli, M o 't Hooft, G en la que una consulta puntual de usuario por Hooft, G recuperará el autor requerido, a diferencia de los métodos mencionados anteriormente.)
*NOTA: Si es autor de su propia lista de publicaciones y detecta que algunas veces su nombre se escribe de forma abreviada y a veces completo, o si desea identificar sus publicaciones entre diversos autores con la misma forma abreviada, por favor contacte con losadministradores de Repositorio Digital que trataran de trabajar conjuntamente para implementar una forma consistente y normalizada de introducción de su nombre en toda la base de datos. Sólo una base de datos con contenido consistente puede garantizar una búqueda por autores exitosa.
Es posible seleccionar un campo determinado en función del tipo de ordenación de los resultados de búsqueda, por ejemplo para ordenarse los resultados por el título principal. De este modo, en ocasiones puede ocurrir que se desee ordenar los documentos por el código de referencia y que un mismo documento tenga más de uno. Por ejemplo, los códigos hep-ph/0204140, CERN-TH-2002-069 y RM3-TH-02-4 apuntan todos al mismo documento. Si se ordena el conjunto de resultados de búsqueda contenidos en el documento, el sistema tendrá en cuenta el primer número de informe, que puede ser cualquiera de los tres. En ocasiones se puede desear clasificar un documento según un determinado código de referencia hep-ph , u otro CERN> según si se ha publicado en una colección de publicaciones de CERN o hep-ph. ¿Como se puede influir en el motor de búsqueda para priorizar un código antes que otro?
En otras palabras, el motor de búsqueda responde por defecto a
una pregunta similar a “ordena por el primer autor” u “ordena por
el primer código de informe”, pero en ocasiones se desea instar al
buscador para que ordene por el “primer código de informe que
comience por el texto CERN-". Esta opción es posible a
través del uso de un paràmetre de ordenación “invisible” denominado
sp
(para a "ordenar según un patrón") que permite
ordenar siguiendo un patron de preferencia dado. Este parámetro es
“invisible” desde el punto de vista de que no está presente en el
interfaz de búsqueda, sino que debe ser añadido manualmente en el
URL de la búsqueda.
Por ejemplo, para recuperar todas las publicaciones del CERN-TH del
año 2001 ordenados por su código, debe buscarse por
CERN-TH-2001*
dentro del índice código de
informe
, y en la página de resultados de búsqueda, cuando
esté satisfecho con los resultados obtenidos, añadir
&sp=CERN-TH
en el URL a fin de ordenar los resultados
sgún los códigos de informe CERN-TH, y conseguir una correcta
ordenación del listado de todas las publicaciones CERN-TH del
2001.
En la página de resultadoss de búsqueda, se oferecen automáticament enlaces a otros servidores tales como Google, SPIRES o KEK bajo el nombre de "Intentar la búsqueda en...". Con un simple cic sobre los enlaces propuestos se puede enviar la búsqueda realizada en dichos buscadores.
Obsérvese que los enlaces a otros cercadores no se muestran si el buscador no soporta el tipo de búsqueda. Por ejemplo, SPIRES o KEK no pueden buscar términos dentro del campo "cualquier campo", de forma que en estos casos, el sistema no los enlazará.
Si un registro de metadatos contiene archivos a texto completo
asociados, Repositorio Digital tratará de extraer la información textual de
los archivos e indexarla en un índice de texto
completo
separado. Para recuperar todos los documentos que
contienen el término e- en el texto completo de sus
documentos asociados, debemos escribir:
Si un registro de metadatos contiene un fichero de texto asociado,
Repositorio Digital trata de extraer las citas automaticamente del fichero e
indexarlas en un índice separado de citas
. Para
recuperar todos los registros que citan a Ellis en sus
listados de citas bibliogáficas, escribiremos: