Príručka vyhľadávania

El motor de búsqueda de este sistema trata de ofrecer la tecnología más actual de búsqueda web, desarrollada por buscadores tan populares como Google . Sin embargo, la naturaleza de una búsqueda bibliográfica difiere considerablemente de la de una página Web. La alternativa propuesta es la de proporcionar numerosas extensiones que hagan posible búsquedas de estructura compleja y precisa, incluso combinando metadatos, texto completo y citas bibliográficas en una misma consulta. Esta página ofrece una serie consejos útiles para conseguir una búsqueda más eficaz.

    Búsqueda simple versus avanzada
    Búsqueda guiada
    Búsqueda por palabras versus búsqueda por frases
    Consultas booleanas
    Parentheses
    Caracteres especiales y puntuación
    Caracteres internacionales
    Truncamientos y búsquedas por raíz
    Búsqueda por metadatos estructurados
    Expresiones regulares
    Consultas por rango
    Refersto/citedby search operators
    Combinación de metadatos/texto completo/cita bibliográfica
    Preguntas frecuentes
        Elegir correctamente los términos de búsqueda (speed-wise)
        ¿Cómo localizar publicaciones a partir del autor?
        ¿Cómo ordenar acorde a cierto patrón de ordenación?
        ¿Cómo obtener documentos de otros servidores? (Google, SPIRES, KEK)
        ¿Cómo buscar en ficheros a texto completo?
        ¿Cómo buscar citas bibliogáficas?

Búsqueda simple versus avanzada

El modo de búsqueda por defecto es la búsqueda simple que permite, en términos generales, escribir una consulta en el campo de texto, acompañado de la posibilidad de seleccionar uno de los índices comunes sobre los que efectuar la consulta. Se introducen las palabras clave a buscar y se acciona la consulta mediante la tecla de retorno (o intro). Por ejemplo, si interesa recuperar documentos sobre modelos estándar que han sido escritos por (o que mencionan a) Ellis, debemos escribir:

y en la página de resultados de la búsqueda podemos volver a añadir o quitar palabras clave para obtener mayor precisión en los resultados, tal y como se especifica en más adelante.

El interfaz de búsqueda avanzada ofrece herramientas específicas con las que configurar la búsqueda: podemos cambiar el tipo de búsqueda por defecto (de alguna palabra a todas, buscar por frase exacta, por expresión regular, etc.); nos permite utilizar las expresiones booleanas combinando varios índices, etc. Por ejemplo, para recuperar todos los documentos escritos por Ellis, J -transcrito exactamente de ese modo- y también las palabras muons o neutrino en el título de la publicación y 2001 en el año, escribiremos lo siguiente:

 

Obsérvese que si utilizamos una sintaxis especial, la Búsqueda Simple ofrece prácticamente la misma funcionalidad que la avanzada, tal y como se indica en las siguientes secciones de esta guía. Este apartado de búsqueda simple-versus-avanzada no se refiere tanto a las funcionalidades disponibles, sino a la forma de búsqueda que podemos configurar mediante pequeñas modificaciones. El sistema se ha adaptado al uso común de los términos de simple/avanzado que podemos encontrar en otros motores de búsqueda.

En realidad, gran parte de la explicación que sigue a continuación, responde a la cuestión de "cómo un usuario avanzado puede utilizar la interficie de búsqueda simple". Recordamos que en cualquier momento es posible recurrir a la ayuda de la búsqueda avanzada para conseguir más asistencia.

Búsqueda guiada

Gracias al sistema de búsqueda en múltiples etapas y a la ayuda que se proporciona en cada una de estas etapas, por lo general resulta suficiente escribir la palabra de búsqueda y revisar los resultados qué nos devuelve el sistema. Si los resultados no son pertinentes, o son excesivos o insuficientes, es posible añadir o quitar palabras de la consulta hasta conseguir resultados más satisfactorios.

Después de recibir una consulta, el motor de búsqueda la analiza y, en caso de no localizar ninguna coincidencia en la base de datos, el sistema tratará de guiar al usuario. Un ejemplo de ello son las listas de los términos indexados que se encuentran más cercanos al término introducido, en caso de que se produzacan errores ortográficos o de transcripción al efectuar la consulta:

Las opciones alternativas se muestran en rojo. El motor de búsqueda avisa de forma similar cuando detecta que los términos de búsqueda no se encuentran, o cuando detecta que sí que existen pero la fórmula de consulta booleana utilizada no puede localizarlos. Así mismo, el motor de búsqueda también realiza de forma oculta acciones alternativas para mejorar los resultados, como por ejemplo eliminar puntuación, etc.

Búsqueda por palabras versus búsqueda por frases

El modo de búsqueda por defecto es la búsqueda por palabras. Ello significa que se ignoran los espacios en blanco, pero también que el motor de búsqueda lo interpreta por defecto como "añade automáticamente una Y booleana entre las palabras introducidas", del mismo modo que hace Google. Por ejemplo, para recuperar todos los registros que contengan tanto la palabra ellis como muon en cualquier parte del registro, debemos escribir:

Si queremos que el espacio en blanco sea significativo, debemos escribir la sentencia entrecomillada. Existen dos formas de búsqueda por frases:
  1. La introducción de dobles comillas le indica al motor de búsqueda buscar la frase exacta. Esta forma de búsqueda por frase devolverá resultados sólo si los campos de metadatos localizados son exactamente iguales al patrón solicitado. Por ejemplo, para recuperar todos los documentos escritos por Ellis, J escrito exactamente de ese modo, debemos escribir:
  2. La introducción de comillas simples le indica al motor de búsqueda buscar alguna parte de la frase. A diferencia de la búsqueda de frase exacta este método permite que exista texto antes/después del patrón solicitado. Sería algo similar al método de "búsqueda por frase" que utilizan Google y otros motores de búsqueda cuando buscan expresiones dentro del texto completo de las páginas web. Por ejemplo, para localizar todos los títulos que contengan la expresión muon decay independientemente de la posición que ocupe la expresión en el título, escribiremos:
    Observemos como se introduciría la búsqueda de un autor que a veces aparece escrito como Ellis, J y otras como Ellis, Jonathan Richard (incluyendo otros autores, como De Lellis, Jim) en una misma acción de búsqueda:
    (Para más información, se recomienda ver también la búsqueda específica por autor.)

La diferencia entre buscar por frase exacta o buscar en parte de la frase puede parecer poco obvia en un primer momento. Sin embargo, mientras que la búsqueda en parte de la frase se asemeja a la búsqueda por frase que suele utilizarse en el contexto de los buscadores web, el uso de la búsqueda por frase exacta resulta mucho más efectiva y rápida cuanto más se conocen y especifican los valores a recuperar.

Otro interesante modo de búsqueda aparte de la búsqueda por palabra o por frase es el uso de la expresión regular de búsqueda, que se efectúa a partir del uso de parentesis en lugar de entrecomillado. Por ejemplo, la búsqueda anterior según el modo de en parte de la frase 'muon decay' es equivalente a la expresión regular/muon decay/. La sintaxis de las expresiones regulares es muy potente, y permite construir búsquedas muy complejas. Para obtener más información, recomendamos la consulta de la sección expresión regular de esta guia.

Búsquedas booleanas

Ya hemos visto como la inclusión de un espacio en blanco es equivalente a la adición de un operador booleano en la búsqueda por palabras. El resto de operadores booleanos son:
+
AND
ellis +muon recupera todos los registros que contengan ambas palabras: ellis y la palabra muon
ellis muon ídem, "syntactic sugar"(*ver nota)
ellis and muon ídem, "syntactic sugar"
-
NOT
ellis -muon recupera todos los registros que contengan la palabra ellis pero que no contenga la palabra muon
ellis not muon ditto, "syntactic sugar"
|
OR
ellis |acelerador recupera todos los registros que contengan al menos, una de las dos palabras
ellis or muon ídem, "syntactic sugar"
(*)Nota de la traducción española: syntactic sugar es una espresión utilizada en inglés para describir "otra forma similar de llamar a una función"

Los operadores lógicos se disponen de forma automática de izquierda a derecha. Logical operations are automatically chained from left to right. Por ejemplo, si queremos buscar documentos escritos por Ellis sobre muon o kaon, escribiremos:

ello nos realizará una búsqueda equivalente a (muon O kaon) Y ellis. Nótese también que se obtienen resultados diferentes si introducimos
que si introducimos (ellis AND muon) OR kaon.

La disposición de los elementos de izquierda a derecha permite refinar fácilmente una búsqueda añadiendo o quitando palabras utilizanto los operadores AND/NOT +/-. Por ejemplo, para excluir los documentos sobre desintegración en la búsqueda anterior, sólo hay que añadir -decay:

y con ello obtendremos una lista más filtrada. Se pueden añadir o quitar tantos elementos como sea conveniente hasta conseguir mayor precisión en la búsqueda.

Parentheses

You can also use parentheses in your queries to group boolean expressions together:

This query returns records containing either gravity or supergravity, and either ellis or perelstein anywhere in the record.

Note that you can use any number of parentheses in the query. Nested parentheses, such as foo AND (bar OR (fuux NOT quux)), are also supported.

Caracteres especiales y puntuación

Cuando se indexan las palabras, se pone especial atención en indexarlas con y sin puntuación. Ello hace posible la búsqueda de términos que contienen caracteres especiales, como por ejemplo C++, textualmente:

Por ejemplo, para recuperar registros que contengan la expresión LaTeX $e^{+}e^{-}$ en el título, debemos escribir:
Por ejemplo, para recuperar un documento con el número de informe hep-ph/0204133, debemos escribir:
Nótese que esta búsqueda es sensible a las mayúsculas:

Caracteres internacionales

El motor de búsqueda se basa en el estandar Unicode UTF-8, lo que hace posible introducir cadenas de búsqueda en cualquier idioma que se encuentre en la base de datos. Por ejemplo, para recuperar documentos escritos por (o sobre) Пушкин, debemos escribir:

Obsérvese que no es necesario introducir acentos para conseguir registros que contienen palabras acentuadas. Por ejemplo, escribiremos Lemaitre para buscar artículos de Lemaître:

Truncamientos y búsquedas por raíz

El truncamiento de una palabra se efectua a través del uso del asterisco (*). Este comodín indica al motor de búsqueda que retorne cualquier número de carácteres en su lugar. Por ejemplo, para recuperar registros que contengan las palabras muon, muonic, muons etc, debemos escribir:

La búsqueda por comodín puede utilizarse tanto en posición de prefijo como de sufijo. Por ejemplo, para recuperar todas las palabras que comiencen por CERN-TH y acaben con 31, debemos escribir:
Obsérvese que el comodín se ignorará si tratamos de utilizarlo en palabras demasiado cortas, como por ejemplo a*:
El carácter comodín también puede usarse en el modo de búsqueda por frase. Por ejemplo, para recuperar todos los documentos cuyo título comience con "Neutrino mass", debemos escribir:
Recordamos que en esta búsqueda hemos introducido las formas de 'frase exacta' y 'parte de la frase'. En realidad, el modo de búsqueda de 'parte de la frase' lanzará una búsqueda exacta sin necesidad de utilizar los comodines: tanto podemos utilizar 'foo bar baz' como "*foo bar baz*". Esto ayuda a comprender porqué la búsqueda de palabras en una parte de la frase es lenta: debido al uso de dos asteriscos delante y detrás del texto, todos y cada de los registros de la base de datos son comprobados para determinar si se corresponden a la búsqueda o no. Actualmente no hay ningún índice de búsqueda que indexe partes de frase.

Structured metadata search

La búsqueda realizada utilizando varios campos bibliográficos (tales como título, autor) se realiza a través de una sintaxis similar a la que utiliza Google en sus búsquedas tipo "site:". Si un término de búsqueda es precedido por un nombre de campo seguido por dos puntos este término se buscará únicamente en el campo especificado. Por ejemplo, para recuperar documentos que contienen la palabra ellis dentro del índice de autores, debemos escribir:

Para recuperar documentos escritos por Ellis que contengan palabras tales como muon, muonic, muons dentro del título, debemos escribir:
Para recuperar documentos escritos por el experimento NA60 del año 2001, debemos escribir:
Los campos de uso más común son los siguientes: author, title, reportnumber, abstract, keyword, year, experiment, fulltext, and reference.

Expresiones regulares

El uso del modo de búsqueda por expresión regular está dirigida sobre todo a usuarios avanzados que conocen la sintaxis tradicional Unix/POSIX regexp. En el interfaz de consulta simple se puede forzar este modo usando barras inclinadas en lugar de comillas:

mientras que en el modo de búsqueda Avanzado se puede seleccionar explícitamente este modo de búsqueda seleccionandolo en el menú desplegable. En el ejemplo anterior se recuperarían todos los títulos que comienzan por la letra E, seguida de cualquier número o cualquier carácter, y que terminen por la letra s.

Otro ejemplo similar es el de la búsqueda por autor de un autor que se ha introducido en la base de datos como Ellis, J o bien como Ellis, John:

La búsqueda por expresión regular permite formular consultas de palabras muy específicas por su proximidad. Por ejemplo, permite recuperar registros cuyos títulos contienen las palabras dense y matter y que estén separadas al menos por una palabra que no contenga la letra l:

Obsérvese que también pueden utilizarse carácteres de intervalo como [a-k] y contadores de ocurrencia como {3}. Por ejemplo, podemos recuperar todos los pre-prints que no se corresponden con la política de catalogación AAAA para describir los años, opcionalmente seguida por ? o por otro -AAAA:

También pueden utilizarse otras clases de caracteres como [:alnum:], el cual en el ejemplo anterior sería equivalente a:

Para conocer más acerca de las expresiones regulares POSIX, se recomienda la consulta de Wikipedia regexp article y MySQL regexp documentation.

Consultas por rango

La consulta por rango se realiza a través del signo ->. Por ejemplo, para recuperar todos los documentos sobre par motor publicados entre 1983 y 1992, debemos escribir:

Para recuperar todos los documentos de autores cuyos nombres estén dentro del rango que va de Ellis, J a Ellis, Qqq, debemos escribir:

Refersto and citedby search operators

It is possible to search in citation network by means of citedby and refersto search operators. For example, to find out who cites hep-th/0201100, you can type:

For example, to find out which papers are cited by Klebanov, you can type:

To set up a cite alert for new papers citing author I. Klebanov, you can type:

Note that refersto and citedby search operators work on any regular query. For example, to find all papers that cite papers that are tagged with the gravitino keyword, type:

Note also that these operators can be freely combined with regular metadata search. For example, to find papers authored by Klebanov that are cited by Papadimitriou but that do not cite any of Papadimitriou's papers themselves, you can type:

Finally, you can make use of regexp-style quoting or phrase-style quoting to combine search expressions in the same refersto/citedby operand. For example, to find papers that are referring to only those I. Klebanov's papers that mention O(N) in the title, you can type:

Combinación de metadatos/texto completo/cita bibliográfica

Toda la sintaxis mencionada anteriormente se puede combinar en una misma consulta. Por ejemplo, para recuperar documentos que contienen la palabra ellis dentro del campo autor, y que no contienen palabras como muon, 'muonic', etc., en ningún otro campo, y que contienen (o subcadena de palabras, para ser más precisos) ‘dense quark matter’ dentro del campo de resumen, y que han sido publicados dentro de los años que comienzan por los dígitos '200', debe escribirse:

Obsérvese que la opción de índice global “cualquier campo” por defecto contiene únicamente términos de metadatos, no del texto completo ni de las citas bibliográficass. Es necesario especificar explícitamente las opciones de buscar en el índice texto completo o de cita bibliográfica si se desea buscar en estos campos. Por ejemplo, para recuperar el término Higgs tanto dentro de los metadatos, las citas o el texto completo, debe escribirse:
Ello permite una interesante combinación de metadatos, texto completo y citas dentro de una misma búsqueda. Por ejemplo, para recuperar todos los documentos escritos por Lin que en el texto completo contengan las palabras Schwarzschild y AdS, que citen la revista Adv. Theor. Math. Phys., debe escribirse:

Preguntas frecuentes

Escoger correctamente los términos de búsqueda (speed-wise)

¿Como localizar publicaciones a partir del autor?

La búsqueda por autor puede realizarse de diversas formas, cada una de las cuales presenta sus ventajas y desventajas.

  1. En primer lugar, es necesario anotar que el modo de búsqueda por palabras no es el que más adecuado en este tipo de búsqueda. Si se selecciona la búsqueda por palabras Ellis J dentro del índice de autores, ello se interpretará como dos consultas (para las palabras Ellis y J) que se efectuarán en primer lugar, y una booleana Y que se realizará después.

    La consulta realizada de este modo recuperará también un documento que presenta como primer autor a Ellis, R y como segundo autor Finch, A J, lo cual, probablemente, no es lo deseado. La búsqueda se ha realizado muy rápidamente y se han recuperado registros sobre el autor requerido, sin embargo, los resultados recuperados siguiendo este método pueden no ser pertinentes, tal y como ocurre en el ejemplo citado anteriormente. En lugar de buscar por palabras, la técnica más conveniente que debe aplicarse en este caso es la búsquda por frase, que permite conseguir mayor precisión.

  2. Es habitual que los nombres de autores que se introducen a través de los formularios contengan únicamente la inicial del nombre, como por ejemplo, Ellis, J. Para obtener un listado de las publicaciones de dicho autor con el nombre escrito exactamente de ese modo, debemos escribir:

    Esta técnica de búsqueda confiere mayor precisión y evita falsos resultados aparentemente positivos. (La presunción de que no existen otros autores cuyo nombre se escriba como Ellis, J, en ocasiones puede no ser cierta*.) La búsqueda se realizará con mucha rapidez.

  3. Algunas veces, en algunos documentos, el nombre propio de un autor se escribe de forma abreviada, (como Ellis, J) y otras de forma completa (como Ellis, John; y en algunas ocasiones también con el nombre compuesto:Ellis, John Rolfe). Para obtener una lista de publicaciones del autor con todas sus formas en una misma búsqueda, se puede utilizar el operador booleano O:

    Este modo de búsqueda nos ofrece aún mayor precisión y evita falsos resultados positivos (o no pertinentes). (La presunción de que no hay más autores que se escriban como Ellis, J O Ellis, John, en ocasiones puede no ser cierta *.) La búsqueda es muy rápida.

  4. Para localizar todas las formas introducidas en el ejemplo anterior con un único término de búsqueda, podemos probar de utilizar una búsqueda con comodín:

    Ello recuperará todos los nombres de autor que comienzan con el texto Ellis, J, no sólo con las formas requeridas en el ejemplo Ellis, J y Ellis, John, sino también Ellis, Jim, o Ellis, John Rolfe, o Ellis, Jonathan Richard.

    Esta búsqueda retornará muchos más resultados, pero puede resultar conveniente en el caso en que se desconozca la forma de introducción de los nombres en la base de datos. Sin embargo, aumenta el riesgo de obtener resultados poco pertinentes. La búsqueda es relativamente rápida.

  5. Aparte de esta última, la alternativa general más utilizada es el uso de una búsqueda por parte de la frase:

    Esta búsqueda recupera no sólo todos los autores mencionados, sino también todos aquellos cuyos nombres contengan la expresión Ellis, J en cualquier parte de su nombre, como por ejemplo De Lellis, Jim. Ello aumenta enormemente las posibilidades de obtener registros con un alto riesgo de ser poco pertinentes. La búsqueda es relativamente lenta.

    (Obsérvese que este modo de búsqueda puede resultar muy práctico para apellidos compuestos tales como Pepe-Altarelli, M o 't Hooft, G en la que una consulta puntual de usuario por Hooft, G recuperará el autor requerido, a diferencia de los métodos mencionados anteriormente.)

  6. Finalmente, anotar que es posible utilizar la sintaxis de expresión regular para construir consultas complejas para buscar por autor. Un ejemplo sencillo es la búsqueda de un autor introducido en la base de datos tanto como Ellis, J como Ellis, John:
    Se recomienda la consulta de búsqueda por expresiones regulares para conocer más acerca de las posibilidades de este modo de búsqueda.

*NOTA: Si es autor de su propia lista de publicaciones y detecta que algunas veces su nombre se escribe de forma abreviada y a veces completo, o si desea identificar sus publicaciones entre diversos autores con la misma forma abreviada, por favor contacte con losadministradores de Repositorio Digital que trataran de trabajar conjuntamente para implementar una forma consistente y normalizada de introducción de su nombre en toda la base de datos. Sólo una base de datos con contenido consistente puede garantizar una búqueda por autores exitosa.

¿Cómo ordenar acorde a cierto patrón de ordenación?

Es posible seleccionar un campo determinado en función del tipo de ordenación de los resultados de búsqueda, por ejemplo para ordenarse los resultados por el título principal. De este modo, en ocasiones puede ocurrir que se desee ordenar los documentos por el código de referencia y que un mismo documento tenga más de uno. Por ejemplo, los códigos hep-ph/0204140, CERN-TH-2002-069 y RM3-TH-02-4 apuntan todos al mismo documento. Si se ordena el conjunto de resultados de búsqueda contenidos en el documento, el sistema tendrá en cuenta el primer número de informe, que puede ser cualquiera de los tres. En ocasiones se puede desear clasificar un documento según un determinado código de referencia hep-ph , u otro CERN> según si se ha publicado en una colección de publicaciones de CERN o hep-ph. ¿Como se puede influir en el motor de búsqueda para priorizar un código antes que otro?

En otras palabras, el motor de búsqueda responde por defecto a una pregunta similar a “ordena por el primer autor” u “ordena por el primer código de informe”, pero en ocasiones se desea instar al buscador para que ordene por el “primer código de informe que comience por el texto CERN-". Esta opción es posible a través del uso de un paràmetre de ordenación “invisible” denominado sp (para a "ordenar según un patrón") que permite ordenar siguiendo un patron de preferencia dado. Este parámetro es “invisible” desde el punto de vista de que no está presente en el interfaz de búsqueda, sino que debe ser añadido manualmente en el URL de la búsqueda. Por ejemplo, para recuperar todas las publicaciones del CERN-TH del año 2001 ordenados por su código, debe buscarse por CERN-TH-2001* dentro del índice código de informe, y en la página de resultados de búsqueda, cuando esté satisfecho con los resultados obtenidos, añadir &sp=CERN-TH en el URL a fin de ordenar los resultados sgún los códigos de informe CERN-TH, y conseguir una correcta ordenación del listado de todas las publicaciones CERN-TH del 2001.

¿Cómo obtener documentos de otros servidores? (Google, SPIRES, KEK)

En la página de resultadoss de búsqueda, se oferecen automáticament enlaces a otros servidores tales como Google, SPIRES o KEK bajo el nombre de "Intentar la búsqueda en...". Con un simple cic sobre los enlaces propuestos se puede enviar la búsqueda realizada en dichos buscadores.

Obsérvese que los enlaces a otros cercadores no se muestran si el buscador no soporta el tipo de búsqueda. Por ejemplo, SPIRES o KEK no pueden buscar términos dentro del campo "cualquier campo", de forma que en estos casos, el sistema no los enlazará.

¿Cómo buscar en ficheros a texto completo?

Si un registro de metadatos contiene archivos a texto completo asociados, Repositorio Digital tratará de extraer la información textual de los archivos e indexarla en un índice de texto completoseparado. Para recuperar todos los documentos que contienen el término e- en el texto completo de sus documentos asociados, debemos escribir:

Recordamos que las palabras del texto completo no se incluyen en el índice global 'cualquier campo' predeterminado, pero es posible realizar una combinación libre de texto completo y metadatos en una misma búsqueda. Por ejemplo, para recuperar todos los artículos escritos por Ellis que contengan la palabra muon tanto en los metadatos como en el texto completo, debemos escribir:

¿Como buscar citas bibliográficas?

Si un registro de metadatos contiene un fichero de texto asociado, Repositorio Digital trata de extraer las citas automaticamente del fichero e indexarlas en un índice separado de citas. Para recuperar todos los registros que citan a Ellis en sus listados de citas bibliogáficas, escribiremos:

Para recuperar todos los registros que citan el pre-print hep-ph/0103062en sus listados de citas bibliográficas, escribiremos:
Para recuperar todos los documentos que citan un artículo de Giddings y Rosspublicado en Physical Review D volumen 61 y en el año 2000, escribiremos:
Recuerde que los términos de las citaciones no estan incluidos dentro del índice “cualquier campo” en la búsqueda global predeterminada, pero puede realizar una combinación libre entre búsqueda por cita bibliogràfica y por metadatos. Por ejemplo, para recuperar todos los artículos sobre modelo estándar que no han sido escritos por Ellis pero lo citan, escribiremos: