2. Guía para la búsqueda

Becky Bell

WALDO

Nicole C. Engard

errores tipográficos fijo, cambió el contenido cuando sea necesario y agregó nuevas capturas de pantalla. 

Octubre 2008

Esta breve guía le mostrará un ejemplo de cómo se puede configurar una base de datos MARC21, así como una breve guía introductoria sobre la búsqueda. Los campos de indexación que describe esta sección se refiere a los datos bibliográficos y no a la indexación de la base de datos de autoridades.

2.1. Indexación y búsqueda

Las bases de datos Koha se indexan con el software de código abierto Zebra. La documentación describe a Zebra como:

"...Zebra es un motor de indexación de texto estructurado de propósito general y de recuperación datos de alto rendimiento. Lee registros en una variedad de formatos de entrada (por ejemplo, correo electrónico, XML, MARC) y proporciona acceso a ellos a través de una poderosa combinación de expresiones de búsqueda booleana y consultas de texto libre clasificadas por relevancia.

Zebra soporta bases de datos grandes (decenas de millones de registros, decenas de gigabytes de datos). Permite actualizaciones incrementales de bases de datos en los sistemas vivos de forma segura. Debido a que Zebra es compatible con el protocolo de recuperación de información Z39.50, puede buscar en bases de datos utilizando una enorme variedad de programas y toolkits, tanto comerciales como libres, que interactuan con este protocolo ..." Zebra - Guía del usuario y de referencia, p. 1, http://www.indexdata.dk/zebra/doc/zebra.pdf

Esta breve guía le mostrará un ejemplo de cómo se puede configurar una base de datos MARC21, así como una breve guía introductoria sobre la búsqueda. Los campos de indexación que describe esta sección se refiere a los datos bibliográficos y no a la indexación de la base de datos de autoridades.

Nota

La configuración de indexación que se describe a continuación es la utilizada por Southeastern University. Su indexación local puede ser diferente.

2.2. Configuración de la indexación

La indexación de Koha utiliza tres archivos de configuración.

El primer archivo de configuración (etc/zebradb/biblios/etc/bib1.att) contiene la lista de atributos bibliográficos bib-1 de Z39.50 y los atributos de uso local como los índices bibliográficos, los índices de ítems, los índices fijos y otros índices especiales. El perfil Z39.50 Bib-1 se compone de seis tipos diferentes de atributos: Use, Relation, Position, Structure, Truncation y Completeness. El atributo Use, identifica un conjunto de puntos de acceso contra el que el término es comparado. Los atributos Relation, Completeness, Truncation y Position especifican otros criterios de coincidencia. El atributo Structure identifica la forma en que el término ha sido suministrado. Para una lista completa de la norma atributos Bib-1, vaya a http://www.loc.gov/z3950/agency/bib1.html .

El segundo archivo (etc/zebradb/marc_defs/[marc21|unimarc]/biblios/record.abs) contiene la sintaxis abstracta que hacen corresponder las etiquetas MARC21 con el conjunto de atributos Use eligidos en el primer archivo. Las reglas establecidas en este archivo proporcionan reglas para autor, título, materia, palabra clave e identificadores estándar (LCCN, ISBN, ISSN, etc), entrom otras cosas.

El tercer archivo (etc/zebradb/ccl.properties) es el de asignaciones de campo del Common Command Language (CCL). Este archivo combina el archivo de atributos bib-1 y agrega los clasificadores, que por lo general se conocen como nombres de índices. Los clasificadores, o índices, pueden ser: pn, cpn, cfn, ti, se, ut, nb, ns, sn, lcn, callnum, su, su-to, su-geo, su-ut, yr,pubdate, acqdate, ln, pl, ab, nt, rtype, mc-rtype, mus, au, su-na, kw, pb, ctype, y an.

El indexación cuadro Koha resume el contenido de los tres de estos archivos en un formato más legible. Las dos primeras columnas de atributos Z39.50 etiqueta y el nombre coincide con el Z39.50 Z39.50 bib-1 atributos de archivo. La tercera columna etiquetada etiquetas MARC indizados es donde usted encuentra que las etiquetas MARC se asignan a un atributo. La cuarta columna etiquetada Eliminatorias identifica las siglas de búsqueda utilizados en la consulta interna CCL. La siguiente descripción proporciona una definición para la palabra 'calificativos'.

Los clasificadores se utilizan para dirigir la búsqueda a un determinado índice de búsqueda, como los índices de título (ti) y de autores (au). La norma en sí CCL no especifica un conjunto particular de clasificadores pero sí sugiere notaciones por unos pocos. Usted puede personalizar el programa de análisis CCL para soportar un conjunto particular de clasificadores para reflejar el perfil de destino actual. Tradicionalmente, un clasificadoro se asignará a un atributo Use particular dentro del conjunto de atributos bib-1. También es posible establecer otros atributos, como atributos de estructura.

En la columna de etiquetas MARC indexadas, hay algunas convenciones utilizadas que tienen significados específicos. Ellas son:

  • Una etiqueta de tres dígitos (por ejemplo 100) significa que todos los subcampos en la etiqueta se puede utilizar en una consulta. Por lo tanto, si se introduce una búsqueda de 'Jackson' como autor, se recuperarán los registros en que Jackson podría ser el apellido o el nombre.

  • Una etiqueta de tres dígitos seguida por $ y una letra (por ejemplo 600$a) significa que una consulta de búsqueda sólo buscará el subcampo 'a'.

  • Una etiqueta de tres dígitos que es seguida por un ':' y una letra (por ejemplo 240:w) significa que la consulta puede ser aún más calificada. La letra que viene despues del ':' identifica la forma de realizar la búsqueda. Los valores más comunes que vemos son la 'w' (palabra), 'p' (frase), 's' (tipo), y 'n' (numérico).

Se indexan todos los contenidos de las etiquetas MARC, subcampos, y/o elementos de campo fijo que se enumeran en esta tabla. Vera que cada línea atributo no se asigna a una calificación específica (índice)-LC número de tarjeta, la línea 9 es un ejemplo. Sin embargo, cada palabra indexada (una cadena de caracteres precedida y seguida por un espacio) se puede buscar usando una palabra clave (kw) de búsqueda. Así, aunque un número específico de tarjeta de índice de LC no existe, usted todavía puede buscar por la etiqueta LCCN desde 010 se asigna al número de atributo LC-card. Para comprobar esto, escriba 72180055 en el cuadro de búsqueda persistente. Usted debe recuperar a Los propios dioses, de Isaac Asimov.

Ejemplos de elementos de campo fijo de indexación se pueden ver en la tabla entre Attribute 8822 y Attribute 8703. Estos atributos son los más comúnmente utilizados para limitar. Los atributos de campo fijo actualmente representan los códigos de BK. Los otros códigos de formato, si son necesarios, se podrían definir.

2.3. Búsqueda básica

El cuadro de búsqueda para el personal de bibliotecas y usuarios de la biblioteca se ve usualmente en la parte superior de la página. Koha interpreta las búsquedas como búsquedas de palabras clave.

Para iniciar una búsqueda, escriba una palabra o varias palabras en el cuadro de búsqueda. Cuando se escribe una sola palabra se realiza búsqueda por palabra clave. Usted puede comprobar esto: escriba una palabra en el formulario y tenga en cuenta el número de resultados localizados. A continuación, repita la búsqueda con un cambio menor. Frente a la palabra de búsqueda, escriba 'kw =' seguido por el mismo término de búsqueda. Los resultados serán idénticos.

Cuando haya más de una palabra en el cuadro de búsqueda Koha también hace una búsqueda por palabras clave, pero un poco diferente. Cada palabra se buscará por su cuenta y después el conector booleano 'y' va a limitar la búsqueda a los registros con todas las palabras que figuran en los registros coincidentes.

Suponga que quiere encontrar material acerca de cómo las bibliotecas están usando mashups. Usted selecciona las palabras importantes y presentarlas a la casilla de búsqueda persistente.

La respuesta a esta búsqueda es:

El orden de las palabras no afecta a la recuperación de los resultados, así que también podría entrar en la búsqueda de "mashups library". La respuesta a esta búsqueda son los resultados

El exceso de palabras en el buscador podría resultar en pocos registros, como ilustra el siguiente ejemplo:

2.4. Búsqueda Avanzada

Cuando usted no puede encontrar el material más adecuado con la búsqueda general, usted puede ir a la página de búsqueda avanzada haciendo clic en la opción de búsqueda en la barra de herramientas.

La página de búsqueda avanzada ofrece muchas maneras para limitar los resultados de su búsqueda. Usted puede buscar utilizando los operadores booleanos AND, OR y NOT, limitar por tipo de ítem; limitar por año e idioma; límitar por los subtipos público, contenido, formato, o también por ubicación y disponibilidad.

La primera sección en la página de búsqueda avanzada ofrece una manera rápida y sencilla de utilizar los operadores booleanos en la búsqueda. Tenga en cuenta que esta pantalla depende de una configuración de las preferencias del sistema. Esta opción se puede encontrar enAdministración > Preferencias del sistema > Buscar. La opción llamada expandedSearchOption se debe establecer en 'mostrar' para ver la siguiente pantalla.

En esta sección puede elegir entre los muchos índices haciendo clic sobre la flecha en la primera casilla. El cuadro en blanco que sigue es donde se introduce el(los) primer(os) término(s) de búsqueda. En la segunda línea, puede elegir el operador booleano que desea utilizar en su búsqueda. Las opciones son 'y', 'o', y 'no'. A continuación, se puede elegir el índice de búsqueda, seguido por el segundo término o términos. Si tiene más términos que desea incluir en su búsqueda, puede hacer clic en el [+] para agregar otra línea en la búsqueda.

Un ejemplo de búsqueda, seguida por sus resultados:

Cuando utiliza los operadores booleanos para ampliar o limitar una búsqueda, recuerde como actúa cada operador. El operador 'y' reduce los resultados que va a recuperar porque la búsqueda se efectuará en los registros que incluyen todos los términos de búsqueda. El operador 'o' amplía los resultados porque la búsqueda buscará las apariciones de cada uno de los términos de búsqueda. El operador 'no' excluye los registros con la expresión que sigue al operador.

Nota: si deja este expandedSearchOption en 'no mostrar', este es la pantalla que se verá:

La página de búsqueda avanzada a continuación, muestra los múltiples tipos de límites que se pueden aplicar a los resultados de su búsqueda. Cualquiera de un cheque de caja o seleccionar los menús desplegables para restringir la búsqueda. Usted escriba el año, el año de rango o un 'mayor que (>) 'o' menor que (<) años.

Por último, puede elegir la forma en que los resultados serán ordenados. Las opciones predefinidas de ordenamiento están en la al final de la pantalla de búsqueda avanzada.

El tipo predeterminado de ordenamiento es por relevancia, aunque se puede optar por ordenar por autor, por título, por signatura topográfica, por fechas, o por popularidad. Si prefiere un orden predeterminado diferente, puede establecer defaultSortField de forma diferente en Administración > Preferencias del sistema > Buscar.

2.5. Lenguaje de búsqueda comandos comunes (CCL)

Koha utiliza el Common Command Language (CCL) (ISO 8777) como su protocolo de búsqueda interna. Las búsquedas iniciadas en la interfaz gráfica utilizan este protocolo, aunque la persona que busca no sabe qué índices, operadores y limitadores están disponibles y se utilizan para llevar a cabo la búsqueda. La persona que está buscando puede acceder a algunos de los índices utilizados en la búsqueda avanzada y así obtener un conjunto de resultados más precisos. Sin embargo, algunos usuarios comunes de la biblioteca y muchos del personal prefierne usar un lenguaje con comandos para la búsqueda. En esta parte del documento se presenta y explica el uso de los comandos de búsqueda de Koha. Los índices, operadores y limitadores utilizados son idénticos a los utilizados en la interfaz gráfica.

2.5.1. Indices

La norma CCL en sí no especifica un conjunto particular de ccalificadores (índices), pero sí sugiere un conjunto de notaciones breves como 'ti', 'au', y 'su'. El Koha por defecto tiene un conjunto de índices, es posible personalizar los índices, agregando los que son necesarios para una biblioteca o conjunto de ellas. Un calificador (índice) se asigna a un atributo Use particular dentro del conjunto de atributos Z39.50 BIB-1. El conjunto completo de atributos Z39.50 Bib-1 se puede ver en http://www.loc.gov/z3950/agency/bib1.html .

El conjunto estándar de índices de Koha es un ejemplo bastante común de reglas de indización MARC21. Los índices que se definen en Koha son índices habitualmente utilizados por otros sistemas integrados para bibliotecas. Los atributos Z39.50 Bib-1 se asignan de la siguiente fórma a los índices:

Tabla 11.1. Atributos

Atributo Bib-1Calificador (índice)
Personal-namepn
Corporate-namecpn
Conference-namecfn
Titleti
Title-seriesse
Title-uniformut
ISBNnb
ISSNns
Local numbersn
Local-classificationlcn and callnum
Subjectsu, su-to, su-geo, su-ut
PubDateyr,pubdate
Date-of-Acquisitionacqdate
Languageln
Place-of-publicationpl
Abstractab
Notesnt
Record-typertype, mc-rtype, mus
Authorau, aut
Subject-person-namesu-na
Any (keyword)kw
Publisherpb
Content-typectype
Koha-Auth-Numberan
Author-personal-bibliographyaub
Author-in-orderauo

Las tres líneas anteriores con las letras verdes son utilizadas principalmente como limitadores. La referencia se encuentra en Koha Indexing Chart para ver las asignaciones de las estiquetas MARC21 a cada atributo Bib-1 y la combinación de índices.

2.5.1.1. Ejemplos de público
  • aud:a Fácil

  • aud:cc Menores

  • aud:d Adulto joven

  • aud:e Adulto

2.5.1.2. Ejemplos del contenido
  • fic:1 Ficción

  • fic:0 No Ficción

  • bio:b Biografía

  • mus:j Grabación musical

  • mus:I Grabación sonora no musical

2.5.2. Sintaxis de búsqueda

En el cuadro de búsqueda persistente (el que aparece en la parte superior de la mayoría de las pantallas) una sola palabra en general recupera conjuntos de gran tamaño. Para limitar una búsqueda, puede utilizar varias palabras. Koha utiliza automáticamente el operador booleano 'y' para crear un conjunto de registros que coinciden con su entrada. Si desea restringir la búsqueda a un autor o un título o un sujeto o algún campo concreto, o si desea utilizar un operador booleano, no hay una forma obvia de lograrlo. El usuario de la biblioteca puede, por supuesto, ir a la página de búsqueda avanzada, sin embargo, si usted sabe cómo construir una búsqueda CCL, se puede lograr una mayor especificidad al utilizar el cuadro de búsqueda persistente en cualquier página.

Hay un orden específico para la sintaxis de búsqueda CCL. Aunque puede ser utilizada para las búsquedas sencillas, es una manera especialmente eficaz para realizar búsquedas complejas, ya que ofrece un gran control sobre los resultados de su búsqueda. Para construir una búsqueda CCL, en primer lugar introducir un código de índice deseado, a continuación, un signo igual, seguido de su búsqueda de la(s) palabra(s). Los siguientes son ejemplos de búsquedas CCL simples.

  • ti=principios de la contabilidad

  • au=Francisco Cabases

  • su=poesía

  • su-na=Shakespeare

  • kw=merluza

Usted puede refinar su búsqueda mediante la combinación de los términos de búsqueda con operadores booleanos 'and' ('y' lógico), 'or' ('o' lógico), o 'not' ('no' lógico). Los siguientes son ejemplos de búsquedas con operadores booleanos.

  • ti=principios de contabilidad and au=Francisco Cabases

  • su=poesía not su-na=Shakespeare

  • kw=comunicación and su=debate

El uso de índices específicos y de operadores booleanos no es la única manera de refinar una búsqueda. También puede refinar su búsqueda como una frase en la búsqueda de un título, autor o tema. La sintaxis de esta búsqueda es índex,phr=palabras de búsqueda .

Para ilustrar los resultados de diversos tipos de búsqueda, se realizaron búsquedas para los términos 'corte suprema'. Los resultados muestran que el índice de búsqueda y el orden de las palabras hacer una diferencia en los resultados de la búsqueda. En estos ejemplos sólo se muestra la cantidad de resultados devueltos y la búsqueda en sí misma. La búsqueda que se ha ejecutado está entre comillas simples.

También puede optar por utilizar limitadores de su consulta. Algunos limitadores comunes incluyen las fechas, los idiomas, los tipos de registros, y los tipos de ítems. En la Búsqueda Avanzada, puede hacer clic en un cuadro o una llave de datos para limitar la búsqueda. También puede aplicar los mismos límites con el uso de CCL.

Por Fecha: su=supreme court and yr,st-numeric=>2000

Cuando se límita por fecha, puede utilizar '>' (mayor que), '<'' (menor que), '=' (igual), o 'AAAA-AAAA '(rango).

Por tipo de ítem: su=enfermería and itype:BK

Cada biblioteca tendrá un conjunto diferente de tipos de ítems definidos en su configuración de circulación. Al configurar los tipos de ítems, se define un código y un nombre para cada uno. El nombre aparecerá en la página de Búsqueda Avanzada. El código que ha asignado se utiliza como un límite de búsqueda CCL, con el formato 'itype:x', donde 'x' es el código asignado. En la instalación de Koha se puede cargar un conjunto inicial de tipos de ítems. Puede inicialmente usar estos y después modificarlos, o agregar otros, según las nececidades de la biblioteca. Los tipo de ítem iniciales son:

  • itype:BKS libros, cuadernos, libros de trabajo

  • itype:SR casetes de audio, CDs

  • itype:IR carpetas

  • itype:CF CD-ROMs, DVD-ROMs, recursos online

  • itype:VR DVDs, VHSs

  • itype:KT Kit

  • itype:AR Models

  • itype:SER Publicaciones periódicas

Por formato: su=Corte suprema not l-format:sr

Los limitadores de formato se derivan de una combinación de las posiciones 006 y 007 del leader o encabezamiento del registro. Los formatos que se definen actualmente son los siguientes.

  • l-format:ta impresión común

  • l-format:tb impresión grande

  • l-format:fk Braille

  • l-format:sd CD audio

  • l-format:ss grabación en casete

  • l-format: cinta VHS

  • l-format: DVD de vídeo

  • l-format:co CD de software

  • l-format:cr sitio Web

Por tipo de contenido: su=corte suprema not ctype:l

Los tipos de contenido se han tomado de la etiqueta 008 de MARC, posiciones 24-27.

Hay dos tipos de limitadores que no se describen en este documento. Ellos son: la audiencia y contenido. La única diferencia en la sintaxis de la CCL es el limitador real. Ellos se mencionan aquíen caso de que quiera utilizarlos.