miejsc pracy opieki zdrowotnej w virginia beach cialis cena w domu testów narkotykowych

Lenguajes documentales y lenguaje natural en la recuperación de información

Lenguaje1Lenguaje Documental.- Son herramientas orientadas a la representación del contenido temático de los documentos de una unidad de información con el objeto de facilitar su posterior recuperación.
El uso de estos lenguajes permite utilizar un vocabulario común y sistematizado (normalización y control) en los procesos clave del tratamiento y difusión documental (análisis de contenido, búsqueda y recuperación de información).
Son, en síntesis, el instrumento a través del cuál se expresa e interactúa el sistema (biblioteca) con su comunidad usuaria desde el punto de vista del acceso temático.
Un lenguaje documental transforma la información relativa a los documentos en datos manipulables para favorecer el control y la validación de los datos, cuando se desea almacenar un documento o la información relativa al mismo, se habrá de extraer de él lo que más tarde nos va a ser necesario recuperar de esa misma información. Por esto, los lenguajes documentales son usados en los sistemas de gestión documental tanto a la entrada del documento como al realizar una búsqueda de los documentos del sistema.
Los lenguajes documentales han de conseguir que se produzca una búsqueda y recuperación de información lo más eficaz posible, evitando al máximo el ruido y el silencio.

  1. Ruido: documentos parásitos seleccionados por el sistema y que no responden a la pregunta.
  2. Silencio: documentos que respondiendo a la pregunta han sido indizados por términos distintos a la demanda.

Los lenguajes documentales son principalmente:Lenguaje2

  • Las indizaciones
  • Encabezamientos de materia
  • Tesauros y
  • Las clasificaciones.

Lenguaje de Indización.- la operación de indizar consiste en retener una o más nociones que representan el contenido de un documento o los conceptos de una búsqueda bibliográfica.
Se entiende por lenguaje de indización o lenguaje documental al conjunto controlado de términos o su representación simbólica, necesaria para poder comunicarnos con la información contenida. En un lenguaje controlado de indización los términos pertenecen a dos categorías:

  • Términos preferentes o descriptores o términos controlados.- Son términos que se utilizan de forma conveniente para representar conceptos precisos y unívocos en el proceso de indización y búsqueda de documentos.
  • Términos no preferentes o no descriptores.- Se asignan a los documentos cuando indizamos, pero pueden proporcionar puntos de acceso en los índices o lenguajes impresos y tesauros y dirigir al usuario a la selección de descriptores a través de los términos sinónimos.

Así, la indización puede realizarse sobre la base de:

  • El texto del resumen
  • El título del documento
  • Términos controlados
  • Términos no controlados( términos libres que pertenecen al lenguaje natural y que se encuentran al arbitrio del profesional)

Encabezamientos de Materia.- Los encabezamiento de materia son un conjunto de asientos bibliográficos los cuales atienden a la descripción o documento teniendo en cuenta la descripción formal que de él se hace mediante las normas establecidas en las reglas de catalogación, sino que describen el documento teniendo en cuenta el campo de la realidad susceptible de ser conocimiento, es decir el tema o la materia que se desarrolla o contiene el documento. Son pues una lista de términos extraídos del lenguaje natural que pretenden sintetizar el contenido temático del documento u tenemos.

Lenguaje3Tesauros.- Una base de datos puede tener simplemente un vocabulario controlado o lenguaje de indización, o bien un tesauro. Éste supone que se señalan las relaciones conceptuales entre los descriptores, y la existencia de un vocabulario de entrada formado por los términos sinónimos o casi sinónimos de los descriptores.

El tesauro reduce las ambigüedades entre términos, indica cómo puede haberse indizado un tema, alivia el problema de identificar todos los posibles términos que se utilizarán en las búsquedas, y proporciona la base para efectuar búsquedas al nivel de generalidad deseado.

Clasificación.- La clasificación se usa para encuadrar una búsqueda y reducir el número de referencias a un capítulo determinado de la clasificación, centrando el tema que de otro modo provocaría ruido o documentos parásitos. La clasificación gana eficacia cuando cada referencia puede estar clasificada en más de una sección cuando el tema que se busca pudiera muy bien haber sido clasificado en otra.

Lenguaje Natural.- Se usa para la comunicación inmediata, la que se realiza ahora mismo, coexisten diferentes significados para un solo significante o diversos significantes sinónimos.

¿Y por qué hay que controlar los términos del lenguaje natural? Porque el lenguaje natural es ambiguo, los conceptos se pueden representar de formas diversas, dando lugar a problemas de recuperación. El lenguaje natural es rico en terminología, en formas (plurales y singulares), tiempos verbales, acrónimos, sinónimos, polisemias, etc. La principal diferencia entre el lenguaje natural y el documental controlado es precisamente el control terminológico, que permite representar los conceptos de forma unívoca, sin ambigüedades. Para ser más concretos, las diferencias se dan en el número de términos del vocabulario, el control de las formas, el control del significado y las relaciones de significado entre términos.

En conclusión para la recuperación de la información, los lenguajes de interrogación se componen de técnicas y símbolos para extraer la información de acuerdo a ciertas restricciones o descripciones dadas por el usuario.

Así, se puede acceder al contenido temático de los documentos referenciados en las bases de datos por:

  1. Palabras de título
  2. Resumen
  3. Lenguajes documentales (índices, descriptores, materias, tesauros, códigos de clasificación.
  4. Lenguaje natural o libre.

Los dos últimos están dando opción de realizar la recuperación de la información ya sea por lenguajes documentales o por lenguaje natural, entendiéndose así, que los diferentes tipos de usuarios son quienes decidirán escoger el lenguaje que conocen y manejan según su ámbito profesional, para la rápida recuperación de la información y satisfacer la necesidad de conocimiento.

CUADRO COMPARATIVO ENTRE LENGUAJES DOCUMENTALES Y LENGUAJE NATURAL O LIBRE.

LCvsLL
Referencias Bibliográficas:

Gil Leiva, I. (2008). Manual de indización. Teoría y práctica. Gijón: Trea.

Fox, Virginia, (2008). Análisis documental del contenido. Buenos Aires: Alfagrama.

Méndez, E.; Moreiro, J. A. (1999). “Lenguaje natural e indización automatizada”. Ciencias de la Información (pág. 11-24).

http://es.slideshare.net/irisalbertina15/clase-sobre-lenguaje-documental

Alonso Berrocal, J. L.; Figuerola, C. G.; Zazo Rodríguez, A. (2009). Recuperación avanzada de la información. Salamanca. [Fecha de consulta: 31 de julio de 2009].

The following two tabs change content below.

Mónica Elizabeth Estrada Villacís

Ingeniera en Ciencias de la Información y Bibliotecología, manejo y conocimiento de Gestión Bibliotecaria, Gestión Documental, Documentación; con amplia trayectoria en Bibliotecas, Archivos y Centros de Documentación.
Notice: Use of undefined constant rand - assumed 'rand' in /usr/home/infotecarios.com/web/wp-content/themes/ribbon/single.php on line 35

Comments

  1. By Jorge

    Responder

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

A %d blogueros les gusta esto: