Metadatos como herramienta en la recuperación de la información

La rápida proliferación de documentos digitales inició una nueva etapa en la organización de la información. Muchas propuestas para la codificación de la información digital surgieron para dar solución a las diferentes necesidades de los usuarios. En este marco, los metadatos ofrecieron amplias posibilidades para representar de manera estandarizada la información digital.

Por otra parte, la búsqueda y recuperación de la información en ambientes digitales ha tomado mayor importancia dada la necesidad de obtener la información con mayor rapidez, pertinencia y organización. La incursión de los metadatos en las tareas de descripción de documentos web, supuso un gran avance en materia de recuperación de la información, pues vino a facilitar, pero sobre todo a normalizar la representación de la información digital.

La recuperación de la información

Búsqueda de información

Huji (2008). Fuente: Wikimedia Commons.

Son ya más de sesenta años desde que Calvin N. Mooers hizo alusión al término recuperación de la información. Los tiempos han cambiado, pero el problema en sí mismo ha estado presente desde entonces, porque como lo mencionó Mooers (1950, p. 3) el problema de la recuperación es un problema digital y no numérico, porque la mayor parte de la comunicación humana es verbal, pero lo más importante es porque la mayoría de las ideas o conceptos no pueden ser fácilmente representados en un espacio euclidiano tridimensional, en otras palabras, no es los mismo la comunicación interpersonal que la interacción humano-computadora, de entrada hay una serie de requisitos técnicos para alcanzar un entendimiento adecuado.

Para Mooers (1950, p. 573) toda recuperación de la información manifiesta ciertos elementos característicos:

  • El destinatario o receptor, y no el emisor, es la parte activa.
  • La comunicación es temporal de una época a otra posterior en el tiempo, aunque posiblemente en el mismo punto en el espacio.
  • La comunicación es unidireccional.
  • El remitente no puede conocer el mensaje particular que va a ser de uso posterior para el receptor y debe enviar todos los mensajes posibles.
  • Digitalmente el mensaje debe ser representable.
  • Un canal es el documento físico almacenado que contiene un mensaje.
  • No hay ruido en el canal, porque se presume que todos los mensajes serán completamente accesibles para el receptor.
Datos

DARPA (2013). Fuente: Wikimedia Commons.

Aquí hay que hacer notar dos cosas, en primera instancia, el receptor de los mensajes es un ser humano; en segundo plano, el emisor de los mensajes es una máquina o computadora. En este caso, al hablar de recuperación de la información es más que la simple búsqueda y obtención de documentos, en realidad es pensar, como lo señala Mooers (1960, p. 229), en el uso de máquinas aplicadas a la recuperación de información, cuyo propósito es decodificar la información registrada para el entendimiento humano.

Entonces, ¿cuál es la finalidad de la recuperación de la información cuando por definición existe una diferencia significativa entre el emisor y receptor? Según Mooers (1950, p. 572):

El objetivo técnico es encontrar en un tiempo mínimo los mensajes de interés para el receptor, donde el receptor tiene a su disposición un dispositivo selectivo con una tasa de escaneo digital finito.

Ahora bien, hablar de búsqueda y recuperación de información implica dos elementos en el proceso: buscar y recuperar. El usuario puede tener infinidad de técnicas para buscar información, pero si los sistemas de recuperación no son eficientes, o si los documentos recuperados no son pertinentes con los criterios de búsqueda empleados por el usuario, debido a una mala descripción de los objetos, de nada sirve poseer grandes habilidades para buscar si no se va a recuperar lo deseado. Una buena búsqueda y recuperación de la información tiene que ser complementaria.

La pregunta entonces es ¿cómo hacer para que la recuperación de la información sea efectiva bajo los criterios de búsqueda del usuario? La respuesta puede hallarse en hacer más efectivos los motores de búsqueda que emplean los sistemas de recuperación de información; pero más que eso, la verdadera solución es describir los objetos o documentos digitales de la mejor forma posible, y bajo estándares establecidos, para que de esta manera, se puedan recuperar de una forma fácil, eficiente y pertinaz. En este sentido, la aparición de los metadatos aplicados a la representación de documentos digitales para su posterior búsqueda y recuperación, significó un gran avance en la materia, tanto que ni el propio Mooers pudo haber vislumbrado en su momento.

Los metadatos como herramienta para recuperación de la información

Hoy por hoy la capacidad para recopilar, indizar, almacenar, acceder, y entregar documentos digitales se han vuelto más importante. Solo basta con dar un clic y los documentos se pueden recuperar instantáneamente. Ahora bien, qué hace posible que esa información electrónica sea fácilmente descrita y recuperable para los usuarios. Una de las alternativas más apropiadas y multifuncionales es el uso de los metadatos.

Internet Map

The Opte Project (2006). Fuente: Wikipedia.

Los metadatos es información que describe las propiedades intrínsecas y extrínsecas de otros recursos de información, ya sean electrónicos o físicos. La aportación principal de los metadatos a la organización de la información es que vinieron a cambiar la manera en como representar la información en la web, lo que facilitó su búsqueda y recuperación.

En términos generales, las principales funciones de los metadatos se pueden resumir de la siguiente manera: describir, localizar, descubrir, archivar y evaluar y seleccionar (Liu, 2007, pp. 11-12). Cada uno de estos elementos conforma el proceso de búsqueda y recuperación de la información del usuario.

Por otra parte, Hodge (2005, p. 35) identifica tres propósitos fundamentales de los metadatos:

  • Facilita el descubrimiento de información relevante mediante la descripción de los del recursos electrónicos.
  • Los metadatos pueden describir el recurso a cualquier nivel de segregación.
  • El nivel en el que se aplica metadatos depende del tipo de datos y las necesidades de acceso previstos.

El uso de los metadatos en la gestión de la información incluye varias maneras, no obstante, donde más se les utiliza, debido a las posibilidades que ofrece, es para describir o recuperar un objeto digital. Por ejemplo, Brasethvik (1998, p. 381) señala que los metadatos se utilizan en dos niveles de descripción:

  • A nivel de sistema, los atributos de metadatos pueden ser almacenados dentro del código HTML por medio de meta-etiquetas o pueden ser almacenados en archivos separados.
  • A nivel persona, para comunicar el significado de la información subyacente, los metadatos se hace disponibles y visibles en la interfaz de usuario, con el fin de facilitar la recuperación de la información y su uso.

Actualmente, muchos de los sistemas de recuperación de información digital, llámense buscadores, catálogos, bases de datos, etc. están estructurados de acuerdo a los esquemas de metadatos del mercado, por lo que son considerados como la base de toda recuperación de la información, como lo señala Garshol (2004, p. 378):

Los metadatos son el fundamento de toda recuperación de la información.

La utilización de metadatos para la recuperación de la información no solo apoya este proceso, sino que inevitablemente también ayuda en la búsqueda de información. Por ejemplo, Garshol también señala que los metadatos tienden a ser utilizados tanto para la búsqueda de recursos como para la recuperación de la información, pues son muy utilizados tanto para la gestión de contenidos como para su descubrimiento después de su publicación (2004, p. 379).

Conclusión

Entre las principales aportaciones de los metadatos a la recuperación de la información podemos mencionar las siguientes:

  • Tienen mejores posibilidades para describir un recurso electrónico.
  • Proporcionar información para ayudar a la transferencia de datos.
  • Facilitan la búsqueda y recuperación de la información
  • Dan información que afecta a la utilización de los datos, como las condiciones legales de uso, su tamaño o edad
  • Proporcionan la historia de los datos, tales como la fuente original de los datos y las modificaciones posteriores
  • Proporcionan información sobre el propietario o el creador del texto

La recuperación de la información por parte del usuario es una de las tareas más importantes en el campo bibliotecológico y en sus afines, como es la informática. El diseño de sistemas de recuperación de la información constantemente está evolucionando, paralelamente con las tecnologías. Creo que en realidad eso no es lo importante, pues evidentemente las bibliotecas y las tecnologías caminan a la par sin ningún problema. Lo que realmente es importante, y nunca debemos de olvidar, es que todo diseño de servicios o sistemas de información, tiene que ser en función de las demandas y necesidades de los usuarios. Siempre al crear nuevos modelos en la búsqueda y recuperación de la información, se debe anteponer al usuario, y centrarse en él como un agente activo en el proceso de recuperación de la información.

Referencias

Brasethvik, T. (1998). A semantic modeling approach to metadata. Internet Research, 8 (5), 377 – 386.

Garshol, L. M. (2004). Metadata? Thesauri? Taxonomies? Topic maps! Making sense of it all. Journal of Information Science, 30 (4), 378 – 391.

Hodge, G. (2005). Metadata for electronic information resources: from variety to interoperability. Information Services and Use, 25 (1), 35 – 45.

Liu, J. (2007). Metadata and its applications in the digital library: approaches and practices. Westport, CT: Libraries Unlimited.

Mooers, C. N. (1950). The theory of digital handling of non-merical information and its implications to machine economics.  Technical Bulletin, 48, 1-17.

Mooers, C. N. (1950). Information retrieval viewed as temporal signaling. En Proceedings of International Congress of Mathematicians, Harvard University, Cambridge, Mass., August 30-September 6, 1, 572 – 573.

Mooers, C. N. (1960). The next twenty years in information retrieval: some goals and predictions. American Documentation, 1960, 11, (3), 229 – 236.

Visitas:1251

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *