El encanto de los Datos de Investigación.

Nuestros recursos de información hoy día se encuentran en una gran cantidad de tipos y formas, desde un simple tuit hasta datos de investigación, que forman parte de un engranaje que permite la comunicación científica y la generación de conocimiento;  por lo que debemos considerar su importancia, análisis y gestión en nuestro entorno. Los datos de investigación incluso están considerados como una de las tendencias y retos para las bibliotecas universitarias, de acuerdo al Horizont report 2017: library edition se considera una tendencia a corto plazo, es decir, de uno a dos años, los datos de investigación ya están y deberán estar siendo incorporados (en acceso abierto o no) a nuestras colecciones.

¿Qué son los datos de investigación?

Existen diversas definiciones y enfoques pero aquella que ha sido usada por entidades de gran prestigio como el National Institute of Health (NIH) o la OECD (2017) considera que los datos de investigación

“… son  todo  aquel  material que ha sido registrado durante la investigación, reconocido por la comunidad científica y que sirve para certificar los resultados de la investigación que se realiza. Además de estas características también se  específica que debe provenir de una fuente única y deben ser difíciles o imposibles de obtener de nuevo por ser propios de un momento o circunstancias irrepetibles de una forma exactamente igual” (Torres–Salinas; Robinson–García; Cabezas–Clavijo, 2012)

Podemos decir que ahora vemos con nuevos ojos los trabajos de investigación, pues de acuerdo a la definición anterior, el peso recae en el trabajo generado durante la investigación: los instrumentos, análisis, pruebas, cuestionarios, videos, modelos, experimentos, etc. previo al resultado de la investigación; por lo tanto dichos datos se convierten en la base de la evidencia sobre la cual los investigadores construyen su investigación (HEFCE 2008).

Tipo de datos de investigación.

Así como encontramos varias definiciones, con la tipología ocurre lo mismo, existe una gran variedad, una de ellas de acuerdo a su formato es la siguiente:

  • Archivos
  • Auxiliares
  • Compresión
  • Documentos
  • Copias
  • Lenguaje de marcado
  • Metadatos
  • Base de datos relacional
  • Hojas de cálculo
  • Vectores

Y esto solo por poner un ejemplo y aunque considero que esta clasificación no dice mucho por ser demasiado general dada la naturaleza de la información, puede servir al momento de gestionar los datos.

Por otro lado, encontramos tipologías de fondo como es el caso de la propuesta por Swan; Brown, 2008:

  1. Según su proceso de obtención, pueden subdividirse en tres tipos:
  • experimentales
  • simulaciones
  • observaciones

2.Según el objetivo de recogida:

  • específicos, es decir, centrados en un proyecto específico.
  • alcance medio: de interés para un área concreta.
  • de interés general: de interés para la ciencia en general e incluso un interés social.

3. Según la fase de la investigación:

  • Datos preliminares (raw data).
  • Datos finales (final research data).

Otra de las tipologías recomendadas es la de Borgam, 2012, que aunque estructurada de distinta forma, coincide en varios puntos con la Swan y Brown (Melero, Remedios, 2014):

  • Datos observacionales: registro históricos, se puede obtener en un lugar y en momento en el tiempo (son irrepetibles).
  • Datos experimentales: datos que acompañan a los experimentos desde su planificación y preparación hasta la obtención de resultados. Con frecuencia reproducibles pero con un alto coste.
  • Datos computacionales, compilados y derivados: datos que suelen incluir datos de entrada, ciertos programas y resultados. Reproducibles con soporte tecnológico.
  • Datos de simulación: datos generados a partir de modelos de prueba donde con frecuencia el modelo de entrada es más representativo que la propia salida de datos.

Ciclo de vida.

El ciclo de vida de los datos de investigación abarca diferentes etapas tanto del proceso de investigación como el uso, difusión y preservación que se hace de los datos.

Así como hay diversidad de definiciones, tipologías, etc. también es difícil generalizar un ciclo de vida de los datos, ya que existen múltiples variables, sin embargo varios autores coinciden en que los datos son un ente dinámico que cambia de acuerdo a la fase en la que se encuentra la investigación y de manera genérica dicho ciclo se clasifica en siete fases:

  • Concepción inicial
  • Planificación
  • Creación de la propuesta de investigación
  • Comienzo de la investigación
  • Recolección de datos
  • Finalización de la investigación

Por su parte el Digital Curation propone un ciclo desde la perspectiva de la curaduría y preservación de datos que abarca cuatro fases del ciclo vital, ocho acciones secuenciales y tres acciones ocasionales para  la gestión y preservación:

Ciclo vital

Acciones secuenciales

Acciones ocasionales

Descripción y asignación de información de representación Conceptualizar Disposición
Planificación de la preservación

 

Crear o recibir Revaloración
Participación y vigilancia de la comunidad Valorar y seleccionar Migración
Curatoría y preservación Ingesta
Acción de preservación
Almacenar
Acceder, usar y reutilizar
Transformar

Imagen tomada de: http://www.bib.upct.es/datos-de-investigacion

¿Cómo compartir los datos de investigación?

El conjunto de datos de investigación se denomina datasets y para poder compartirlos es necesario seguir estándares nacionales (si los hay) e internacionales, con el fin de facilitar el intercambio, como lo hacemos nosotros al utilizar MARC por ejemplo. Algunos recomiendan como mejores prácticas en cuanto al formato de datos:

  • Que no sea propietario.
  • Documentado según estándares del mercado.
  • Ampliamente aceptado por la comunidad de investigadores.
  • No-encriptado.
  • Sin compresión.

Como aliado para la comunicación de datos de investigación contamos con el movimiento Open Access que de manera libre nos permite acceder a los datos (con los debidos requerimientos que esto  implica).

Dichos datos se pueden difundir de dos formas:

  • Formal :
    • Publicaciones tradicionales.
    • Repositorio.
    • Data journal.
  • Informal:
    • A petición, cuando el investigador es contactado por una solicitud específica.
    • Descentralizada: a través de medios como una web personal.

Aunque aún seguimos en el desarrollo de guías, estándares, tratamiento, etc., de los datos de investigación es necesario considerar más que las limitantes, los beneficios de nos otorgan dichos datos, entre las principales se encuentran:

  • Promueve la colaboración al interior y más allá de las comunidades de investigación
  • Puede dar pie a nuevas investigaciones y a nuevos descubrimientos
  • ​Colaborar en la formación de futuros/as investigadores al utilizar los datos como recursos educativos
  • Promueve la innovación, al permitir múltiples usos de un mismo set de datos
  • Maximiza la transparencia y rendición de cuentas en la investigación
  • Eleva los estándares de la investigación científica, al permitir el escrutinio de los hallazgos y asegurar la integridad y reproducibilidad de la investigación
  • Promueve la mejora y validación de métodos de investigación
  • Maximiza el uso de recursos invertidos y evita la duplicación de esfuerzos
  • Aumenta el impacto y visibilidad de la investigación

A manera de resumen y poniendo a prueba su atención a este post, no dejen de realizar el test al final del video:

 

Obras consultadas y/o recomendadas

  • Datos de Investigación. En Crai Biblioteca. Universidad Politécnica de Cartagena. Recuperado de: http://www.bib.upct.es/datos-de-investigacion
  • Gestión de datos de investigación. En Biblioguías-Bibliotecas Cepal. Recuperado de:
  • Melero R., Hernández San Miguel, J. (2014). Acceso abierto a los datos de investigación, una vía hacia la colaboración científica. El Profesional de la Información, vol. 37, no 4. Recuperado de: http://redc.revistas.csic.es/index.php/redc/article/view/869
  • Swan, Alma; Brown, Sheridan. (2008).To share or not to share: publication and quality assurance of research data outputs. A report commissioned by the Research Information Network (Main report). Recuperado de :http://www.rin.ac.uk/our-work/data-management-andcuration/share-or-not-share-research-data-outputs
  • Torres-Salinas, D., Robinson-Garcia, N., Cabezas-Clavijo, A. (2012). Compartir los datos de investigación en ciencia: introducción al data sharing. El Profesional de la Información, vol. 21, n. 2. Recuperado de: http://eprints.rclis.org/16786/1/data%20sharing.pdf

 

Deja un comentario