La imparcialidad de los repositorios y sus datos

Ivanović, Dragan, Schmidt, Birgit, Grim, Rob, & Dunning, Alastair. (2019). FAIRness of Repositories & Their Data: A Report from LIBER’s Research Data Management Working Group. Zenodo, 2019. http://doi.org/10.5281/zenodo.3251593

Texto completo

Los repositorios de datos desempeñan un papel crucial en la evolución de la ciencia abierta. Los principios de datos FAIR establecen cómo hacer que los datos sean localizables, accesibles, interoperables y reutilizables (Wilkinson et al., 2016). Los principios FAIR son los siguientes:

Ser Localizable

F1. A los (meta)datos se les asigna un identificador globalmente único y eternamente persistente.
F2. los datos se describen con metadatos ricos.
F3. Los (meta)datos se registran o indexan en un recurso que permite realizar búsquedas.
F4. los metadatos especifican el identificador de los datos.


Ser accesible:

A1 los (meta)datos son recuperables por su identificador utilizando un protocolo de comunicación estandarizado.
A1.1 el protocolo es abierto, libre y universalmente implementable.
A1.2 el protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario.
A2 los metadatos son accesibles, incluso cuando los datos ya no están disponibles.


Ser interoperable

I1. Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento.
I2. Los (meta)datos utilizan vocabularios que siguen los principios FAIR.
I3. Los (meta)datos incluyen referencias cualificadas a otros (meta)datos.

Ser reutilizables

R1. Los (meta)datos tienen una pluralidad de atributos precisos y relevantes.
R1.1. Los (meta)datos se publican con una licencia de uso de datos clara y accesible.
R1.2. Los (meta)datos están asociados a su procedencia.
R1.3. Los (metadatos) cumplen con las normas comunitarias relevantes para el sector.

En el informe se resumen las mejores prácticas para la aplicación de los principios FAIR, tales como:

  • Deben utilizarse DOI, Handle, URN, URI o números generados localmente como identificadores permanentes para los registros de metadatos y datos.
  • Deben aplicarse, en la medida de lo posible, vocabularios globales estandarizados conocidos, como los vocabularios ISO para los códigos de países y lenguas, así como los vocabularios COAR, OpenAIRE y DataCite para los tipos de publicación/recursos, el estado de acceso y las funciones.
  • Los repositorios deberían conservar la información sobre la procedencia de los datos almacenada en los metadatos: creador, instituciones – editores, fuente, dirección de correo, año de publicación, año de producción, geolocalización, recolector de datos, gestor de datos, distribuidor, editor, financiador, productor, titular de derechos, patrocinador y supervisor.
  • Al mismo tiempo, las encuestas pusieron de manifiesto algunos malentendidos sobre los Principios FAIR, así como aplicaciones erróneas.

Malentendidos

Modelos de metadatos enriquecidos – La definición de lo que constituye un modelo de metadatos enriquecido no está bien definida, lo que conduce a una cierta incomprensión del principio F2 FAIR. En esta encuesta, la mayoría de los encuestados dijeron que utilizaban un modelo de datos enriquecido, pero 12 de los repositorios analizados tenían 13 o menos campos obligatorios. De ellos, ocho tenían siete o menos campos obligatorios.

Legibilidad mecánica – Casi el 80% de los encuestados dijo que sus repositorios cumplen completamente con el principio I1 FAIR: Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento). Esto significa que los humanos y los ordenadores deben ser capaces de intercambiar e interpretar los datos de los demás. Los datos deben ser legibles para las máquinas sin necesidad de algoritmos, traductores o mapeos especializados o ad hoc. Para garantizarlo, es fundamental utilizar (1) vocabularios controlados, ontologías y tesauros de uso común y (2) un marco bien definido para describir y estructurar los (meta)datos. Sin embargo, el 45% no contestó o dijo no saber si su repositorio podía mostrar metadatos en alguna tecnología de la web semántica como OWL, notación RDF. Cinco repositorios ofrecen metadatos en una tecnología de la web semántica, mientras que cuatro planean implementar esta característica. Los siete encuestados restantes informaron de que no existía esa posibilidad en su repositorio.

Procedencia de los metadatos – Aunque la procedencia de los (meta)datos (R1.2) debe describirse en un formato legible por máquina, algunas implementaciones de este principio FAIR incluyen una descripción de procedencia en texto libre o un archivo adjunto que describe la procedencia.

Falta de infraestructura – Teniendo en cuenta que el principio FAIR de I2 a menudo se pasa por alto y es bastante complicado de implementar, una infraestructura/plataforma/servicio que pueda ayudar en esta implementación debería ser una prioridad de la UE y otros programas de financiación.