Archivo de la etiqueta: Gestión de datos de investigación

Plataformas de repositorios de datos: una guía básica


A modular, cloud-based platform | Eslevier Solutions

Data Repository Platforms: A Primer”. Ithaka S+R, 2021

Texto completo

En la guía de recoge una variedad de características de los principales repositorios de datos que puede ser útil para los investigadores

Las plataformas de repositorio incluidas en el informe resumido son

  • Dryad
  • Figshare
  • Harvard Dataverse
  • ICPSR
  • Mendeley Data
  • Roper Center for Public Opinion Research
  • Zenodo

Datos abiertos en gobiernos locales: hacia los Objetivos de Desarrollo Sostenible

Galizzi, Bruno. Datos abiertos en gobiernos locales: hacia los Objetivos de Desarrollo Sostenible“. Fundación Internacional Baltasar Garzón (FIBGAR) 2020 DOI: 10.6084/m9.figshare.13072691.

Texto completo

La Agenda de Desarrollo Sostenible de 2030 definida por Naciones Unidas tiene como objetivo orientar las acciones a nivel global para atender las problemáticas más relevantes. Los objetivos de desarrollo sostenible son una guía para un fortalecimiento más igualitario, diverso, justo y medio-ambientalmente responsable para la realización de esfuerzos comunitarios en su resolución. Los beneficios de los Datos Abiertos para medir el desarrollo sostenible han sido también demostrados para: (i) la mejora de la eficiencia y cobertura de los servicios públicos, (ii) aumentar la transparencia, rendición de cuentas y participación ciudadana y (iii) facilitar el intercambio de información con los Gobiernos. Contar con una agenda de Datos Abiertos es un requisito y una necesidad para avanzar con compromiso y constancia en el cumplimiento de los ODS 2030.

Informe anual del Inventario de datos abiertos (ODIN) 2020/21

ODIN Open Data Inventory 2020/21

Texto completo

Open Data Watch lanza el Informe Anual del Inventario de Datos Abiertos (ODIN) 2020/21 que evalúa la cobertura y la apertura de las estadísticas oficiales en 187 países. ODIN monitorea el progreso de los datos abiertos que son relevantes para el desarrollo económico, social y ambiental. 

El año 2020 fue un año desafiante para el mundo, ya que los países se enfrentaron a la pandemia de COVID-19. No obstante, y a pesar del impacto negativo de la pandemia en la capacidad de los productores de estadísticas, en 2020 se registró un gran avance en los datos abiertos. En el informe completo se presentan las historias de ocho países que han logrado mejoras sustanciales en la cobertura y apertura de sus sistemas estadísticos.

Sin embargo, el progreso no se distribuyó de manera uniforme. Los países de todas las regiones todavía luchan por publicar datos de género y muchos de los mismos países no pueden proporcionar datos desglosados ​​por sexo sobre la pandemia de COVID-19. Y los países de bajos ingresos continúan necesitando apoyo para el desarrollo de capacidades y recursos financieros adicionales para superar las barreras a la publicación de datos abiertos.

Los puntajes promedio de apertura han aumentado de manera constante desde 2016. Los puntajes de cobertura disminuyeron en 2017, en parte debido a cambios en la metodología ODIN, pero han ido aumentando desde entonces. Para los 187 países incluidos en el ODIN 2020/21, los cinco elementos de apertura aumentaron en un 30 por ciento desde 2016, mientras que los cinco elementos de cobertura aumentaron en un 18 por ciento. Debido a un cambio significativo en la cobertura de países, los puntajes de 2015 no se muestran en este ni en los gráficos y tablas posteriores

Los datos abiertos aumentan el impacto de las revistas

Zhang, L., Ma, L. Does open data boost journal impact: evidence from Chinese economicsScientometrics (2021). https://doi.org/10.1007/s11192-021-03897-z

Texto completo

Para fomentar la transparencia de la investigación y su reproducción, cada vez más revistas exigen a los autores que compartan los conjuntos de datos originales y los procedimientos analíticos que respaldan sus publicaciones. ¿Impulsan los datos abiertos el impacto de las revistas? En este artículo, se presenta uno de los primeros estudios empíricos que evalúan los efectos de los datos abiertos en el impacto de las revistas.

La revista China Industrial Economics (CIE) obligó a los autores a poner en abierto los datos de sus investigaciones a finales de 2016, siendo la primera en adoptar los datos abiertos entre las revistas chinas y proporcionando un experimento natural para la evaluación de políticas. Para ello se utilizaron los datos de 37 revistas chinas de economía de entre 2001 a 2019 y se aplicó el método de control sintético para estimar causalmente los efectos de los datos abiertos, los resultados muestran que los datos abiertos han aumentado significativamente las citas de los artículos de las revistas. De promedio, las citas actuales y de segundo año de los artículos publicados con CIE han aumentado entre 1 y 4 veces, y los artículos publicados antes de la política de datos abiertos también se beneficiaron del efecto indirecto. Los resultados sugieren que las revistas pueden aprovechar los datos abiertos obligatorios para desarrollar su reputación y amplificar el impacto académico.

Capacitación en gestión de datos basada por dominios para bibliotecarios de enlace

Wittenberg, J., Sackmann, A., & Jaffe, R. (2018). Situating Expertise in Practice: Domain-Based Data Management Training for Liaison Librarians. Journal of Academic Librarianship44(3), 323–329. https://doi.org/10.1016/j.acalib.2018.04.004

Texto completo

El equipo de gestión de datos de investigación de la Universidad de California en Berkeley implementó un Programa de formación de bibliotecarios basado en dominios para mejorar las habilidades de los bibliotecarios de enlace en los principios de gestión de datos de investigación y crear una comunidad de práctica entre los bibliotecarios que brindan apoyo a los datos de investigación. El programa de capacitación se asoció con representantes de cada división temática de la Biblioteca para integrar contenido de disciplinas relevantes. El modelo de capacitación enfatizó el andamiaje y los entregables concretos, la enseñanza de herramientas y conceptos específicos y la creación de objetos de aprendizaje útiles para la instrucción y el alcance. Al emplear un modelo pedagógico basado en el aprendizaje, el programa tuvo más éxito que los intentos anteriores de capacitación en gestión de datos de investigación en toda la biblioteca en Berkeley. Este análisis detalla la gestión del programa, el diseño curricular.

La imparcialidad de los repositorios y sus datos

Ivanović, Dragan, Schmidt, Birgit, Grim, Rob, & Dunning, Alastair. (2019). FAIRness of Repositories & Their Data: A Report from LIBER’s Research Data Management Working Group. Zenodo, 2019. http://doi.org/10.5281/zenodo.3251593

Texto completo

Los repositorios de datos desempeñan un papel crucial en la evolución de la ciencia abierta. Los principios de datos FAIR establecen cómo hacer que los datos sean localizables, accesibles, interoperables y reutilizables (Wilkinson et al., 2016). Los principios FAIR son los siguientes:

Ser Localizable

F1. A los (meta)datos se les asigna un identificador globalmente único y eternamente persistente.
F2. los datos se describen con metadatos ricos.
F3. Los (meta)datos se registran o indexan en un recurso que permite realizar búsquedas.
F4. los metadatos especifican el identificador de los datos.


Ser accesible:

A1 los (meta)datos son recuperables por su identificador utilizando un protocolo de comunicación estandarizado.
A1.1 el protocolo es abierto, libre y universalmente implementable.
A1.2 el protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario.
A2 los metadatos son accesibles, incluso cuando los datos ya no están disponibles.


Ser interoperable

I1. Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento.
I2. Los (meta)datos utilizan vocabularios que siguen los principios FAIR.
I3. Los (meta)datos incluyen referencias cualificadas a otros (meta)datos.

Ser reutilizables

R1. Los (meta)datos tienen una pluralidad de atributos precisos y relevantes.
R1.1. Los (meta)datos se publican con una licencia de uso de datos clara y accesible.
R1.2. Los (meta)datos están asociados a su procedencia.
R1.3. Los (metadatos) cumplen con las normas comunitarias relevantes para el sector.

En el informe se resumen las mejores prácticas para la aplicación de los principios FAIR, tales como:

  • Deben utilizarse DOI, Handle, URN, URI o números generados localmente como identificadores permanentes para los registros de metadatos y datos.
  • Deben aplicarse, en la medida de lo posible, vocabularios globales estandarizados conocidos, como los vocabularios ISO para los códigos de países y lenguas, así como los vocabularios COAR, OpenAIRE y DataCite para los tipos de publicación/recursos, el estado de acceso y las funciones.
  • Los repositorios deberían conservar la información sobre la procedencia de los datos almacenada en los metadatos: creador, instituciones – editores, fuente, dirección de correo, año de publicación, año de producción, geolocalización, recolector de datos, gestor de datos, distribuidor, editor, financiador, productor, titular de derechos, patrocinador y supervisor.
  • Al mismo tiempo, las encuestas pusieron de manifiesto algunos malentendidos sobre los Principios FAIR, así como aplicaciones erróneas.

Malentendidos

Modelos de metadatos enriquecidos – La definición de lo que constituye un modelo de metadatos enriquecido no está bien definida, lo que conduce a una cierta incomprensión del principio F2 FAIR. En esta encuesta, la mayoría de los encuestados dijeron que utilizaban un modelo de datos enriquecido, pero 12 de los repositorios analizados tenían 13 o menos campos obligatorios. De ellos, ocho tenían siete o menos campos obligatorios.

Legibilidad mecánica – Casi el 80% de los encuestados dijo que sus repositorios cumplen completamente con el principio I1 FAIR: Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento). Esto significa que los humanos y los ordenadores deben ser capaces de intercambiar e interpretar los datos de los demás. Los datos deben ser legibles para las máquinas sin necesidad de algoritmos, traductores o mapeos especializados o ad hoc. Para garantizarlo, es fundamental utilizar (1) vocabularios controlados, ontologías y tesauros de uso común y (2) un marco bien definido para describir y estructurar los (meta)datos. Sin embargo, el 45% no contestó o dijo no saber si su repositorio podía mostrar metadatos en alguna tecnología de la web semántica como OWL, notación RDF. Cinco repositorios ofrecen metadatos en una tecnología de la web semántica, mientras que cuatro planean implementar esta característica. Los siete encuestados restantes informaron de que no existía esa posibilidad en su repositorio.

Procedencia de los metadatos – Aunque la procedencia de los (meta)datos (R1.2) debe describirse en un formato legible por máquina, algunas implementaciones de este principio FAIR incluyen una descripción de procedencia en texto libre o un archivo adjunto que describe la procedencia.

Falta de infraestructura – Teniendo en cuenta que el principio FAIR de I2 a menudo se pasa por alto y es bastante complicado de implementar, una infraestructura/plataforma/servicio que pueda ayudar en esta implementación debería ser una prioridad de la UE y otros programas de financiación.

Selección del repositorio de datos: criterios que importan

Data Repository Selection: Criteria that Matter. COAR, 2020

Ver original

Selección del repositorio de datos: Los criterios que importan son un conjunto de criterios propuestos por un grupo de (principalmente) editores. COAR tiene una serie de preocupaciones sobre estos criterios:

  • Actualmente, muchos repositorios no cumplen con los criterios . Hay una serie de repositorios de dominio, repositorios de datos generalistas y repositorios institucionales que no cumplen y no tienen los recursos para adoptar los criterios; (revisión anónima, soporte para versiones de datos, etc.). Los editores utilizarán estos criterios para indicar a los autores dónde pueden depositar sus datos y, por lo tanto, la mayoría de los repositorios serán descalificados.
  • Los criterios están concebidos de forma demasiado restringida. Los criterios preliminares actuales son una combinación de requisitos. Si bien no son intrínsecamente malos, aunque se inclinan hacia las necesidades de los editores de vincular y revisar los datos por pares, no incluyen otras consideraciones importantes sobre dónde un autor puede querer depositar. Por ejemplo, un autor puede preferir depositar datos en su propia jurisdicción, incluso si esos repositorios locales no cumplen con estos requisitos.
  • Los editores no deberían determinar dónde los autores depositan sus datos. Deberían ser los investigadores (y su financiador) quienes decidan la mejor ubicación para el depósito de datos. Este enfoque les da un gran control a estos editores para establecer el estándar de cumplimiento del repositorio. Con el tiempo, si cedemos el control a esos editores, esto podría (y probablemente lo hará) llevar a que solo los repositorios con recursos suficientes estén disponibles para los autores que publican en esas revistas.

Toolkit de herramientas de comunicación académica para la Implementación de prácticas de datos efectivas

Implementing Effective Data Practices Toolkit. Association of Research Libraries 2021

Texto completo

The Association of Research Libraries (ARL), California Digital Library (CDL), Association of American Universities (AAU), y Association of Public and Land-grant Universities (APLU) acaban de publicar un conjunto de herramientas de comunicación para facilitar la comunicación institucional y los debates en torno a la adopción generalizada de identificadores persistentes (PID) y planes de gestión de datos legibles por máquina (maDMP).

Este conjunto de herramientas de comunicación se basa en los resultados de una conferencia de 2019,“Implementing Effective Data Practices: A Conference on Collaborative Research Support,” , convocada por ARL, CDL, AAU y APLU y patrocinada por la US National Science Foundation (NSF). El objetivo general de la conferencia era explorar las formas en que las partes interesadas en las comunicaciones académicas pueden ayudar a implementar un ecosistema más conectado para la producción de datos de investigación. En el informe final se resumió un conjunto de recomendaciones para apoyar la adopción generalizada de identificadores persistentes (PID) y planes de gestión de datos (DMP) que puedan ser ejecutados por máquinas. En concreto, la conferencia identificó y determinó:

  • Determinar que barreras existen para implementar identificadores persistentes y planes de gestión de datos legibles por máquina
  • Qué tipos de flujos de trabajo modelo podrían eliminar esas barreras, minimizando al mismo tiempo la carga del profesorado
  • Qué significa la implementación para la gobernanza de los datos institucionales (por ejemplo, compartir los DMP entre unidades del campus, entre instituciones y públicamente)
  • Conclusiones que se pueden transmitir a los responsables políticos, a las agencias de financiación y a las instituciones para que puedan participar en un debate sobre los próximos pasos.
  • Recomendaciones de prácticas eficaces para las oficinas de subvenciones, incluida la orientación a sus investigadores

El Toolkit inlcuye

Guía práctica para la alineación internacional de la gestión de datos de investigación – Edición ampliada

 “Practical Guide To The International Alignment Of Research Data Management – Extended Edition”, Science Europe 2021

Texto completo

Lanzado en 2019, y tras de su aceptación exitosa por muchas organizaciones, la edición extendida presenta una nueva versión para facilitar la evaluación de un plan de gestión de datos (DMP). La guía también presenta los requisitos básicos para los DMP, los criterios para la selección de repositorios confiables y una guía para que los investigadores cumplan con los requisitos organizacionales.

Science Europe trabajará para promover estos requisitos a fin de garantizar que sean aceptados por el mayor número posible de partes interesadas.

Guía práctica para la alineación internacional de la gestión de datos de investigación

Europe Member Organisations, this guide aims to align research data management (RDM). Science Europe, 2019

Texto completo

Desarrollada por expertos de las organizaciones miembros de Science Europe, esta guía tiene como objetivo alinear los requisitos de la gestión de datos de investigación (RDM) en las distintas organizaciones de investigación. Science Europe trabajará para promover estos requisitos con el fin de garantizar que sean aceptados por el mayor número posible de interesados.