Archivo de la etiqueta: Gestión de datos de investigación

Vivir con los datos: comprensión pública y percepciones de las prácticas de datos

Helen Kennedy, Susan Oman, Mark Taylor, Jo Bates, Robin Steedman. Living With Data: knowledge, experiences and perceptions of data practices University of Sheffield, 2021

Texto completo

Living With Data: knowledge, experiences and perceptions of data practices ha llevado a cabo una amplia revisión de la investigación empírica existente sobre la comprensión y las percepciones del público sobre las prácticas de datos. La revisión se publicó el 21 de mayo de 2020.

Se dice que la recopilación y el uso omnipresentes de datos digitales tiene efectos de gran alcance. A medida que se han incrementado estas prácticas, el interés por cómo las percibe el públicoha comenzado a crecer. Se considera importante comprender la opinión del público sobre las prácticas de datos de los datos para garantizar que los datos trabajen «para las personas y la sociedad» (misión del Instituto Ada Lovelace) y sean «una fuerza para el bien».

Para conocer mejor la opinión del público sobre las prácticas de datos, se llevó a cabo una revisión de la investigación empírica original de la percepción, la actitud y los sentimientos del público sobre las prácticas de datos. Se usa el término «prácticas de datos» para referirse a la recopilación sistemática análisis e intercambio de datos y los resultados de estos procesos. Los datos que se encuentran en el centro de estas prácticas suelen ser los datos personales, y la investigación relacionada se centra a menudo en estos datos. Esta revisión también abarcó fenómenos relacionados, como la IA y el reconocimiento facial.

Se realizó una búsqueda sistemática en las bases de datos de de investigación académica en línea y una búsqueda manual, que comenzó con la literatura con la que ya estábamos familiarizados. La revisión abarcó una amplia gama de disciplinas académicas y la literatura gris, es decir – de la sociedad civil, del tercer sector, del gobierno o de empresas.

Utilización de datos en las bibliotecas: de la desilusión a la productividad

Pace, Andrew K. 2020. «Utilisation des données liées dans les bibliothèques : de la désillusion à la productivité.» Archimag  (Bibliothèque Édition) 09 July 2020.

Texto completo

OCLC lleva más de una década investigando el uso de los datos enlazados en las bibliotecas. A veces es difícil saber exactamente dónde reside el valor de los datos enlazados y qué beneficios podemos obtener de ellos. Por ello, es conveniente considerar su utilidad desde el punto de vista del personal de la biblioteca. ¿Qué significa la «productividad de los datos enlazados»? ¿Qué cambiaría la catalogación de los datos enlazados para el personal de la biblioteca y los usuarios finales? Este artículo responde a estas preguntas y ofrece una perspectiva sobre el panorama de los datos enlazados para las bibliotecas.

Visualización de datos con R para la colección digital

Glowacka-Musial, Monika «Data Visualization with R for Digital Collections» Library Technology Reports vol. 57, no. 1 (January 2021)

Texto completo

Desde la década de 1990, las bibliotecas han invertido en el desarrollo de colecciones digitales y servicios en línea para facilitar el acceso a fuentes históricas. Una forma de inspirar a los usuarios para que se comprometan activamente con estos materiales es crear contextos visuales para los mismos. Estos elementos visuales proporcionan una visión general del contenido de una colección e inspiran a los usuarios a experimentar con los datos de la colección para diversos fines, incluida la investigación.

Este número de Library Technology Reports (vol. 57, nº 1) presenta un enfoque que considera las colecciones digitales como datos que pueden ser extraídos, analizados y visualizados mediante el lenguaje de programación R. R es de código abierto, relativamente fácil de aprender y cuenta con el apoyo de una comunidad establecida de programadores. La selección de gráficos que se presenta en el informe incluye scripts de R, fragmentos de tablas de datos y alguna explicación del código de R utilizado para crear los gráficos.

Datos científicos abiertos: por qué es importante elegir y reutilizar los datos adecuados

Lipton, V. [e-Book] Open Scientific Data : Why Choosing and Reusing the RIGHT DATA Matters, london: IntechOpen 2020.

Texto completo

Este libro muestra cómo la visión del acceso abierto a los datos científicos puede alcanzarse más fácilmente mediante un modelo por etapas que los financiadores de la investigación, los responsables políticos, los científicos y las organizaciones de investigación pueden adoptar en su práctica. Basándose en su propia experiencia con el procesamiento de datos, en los primeros resultados de los datos científicos abiertos en el CERN (la Organización Europea para la Investigación Nuclear) y en estudios de casos de datos de ensayos clínicos compartidos, la autora actualiza nuestra comprensión de los datos de investigación: qué son, cómo evolucionan dinámicamente en las distintas disciplinas científicas y en las diversas etapas de la práctica de la investigación, y cómo pueden, y de hecho deben, compartirse en cualquiera de esas etapas. El resultado es un camino flexible y pragmático para implementar los datos científicos abiertos.

Plataformas de repositorios de datos: una guía básica


Data Repository Platforms: A Primer”. Ithaka S+R, 2021

Texto completo

En la guía de recoge una variedad de características de los principales repositorios de datos que puede ser útil para los investigadores

Las plataformas de repositorio incluidas en el informe resumido son

  • Dryad
  • Figshare
  • Harvard Dataverse
  • ICPSR
  • Mendeley Data
  • Roper Center for Public Opinion Research
  • Zenodo

Datos abiertos en gobiernos locales: hacia los Objetivos de Desarrollo Sostenible

Galizzi, Bruno. «Datos abiertos en gobiernos locales: hacia los Objetivos de Desarrollo Sostenible«. Fundación Internacional Baltasar Garzón (FIBGAR) 2020 DOI: 10.6084/m9.figshare.13072691.

Texto completo

La Agenda de Desarrollo Sostenible de 2030 definida por Naciones Unidas tiene como objetivo orientar las acciones a nivel global para atender las problemáticas más relevantes. Los objetivos de desarrollo sostenible son una guía para un fortalecimiento más igualitario, diverso, justo y medio-ambientalmente responsable para la realización de esfuerzos comunitarios en su resolución. Los beneficios de los Datos Abiertos para medir el desarrollo sostenible han sido también demostrados para: (i) la mejora de la eficiencia y cobertura de los servicios públicos, (ii) aumentar la transparencia, rendición de cuentas y participación ciudadana y (iii) facilitar el intercambio de información con los Gobiernos. Contar con una agenda de Datos Abiertos es un requisito y una necesidad para avanzar con compromiso y constancia en el cumplimiento de los ODS 2030.

Informe anual del Inventario de datos abiertos (ODIN) 2020/21

ODIN Open Data Inventory 2020/21

Texto completo

Open Data Watch lanza el Informe Anual del Inventario de Datos Abiertos (ODIN) 2020/21 que evalúa la cobertura y la apertura de las estadísticas oficiales en 187 países. ODIN monitorea el progreso de los datos abiertos que son relevantes para el desarrollo económico, social y ambiental. 

El año 2020 fue un año desafiante para el mundo, ya que los países se enfrentaron a la pandemia de COVID-19. No obstante, y a pesar del impacto negativo de la pandemia en la capacidad de los productores de estadísticas, en 2020 se registró un gran avance en los datos abiertos. En el informe completo se presentan las historias de ocho países que han logrado mejoras sustanciales en la cobertura y apertura de sus sistemas estadísticos.

Sin embargo, el progreso no se distribuyó de manera uniforme. Los países de todas las regiones todavía luchan por publicar datos de género y muchos de los mismos países no pueden proporcionar datos desglosados ​​por sexo sobre la pandemia de COVID-19. Y los países de bajos ingresos continúan necesitando apoyo para el desarrollo de capacidades y recursos financieros adicionales para superar las barreras a la publicación de datos abiertos.

Los puntajes promedio de apertura han aumentado de manera constante desde 2016. Los puntajes de cobertura disminuyeron en 2017, en parte debido a cambios en la metodología ODIN, pero han ido aumentando desde entonces. Para los 187 países incluidos en el ODIN 2020/21, los cinco elementos de apertura aumentaron en un 30 por ciento desde 2016, mientras que los cinco elementos de cobertura aumentaron en un 18 por ciento. Debido a un cambio significativo en la cobertura de países, los puntajes de 2015 no se muestran en este ni en los gráficos y tablas posteriores

Los datos abiertos aumentan el impacto de las revistas

Zhang, L., Ma, L. Does open data boost journal impact: evidence from Chinese economicsScientometrics (2021). https://doi.org/10.1007/s11192-021-03897-z

Texto completo

Para fomentar la transparencia de la investigación y su reproducción, cada vez más revistas exigen a los autores que compartan los conjuntos de datos originales y los procedimientos analíticos que respaldan sus publicaciones. ¿Impulsan los datos abiertos el impacto de las revistas? En este artículo, se presenta uno de los primeros estudios empíricos que evalúan los efectos de los datos abiertos en el impacto de las revistas.

La revista China Industrial Economics (CIE) obligó a los autores a poner en abierto los datos de sus investigaciones a finales de 2016, siendo la primera en adoptar los datos abiertos entre las revistas chinas y proporcionando un experimento natural para la evaluación de políticas. Para ello se utilizaron los datos de 37 revistas chinas de economía de entre 2001 a 2019 y se aplicó el método de control sintético para estimar causalmente los efectos de los datos abiertos, los resultados muestran que los datos abiertos han aumentado significativamente las citas de los artículos de las revistas. De promedio, las citas actuales y de segundo año de los artículos publicados con CIE han aumentado entre 1 y 4 veces, y los artículos publicados antes de la política de datos abiertos también se beneficiaron del efecto indirecto. Los resultados sugieren que las revistas pueden aprovechar los datos abiertos obligatorios para desarrollar su reputación y amplificar el impacto académico.

Capacitación en gestión de datos basada por dominios para bibliotecarios de enlace

Wittenberg, J., Sackmann, A., & Jaffe, R. (2018). Situating Expertise in Practice: Domain-Based Data Management Training for Liaison Librarians. Journal of Academic Librarianship44(3), 323–329. https://doi.org/10.1016/j.acalib.2018.04.004

Texto completo

El equipo de gestión de datos de investigación de la Universidad de California en Berkeley implementó un Programa de formación de bibliotecarios basado en dominios para mejorar las habilidades de los bibliotecarios de enlace en los principios de gestión de datos de investigación y crear una comunidad de práctica entre los bibliotecarios que brindan apoyo a los datos de investigación. El programa de capacitación se asoció con representantes de cada división temática de la Biblioteca para integrar contenido de disciplinas relevantes. El modelo de capacitación enfatizó el andamiaje y los entregables concretos, la enseñanza de herramientas y conceptos específicos y la creación de objetos de aprendizaje útiles para la instrucción y el alcance. Al emplear un modelo pedagógico basado en el aprendizaje, el programa tuvo más éxito que los intentos anteriores de capacitación en gestión de datos de investigación en toda la biblioteca en Berkeley. Este análisis detalla la gestión del programa, el diseño curricular.

La imparcialidad de los repositorios y sus datos

Ivanović, Dragan, Schmidt, Birgit, Grim, Rob, & Dunning, Alastair. (2019). FAIRness of Repositories & Their Data: A Report from LIBER’s Research Data Management Working Group. Zenodo, 2019. http://doi.org/10.5281/zenodo.3251593

Texto completo

Los repositorios de datos desempeñan un papel crucial en la evolución de la ciencia abierta. Los principios de datos FAIR establecen cómo hacer que los datos sean localizables, accesibles, interoperables y reutilizables (Wilkinson et al., 2016). Los principios FAIR son los siguientes:

Ser Localizable

F1. A los (meta)datos se les asigna un identificador globalmente único y eternamente persistente.
F2. los datos se describen con metadatos ricos.
F3. Los (meta)datos se registran o indexan en un recurso que permite realizar búsquedas.
F4. los metadatos especifican el identificador de los datos.


Ser accesible:

A1 los (meta)datos son recuperables por su identificador utilizando un protocolo de comunicación estandarizado.
A1.1 el protocolo es abierto, libre y universalmente implementable.
A1.2 el protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario.
A2 los metadatos son accesibles, incluso cuando los datos ya no están disponibles.


Ser interoperable

I1. Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento.
I2. Los (meta)datos utilizan vocabularios que siguen los principios FAIR.
I3. Los (meta)datos incluyen referencias cualificadas a otros (meta)datos.

Ser reutilizables

R1. Los (meta)datos tienen una pluralidad de atributos precisos y relevantes.
R1.1. Los (meta)datos se publican con una licencia de uso de datos clara y accesible.
R1.2. Los (meta)datos están asociados a su procedencia.
R1.3. Los (metadatos) cumplen con las normas comunitarias relevantes para el sector.

En el informe se resumen las mejores prácticas para la aplicación de los principios FAIR, tales como:

  • Deben utilizarse DOI, Handle, URN, URI o números generados localmente como identificadores permanentes para los registros de metadatos y datos.
  • Deben aplicarse, en la medida de lo posible, vocabularios globales estandarizados conocidos, como los vocabularios ISO para los códigos de países y lenguas, así como los vocabularios COAR, OpenAIRE y DataCite para los tipos de publicación/recursos, el estado de acceso y las funciones.
  • Los repositorios deberían conservar la información sobre la procedencia de los datos almacenada en los metadatos: creador, instituciones – editores, fuente, dirección de correo, año de publicación, año de producción, geolocalización, recolector de datos, gestor de datos, distribuidor, editor, financiador, productor, titular de derechos, patrocinador y supervisor.
  • Al mismo tiempo, las encuestas pusieron de manifiesto algunos malentendidos sobre los Principios FAIR, así como aplicaciones erróneas.

Malentendidos

Modelos de metadatos enriquecidos – La definición de lo que constituye un modelo de metadatos enriquecido no está bien definida, lo que conduce a una cierta incomprensión del principio F2 FAIR. En esta encuesta, la mayoría de los encuestados dijeron que utilizaban un modelo de datos enriquecido, pero 12 de los repositorios analizados tenían 13 o menos campos obligatorios. De ellos, ocho tenían siete o menos campos obligatorios.

Legibilidad mecánica – Casi el 80% de los encuestados dijo que sus repositorios cumplen completamente con el principio I1 FAIR: Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento). Esto significa que los humanos y los ordenadores deben ser capaces de intercambiar e interpretar los datos de los demás. Los datos deben ser legibles para las máquinas sin necesidad de algoritmos, traductores o mapeos especializados o ad hoc. Para garantizarlo, es fundamental utilizar (1) vocabularios controlados, ontologías y tesauros de uso común y (2) un marco bien definido para describir y estructurar los (meta)datos. Sin embargo, el 45% no contestó o dijo no saber si su repositorio podía mostrar metadatos en alguna tecnología de la web semántica como OWL, notación RDF. Cinco repositorios ofrecen metadatos en una tecnología de la web semántica, mientras que cuatro planean implementar esta característica. Los siete encuestados restantes informaron de que no existía esa posibilidad en su repositorio.

Procedencia de los metadatos – Aunque la procedencia de los (meta)datos (R1.2) debe describirse en un formato legible por máquina, algunas implementaciones de este principio FAIR incluyen una descripción de procedencia en texto libre o un archivo adjunto que describe la procedencia.

Falta de infraestructura – Teniendo en cuenta que el principio FAIR de I2 a menudo se pasa por alto y es bastante complicado de implementar, una infraestructura/plataforma/servicio que pueda ayudar en esta implementación debería ser una prioridad de la UE y otros programas de financiación.