Archivo de la etiqueta: Curación de datos

preLights: sitio de curación de preprints para la comunidad de Biología

About us - preLights

Preprint highlights

A medida que el número de preprints crece, se hará cada vez más difícil encontrar y filtrar preprints relevantes/interesantes. preLights cuenta con un equipo de científicos revisa, destaca y comenta regularmente los preprints que consideran de interés para la comunidad biológica. En el sitio encontrarás un resumen de cada preprint, las razones por las que fue seleccionado y las ideas del selector sobre su significado. También podrás ver comentarios relevantes de los autores de los preprints. Y puedes también incluir tus propios pensamientos y comentarios.

The Company of Biologists es una organización editorial sin ánimo de lucro dedicada a apoyar e inspirar a la comunidad biológica. La Compañía publica cinco revistas especializadas revisadas por pares: Development, Journal of Cell Science, Journal of Experimental Biology, Disease Models & Mechanisms y Biology Open. Ofrece más apoyo a la comunidad biológica facilitando reuniones científicas, proporcionando becas a los investigadores y apoyando a las sociedades de investigación.

Conceptualización de las actividades de curación de datos en dos bibliotecas universitarias

 

b970de2323e4c535b70b3701b46e7f08

 

Lafferty-Hess, S., Rudder, J., Downey, M., Ivey, S., Darragh, J. and Kati, R., 2020. Conceptualizing Data Curation Activities Within Two Academic Libraries. Journal of Librarianship and Scholarly Communication, 8(1), p.eP2347. DOI: http://doi.org/10.7710/2162-3309.2347

 

A medida que los patrocinadores y las revistas crean políticas que requieren una gestión y un intercambio de datos eficaces, muchas instituciones han desarrollado programas de gestión de datos de investigación (RDM) para ayudar a los investigadores a cumplir con estos mandatos. Si bien no existe un conjunto estándar de servicios para estos programas de RDM, algunas instituciones, particularmente aquellas con repositorios que aceptan depósitos de datos, brindan servicios de conservación de datos como una forma de agregar valor a los datos de investigación y ayudar a que los datos sean más accesibles y reutilizables. Las comunidades de partes interesadas dentro del campo, como la Red de Conservación de Datos (DCN), también están desarrollando pautas, procedimientos y mejores prácticas para apoyar y expandir las prácticas de conservación de datos. 

Este documento examina las actividades de conservación de datos definidas por el DCN, y describe una actividad realizada por el personal de la biblioteca en la Universidad de Duke y la Universidad de Carolina del Norte en Chapel Hill para crear un modelo estructurado de estas tareas para conceptualizar y comunicar más fácilmente la conservación de datos dentro de estos dos entornos institucionales. El propósito de este documento es describir cómo este modelo proporcionó una base para la implementación y expansión de los servicios de conservación de datos en cada institución y concluye con las lecciones generales aprendidas.

A medida que desarrollamos nuestros servicios, las bibliotecas tienen la oportunidad de hacer que el trabajo de curaduría, a menudo invisible, sea más transparente. Este documento tiene como objetivo proporcionar un punto de referencia para otras bibliotecas a medida que consideran cómo ampliar sus programas de conservación de datos, así como contribuir a las discusiones sobre la priorización de los servicios, la evaluación del programa y la comunicación con las partes interesadas.

Humanidades digitales y Wikipedia. Planeta Biblioteca 202005/27.

 

fd0a803587d0721b99a141b67284d620

Ir a descargar

 

En esta ocasión hemos entrevistado a Iván Hernández Cazorla. Historiador que ha desarrollado su trayectoria profesional en torno a las Humanidades digitales y patrimonio cultural, y en en relación con el movimiento Wikimedia, Wikipedia, Wikidata ha trabajado en el proyecto Wikidata-IATEXT que consistió en la curación y estructuración de datos relacionados con los miembros del Instituto de Análisis y Aplicaciones Textuales (IATEXT) del «instituto universitario de la ULPGC

Fotografía:

Archivo: Wikidata Days 2019 – NOVA SBE, Carcavelos – IMG 20190607 133128.jpg. Licencia

OpenRefine – Guía básica para curar datos de investigación

 

openrefine

SiB Colombia (2019). OpenRefine – Guía básica, Limpieza de datos sobre biodiversidad. Sistema de Información sobre Biodiversidad de Colombia, Bogotá D.C., Colombia, 22 p.

Texto completo

 

OpenRefine (anteriormente Google Refine) es una herramienta que dispone de un conjunto de características para trabajar con datos tabulares que mejoran la calidad general de un conjunto de datos. Se trata de una aplicación que se ejecuta fuera de tu ordenador como un pequeño servidor web, al que se accede desde un navegador web. Debe pensar en OpenRefine como una aplicación web personal y de acceso privado. Es similar a las aplicaciones de hoja de cálculo ( y puede trabajar con formatos de archivo de hoja de cálculo) , sin embargo , se comporta más como un base de datos.

OpenRefine es utilizado por científicos, investigadores de datos, analistas de negocios, periodistas de datos y administradores de repositorios digitales en una variedad de disciplinas, los cuales necesitan datos utilizables y limpios. A pesar de no ser una herramienta complicada, si el usuario desea obtener el mayor provecho de OpenRefine, tendrá que aprender las principales características y herramientas con las cuales dispone.

 

Encuesta sobre la gestión y curación de datos de investigación en las universidades de Reino Unido

maxresdefault

Pham, Amy Surveying the state of data curation: a review of policy and practice in UK HEIs.,[Thesis] MSc thesis thesis, University of Strathclyde, 2018

Texto completo

 

A medida que las organizaciones de financiación de la investigación pública del Reino Unido reconocen cada vez más el valor de los datos de investigación, de esta manera se ha presionado a las instituciones de educación superior para que proporcionen acceso a los datos de investigación o se arriesguen a no obtener financiación en el futuro. Como resultado se han creado rápidamente diferentes servicios de gestión de datos de investigación en los últimos años. Sin embargo, no está claro si estos servicios garantizan efectivamente la gestión o preservación de datos a largo plazo o si aplican las medidas de curación de datos adecuadas.

A través de una metodología de tres partes, la investigación pretendía proporcionar una imagen clara del estado actual de la curación de datos en las instituciones de enseñanza superior del Reino Unido, incluyendo la adhesión a las mejores prácticas y la existencia de disposiciones para los esfuerzos de conservación de datos. Se distribuyó un cuestionario de encuesta como método principal de recopilación de datos y se recopiló información adicional mediante un examen de la bibliografía y un análisis de los recursos en línea y las políticas institucionales.

Se encontró que las prácticas de conservación de los datos eran en su mayoría incompatibles con las mejores prácticas y se centraban en gran medida en facilitar el acceso a los datos de la investigación. Sin embargo, existe una conciencia de la conservación de datos, especialmente la preservación, y se están haciendo esfuerzos para mejorar estas áreas. Se comprobó que las políticas institucionales eran principalmente documentos que definían funciones y responsabilidades y proporcionaban poca orientación para el seguimiento. El papel de los investigadores fue enfatizado repetidamente tanto en la política como en la práctica y fue esencial para comprender el estado actual de la conservación de los datos.

Importancia de la curación de datos para los investigadores. Brechas y oportunidades para las bibliotecas universitarias

75570927950ae56bba853559e1b813d2

Johnson, L.R., et al. (2018). How Important Are Data Curation Activities to Researchers? Gaps and Opportunities for Academic Libraries. Journal of Librarianship and Scholarly Communication, 6(General Issue), eP2198. https://doi.org/10.7710/2162-3309.2198

Curaduría de datos, según la definición de la Escuela de Posgrado en Biblioteconomía y Ciencias de la Información de la Universidad de Illinois: «es la gestión activa y continua de los datos a lo largo de su ciclo de vida de vida y utilidad.»

Por su parte, Sayeed Choudhury, Decano Asociado de Gestión de Datos de Investigación de la Universidad Johns Hopkins (JHU, por sus siglas en inglés) y líder de Data Conservancy, detalla las actividades iterativas de Data Curation:

  • Conservar: Recolección y cuidado de los datos de la investigación.
  • Compartir: Revelar el potencial de los datos en todos los dominios
  • Descubrir: Promover la reutilización y las nuevas combinaciones de datos

Según Alation: «En la práctica, la curación de datos se ocupa más del mantenimiento y la gestión de los metadatos que de la propia base de datos y, con ese fin, gran parte del proceso de curación de datos gira en torno a la gestión de metadatos como el esquema, la estructura de tablas y columnas, el uso.. Los curadores de datos no sólo crean, administran y mantienen los datos, sino que también pueden participar en la determinación de las mejores prácticas para trabajar con esos datos. Los curadores de datos a menudo presentan los datos en un formato visual como un gráfico, un tablero o un informe».

Para techrepublic, Los procesos de recolección de datos de diversas fuentes y su integración en repositorios proporcionan un valor añadido mucho más valioso que estando en bases de datos independientes, ya que de esta manera pueden ser remezclados y rehutilizados con diferentes propósitos. Ya que la curaduría digital implica mantener, preservar y agregar valor a los datos de la investigación digital a lo largo de su ciclo de vida, incluyendo la organización, descripción, limpieza, mejora y conservación de los datos para uso público.

El proceso conlleva:

  • Detección y recuperación de datos.
  • Mantener la calidad de datos.
  • Agregar valor.
  • Proporcionar la reutilización de los datos a lo largo del tiempo.
  • Maximizare el acceso.

Por lo tanto, ¿Qué importancia tienen las actividades de curación de datos para los investigadores? Brechas y oportunidades para las bibliotecas académicas.

La curación de datos promete ser un servicio emergente para las bibliotecas universitarias, pero los investigadores activamente «curan» sus datos de varias maneras, incluso si la terminología no siempre se adecua a la situación. Sobre la base de las evaluaciones de necesidades de usuario realizadas en el pasado a través de encuestas y grupos focales, los autores buscaron la opinión directa de los investigadores sobre la importancia y la utilización de actividades específicas de curación de datos.

De este modo entre el el 21 de octubre de 2016 y el 18 de noviembre de 2016, el equipo de estudio realizó grupos focales con 91 participantes en seis instituciones académicas diferentes para determinar qué actividades de curación de datos eran más importantes para los investigadores, qué actividades estaban actualmente en curso y qué nivel de satisfacción tenían con los resultados.

Los resultados muestran que los investigadores participan activamente en una variedad de actividades de curación de datos, y si bien consideraron que la mayoría de las actividades de curación de datos son muy importantes, la mayoría de la muestra manifestó su insatisfacción con el estado actual de curación de datos en su institución. Estos hallazgos demuestran brechas y oportunidades específicas para que las bibliotecas universitarias enfoquen sus servicios de curación de datos para satisfacer de manera más efectiva las necesidades de los investigadores. Para de este modo, las bibliotecas de investigación participen en estos servicios más activamente invirtiendo y promoviendo servicios altamente valorados que actualmente muchos investigadores no pueden utilizar.

 

Kit de curación de datos a lo largo de todo el ciclo vital de los datos

1

Hudson-Vitale, C., H. Imker, et al. [e-Book]  SPEC Kit 354: Data Curation (May 2017). Chicago, ACRL, 2017.

Texto completo

Más contenidos sobre 

La Association of Research Libraries (ARL) ha publicado Data Curation, SPEC Kit 354, un análisis de la infraestructura que las instituciones miembros de ARL están utilizando para el manejo activo y continuo de datos en todo su ciclo de vida y la utilidad que tiene para actividades académicas y académicas.

Este kit de SPEC explora la infraestructura que las instituciones miembros de ARL están usando para la recuperación de datos, cuáles servicios de recuperación de datos se ofrecen, quiénes pueden usarlos, qué disciplinas demandan más servicios, niveles de intervención del personal de biblioteca, políticas y flujos de trabajo y los desafíos que implica apoyar estas actividades.

Cómo realizar el seguimiento de los datos de investigación con métricas

 

research-data-metrics

Ball, A. and M. Duke (2015). [e-Book] How to Track the Impact of Research Data with Metrics, Digital Curation Centre, 2015

Texto completo

Esta guía ayudará a rastrear y medir el impacto de los datos de la investigación, ya sea propio o de una institución. El documento proporciona una visión general de los conceptos clave de medición de impacto y los servicios y herramientas disponibles para medir el impacto. Después de discutir algunos de los problemas y retos actuales, proporciona algunas sugerencias sobre cómo mejorar el impacto de los propios datos. Esta guía es del interés de investigadores que trabajan en la investigación de los datos pertinentes, gestores en el ámbito de la evaluación de la calidad de la investigación,bibliotecarios y otros que ayudan a realizar un seguimiento del impacto de los datos dentro de las instituciones.

Data Curation Network : seis bibliotecas universitarias se asocian para desarrollar una red de curación de datos

26914859940_0003f384cc_d

The Data Curation Network

Seis de las grandes bibliotecas universitarias y de investigación estadounidenses, han creado una red para desarrollar el proyecto “Data Curation Network”,  con el objetivo de mejorar el apoyo al investigador  El proyecto tienen como base preparar los datos digitales de investigación para el acceso abierto y la reutilización o lo que se denomina Research Data Managemant (RDM). Lo que permitirá a las bibliotecas universitarias trabajar colectivamente y de manera más eficaz, con una variedad más amplia de tipos de datos (por ejemplo, disciplina, formato de archivo, etc.) más allá de lo que podría ofrecer una institución por si sola. El proyecto en principio tiene un año de duración y está financiado por la Fundación Alfred P. Sloan.

El desarrollo tiene como objetivo investigar y definir los flujos de trabajo y mecanismos de curación de datos a través de reuniones de un equipo profesional estructurado, para definir las pautas de trabajo a partir de otras experiencias y conocimientos previos adquiridos por cada una de las instituciones participantes. Para ello se han planteado tres acciones:

  • Establecer parámetros y controlar el esfuerzo (por ejemplo, el costo, tiempo, experiencia) en cada una de las seis instituciones participantes (Universidad de Minnesota, Cornell Univ, Penn State Univ, Univ de Illinois, Univ de Michigan y Washington Univ St. Louis )
  • Solicitar información a los investigadores para comprender mejor en que medida los servicios de curación datos se adaptan a las necesidades del flujo de trabajo de investigación y gestión de datos, a través de las actividades de participación informales realizadas en paralelo en cada uno de los campus.
  • Desarrollar un modelo para el intercambio de datos entre las instituciones con el objetivo de proporcionar servicios de custodia de información en el que se tenga en cuenta la dotación de personal, costos, conjuntos de habilidades, y la demanda necesaria para su implementación.

El resultado de este proyecto pretende establecer un modelo de gestión y curación de datos que proporcionará una serie de conocimientos sobre como puede ser implementado, evaluado, y sostenido por un grupo de instituciones académicas que será de interés para otras experiencias futuras.