Archivo de la etiqueta: Research Data Management (RDM)

Bibliotecas y Gestión de Datos de Investigación en Humanidades y Ciencias Sociales

 

26739302624_7aae4975cb_o_d

Johnsson, M. and J. Åhlfeldt (2015 ). [e-Book] Research Libraries and Research Data Management within the Humanities and Social Sciences Lund: University of Lund, 2015

Texto completo

Presentación

Gestión de Datos de Investigación (RDM) es un proceso diseñado para procesar los conjuntos de datos de alta calidad, que cumplan con los requisitos académicos, legales y éticos. A priori es importante tener en cuenta que la investigación en gestión de datos exige de una nueva forma de organizar la información a través de tareas específicas y necesita de un esfuerzo importante de inversión en el aprendizaje de nuevos sistemas, métodos de trabajo y colaboración.

Hay dos salidas del proceso de RDM:

1. La preservación a largo plazo de los conjuntos de datos mediante sistemas de almacenamiento.

2. Compartir y reutilizar de los conjuntos los datos para la investigación y otros fines sociales.

Esta propuesta hace hincapié en la creación de una organización coherente de gestión de datos de investigación en la Universidad de Lund, que utiliza los recursos existentes tanto dentro como fuera de la universidad y establece nuevas unidades de organización y sistemas de información, específicos para esta nueva tarea. Se propone la creación de una nueva unidad para la Gestión de Datos de Investigación y Coordinación en la Biblioteca de la Universidad cuya responsabilidad sería la de coordinar la red de agentes existentes que apoyan las actividades de investigación, tales como expertos procedentes de bibliotecas, aspectos legales, archivo y en gestión de datos. Además, proponen la creación de un nuevo sistema de información, el Directorio de la Universidad de Lund sobre conjuntos de datos, lo que facilitará la gestión de bases de datos y recuperación de la información en todo el ciclo de vida de los datos.

Los conjuntos de datos de investigación podrían ser depositados en repositorios nacionales o disciplinarias para archivar y compartir,  al igual que las tecnologías de la web semántica requerirá los servicios de datos en línea no previstos actualmente  Por lo que de momento se propone la creación de un laboratorio de datos dentro de la red RDM en la Universidad de Lund.

Data Curation Network : seis bibliotecas universitarias se asocian para desarrollar una red de curación de datos

26914859940_0003f384cc_d

The Data Curation Network

Seis de las grandes bibliotecas universitarias y de investigación estadounidenses, han creado una red para desarrollar el proyecto “Data Curation Network”,  con el objetivo de mejorar el apoyo al investigador  El proyecto tienen como base preparar los datos digitales de investigación para el acceso abierto y la reutilización o lo que se denomina Research Data Managemant (RDM). Lo que permitirá a las bibliotecas universitarias trabajar colectivamente y de manera más eficaz, con una variedad más amplia de tipos de datos (por ejemplo, disciplina, formato de archivo, etc.) más allá de lo que podría ofrecer una institución por si sola. El proyecto en principio tiene un año de duración y está financiado por la Fundación Alfred P. Sloan.

El desarrollo tiene como objetivo investigar y definir los flujos de trabajo y mecanismos de curación de datos a través de reuniones de un equipo profesional estructurado, para definir las pautas de trabajo a partir de otras experiencias y conocimientos previos adquiridos por cada una de las instituciones participantes. Para ello se han planteado tres acciones:

  • Establecer parámetros y controlar el esfuerzo (por ejemplo, el costo, tiempo, experiencia) en cada una de las seis instituciones participantes (Universidad de Minnesota, Cornell Univ, Penn State Univ, Univ de Illinois, Univ de Michigan y Washington Univ St. Louis )
  • Solicitar información a los investigadores para comprender mejor en que medida los servicios de curación datos se adaptan a las necesidades del flujo de trabajo de investigación y gestión de datos, a través de las actividades de participación informales realizadas en paralelo en cada uno de los campus.
  • Desarrollar un modelo para el intercambio de datos entre las instituciones con el objetivo de proporcionar servicios de custodia de información en el que se tenga en cuenta la dotación de personal, costos, conjuntos de habilidades, y la demanda necesaria para su implementación.

El resultado de este proyecto pretende establecer un modelo de gestión y curación de datos que proporcionará una serie de conocimientos sobre como puede ser implementado, evaluado, y sostenido por un grupo de instituciones académicas que será de interés para otras experiencias futuras.

Una introducción a la Ciencia de los Datos

introduction-to-data-science

Stanton, J. M. (2013). [e-Book] An Introduction to Data Science. Syracuse, Syracuse University, 2013

Texto completo

La ciencia de los datos se refiere a un área emergente de trabajo relacionado con la recolección, preparación, análisis, visualización, administración y conservación de grandes colecciones de información. Aunque el nombre de Datos Científicos parece conectar más fuertemente con áreas tales como bases de datos y la informática, incluye diferentes tipos de habilidades – incluyendo las habilidades matemáticas. Para algunos, el término «ciencia de datos» evoca imágenes de estadísticos con batas blancas de laboratorio que miran fijamente parpadear la pantalla del ordenador llenos de números en desplazamiento. Nada mas lejos de la verdad. En primer lugar, los estadísticos no llevan batas de laboratorio: esta moda está reservada para los biólogos, médicos, y otros que tienen que mantener su ropa limpia en ambientes asepticos. En segundo lugar, muchos de los datos en el mundo no son numéricos ni estructurados. En este contexto, no estructurado significa que los datos no están dispuestos en filas y columnas ordenadas. Por ejemplo una página web con fotografías y mensajes cortos entre amigos. Si bien es cierto que las empresas, las universidades y los gobiernos utilizan un montón de información numérica – ventas de productos, promedios de calificaciones, evaluaciones fiscales son algunos ejemplos. Así que, aunque siempre es útil tener buenas habilidades matemáticas, hay mucho por hacer en el mundo de la ciencia de los datos para aquellos que generalmente trabajamos con palabras, listas, fotografías, sonidos, y otros tipos de información. Además, la ciencia de los datos es mucho más que un simple análisis de datos. Hay muchas personas que disfrutan del análisis de datos, y que podría felizmente pasar todo el día mirando histogramas y medias, pero para aquellos que prefieren otras actividades, la ciencia de los datos ofrece una gama desarrollos y requiere una serie de habilidades. Vamos a considerar esta idea pensando en algunos de los datos subyacentes que hay en transacciones tan cotidianas como la compra de una caja de cereales.

El papel de los bibliotecarios en la gestión de datos de investigación

 

 aaeaaqaaaaaaaau2aaaajdy4nmu4mmniltc2mjutndzims1hzdbklwjhnmu5zwewownhza

Elaine R. Martin. The Role of Librarians in Data Science: A Call to Action”. Journal of eScience Librarianship, Vol 4, No 2 (2015)

Texto completo

El aumento del volumen y organización de la información capturada por las empresas y organizaciones, el aumento de los multimedia, las redes sociales y la “Internet de las cosas” van a impulsar un crecimiento exponencial de los datos en el futuro. Datos de registros de llamadas, transacciones de banca móvil, contenido generado por el usuario de internet, tales como blogs y tweets, búsquedas en línea, imágenes de satélite, etc. es información procesable que requiere el uso de técnicas computacionales para dar a conocer las tendencias y patrones dentro de y entre éstos extremadamente grandes conjuntos de datos socioeconómicos.

Debido a esta aceleración de la tendencia, hospitales, escuelas, colegios, fabricantes, minoristas, agencias gubernamentales, y las bibliotecas han comenzado a recoger y almacenar enormes cantidades de datos. El objetivo es hacer que el uso de estos datos pueda proporcionar nuevos y valiosos servicios o mejorar la eficiencia. El problema para alcanzar estas metas es que a medida que la cantidad de almacenamiento y procesamiento ha crecido, la complejidad de los datos y los retos de gestión son más complejos.

Los bibliotecarios siempre hemos sido valiosos en la gestión y organización de la información. Esta es una habilidad fundamental en la ciencia de datos; que se manifiesta con mayor fuerza en el componente de curación de datos a gran escala. Muchos bibliotecarios también son destacados comunicadores y han sido formados en el arte y la ciencia de la transformación de la información, las necesidades de los usuarios y en las estrategias y recursos para la investigación y el aprendizaje. Así que los bibliotecarios tienen claramente un papel en el inicio y el final de la gran problema de los datos. La tarea esencial del profesional de la ciencia de datos es transformar, datos brutos desordenados en conocimiento procesable que puede ser utilizado por los tomadores de decisiones.

Según David Lankes, un bibliotecario no tiene que convertirse en un programador, pero debe estar interesado en la creación de conocimiento, debe tener cierta familiaridad con la forma esencial de las diversas herramientas de software que pueden transformar los datos. Un bibliotecario no tiene que ser un ingeniero de base de datos, pero debe comprender los fundamentos de las herramientas de recuperación de información. Un bibliotecario no tiene por qué ser un estadístico, pero debe tener una comprensión clara de cómo se gestionan los datos numéricos para que puedan ser adecuadamente utilizados. Por último, un bibliotecario no tiene por qué ser un diseñador gráfico, pero tiene que reconocer las características necesarias para hacer una presentación de datos eficaces.

Muchas instituciones académicas y sus bibliotecas han desarrollado servicios de gestión de datos de investigación , pero a veces los objetivos institucionales, organizaciones profesionales, y las funciones actuales y futuras de los bibliotecarios no siempre están adecuadamente sincronizadas. En este número de «Journal of eScience Librarianship», los bibliotecarios informan como están desarrollando servicios sobre Gestión de Datos de Investigación (RDM) y como con frecuencia se enfrentan a obstáculos institucionales y profesionales.

¿Hacia dónde se dirige la biblioteca de investigación del futuro?

Alonso-Arévalo, Julio. ¿Hacia dónde se dirige la biblioteca de investigación del futuro?. XII Jornadas APDIS Coimbra, 20-22 de abirl de 2016. Coimbra: APDIS, 2016

Texto completo

presentación en Prezi

“El profesional de la información es la biblioteca del futuro” (Harris 2012).

Resumen: Si hay una palabra que define nuestro tiempo es cambio. La tecnología, las necesidades y preferencias de los usuarios están ayudando a impulsar el cambio en las bibliotecas de todo tipo. El nuevo concepto de biblioteca de investigación del futuro conlleva un cambio que implica una toma de postura a veces desafiante y controvertida. Las bibliotecas están transformándose, reimaginando sus espacios, definiendo sus misión y ampliando sus servicios para continuar siendo relevantes en el futuro. La biblioteca universitaria y de investigación se está convirtiendo rápidamente en un centro multifacético diseñado para soportar una amplia y variada gama de actividades de investigación y de aprendizaje tanto para estudiantes como para investigadores. Este documento analiza las principales tendencias de futuro de la biblioteca científica tales como la gestión y vinculación de grandes conjuntos de datos, servicios a través de dispositivos digitales, evolución de la apertura de la educación superior, aprendizaje basado en competencias, métricas alternativas, y humanidades digitales;  lo que afectará a la transformación del espacio, las colecciones y a las tareas desarrolladas por los profesionales más orientadas al apoyo al aprendizaje que a las tareas tradicionales.

Descriptores: bibliotecas universitarias, bibliotecas públicas, futuro, tendencias, Big data, Alfabetización informacional, Enseñanza virtual, Espacios, Tecnologías de la Información

Abstract: Technology, needs and preferences of users are helping to drive change in libraries of all kinds. The new concept of research library of the future involves a change  which is taking a stance sometimes challenging and controversial. Libraries are changing, reimagining spaces, defining its mission and expand its services to remain relevant in the future. The academic and research library is fast becoming a multifaceted facility designed to support a wide and varied range of research and learning for both students and researchers. This paper analyzes the main trends of future scientific library such as management and linking large sets of data, services through digital devices, changing the opening of higher education, competence based learning, altmetrics and digital humanities; which will affect the transformation of space, collections and the tasks performed by professionals more oriented learning support than traditional tasks.

Descriptors: Academic libraries, Public libraries, Future trends, Big data, Information literacy, eLearning, Spaces, Information Technology

Gestión de los repositorios de Datos de Investigación (RDM)

rdm20life20cycle

Research data life cycle

Johnsson, M. and J. Ahlfeldt (2015). [e-Book]  Research Libraries and Research Data Management within the Humanities and Social Sciences Lund, Lund University, 2015

Texto completo

Cada vez se pone mayor énfasis en la apertura de datos, gestión de datos planos, y en la investigación en torno a  ”Big data”, lo que está impulsando a las instituciones académicas a desarrollar y desplegar nuevas iniciativas.  El análisis de las necesidades de datos de los investigadores a través de dominios institucionales puede requerir de la participación de la biblioteca para identificar y conectar a los investigadores en todas las unidades funcionales, tanto formales e informales para compartir, analizar, y reutilizar datos. La investigación sobre la gestión de datos de investigación es uno de los retos futuros que deberemos asumir las bibliotecas de investigación. Se trata de una nueva forma de organizar la información que exige esfuerzos importantes en el aprendizaje de nuevos sistemas, métodos de trabajo y colaboración con los agentes implicados. Aquí se presenta el proyecto sobre Research Data Management (RDM) de la Universidad de Lund en Suecia.

El aumento del volumen y orrganización de la información capturada por las empresas y organizaciones, el aumento de los multimedia, las redes sociales y la “Internet de las cosas” van a impulsar un crecimiento exponencial de los datos en el futuro.  Datos de registros de llamadas, transacciones de banca móvil, contenido generado por el usuario de internet, tales como blogs y tweets, búsquedas en línea, imágenes de satélite, etc. es información procesable que requiere el uso de técnicas computacionales para dar a conocer las tendencias y patrones dentro de y entre éstos extremadamente grandes conjuntos de datos socioeconómicos. Las bibliotecas de investigación juegan un papel vital en la gestión y curación de este tipo contenido, pero requieren de mecanismos de financiación adecuados.

La Ciencia Datos se refiere a un área emergente de trabajo se ocupa de la recogida, preparación, análisis, visualización, administración y conservación de grandes colecciones de información. Casi todos los analistas consideran “Big Data” como una de las tendencias de futuro que tendrán que tener en cuenta la mayoría de las empresas e instituciones. La sociedad TIC propicia y requiere un diluvio universal de datos, procesarlos, entenderlos y transformarlos en decisiones de valor es el reto del análisis big data. Vital para las empresas cuyo activo es la información.

Gestión de Datos de Investigación (RDM) es un proceso que está diseñado para gestionar y difundir conjuntos de datos de alta calidad, que cumplan con los requisitos académicos, legales y éticos. Hay dos salidas del proceso de RDM:

1. La preservación a largo plazo de los conjuntos de datos mediante sistemas de almacenamiento
2. Compartir y reutilización de los conjuntos de datos para la investigación y otros fines en la sociedad en general.

Esta propuesta hace hincapié en la creación de una organización coherente de gestión de datos de investigación en la Universidad de Lund, que utiliza los recursos existentes tanto dentro como fuera de la universidad y establece nuevas unidades de organización y sistemas de información específicos para esta nueva tarea. Se propone la creación de una nueva unidad para la Gestión de Datos de Investigación y Coordinación en la biblioteca de la universidad cuya responsabilidad sería la de coordinar la red de agentes existentes que apoyen las actividades de investigación desde los diferentes centros de manera ética, por parte de expertos en gestión de datos.

tutkimusaineiston_elinkaari_en

Además, se propone la creación de un nuevo sistema de información, “Lund University Dataset Directory”, un directorio de grupos de datos facilitaría la gestión de bases de datos y recuperación de la información en todo el ciclo de vida de los datos.

El objetivo es que los conjuntos de datos de investigación sean depositados en repositorios para compartir a nivel nacionales o disciplinarlo que requerirá – al igual que las tecnologías de la web semántica – de servicios de datos en línea no previstos aún por los agentes nacionales, por lo que para ello será necesario crear un laboratorio de datos dentro de la red RDM en la Universidad de Lund.

Ver además

Analytics: el uso de big data en el mundo real. Cómo las empresas más innovadoras extraen valor de datos inciertos [e-Book]  IBM Institute for Business Value, 2014 Texto completo

Whyte, A. (2015). ‘Where to keep research data: DCC checklist for evaluating data repositories’ v.1.1 Edinburgh: Digital Curation Centre, 2015 Texto completo

Wanner, AmandaData literacy instruction in academic libraries: best practices for librarians. Archival and Information Studies Student Journal 2015  Texto completo

Erway, R. and A. Rinehart (2016). [e-Book] If You Build It, Will They Fund? Making Research Data Management Sustainable OCLC, 2016.Texto completo

 

Otros post relacionados

Alfabetización sobre datos en bibliotecas de investigación : mejores prácticas para los bibliotecarios
El uso de Big Data en el mundo real: cómo las empresas más innovadoras extraen valor de datos inciertos
Análisis de las posibilidades de uso de Big Data en las organizaciones
Bibliotecas y Big Data : como hacer unas gestión de datos de investigación sostenible
Big Data: la nueva frontera de la innovación, la competencia y la productividad
Big Data para el Desarrollo: Desafíos y Oportunidades
La normalización en el ámbito de la innovación y el desarrollo tecnológico, especialmente en el campo minería de textos y datos

 

Cómo las bibliotecas sirven de apoyo para el tratamiento de los datos de investigación a lo largo de todo el ciclo vital

 

research-lifecycle

Libraries Support Data-Sharing Across the Research Lifecycle By William M. Cross on February 1, 2016 Library Journal

Ver completo

Los mandatos de los organismos de financiación han hecho de la gestión e intercambio de datos sea una prioridad de primer nivel para los investigadores; las nuevas estrategias para la reutilización y la visualización están datos cobran importancia cuando se establecen repositorios de datos bien establecidos que acrecientan la capacidad de descubrimiento. Por ello las bibliotecas deben aprovechar esta oportunidad para demostrar su valor a lo largo de todo el ciclo de vida de la investigación y en apoyo a la cultura abierta. Las bibliotecas tienen un papel importante que desempeñar en la gestión de los datos de la investigación y el intercambio de los mismos; teniendo en cuenta que la gestión de datos de investigación, como la mayoría de los esfuerzos en comunicación académica, es un trabajo de equipo.

Esta urgencia se hace sentir en la mayoría de los campus; Las bibliotecas han respondido con una variedad de servicios. Aproximadamente la mitad de todas las bibliotecas universitarias tienen algún tipo de programa de apoyo a la gestión de datos.  Los bibliotecarios también están haciendo un trabajo interesante para ayudar a gestionar esta evolución basada en los principios de apertura e interoperabilidad. Esta práctica es necesaria para la transición desde la idea tradicional que se tiene de una «infraestructura de datos» centrada en torno a las revistas especializadas o repositorios institucionales en un sistema más robusto centrado en los datos de investigación. La creación de este nuevo ecosistema requerirá de la evolución en muchas áreas, incluyendo el desarrollo de nuevos estándares en torno a la validación de los datos de la investigación, los procedimientos para documentar la procedencia de los conjuntos de datos, y los nuevos modos de gestión y propiedad de los datos de la investigación.

Así los bibliotecarios se están mostrando activos en todos estos espacios. Las bibliotecas tienen  identificadores de objetos digitales (Dois) que identifican los conjuntos de datos específicos utilizando servicios como DataCite y EZID. También están haciendo ricos con el trabajo de metadatos que facilita el descubrimiento y la reutilización a través de consultas individuales y el desarrollo de esquema.

Este enfoque de colaboración conecta experiencias diversas que desarrollan las bibliotecas con los investigadores en el momento que se percibe una necesidad, creando oportunidades para construir redes dentro y fuera de la biblioteca, que facilitan que la biblioteca se integre en el proceso de investigación el el proceso de apoyo al acceso abierto a los datos de investigación. Esta formación debe ser continua para los bibliotecarios y los investigadores ya que los recursos técnicos y las mejores prácticas están en constante flujo; de este modo entre los desafíos que conlleva proporcionar cobertura de datos abiertos hace que surjan nuevos servicios y proveedores de fondos, se están empezando a establecer mandatos por parte de los organismos de financiación, y a surgir algunas normas para el almacenamiento y el acceso público a los resultados de la investigación, si bien todo ello está operando en un panorama cambiante.

Mendeley Data. La plataforma de Datos de Investigación de Mendeley

 

logo1

https://data.mendeley.com/

Los procesos de investigación y comunicación científica cada vez generan mayor cantidad de datos, a su vez, también los organismos de financiación y gobiernos empiezan a exigir que todos los datos generados por una investigación deben estar disponibles. Por ello los investigadores están buscando formas de publicar sus datos, compartirlos, y ponerlos a disposición de otros investigadores. El nuevo repositorio Mendeley Data está diseñado para ayudar a los investigadores con estos objetivos. De momento funciona en versión beta

drag-files

La plataforma permite a los investigadores cargar datos en bruto de su investigación, y les proporciona un identificador único (DOI versionado) con el objetivo de que se puedan vincular con las webs de revistas como ScienceDirect, cellPres, y otras que se irán incorporando progresivamente, para generar enlaces desde los artículos a todo el conjunto de datos de investigación, lo que permite a los lectores no sólo tener a disposición el resultado final de la investigación (el artículo), si no también otros datos subyacentes que han contribuido a la investigación vinculados al artículo. 

Además los investigadores pueden también compartir sus datos no publicados de manera privada sólo con sus colaboradores, y tener varias versiones de los datos relativos a un solo proyecto de investigación.

Mendeley datos es un servicio gratuito y los conjuntos de datos están bajo licencias abiertas. En cuanto a la seguridad, los conjuntos de datos de investigación se archivan permanentemente en DANS (Data Archive and Networking Services) que tiene su sede en los Países Bajos.

El fenómeno de los datos abiertos. Indicaciones y normas para un mundo de datos abiertos.

opendata1

Aliprandi, Simone Il fenomeno open data. Indicazioni e norme per un mondo di dati aperti.  [e-Book] Roma, LediPublishing, 2014

Texto completo

En el fascinante mundo de la cultura abierta después del software de código abierto, estándares abiertos, el acceso abierto y el contenido abierto; el fenómeno de los datos abiertos es la última frontera y quizás incluso en la actualidad uno de los recursos más estratégicos para gobiernos y organizaciones. A finales de la década del 2000 se abrió el debate sobre la importancia de la disponibilidad y la libre difusión de los datos “en bruto” con el fin de aumentar el potencial de la información y la comunicación del conocimiento compartido de la revolución digital. Pronto se percibió que la capacidad de recopilar, gestionar y reutilizar cantidades de datos cada vez más relacionados y más densos conducía a la necesidad de algunas reflexiones de carácter tanto legales como tecnológicas. En este libro se trata de presentar los principales temas emergentes, dibujando un marco normativo completo y ofreciendo algunas líneas esenciales.