Archivo de la etiqueta: Gestión de datos de investigación

La anatomía de una citación de datos: Descubrimiento, Reutilización y Crédito

 

simons-fig3

Mooney, H. and M. Newton «The Anatomy of a Data Citation: Discovery, Reuse, and Credit.» Journal of Librarianship and Scholarly Communication vol. 1, n. 1 (2012). pp.: http://dx.doi.org/10.7710/2162-3309.1035

La citación de datos debe ser un corolario necesario de la publicación y reutilización de datos. Muchos investigadores se resisten a compartir sus datos, sin embargo, están cada vez más animados a hacer precisamente eso. Por lo cual es necesario desarrollar estructuras de recompensa para alentar la publicación de datos,siendo la cita la herramienta más adecuada para el reconocimiento académico. La citación de datos también permite la identificación, recuperación, replicación, y la verificación de los datos subyacentes. Este estudio analiza el comportamiento y las fuentes para el estilo y la citación por escrito a través de un análisis de contenido de artículos de revistas, libros de estilo y editores de datos.

¿Cuál es el papel de los bibliotecarios en la gestión de datos de investigación?

27568840446_bbb7f9a5dd_n_d

Papel de los bibliotecarios en la gestión de datos de investigación

Julio Alonso-Arévalo Grupo Electra Universidad de Salamanca (España)

Horizontes del bibliotecario, 3 mayo-junio de 2016

Ver artículo completo

Ver versión abreviada en la revista

Durante siglos los bibliotecarios hemos sido expertos en la organización de las colecciones y saber cómo encontrar las cosas. La transición a los formatos digitales ha traído consigo un enorme volumen de datos que necesita ser curados como los relativos a descargas, citas, citas de patentes y la cobertura de los medios de comunicación. Todo ello ha ido acrecentando las competencias y habilidades de los bibliotecarios como uno de los segmentos profesionales más capacitados para la gestión de grandes cantidades de datos. (Taylor Stang, 2016)

Los bibliotecarios llevamos algunos años desplegando conocimientos técnicos y expertos en promover y apoyar la gestión de repositorios y el intercambio de datos abiertos, por lo que la gestión de datos de investigación ha de formar parte de un desarrollo natural en nuestras tareas y funciones. Según MJ Tooey bibliotecaria de la University of Maryland “Tenemos el conjunto de habilidades necesarias para organizar las cosas. Entendemos los vocabularios controlados. Entendemos las ontologías. Sabemos como organizar la información. Hemos realizado la evolución de la palabra impresa y el encabezamiento de materia a los datos como un proceso natural.

Así que estamos preparados para ayudar a la gente a organizar, acceder y almacenar datos.” La adecuada gestión de datos es fundamental para los datos de investigación de alta calidad y, por tanto, la investigación de excelencia, es crucial para facilitar el intercambio de datos y asegurar la sostenibilidad y la accesibilidad de los datos a largo plazo y por lo tanto su reutilización para la ciencia futura

Redacción: Julio Alonso-Arévalo Grupo Electra Universidad de Salamanca (España)

Big Data: la próxima «gran cosa» en la gestión de la información

e69c68d5f7c7dcb6ae57282cbc692e14

Alonso Arévalo, Julio (2016). «Big Data: la próxima «gran cosa» en la gestión de la información – BiD: textos universitaris de biblioteconomia i documentació, núm. 36 (juny)

Texto completo

Especial BID Innovación

Número 36, Junio 2016

Según la investigación de MGI y la Oficina de Tecnología de Negocios de McKinsey (Mannyica et al., 2011), la cantidad de información que genera cualquier actividad pública o privada proporciona grandes conjuntos de datos, y el análisis de estos se ha convertido en una de las bases clave para la competencia en un futuro inmediato que sustentará las nuevas oleadas de crecimiento, de productividad, innovación y excedente del consumidor. Los líderes de todos los sectores deberán tener en cuenta las consecuencias de la gestión adecuada de esta ingente cantidad de datos, no solo orientada a aquellos que deben gestionarlos de manera directa como los propios administradores de datos, sino también con quienes tienen que tomar decisiones en las organizaciones. El aumento del volumen y el detalle de la información capturada por las empresas, el aumento de los multimedia, las redes sociales y la «Internet de las cosas» van a impulsar un crecimiento exponencial de los datos en el futuro previsible.

Los servicios como las redes sociales, la web semántica e inteligente y el comercio electrónico a menudo tienen que manejar datos a una escala demasiado grande para una base de datos tradicional. A medida que aumenta la escala y la demanda, también lo hace la complejidad. Afortunadamente, la escalabilidad y la simplicidad no son mutuamente excluyentes —en lugar de utilizar una tecnología de moda, es necesario un enfoque diferente—, ya que los sistemas que utilizan grandes cantidades de datos utilizan muchas máquinas que trabajan en paralelo para almacenar y procesar datos, que introduce retos fundamentales desconocidos para la mayoría de los desarrolladores. Big Data muestra cómo construir estos sistemas usando una arquitectura que aprovecha las ventajas de hardware agrupado junto con nuevas herramientas diseñadas específicamente para capturar y analizar datos a escala web. En él se describe la escalabilidad, para entender el enfoque de los sistemas de grandes volúmenes de datos que se pueden construir a partir de un equipo pequeño (Marz; Warren, 2012).

Casi todos los analistas consideran Big Data como una de las tendencias de futuro que deberán tener en cuenta la mayoría de las empresas e instituciones. La sociedad de las tecnologías de la información y la comunicación (TIC) propicia y requiere un diluvio universal de datos, procesarlos, entenderlos y transformarlos en decisiones de valor es el reto del análisis Big Data. Vital para las empresas cuyo activo es la información. Según estima la International Data Corporation (IDC) hoy los datos se incrementan un 50 % al año, o sea que se duplican cada dos años. Un informe del Foro Económico Mundial declaró que los datos constituyen una nueva clase de activo económico, como la moneda o el oro. Para la revista Forbes, el Big Data ha sido la principal tendencia tecnológica de los últimos años que se mantendrá los próximos años. Según la IDC, hasta 2015 su crecimiento será siete veces superior al de la media de todo el sector de las TIC. En áreas tan variadas como la ciencia y los deportes, la publicidad y la salud pública se ha producido un salto hacia el descubrimiento y la toma de decisiones a partir de los datos (López García, 2013). La tendencia ligada a Big Data también es alimentada por un mejor acceso a la información, especialmente desde que la mayoría de las empresas e instituciones han desplazado sus negocios a la nube, en lo que se ha denominado cloud computing, lo que facilita el acceso a estos desde cualquier tiempo y lugar mediante dispositivos móviles, e incluso que estos datos puedan ser utilizados por cualquier objeto o dispositivo electrónico en lo que se ha denominado la «Internet de las cosas».

Big Data ha dejado de estar limitado al mundo de la tecnología. Hoy en día se trata de una prioridad empresarial dada su capacidad para influir profundamente en el comercio de una economía integrada a escala global. Además de proporcionar soluciones a antiguos retos empresariales, Big Data inspira nuevas formas de transformar procesos, empresas, sectores enteros e incluso la propia sociedad. Aun así, la amplia cobertura mediática que está recibiendo no nos permite distinguir claramente el mito de la realidad: ¿qué está ocurriendo realmente? (Analytics, 2014). Las empresas utilizan Big Data para obtener resultados centrados en el cliente, aprovechar los datos internos y crear un mejor ecosistema de información. El análisis de todos los datos disponibles está convirtiéndose en un elemento de disrupción, así como en un factor de desintermediación que está afectando a la cadena de valor, el análisis de información en grandes volúmenes, de diversas fuentes, a gran velocidad y con una flexibilidad sin precedentes, puede suponer un factor diferencial para aquellos que decidan adoptarlo (Big Data, 2013).

La agencia Gartner proporciona una descripción del término en la siguiente frase: Big Data se refiere al volumen, variedad y velocidad de datos estructurados y no estructurados que se vierten a través de redes en los procesadores y dispositivos de almacenamiento, así como la conversión de dichos datos para el asesoramiento empresarial. Estos elementos se pueden dividir en tres categorías distintas: volumen, variedad y velocidad.

— Volumen (terabytes, petabytes y exabytes, eventualmente): La cantidad cada vez mayor de datos creada por los seres humanos y las máquinas está poniendo un reto a los sistemas informáticos, que están luchando para almacenar, proteger y poner a disposición toda la información para su uso futuro.

— Variedad: Big Data es también el creciente número de tipos de datos que deben ser manejados de manera diferente a partir de simple correo electrónico, registros de datos y los registros de tarjetas de crédito. Reunidos datos para estudios científicos, registros de salud, datos financieros y multimedia: fotos, presentaciones gráficas, música, audio y vídeo.

— Velocidad: Se trata de la velocidad a la que estos datos se mueve a partir de criterios de valoración en el procesamiento y almacenamiento.

Big Data es, sin la menor duda, uno de los campos más importantes de trabajo para los profesionales de las TIC. No hay área ni sector que no esté afectado por las implicaciones que este concepto está incorporando; cambian algunas herramientas, se modifican estrategias de análisis y patrones de medida. Uno de los retos y oportunidades que tienen los profesionales de la información en este entorno es el relativo a la alfabetización sobre datos en bibliotecas universitarias y de investigación. La alfabetización informacional y la alfabetización digital en las bibliotecas han sido ampliamente discutidas y aplicadas en la literatura profesional, pero hasta hace muy poco se ha prestado poca atención a la alfabetización de datos. Sin embargo, las nuevas iniciativas de gobierno electrónico y de datos abiertas en la última década han creado datos públicos ampliamente disponibles que son de gran interés para investigadores y estudiantes. El aumento de la capacidad tecnológica para procesar gran cantidad de datos (Big Data) ofrece nuevas oportunidades tanto para el profano como para el investigador. Conocer y alfabetizar sobre estas cuestiones requiere un esfuerzo de readaptación profesional para fomentar una mentalidad sobre la importancia de estos datos y la cultura de análisis, ya que se trata de la adopción de las nuevas tecnologías, ello presenta desafíos únicos para los bibliotecarios. ¿Cómo pueden las bibliotecas desempeñar su papel en este esfuerzo de recualificación para desarrollar una «mentalidad basada en datos»? (Big Data Now, 2011).

El mundo científico, caracterizado por tener que manejar grandes volúmenes de datos, se ha visto muy beneficiado por Big Data Analytics. Desde aplicaciones para ciencias naturales y del cosmos, como la astronomía, la botánica y la geología, hasta funcionalidades que permiten realizar análisis pormenorizados de los casos y ofrecer tratamientos más personalizados en el ámbito de las ciencias de la salud, pasando por las distintas ciencias económicas y sociales que mayor ventaja obtienen aprovechando los beneficios aportados por estas herramientas de análisis de datos ―estadística, economía o sociología, entre otras.

Como se pregunta Mario Tascón (2013), «¿Va a ser Big Data una etiqueta más que añadir a las múltiples modas que hemos ido viendo a lo largo de los últimos años en el panorama de Internet y los desarrollos digitales o es una tendencia de fondo que está afectando en su totalidad a la evolución de la Web? ¿Se trata de un verdadero reto para las empresas en los próximos años o una nueva estrategia de marketing y vaporware de los proveedores tecnológicos? Big Data puede llegar a ser el activo más valioso de una organización o una de sus obligaciones más costosas, todo depende de las estrategias y soluciones que se pongan en marcha a corto plazo para afrontar el ingente crecimiento del volumen, la complejidad, la diversidad y la velocidad de los datos». Como veremos, es una tendencia importante para las organizaciones y sus procesos de toma de decisiones, pero en absoluto afectará de la misma forma a todas las firmas y sectores. En España, según Big Data de IDC, cerca de un 5 % de las empresas españolas ya utiliza esta tecnología.

La ciencia de datos se refiere a un área emergente de trabajo que se ocupa de la recogida, preparación, análisis, visualización, administración y conservación de grandes colecciones de información. Aunque el término de datos científicos parece conectar más fuertemente con áreas tales como bases de datos y la informática, incluye muchos tipos diferentes de habilidades —incluyendo habilidades no matemáticas—. Para algunos, el término ciencia de datosevoca imágenes de los estadísticos en el laboratorio mirando fijamente parpadear las pantallas de ordenador llenas de números en desplazamiento. Nada podría estar más lejos de la verdad. Tampoco muchos de estos datos disponibles en el mundo no son solo numéricos y estructurados. En este contexto, «no estructurado» significa que los datos no están dispuestos en filas y columnas ordenadas. Si bien es cierto que las empresas, las escuelas y los gobiernos utilizan gran cantidad de información numérica —ventas de productos, promedio de calificaciones y evaluaciones fiscales son algunos ejemplos—, hay un montón de otra información en el mundo distinta de la utilizada por matemáticos y estadísticos. Así, mientras que siempre es útil tener grandes habilidades matemáticas, hay mucho por hacer en el mundo de la ciencia de datos para aquellos otros tipos de datos, como aquellos que contienen palabras, listas, fotografías, sonidos y otros tipos de información. Además, la ciencia de datos va más allá del simple análisis, ya que la ciencia de datos ofrece una gama de funciones y requiere una serie de habilidades muy diferentes (Stanton, 2013).

Ya existe alguna aplicación como Dataverse, una aplicación web de código abierto desarrollada por la Universidad de Harvard que permite compartir, preservar, citar, explorar y analizar datos de investigación. El programa facilita la toma de datos y los pone a disposición de los demás, y permite replicar otros trabajos de investigación. Un repositorio Dataverse aloja varios dataverses. Cada dataverse contiene un datatset u otros dataverses, y cada conjunto de datos contiene metadatos descriptivos y archivos de datos (incluyendo la documentación y el código que acompañan a los datos). Dataverse normaliza la cita de los conjuntos de datos para que sea más fácil para los investigadores publicar sus datos y obtener un mejor reconocimiento de su trabajo. Cuando se crea un conjunto de datos en Dataverse, se genera la citación y se presenta de forma automática como un marco único de código abierto y repositorio de datos de investigación, lo que hace que los datos científicos sean lo más accesibles, reutilizables, y abiertos posible. Por lo que Big Data también supone una oportunidad, un reto y un desafío profesional para documentalistas y bibliotecarios, que como expertos en la compilación, organización, gestión y difusión de la información deberemos estar alineados con la evolución de esta propuesta, que es, sin lugar a dudas, una de las grandes líneas de desarrollo profesional, por ello deberemos conocer y adquirir las destrezas necesarias para saber cómo gestionar con eficiencia esta cantidad ingente de datos para dotarlos de valor en la sociedad de la información (Torres i Viñals, 2012).

Bibliografía

Analytics: el uso de Big Data en el mundo real. Cómo las empresas más innovadoras extraen valor de datos inciertos (2014). IBM Institute for Business Value. <http://www-05.ibm.com/services/es/gbs/consulting/pdf/
El_uso_de_Big_Data_en_el_mundo_real.pdf
>. [Consulta: 30/12/2015].

Big Data: es hora de generar valor de negocio con los datos (2013). BBVA. <https://www.centrodeinnovacionbbva.com/sites/default/files/bigdata_spanish.pdf>. [Consulta: 30/12/2015].

Big Data Now (2011). Cambridge: O’Reilly Media. <http://www.onmeedia.com/donwloads/Big_Data_Now_Current_Perspectives_from_OReilly_Radar.pdf>.
[Consulta: 30/12/2015].

International Data Corporation (IDC). <http://www.idc.com/>. [Consulta: 30/12/2015].

López García, David (2013). Análisis de las posibilidades de uso de Big Data en las organizaciones. Santander: Universidad de Cantabria. <http://repositorio.unican.es/xmlui/bitstream/handle/10902/4528/TFM%20-%20David%20L%C3%B3pez%20Garc%C3%ADaS.pdf?sequence=1>. [Consulta: 30/12/2015].

Mannyica, James et al. (2011). Big Data: The Next Frontier for Innovation, Competition, and Productivity. New York: McKinsey & Company. <http://lazowska.cs.washington.edu/escience/McKinsey.big.data.pdf>. [Consulta: 30/12/2015].

Marz, Nathan; Warren, James (2012). Big Data: Principles and Best Practices of Scalable Realtime Data Systems. New York: Manning Publications. <http://www.manning.com/marz/BD_meap_ch01.pdf>. [Consulta: 30/12/2015].

Stanton, Jeffrey M. (2013). An Introduction to Data Science. Syracuse: Syracuse University. <https://ischool.syr.edu/media/documents/2012/3/DataScienceBook1_1.pdf>. [Consulta: 30/12/2015].

Tascón, Mario (2013). Big Data. Madrid: Fundación Telefónica. <http://www.fundaciontelefonica.com/arte_cultura/publicaciones-listado/pagina-item-publicaciones/?itempubli=264>. [Consulta: 30/12/2015].

Torres i Viñals, Jordi (2012). Del Cloud Computing al Big Data: visión introductoria para jóvenes emprendedores. Barcelona: UOC. <http://www.jorditorres.org/wp-content/uploads/2012/03/
Del.Cloud_.Computing.al_.Big_.Data_.JordiTorres.ES_.pdf
>. [Consulta: 30/12/2015].

Cita recomendada

Alonso Arévalo, Julio; Vázquez Vázquez, Marta (2016). «Big Data: la próxima «gran cosa» en la gestión de la información – See more at: http://bid.ub.edu/es/36/alonso.htm#sthash.jacFPCMg.dpuf». BiD: textos universitaris de biblioteconomia i documentació, núm. 36 (juny) . <http://bid.ub.edu/es/36/alonso.htm&gt;. DOI: http://dx.doi.org/10.1344/BiD2016.36.2 [Consulta: 12-09-2016].

Díez recomendaciones para que las bibliotecas inicien servicios de gestión de datos de investigación (RDM)

feature4-lg

Christensen-Dalsgaard, B. et al. (2012). [e-Book] Ten recommendations for libraries to get started with research data management, LIBER, 2012.

Texto completo

El grupo de trabajo LIBER E-Ciencia  fue creado para investigar el papel que las las bibliotecas  deben desempeñar en el ámbito de la e-Ciencia. El grupo decidió concentrarse en los datos de la investigación ya que se consideró que esta era la necesidad más urgente de la e-ciencia para la comunidad de de investigación. Por ello publicó un informes obre la gestión de datos de investigación.

El grupo llevó a cabo tres talleres: el primero durante la conferencia Libe  de 2011 en Barcelona, el segunda durante la conferencia IDCC 2011 en Bristol y el tercero y último durante la conferencia LIBER-2012 en Tartu. Los resultados de los dos primeros talleres se utilizaron como base para la elaboración de recomendaciones a la comunidad LIBER.

Díez recomendaciones para que las bibliotecas inicien servicios de gestión de datos de investigación (RDM)
1. Iniciar propuestas sobre Gestión de Datos de Investigación (RDM) que incluyan planes de gestión de datos para la solicitud de subvenciones, asesoramiento sobre derechos de propiedad intelectual y material informativo. Ayudar a los profesores con los planes de gestión de datos y la integración de la gestión de datos en los planes de estudios.
2. Participar en el desarrollo de estándares de metadatos para proporcionar servicios sobre la gestión de datos de investigación.
3. Difundir y desarrollar las habilidades necesarias para la gestión de datos entre el personal profesional.
4. Participar activamente en la investigación para el desarrollo de políticas de datos institucionales, incluyendo los planes de recursos. Fomentar y adoptar políticas de apertura en todo el ciclo de vida de los datos de investigación.
5. Mantener contactos y colaborar con los investigadores, grupos de investigación, archivos de datos y centros de datos para fomentar una infraestructura interoperable para el acceso a datos, descubrimiento y difusión de los datos de investigación.
6. Apoyar todo el ciclo de vida para los datos de investigación, proporcionando servicios para el almacenamiento, el descubrimiento y el acceso permanente.
7. Promover la investigación sobre datos mediante la aplicación de identificadores persistentes a los datos de investigación.
8. Proporcionar un catálogo de datos institucional o repositorio de datos, dependiendo de la infraestructura disponible.
9. Participa en la práctica de gestión de datos en la disciplina de trabajo específica.
10. Oferta o mediar en torno a cuestiones como el almacenamiento seguro para los datos de la investigación dinámica y estática en cooperación con las unidades que gestionan TICs a nivel institucional y / o buscar la explotación de los servicios apropiados. en la nube

Gestión de datos de investigación para bibliotecas

krier300

Krier, L. and C. A. Strasser (2014). [e-Book] Data Management for Libraries. Chicago, ALA.

Muestra

En casi todos los campos, las prácticas de investigación están cambiando. Las nuevas tecnologías y herramientas que se utilizan para llevar a cabo la investigación están proporcionando nuevos tipos de dato en cantidades inimaginables en épocas pretéritas. Tanto en las ciencias como en las humanidades, los datos de la investigación se encuentran cada vez mas disponibles en formato digital, tanto en discos duros locales, como en servidores remotos, o dispersos a través de las redes. Algunos proyectos de investigación combinan los datos físicos y digitales, y los investigadores deben realizar un seguimiento de ambos a la vez. Y, cada vez más, los proyectos de investigación están produciendo enormes conjuntos de datos que sería difícil de manejar sin la ayuda de ordenadores para procesarlos y de planes de gestión de datos que les otorguen valor añadido.

Por ello la National Science Foundation se unió a los Institutos Nacionales de Salud para desarrollar nuevas propuestas que incluyen un plan de gestión de datos, y son precisamente los los bibliotecarios universitarios quienes más interés han puesto en estas propuestas. La gestión de datos es una nueva área de servicio que requiere planificación y ejecución cuidadosa. Esta guía ofrece unas pautas iniciales sobre la construcción y el mantenimiento de un servicio de gestión de datos, que pone de relieve como la biblioteca académica puede ser muy valiosa para los investigadores.

  • Ofreciendo argumentos convincentes para persuadir a los investigadores a crear un plan de gestión de datos, con consejos sobre colaborando con ellos
  • Trazando las bases para iniciar un nuevo servicio de gestión de datos de investigación y planes de gestión de datos
  • Proporcionar consejos para la realización de entrevistas sobre gestión de datos
  • Dirigir a los lectores a través de la toma de decisiones sobre los depósitos y otras infraestructuras.
  • Abordar cuestiones sensibles como la propiedad, la propiedad intelectual, el intercambio y el acceso, los metadatos y la preservación.
  • Esta guía será de gran utilidad para los bibliotecarios universitarios que  trabajan con investigadores, profesores y otras partes interesadas en organizar planes que conlleven a una manera efectiva depreservar y facilitar el acceso a datos de la investigación.

 

 

Libro Blanco ACRL sobre gestión de datos de investigación (RDM) en bibliotecas universitarias

 

8220874391_fa7b782d9e_m

Tenopir, C., B. Birch, et al. (2012). [e-Book] Academic Libraries and Research Data Services: Current Practices and Plans for the Future. An ACRL White Paper, ACRL, 2012

 Texto completo

A medida que la ciencia se vuelve más colaborativa con el uso y intensivo de datos y ordenadores, los investigadores necesitan disponer de datos debidamente compilados, gestionados , estructurados y listos para su reutilización en un momento dado. Combinar estas necesidades con las directivas de financiación requiere la planificación de la gestión de datos, siendo esta cuestión un imperativo para las universidades. Las bibliotecas universitarias pueden ser clave en todo este proceso relativo a la gestión de los servicios de datos de investigación en los campus, proporcionando oportunidades únicas para poder ser participantes activos en el ciclo de creación de conocimiento en su institución. Recientemente la comunidad profesional ha identificado la curación de datos de investigación como una de las diez mayores tendencias. Algunas bibliotecas universitarias ya están participando en estas actividades, y otras están examinando la mejor manera de proporcionar una gama de servicios de datos de investigación. Este estudio intenta proporcionar una evaluación inicial del estado actual y los futuros planes de servicios de datos de investigación en las bibliotecas universitarias en Estados Unidos y Canadá.

• Sólo una pequeña parte de las bibliotecas universitarias de Estados Unidos y Canadá ofrecen actualmente servicios relacionados con la gestión de datos de investigación (RDM), aunque la mayoría de las bibliotecas se están planeando ofrecer algunos servicios relacionado con la cuestión en los próximos dos años.

• La creación de una guía web para ayudar a localizar los datos ofrecidos puede ser un buen comienzo para extender las prácticas tradicionales de la biblioteca en el nuevo entorno.

• Las bibliotecas de las instituciones más grandes son más dadas a ofrecer una gama de servicios informativos de consulta, aunque algunas bibliotecas de entidades de todo tamaño tienen previsto ofrecer RDM en el futuro. Algunos de estos servicios extienden y amplian el papel de la biblioteca en el proceso de creación de conocimiento.

• Los organismos de financiación están impulsando la necesidad de RDM. Si la biblioteca no se anticipa y participa activamente en proporcionar estos servicios, alguna otra unidad es probable que lidere la gestión de esta nueva necesidad, lo que puede mermar la imagen de la biblioteca como un socio colaborativo en el proceso de investigación

• En el momento actual son pocas las bibliotecas universitarias responsables del desarrollo de políticas de datos de investigación.Si bien de momento están operando como centros de intercambio de ideas y de proporción de experiencias para construir las futuras políticas de gestión de datos de investigación

• La gestión de datos de investigación (RDM) requiere de la colaboración con otras unidades en el campus como la oficina de apoyo a la investigación. Esta colaboración es una oportunidad excelente para que las bibliotecas asuman el liderazgo en el proceso de creación de conocimiento, lo que será de gran ayuda para la mejor valoración de la biblioteca por parte d ela comunidad universitaria.

• La reasignación al proceso de gestión de datos de personal existente de la biblioteca es la táctica más común que están desarrollando las biblioteas para ofrecer serviciso de RDM. Este enfoque también debe ser compatible con el desarrollo profesional para el personal, ya que facilitará la adquisición de los conocimientos necesarios para proporcionar una gama completa de gestión de datos

• De las bibliotecas que proporcionan RDS, la mayoría han reasignado, o tiene intención de volver a asignar personal existente. Esto que puede verse como una debilidad financiera, puede ser un potencial como un medio para el desarrollo de un argumento que permita obtener fondos adicionales para nuevas propuestas que tengan relación con la RDM.

• Las bibliotecas están ofreciendo conferencias o talleres para capacitar a su personal en gestión de datos de investigación (RDM)

• Las bibliotecas necesitan algún tipo de apoyo institucional para capacitar a sus bibliotecarios en ese área de desarrollo profesional, y es importante para las organizaciones profesionales seguir proporcionando esta formación. Puede haber una oportunidad formativa para aquellas bibliotecas que inicien antes estos procesos para crear una relación de tutoría con compañeros u otros asociados, para ayudar en la formación de otros profesionales a través de sus propias experiencias .

Bibliotecas y Gestión de Datos de Investigación en Humanidades y Ciencias Sociales

 

26739302624_7aae4975cb_o_d

Johnsson, M. and J. Åhlfeldt (2015 ). [e-Book] Research Libraries and Research Data Management within the Humanities and Social Sciences Lund: University of Lund, 2015

Texto completo

Presentación

Gestión de Datos de Investigación (RDM) es un proceso diseñado para procesar los conjuntos de datos de alta calidad, que cumplan con los requisitos académicos, legales y éticos. A priori es importante tener en cuenta que la investigación en gestión de datos exige de una nueva forma de organizar la información a través de tareas específicas y necesita de un esfuerzo importante de inversión en el aprendizaje de nuevos sistemas, métodos de trabajo y colaboración.

Hay dos salidas del proceso de RDM:

1. La preservación a largo plazo de los conjuntos de datos mediante sistemas de almacenamiento.

2. Compartir y reutilizar de los conjuntos los datos para la investigación y otros fines sociales.

Esta propuesta hace hincapié en la creación de una organización coherente de gestión de datos de investigación en la Universidad de Lund, que utiliza los recursos existentes tanto dentro como fuera de la universidad y establece nuevas unidades de organización y sistemas de información, específicos para esta nueva tarea. Se propone la creación de una nueva unidad para la Gestión de Datos de Investigación y Coordinación en la Biblioteca de la Universidad cuya responsabilidad sería la de coordinar la red de agentes existentes que apoyan las actividades de investigación, tales como expertos procedentes de bibliotecas, aspectos legales, archivo y en gestión de datos. Además, proponen la creación de un nuevo sistema de información, el Directorio de la Universidad de Lund sobre conjuntos de datos, lo que facilitará la gestión de bases de datos y recuperación de la información en todo el ciclo de vida de los datos.

Los conjuntos de datos de investigación podrían ser depositados en repositorios nacionales o disciplinarias para archivar y compartir,  al igual que las tecnologías de la web semántica requerirá los servicios de datos en línea no previstos actualmente  Por lo que de momento se propone la creación de un laboratorio de datos dentro de la red RDM en la Universidad de Lund.

Data Curation Network : seis bibliotecas universitarias se asocian para desarrollar una red de curación de datos

26914859940_0003f384cc_d

The Data Curation Network

Seis de las grandes bibliotecas universitarias y de investigación estadounidenses, han creado una red para desarrollar el proyecto “Data Curation Network”,  con el objetivo de mejorar el apoyo al investigador  El proyecto tienen como base preparar los datos digitales de investigación para el acceso abierto y la reutilización o lo que se denomina Research Data Managemant (RDM). Lo que permitirá a las bibliotecas universitarias trabajar colectivamente y de manera más eficaz, con una variedad más amplia de tipos de datos (por ejemplo, disciplina, formato de archivo, etc.) más allá de lo que podría ofrecer una institución por si sola. El proyecto en principio tiene un año de duración y está financiado por la Fundación Alfred P. Sloan.

El desarrollo tiene como objetivo investigar y definir los flujos de trabajo y mecanismos de curación de datos a través de reuniones de un equipo profesional estructurado, para definir las pautas de trabajo a partir de otras experiencias y conocimientos previos adquiridos por cada una de las instituciones participantes. Para ello se han planteado tres acciones:

  • Establecer parámetros y controlar el esfuerzo (por ejemplo, el costo, tiempo, experiencia) en cada una de las seis instituciones participantes (Universidad de Minnesota, Cornell Univ, Penn State Univ, Univ de Illinois, Univ de Michigan y Washington Univ St. Louis )
  • Solicitar información a los investigadores para comprender mejor en que medida los servicios de curación datos se adaptan a las necesidades del flujo de trabajo de investigación y gestión de datos, a través de las actividades de participación informales realizadas en paralelo en cada uno de los campus.
  • Desarrollar un modelo para el intercambio de datos entre las instituciones con el objetivo de proporcionar servicios de custodia de información en el que se tenga en cuenta la dotación de personal, costos, conjuntos de habilidades, y la demanda necesaria para su implementación.

El resultado de este proyecto pretende establecer un modelo de gestión y curación de datos que proporcionará una serie de conocimientos sobre como puede ser implementado, evaluado, y sostenido por un grupo de instituciones académicas que será de interés para otras experiencias futuras.

Una introducción a la Ciencia de los Datos

introduction-to-data-science

Stanton, J. M. (2013). [e-Book] An Introduction to Data Science. Syracuse, Syracuse University, 2013

Texto completo

La ciencia de los datos se refiere a un área emergente de trabajo relacionado con la recolección, preparación, análisis, visualización, administración y conservación de grandes colecciones de información. Aunque el nombre de Datos Científicos parece conectar más fuertemente con áreas tales como bases de datos y la informática, incluye diferentes tipos de habilidades – incluyendo las habilidades matemáticas. Para algunos, el término «ciencia de datos» evoca imágenes de estadísticos con batas blancas de laboratorio que miran fijamente parpadear la pantalla del ordenador llenos de números en desplazamiento. Nada mas lejos de la verdad. En primer lugar, los estadísticos no llevan batas de laboratorio: esta moda está reservada para los biólogos, médicos, y otros que tienen que mantener su ropa limpia en ambientes asepticos. En segundo lugar, muchos de los datos en el mundo no son numéricos ni estructurados. En este contexto, no estructurado significa que los datos no están dispuestos en filas y columnas ordenadas. Por ejemplo una página web con fotografías y mensajes cortos entre amigos. Si bien es cierto que las empresas, las universidades y los gobiernos utilizan un montón de información numérica – ventas de productos, promedios de calificaciones, evaluaciones fiscales son algunos ejemplos. Así que, aunque siempre es útil tener buenas habilidades matemáticas, hay mucho por hacer en el mundo de la ciencia de los datos para aquellos que generalmente trabajamos con palabras, listas, fotografías, sonidos, y otros tipos de información. Además, la ciencia de los datos es mucho más que un simple análisis de datos. Hay muchas personas que disfrutan del análisis de datos, y que podría felizmente pasar todo el día mirando histogramas y medias, pero para aquellos que prefieren otras actividades, la ciencia de los datos ofrece una gama desarrollos y requiere una serie de habilidades. Vamos a considerar esta idea pensando en algunos de los datos subyacentes que hay en transacciones tan cotidianas como la compra de una caja de cereales.

El papel de los bibliotecarios en la gestión de datos de investigación

 

 aaeaaqaaaaaaaau2aaaajdy4nmu4mmniltc2mjutndzims1hzdbklwjhnmu5zwewownhza

Elaine R. Martin. The Role of Librarians in Data Science: A Call to Action”. Journal of eScience Librarianship, Vol 4, No 2 (2015)

Texto completo

El aumento del volumen y organización de la información capturada por las empresas y organizaciones, el aumento de los multimedia, las redes sociales y la “Internet de las cosas” van a impulsar un crecimiento exponencial de los datos en el futuro. Datos de registros de llamadas, transacciones de banca móvil, contenido generado por el usuario de internet, tales como blogs y tweets, búsquedas en línea, imágenes de satélite, etc. es información procesable que requiere el uso de técnicas computacionales para dar a conocer las tendencias y patrones dentro de y entre éstos extremadamente grandes conjuntos de datos socioeconómicos.

Debido a esta aceleración de la tendencia, hospitales, escuelas, colegios, fabricantes, minoristas, agencias gubernamentales, y las bibliotecas han comenzado a recoger y almacenar enormes cantidades de datos. El objetivo es hacer que el uso de estos datos pueda proporcionar nuevos y valiosos servicios o mejorar la eficiencia. El problema para alcanzar estas metas es que a medida que la cantidad de almacenamiento y procesamiento ha crecido, la complejidad de los datos y los retos de gestión son más complejos.

Los bibliotecarios siempre hemos sido valiosos en la gestión y organización de la información. Esta es una habilidad fundamental en la ciencia de datos; que se manifiesta con mayor fuerza en el componente de curación de datos a gran escala. Muchos bibliotecarios también son destacados comunicadores y han sido formados en el arte y la ciencia de la transformación de la información, las necesidades de los usuarios y en las estrategias y recursos para la investigación y el aprendizaje. Así que los bibliotecarios tienen claramente un papel en el inicio y el final de la gran problema de los datos. La tarea esencial del profesional de la ciencia de datos es transformar, datos brutos desordenados en conocimiento procesable que puede ser utilizado por los tomadores de decisiones.

Según David Lankes, un bibliotecario no tiene que convertirse en un programador, pero debe estar interesado en la creación de conocimiento, debe tener cierta familiaridad con la forma esencial de las diversas herramientas de software que pueden transformar los datos. Un bibliotecario no tiene que ser un ingeniero de base de datos, pero debe comprender los fundamentos de las herramientas de recuperación de información. Un bibliotecario no tiene por qué ser un estadístico, pero debe tener una comprensión clara de cómo se gestionan los datos numéricos para que puedan ser adecuadamente utilizados. Por último, un bibliotecario no tiene por qué ser un diseñador gráfico, pero tiene que reconocer las características necesarias para hacer una presentación de datos eficaces.

Muchas instituciones académicas y sus bibliotecas han desarrollado servicios de gestión de datos de investigación , pero a veces los objetivos institucionales, organizaciones profesionales, y las funciones actuales y futuras de los bibliotecarios no siempre están adecuadamente sincronizadas. En este número de «Journal of eScience Librarianship», los bibliotecarios informan como están desarrollando servicios sobre Gestión de Datos de Investigación (RDM) y como con frecuencia se enfrentan a obstáculos institucionales y profesionales.