Archivo de la etiqueta: Gestión de datos de investigación

Agenda Big Data : Ética de los datos y estudios de datos críticos

 

51fyovht6fl-_sx331_bo1204203200_

 

Richterich, A. [e-Book]  The Big Data Agenda : Data Ethics and Critical Data Studies. Westminster, University of Westminster Press, 2018

Texto completo

 

Las grandes prácticas actuales en materia de datos se guían en gran medida por las deliberaciones relativas a su eficiencia y optimización. Sin embargo, hay otra perspectiva. Este libro destaca que la capacidad de recopilar, analizar y utilizar grandes cantidades de datos digitales (de los usuarios) plantea importantes problemas éticos. Annika Richterich proporciona una visión general contemporánea y sistemática del campo de los estudios de datos críticos que refleja las prácticas – corporativas, institucionales y gubernamentales – de recolección y análisis de datos digitales. Evalúa en detalle una gran área de investigación de datos: los estudios biomédicos, centrados en la vigilancia epidemiológica. Estudios de caso específicos exploran cómo se han utilizado los grandes datos en el trabajo académico. La Agenda de los Big Data concluye preguntando si la propiedad de los datos puede ser reclamada por los ciudadanos para que no sea simplemente una afirmación de una concepción de los derechos sobre los datos (de los usuarios) definida por el dominio tecnológico. Ella argumenta que la alfabetización de datos y la ética del discurso pueden contener soluciones y críticas.

Anuncios

Support Your Data: Guía de gestión de datos de investigación para investigadores

 

dcrecxswsaa-pwj

Support Your Data. University of California Curation Center (UC3)

Texto completo

PDF

A Research Data Management Guide for Researchers

 

Los investigadores se enfrentan a un conjunto cambiante de expectativas relacionadas con la forma en que gestionan y comparten los datos. Desafortunadamente, existe una importante brecha de comunicación entre los investigadores y los proveedores de servicios de datos basados en bibliotecas. La superación de este vacío de comunicación requiere situar el Research Data Managemente (RDM) en el contexto del trabajo diario del investigador y superar las diferencias en el lenguaje, la terminología y las prioridades entre las diferentes comunidades de investigación y dentro de ellas. Por ello UC3 ha elaborado una guía fácil de usar que permita a los investigadores evaluar y mejorar sus propias prácticas de gestión de datos.

 

Los investigadores se enfrentan a expectativas en rápida evolución acerca de cómo deben gestionar y compartir sus datos, código y otros materiales de investigación. Para ayudarles a cumplir con estas expectativas y, en general, a gestionar y compartir sus datos de forma más eficaz, University of California Curation Center (UC3) está desarrollando un conjunto de herramientas para permitir a los investigadores autoevaluar sus prácticas actuales de manejo de datos y una serie de guías cortas que que les proporcionan información sobre cómo avanzar en las prácticas de gestión de datos de investigación según sea necesario o deseado, que tienen la intención de ser fácilmente personalizables para satisfacer las necesidades de los investigadores que trabajan en una variedad de contextos institucionales y disciplinarios.

Los datos que se ponen a disposición de los demás investigadores sólo son útiles si se formatean, documentan y organizan de manera que permitan su examen y reutilización por parte de otros, un factor clave para permitir el intercambio eficaz de datos, que en sí mismo es un factor clave para establecer la transparencia y la reproducibilidad de la investigación. La gestión de datos de investigación (RDM, por sus siglas en inglés), es un término que abarca actividades relacionadas con el almacenamiento, la organización, la documentación y la difusión de datos, que es fundamental para los esfuerzos encaminados a maximizar el valor de la inversión científica, así como y poder abordar las cuestiones relacionadas con la integridad del proceso de investigación. Desafortunadamente, cuando se pregunta a los investigadores a menudo reconocen que carecen de las habilidades y experiencia necesarias para manejar y compartir sus datos de manera efectiva.  Esta desconexión demuestra la necesidad de herramientas que cierren la brecha de comunicación que existe entre la comunidad de investigación, los proveedores de servicios de datos y otros grupos locales, nacionales e internacionales.

La intención del proyecto Support Your Data es abordar estas tendencias mediante el desarrollo de materiales que enmarquen las actividades relacionadas con la gestión de datos de investigación, de modo que los investigadores puedan comprenderlas fácilmente y actuar al respecto. En la actualidad, estos materiales consisten en una rúbrica diseñada para permitir a los investigadores autoevaluar sus propias prácticas de gestión de datos de investigación en el curso de un proyecto de investigación y un conjunto complementario de guías que orientan a los investigadores hacia los servicios relacionados con RDM en su institución y proporcionan información práctica sobre cómo avanzar en sus prácticas según sea necesario o deseado. Para satisfacer las necesidades de los investigadores en diferentes contextos institucionales y disciplinarios, además, todos estos materiales han sido diseñados para ser fácilmente personalizables.

 

Force 11: norma para la cita de datos de investigación

ge8rnroq_400x400

El Grupo de Expertos en Identificadores del proyecto piloto de implementación de citas de datos (DCIP) de FORCE11 ha dado un paso importante hacia la armonización de las normas de resolución de identificadores para las citas de datos en artículos de investigación.

Ver noticia

Force11 (the Future of Research Communication and e-Scholarship) es una organización sin fines de lucro y una comunidad de investigadores, bibliotecarios, archiveros, editores e instituciones de investigación que ha surgido orgánicamente para ayudar a facilitar el cambio hacia una mejor creación e intercambio de conocimientos. Su objetivo es lograr un cambio en las comunicaciones académicas modernas a través del uso efectivo de la tecnología de la información. Se trata de un grupo de trabajo en el que las partes interesadas se sientan a la mesa para un debate abierto con el fin de hablar de cambiar las formas en que se comunica, comparte y utiliza la información académica y científica.

La armonización de los servicios de resolución de identificadores es el principal objetivo del Grupo de Expertos en Identificadores de FORCE11, que dio prioridad a la creación de vínculos entre los servicios de resolución de identificadores. El grupo está dirigido por Tim Clark y Maryann Martone, en colaboración con el Laboratorio Europeo de Biología Molecular, el Instituto Europeo de Bioinformática (EMBL-EBI) y la Biblioteca Digital de California (CDL), han establecido la interoperabilidad de identificadores compactos y han desarrollado un enfoque global para la cita formal de datos de investigación en ciencias de la vida. El enfoque y su desarrollo se describen en un artículo publicado hoy en la revista Scientific Data, que también ha anunciado la adopción de la norma.

El identificador crea un sistema de citación fácil de leer y procesar combinando un prefijo único para el archivo individual con un identificador asignado localmente; apunta a registros idénticos a través de los sistemas de resolución EMBL-EBI o CDL. Para que este sistema funcione globalmente, EMBL-EBI y CDL establecieron un registro de espacio de nombres con un formulario fácil de usar para solicitar nuevos prefijos, y reglas claras de gestión y mantenimiento para resolver todas las referencias a las colecciones de datos correctas. El trabajo sistemático de otros grupos de expertos del DCIP ha definido hojas de ruta para la aplicación de la cita de datos como práctica habitual para los editores y los depósitos de datos.

 

 

 

Importancia de la curación de datos para los investigadores. Brechas y oportunidades para las bibliotecas universitarias

75570927950ae56bba853559e1b813d2

Johnson, L.R., et al. (2018). How Important Are Data Curation Activities to Researchers? Gaps and Opportunities for Academic Libraries. Journal of Librarianship and Scholarly Communication, 6(General Issue), eP2198. https://doi.org/10.7710/2162-3309.2198

Curaduría de datos, según la definición de la Escuela de Posgrado en Biblioteconomía y Ciencias de la Información de la Universidad de Illinois: “es la gestión activa y continua de los datos a lo largo de su ciclo de vida de vida y utilidad.”

Por su parte, Sayeed Choudhury, Decano Asociado de Gestión de Datos de Investigación de la Universidad Johns Hopkins (JHU, por sus siglas en inglés) y líder de Data Conservancy, detalla las actividades iterativas de Data Curation:

  • Conservar: Recolección y cuidado de los datos de la investigación.
  • Compartir: Revelar el potencial de los datos en todos los dominios
  • Descubrir: Promover la reutilización y las nuevas combinaciones de datos

Según Alation: “En la práctica, la curación de datos se ocupa más del mantenimiento y la gestión de los metadatos que de la propia base de datos y, con ese fin, gran parte del proceso de curación de datos gira en torno a la gestión de metadatos como el esquema, la estructura de tablas y columnas, el uso.. Los curadores de datos no sólo crean, administran y mantienen los datos, sino que también pueden participar en la determinación de las mejores prácticas para trabajar con esos datos. Los curadores de datos a menudo presentan los datos en un formato visual como un gráfico, un tablero o un informe”.

Para techrepublic, Los procesos de recolección de datos de diversas fuentes y su integración en repositorios proporcionan un valor añadido mucho más valioso que estando en bases de datos independientes, ya que de esta manera pueden ser remezclados y rehutilizados con diferentes propósitos. Ya que la curaduría digital implica mantener, preservar y agregar valor a los datos de la investigación digital a lo largo de su ciclo de vida, incluyendo la organización, descripción, limpieza, mejora y conservación de los datos para uso público.

El proceso conlleva:

  • Detección y recuperación de datos.
  • Mantener la calidad de datos.
  • Agregar valor.
  • Proporcionar la reutilización de los datos a lo largo del tiempo.
  • Maximizare el acceso.

Por lo tanto, ¿Qué importancia tienen las actividades de curación de datos para los investigadores? Brechas y oportunidades para las bibliotecas académicas.

La curación de datos promete ser un servicio emergente para las bibliotecas universitarias, pero los investigadores activamente “curan” sus datos de varias maneras, incluso si la terminología no siempre se adecua a la situación. Sobre la base de las evaluaciones de necesidades de usuario realizadas en el pasado a través de encuestas y grupos focales, los autores buscaron la opinión directa de los investigadores sobre la importancia y la utilización de actividades específicas de curación de datos.

De este modo entre el el 21 de octubre de 2016 y el 18 de noviembre de 2016, el equipo de estudio realizó grupos focales con 91 participantes en seis instituciones académicas diferentes para determinar qué actividades de curación de datos eran más importantes para los investigadores, qué actividades estaban actualmente en curso y qué nivel de satisfacción tenían con los resultados.

Los resultados muestran que los investigadores participan activamente en una variedad de actividades de curación de datos, y si bien consideraron que la mayoría de las actividades de curación de datos son muy importantes, la mayoría de la muestra manifestó su insatisfacción con el estado actual de curación de datos en su institución. Estos hallazgos demuestran brechas y oportunidades específicas para que las bibliotecas universitarias enfoquen sus servicios de curación de datos para satisfacer de manera más efectiva las necesidades de los investigadores. Para de este modo, las bibliotecas de investigación participen en estos servicios más activamente invirtiendo y promoviendo servicios altamente valorados que actualmente muchos investigadores no pueden utilizar.

 

Indicadores de calidad de datos abiertos: el caso del portal de datos abiertos de Barcelona

exploring-open-data-quality-1280x739

Abella García, A., M. Ortiz de Urbina Criado, et al. “Indicadores de calidad de datos abiertos: el caso del portal de datos abiertos de Barcelona.” El profesional de la información vol. 27, n. 2 (2018).  pp. 375-382.

Texto completo

 

Los datos abiertos son una infraestructura básica para la creación de negocios y de productos y servicios. Para hacer un análisis de su utilidad hay que tener en cuenta que no es igual el acceso a los mismos y su difusión que su reutilización. El objetivo de este trabajo es analizar como el modelo de cinco estrellas de Berners-Lee y otros factores ayudan a evaluar la calidad de los datos de cara a su reutilización en el portal de datos abiertos de Barcelona y analizar su relación con su descarga y sus temáticas. Los resultados obtenidos muestran que puede ser interesante incorporar aspectos como la frecuencia de actualización de datos y la geolocalización en los modelos que miden la calidad de los datos abiertos para su reutilización.

Datos, algoritmos y políticas: la redefinición del mundo digital

portada

 

Datos, algoritmos y políticas: la redefinición del mundo digital. [e-Book]  México, CEPAL, 2018.

Texto completo

ePub

Mobi

 

La convergencia del mundo físico y el mundo digital configura un ecosistema cuya dinámica redefine el modelo de desarrollo económico y social. En este libro se analizan la Internet de las cosas, las cadenas de bloques y la inteligencia artificial, y su potencial transformador. Se estudian dos elementos habilitantes para su uso: las plataformas digitales globales y la formación de recursos humanos. Se analizan esas y otras tecnologías digitales en las actividades manufactureras y de servicios avanzados, y las empresas de tecnología financiera digital (fintech). Se concluye con una reflexión sobre las implicancias de la inteligencia artificial para el logro de los Objetivos de Desarrollo Sostenible.

Índice: Prólogo .– Introducción .– I. La digitalización del mundo físico: la Internet de las cosas .– II. La cadena de bloques: la Internet de la confianza .– III. Una economía y una sociedad basadas en plataformas digitales .– IV. Formación de recursos humanos para el uso de tecnologías digitales en América Latina .– V. Tecnologías financieras digitales para la inclusión, ¿qué piensan los países de la región? .– VI. Internet industrial para la manufactura avanzada .– VII. Inteligencia artificial para el desarrollo.

Economía de los datos. Riqueza 4.0

econdat

 “Economía de los datos. Riqueza 4.0“. Madrid: Fundación Telefónica y Analistas Financieros Internacionales – Afi, 2018

Texto completo

PDF

ePuB

Más entradas en UA sobre Gestión de Datos de Investigación

La Economía de los Datos se está convirtiendo a pasos acelerados en un nuevo paradigma, y el dato en una materia prima que está revolucionando la forma en la que hoy resolvemos los problemas, enfrentamos las preguntas que se nos presentan y abordamos tareas que hasta hace escasos años realizábamos de forma manual y sin conocerlas en detalle.

Esta publicación, editada por Fundación Telefónica en colaboración con Analistas Financieros Internacionales (Afi), pretende familiarizarnos con el big data, uno los pilares de la era digital en la que estamos inmersos, cuyas aplicaciones prácticas están cada vez más presentes en nuestra vida cotidiana. Podemos verlas en el control remoto de los dispositivos conectados de nuestro hogar (a través de Internet de las Cosas), en la oferta personalizada de productos y servicios basada en el conocimiento que las empresas tienen de sus clientes, o en la individualización de los tratamientos médicos, entre muchos otros ejemplos.