Archivo de la etiqueta: Datos abiertos

¿Utilizan los investigadores datos de investigación abiertos?

Quarati, A. , Raffaghelli, J. E. “Do Researchers Use Open Research Data? Exploring the Relationships Between Usage Trends and Metadata Quality Across Scientific Disciplines From the Figshare Case“. Journal of Information Science
Article First Published Online October 4, 2020

Texto completo

Los datos de investigación abiertos (ORD) se han considerado un motor de transparencia científica. Sin embargo, también se ha señalado la fricción de datos, como fenómeno de subutilización de datos por varias causas. Un factor que a menudo se cuestiona por el bajo uso de ORD es la calidad de la ORD y los metadatos asociados. 

Este trabajo tiene como objetivo ilustrar el uso de ORD, publicado por el repositorio científico de Figshare, en relación con su disciplina científica, su tipo y en comparación con la calidad de sus metadatos. Considerando todos los recursos de Figshare y realizando una evaluación de la calidad programática de sus metadatos, nuestro análisis destacó dos aspectos. 

En primer lugar, independientemente del dominio científico considerado, la mayoría de las ORD están infrautilizadas, pero con casos excepcionales que concentran la atención de la mayoría de los investigadores. Segundo, No hubo evidencia de que el uso de ORD esté asociado con buenas prácticas de publicación de metadatos. Estos dos hallazgos abrieron una reflexión sobre las posibles causas de tal fricción de datos.

Publicar en el ecosistema de la ciencia abierta

Así será la transición editorial a la ciencia abierta

Antunes, M. L.; Sanches, T.; Lopes, C. y Alonso-Arévalo, J. (2020). Publicar en el ecosistema de la ciencia abierta. Cuadernos de Documentación Multimedia, 31, e71449.

Texto completo

La difusión del conocimiento científico se materializa en su escritura, publicación y circulación. La Ciencia Abierta es, por su la naturaleza, una plataforma para el diálogo, fomentando más intercambios y estimulando a los investigadores adaptar sus prácticas de publicación y difusión, lo que les permitirá reducir los costes, la mejora de los contenidos académicos, así como el fomento de una mayor circulación y generación del conocimiento. El objetivo es la realización de propuestas sobre las acciones que los investigadores deben llevar a cabo en el ámbito de la investigación como conversación, es decir, la integración de la escritura académica en la Ciencia Abierta y el intercambio de datos y resultados de la investigación. Finalmente se reflexiona sobre los actuales retos de la Ciencia Abierta para los investigadores y el mundo académico.

Covid-19: cómo el intercambio de datos sin precedentes ha llevado a una investigación de brotes más rápida que nunca

 

Virology Lab Work As Europe On Coronavirus High Alert

 

Covid-19: How unprecedented data sharing has led to faster-than-ever outbreak research Horizon, 23 March 2020 by Ian Le Guillou

Ver completo.

“El impulso hacia la ciencia abierta, los datos abiertos y los preprints realmente ha cambiado la forma en que experimentamos el discurso científico en este brote en comparación con los anteriores”, dijo el profesor Richard Neher, de la Universidad de Basilea, Suiza.

Los avances en la secuenciación de genes han permitido a los científicos rastrear y monitorear la pandemia de COVID-19 más rápido que cualquier brote anterior. Sin embargo, las lagunas en nuestro conocimiento de cómo funcionan los coronavirus ha dificultado la comprensión de lo que hace especial al nuevo coronavirus.

 

Cuando se identificó el nuevo coronavirus (conocido formalmente como SARS-CoV-2) en China en enero, los científicos de todo el mundo estaban listos para responder. Toda la composición genética del virus, o genoma, se publicó en línea en cuestión de días. En comparación, durante el brote de coronavirus del SARS en 2003, esto tomó casi tres meses, después de que la enfermedad se atribuyera originalmente a la clamidia

Los avances en la tecnología han reducido significativamente el costo de la secuenciación de genes y las máquinas ahora son lo suficientemente pequeñas como para caber en la palma de su mano. Esto ha facilitado la secuenciación de una gran cantidad de muestras en todo el mundo.

‘Puede ver en las secuencias cómo se propaga el virus, la velocidad a la que se propaga y estimar la cantidad de personas infectadas. A medida que tenemos más y más secuencias, los números son cada vez más precisos ”, dijo la profesora Anne-Mieke Vandamme de KU Leuven, Bélgica.

La secuenciación de próxima generación, o NGS, puede generar enormes cantidades de datos, y el desafío es encontrar formas de analizarlos adecuadamente.

Una de las herramientas desarrolladas, llamada Genome Detective, puede tomar los datos sin procesar de la máquina de secuenciación, filtrar los resultados de los no virus, juntar el genoma y usarlo para identificar el virus. No se basa en conjeturas o hipótesis anteriores, por lo que incluso puede identificar virus que no se han visto antes. Esto se utilizó para confirmar el primer caso de COVID-19 en Bélgica, identificándolo como un coronavirus relacionado con el SARS.

El poder de la secuenciación de genes proviene de comparar los resultados en diferentes casos. El profesor Vandamme dice que ha sido ‘fantástico’ ver el nivel de colaboración internacional: ‘Hay mucho más intercambio de datos y secuencias en línea … en comparación con el pasado porque tenemos muchas más herramientas de intercambio en línea disponibles’.

Una de estas herramientas es NextStrain, un recurso en línea que utiliza datos del genoma para monitorear la evolución de los organismos que causan enfermedades como los virus en tiempo real. Ha rastreado varios brotes, incluidos el zika, el ébola y el dengue, e incluso se ha utilizado para informar la política de la Organización Mundial de la Salud sobre la gripe estacional.

Los trabajos de investigación generalmente tardan meses en publicarse, un eón en la carrera actual para enfrentar la pandemia. La necesidad de compartir información rápidamente ha alentado un mayor intercambio de ‘preprints, borradores de documentos que aún no han sido revisados ​​por pares.

“El impulso hacia la ciencia abierta, los datos abiertos y los preprints realmente ha cambiado la forma en que experimentamos el discurso científico en este brote en comparación con los anteriores”, dijo el profesor Richard Neher, de la Universidad de Basilea, Suiza, que lidera el proyecto NextStrain.

Impacto económico del Open Data

 

captura-6

The Economic Impact of Open Data: Opportunities for value creation in Europe”. Capegnini, 2020

Texto completo

 

Los datos abiertos hacen referencia a la información recopilada, elaborada o encargada por organismos públicos que puede utilizarse, modificarse y compartirse libremente por cualquier persona. Entre sus ventajas están un aumento en la transparencia y responsabilidad gubernamental, así como beneficios financieros tangibles para los ciudadanos, negocios y la sociedad civil

 

El estudio destaca las oportunidades cuantificables que ofrecen la utilización y la reutilización de series de datos abiertos, como el incremento de la eficiencia, la reducción de costes y ayuda para la consecución de objetivos sociales y medioambientales. El informe se ha elaborado a petición de la Comisión Europea en el marco de la iniciativa del Portal Europeo de Datos bajo la dirección de Capgemini Invent

El estudio de Capgemini publicado en 2015 para el lanzamiento del Portal Europeo de Datos estimó un valor de 75.700 millones de euros en volumen de mercado para Open Data en 2020, con un aumento significativo de aproximadamente un 37% entre 2016 y 2020. En este contexto, la Unión Europea lanzó el Portal Europeo de Datos, que recopila información sobre los datos disponibles en cada país europeo. Hasta la fecha, engloba 35 países, 82 catálogos, enlaces a casi un millón de conjuntos de datos en toda Europa y ofrece una serie de recursos de aprendizaje y ejemplos de uso de datos abiertos.

Esta edición del estudio, publicado por primera vez en 2015, examina de qué forma los datos abiertos (open data) pueden crear valor económico de múltiples formas. En concreto, muestra que el open data puede ser beneficioso en diversos sectores, de formas distintas y para una variedad de usuarios como empresas, administraciones públicas y ciudadanos. El informe revela también que los datos abiertos permiten un acceso más sencillo y rápido a un volumen mayor de información, contribuyendo así a mejorar el proceso de toma de decisiones. Estas son las principales conclusiones del estudio:

Dimensión del mercado de datos abiertos: En un escenario conservador de crecimiento, el tamaño del mercado de datos abiertos en la UE27+ llegará a los 199.510 millones de euros en 2025. En un marco optimista, la cifra alcanzaría los 334.200 millones; una diferencia de 143.690 millones de euros.

Empleo en el ámbito del open data: También se espera que crezca el número de personas que trabaja con el movimiento de datos abiertos. Según las previsiones, en 2025, este sector puede llegar hasta los 1,97 millones empleados directos e indirectos en un escenario optimista, 884.000 más que ahora —el escenario conservador augura alcanzar 1,12 millones de empleos—. Si en 2025 el valor creado por cada empleado superase los 169.000 euros (tal y como ocurrió en 2019), el tamaño del mercado de datos abiertos podría ser incluso mayor del previsto.

Incremento de la eficiencia y reducción de los costes gracias a los datos abiertos: El valor creado por los datos abiertos no se limita exclusivamente a los beneficios económicos. Los datos abiertos no solo ayudan a las empresas y las administraciones públicas a generar más ingresos por la creación de nuevos servicios y a reducir costes gracias a una mayor eficiencia en el trabajo, sino que también pueden ayudar a salvar vidas, ahorrar tiempo, conservar el medio ambiente y mejorar la transferencia de conocimientos a través de servicios lingüísticos.

Oportunidades para alcanzar el pleno potencial de los datos abiertos: Si se examina la creación de valor del open data, puede observarse que las oportunidades no solo residen en el tamaño de la fuerza de trabajo, sino, también, en la forma en que se crea y puede crearse valor en el futuro. Para ello es necesario que haya un suministro adecuado de series de datos abiertos. En la actualidad, existe un gran volumen de datos aptos para su publicación como open data, pero que todavía no están abiertos, lo que supone perder una oportunidad potencial. Al mismo tiempo, muchas series de datos no son adecuadas para su libre disponibilidad en su forma original, porque son confidenciales o porque contienen datos personales, como es el caso de los historiales médicos, y que se deben someter a un proceso de agregación o anonimización antes de que puedan ser distribuidos.

Esther Huyer, consultora de Capgemini Invent e investigadora jefe y autora del informe, ha señalado: “El open data está ahí para enriquecer nuestros proyectos basados en datos, permitir la adopción de decisiones informadas y mejorar nuestros procesos, servicios y productos. El potencial económico se materializa cuando incrementamos nuestro nivel de conocimiento y competencia para descubrir y aprovechar oportunidades. Debemos explorar y mejorar los enfoques dados a la reutilización de datos, ajustándolos a principios éticos y de sostenibilidad, dándoles la utilidad requerida y combinando potencialmente datos abiertos con datos personales, compartidos o de fuentes participativas”.

Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad

 

datos-abiertos-2-1024x899-1

 

Cadena Vela, Susana G. Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad. Tesis Universidad de Alicante, 2019

Texto completo

Haz clic para acceder a tesis_susana_graciela_cadena_vela.pdf

Los portales donde se publican datos abiertos son una oportunidad para democratizar el acceso a la información generada por las instituciones del sector público, así como potenciar su reutilización. Esta reutilización de datos abiertos permite el desarrollo de nuevos productos y servicios digitales, creando oportunidades de desarrollo social y económico. Sin embargo, la reutilización de estos datos se enfrenta con diversas barreras en su expansión, debido a diversos problemas relacionados con la calidad de datos que van desde la incompletitud de los datos hasta la falta de actualización de los mismos. En concreto, un criterio relevante de calidad de datos abiertos es la comprensibilidad, ya que un proceso de interpretación errónea de los datos abiertos provocará ambigüedades o malentendidos que desmotivará su reutilización. Por esta razón, un aspecto importante en el acceso a los datos abiertos son sus metadatos, es decir aquellos datos que describen el contenido del conjunto de datos abiertos, cuya finalidad es facilitar su comprensión. Con el fin de mejorar la comprensibilidad de los datos abiertos, las propuestas actuales se centran en la evaluación de los datos ya publicados, no existiendo propuestas que evalúen cómo se puede mejorar la comprensibilidad de los datos abiertos desde los sistemas de información de origen del dato. Esta tesis doctoral revisa y analiza los trabajos de investigación en datos abiertos mediante el desarrollo de un mapeo sistemático, incluyendo un análisis de barreras en la reutilización de datos abiertos, así como buenas prácticas y estándares aplicables al proceso de publicación de datos en formatos abiertos. Este análisis sistemático de trabajos previos de investigación ha servido como punto de partida para la definición de un marco de referencia que permita la publicación de datos abiertos comprensibles. En este marco de referencia se considera la comprensibilidad de los datos abiertos mediante la gestión de los metadatos desde las mismas fuentes de datos en los sistemas de información de origen, incluyendo el concepto de fichero de datos maestros de apertura. Finalmente, cabe destacar que, a través de la aplicación del método de investigación-acción, se ha validado el marco de referencia, utilizando entrevistas y grupos de discusión con varios administradores de portales de datos abiertos.

 

Tecnologías emergentes y datos abiertos: Inteligencia Artificial

30e68744ab73e1ef663a5602785fdeaa

 

Alejandro Alija. Tecnologías emergentes y datos abiertos: Inteligencia Artificial. Madrid: Gobierno de España, 2020

Texto completo

PDF

DOC

 

El primer informe de la serie está dedicado a la Inteligencia Artificial. Podemos definir la Inteligencia Artificial (IA) como la capacidad de una máquina para imitar la inteligencia humana. Esta tecnología tendrá un gran impacto en nuestras vidas, mediante dos vías: la automatización de tareas cotidianas, rutinarias y peligrosas y el aumento de las capacidades humanas, ayudando a potenciar la fuerza del trabajo del futuro.

 

Los buenos datos y los malos datos

 

612bxt6u4til

 

Good Data. Edited by Angela Daly, S. Kate Devitt and Monique Mann. Institute of Network Cultures, Amsterdam, 2019. ISBN 978-94-92302-27-4

Texto completo

PDF

ePub

 

Alejándose del fuerte cuerpo de críticas a las omnipresentes prácticas de “malos datos” tanto por parte de los gobiernos como de los actores privados en la economía digital globalizada, este libro pretende pintar un cuadro alternativo, más optimista pero aún pragmático, del futuro de los datos. Los autores examinan y proponen prácticas, valores y principios de “buenos datos” desde una perspectiva interdisciplinaria e internacional. Desde las ideas de soberanía y justicia de los datos, hasta los manifiestos por el cambio y los llamados al activismo, esta colección abre una conversación multifacética sobre los tipos de futuros que queremos ver, y presenta pasos concretos sobre cómo podemos empezar a realizar buenos datos en la práctica.

 

Desarrollo de recursos lingüísticos vinculados de datos abiertos para la investigación intensiva

3fcollid3dbooks_covers_026isbn3d978026253625726type3d

Pareja-Lora, Antonio — Lust, Barbara — Blume, Maria — Chiarcos, Christian. Development of Linguistic Linked Open Data Resources for Collaborative Data-Intensive Research in the Language Sciences. Knowledge Unlatched, 2020.

Texto completo

 

Este libro es el producto de un taller internacional dedicado a abordar la accesibilidad a los datos en el campo de la lingüística. Por lo tanto, es vital para la misión del libro que su contenido sea de acceso abierto. La lingüística como campo queda por detrás de muchos otros en lo que respecta a la gestión de datos y las estrategias de accesibilidad. El problema es particularmente agudo en el subcampo de la adquisición de lenguas, donde se necesitan archivos de sonido lingüísticos internacionales como referencia. Las preocupaciones de los lingüistas están muy ligadas a la cantidad de información acumulada por los investigadores individuales a lo largo de los años, que sigue siendo fragmentada e inaccesible para la comunidad en general. Estas preocupaciones son compartidas por otros campos, pero la lingüística hasta la fecha ha visto pocos esfuerzos para abordarlas. Esta colección, realizada por una serie de expertos líderes en el campo, representa un gran paso adelante. Su alcance internacional y la combinación interdisciplinaria de académicos/bibliotecarios/consultores de datos proporcionarán una importante contribución al campo.

 

Reutilización de datos abiertos, una oportunidad para España

 

74dfb6cd664d275bc9bfb9b2d11e071d

 

Reutilización de datos abiertos, una oportunidad para España. Madrid COTEC 2019

 

Texto completo

En este estudio se han identificado los portales de datos abiertos en España y se ha analizado la muestra de juego de datos disponibles y los servicios basados en ellos. Con este análisis se ha hecho un diagnóstico sobre el conocimiento que existe acerca de la reutilización de datos abiertos, el tipo de innovación que se puede promover con ellos y las actividades de promoción de su uso.

A partir de este diagnóstico se han desarrollado algunas reflexiones con el objetivo de construir políticas públicas de gestión de datos para sacar el máximo potencial de ellos a favor de los usuarios.

La fundación COTEC, una organización privada sin ánimo de lucro que fomenta la innovación como motor de desarrollo económico y social en España, ha publicado recientemente su informe “La Reutilización de Datos Abiertos: una oportunidad para España”.  En este estudio, liderado por los expertos Alberto Abella, María Ortiz de Urbina y Carmen de Pablos, se han realizado diferentes ejercicios de diagnóstico para dibujar un escenario que busca mostrar el conocimiento actual sobre la reutilización de los datos abiertos, para, así, identificar directrices y recomendaciones que ayuden a fomentar el uso de los datos en la generación de negocios.

La realización del estudio ha seguido una metodología que incluye principalmente tres áreas de investigación:

  • Estudio de 103 portales nacionales operativos referidos en el mapa de iniciativas de datos.gob.es, y de su madurez según una versión simplificada del modelo establecido por el portal paneuropeo de datos.
  • Estudio de los juegos de datos publicados,  sobre un total de 20.026 datasets identificados, tras el filtrado necesario para evitar duplicidades fruto de las federaciones entre portales.
  • Estudio de la reutilización de los datos publicados a través de una encuesta realizada a los responsables de los portales open data en España.

 

Informe anual de la madurez de los datos abiertos en Europa 2019

 

captura-12

 

Open Data Maturity Report 2019”.  Brussels: European Commission Capgemini, 2019

Texto completo

 

Según dijo Marit Blank, consultora de Capgemini Invent e investigadora principal y autora del informe, a medida que madura la oferta de datos abiertos de los Estados miembros, podemos ver que su enfoque se desplaza hacia la centralización de los reutilizadores de datos abiertos Esta es una ilustración tangible de cómo los países europeos se esfuerzan por ir más allá de lo básico para ofrecer un valor coherente y sostenible a sus ciudadanos

 

El informe “Open Data Maturity Report 2019″ registra los avances logrados por los países europeos a medida que impulsan la publicación y reutilización de datos abiertos y las diferentes prioridades que han establecido para permitirlo. El informe fue solicitado por la Comisión Europea en el contexto del Portal Europeo de Datos y coordinado por Capgemini.

De la aceleración a la consolidación: Tras años de aceleración de la madurez de los datos abiertos, Europa ha entrado en una fase de consolidación. Desde el inicio de la evaluación en 2015, el nivel general de madurez aumentó significativamente cada año hasta alcanzar su punto máximo en 2017. La aceleración más temprana y fácil hacia la madurez evolucionó hacia la tendencia más estable de mejora y consolidación que se observa hoy en día. Frente a unas políticas de datos abiertas, unos modelos de gobernanza y unos portales avanzados sólidos, los países de la UE28+ están ampliando e intensificando sus esfuerzos en los ámbitos más difíciles de la calidad y el impacto de los datos abiertos.

De la cantidad a la calidad, para atender mejor las necesidades de los usuarios: A medida que maduran las propuestas de datos abiertos de los países europeos, su enfoque se ha desplazado de la cantidad a la calidad. En los primeros años, se hicieron grandes esfuerzos para publicar más datos bajo una licencia abierta, liberando activos de datos que ya estaban en manos de las administraciones públicas. Hoy en día, se hace un mayor hincapié en garantizar el valor de los datos para los reutilizadores, lo que a menudo significa mejorar la calidad de los datos en primer lugar. Esto es particularmente cierto a medida que los equipos de datos abiertos, tanto a nivel nacional como local, se comprometen más con la comunidad de reutilizadores, escuchan sus comentarios y se esfuerzan por satisfacer sus necesidades.

De la publicación a la creación de impacto: Los países de la UE28+ ya no se centran únicamente en la publicación de datos abiertos y en el cumplimiento de los demás requisitos de la Directiva sobre la información del sector público de la Unión Europea, sino más bien en aprovechar al máximo los datos para lograr un mayor impacto. Están llevando a cabo más actividades para comprender y capturar cómo se crea valor con los datos y para obtener información sobre las demandas y necesidades de los reutilizadores. Los ejemplos van desde eventos para comprometerse con las diversas comunidades de reutilizadores y el desarrollo de marcos de monitoreo de impacto, hasta encuestas de satisfacción y estudios sobre el valor social, ambiental, político y económico de los datos abiertos.

El intercambio de datos es la próxima frontera: Los gobiernos son cada vez más conscientes de las oportunidades que ofrece el intercambio de datos en general. Cuando un conjunto de datos no puede publicarse libremente -por ejemplo, debido a limitaciones de propiedad intelectual o a preocupaciones de confidencialidad- no significa que su valor no pueda ser realizado de acuerdo con otros modelos. Esto se denomina comúnmente “intercambio de datos” en los sectores público y privado. Los Estados Miembros se están preparando para compartir eficazmente los datos con otros gobiernos y organizaciones, de manera segura y respetando plenamente la propiedad intelectual y la privacidad. La Comisión Europea es consciente de este cambio y desea apoyar el proceso. Para ello, inició un nuevo proyecto, lanzado el pasado mes de octubre: el “Support Centre for Data Sharing”.

Datos generales de madurez de datos abiertos 2019

Las puntuaciones generales de madurez de los datos abiertos de la evaluación de 2019:

– Irlanda, España y Francia mantienen desde el año pasado su posición de liderazgo en Europa.
– La puntuación media de la madurez de los datos abiertos de la UE28 es del 66 %, lo que supone un aumento de tan sólo un punto porcentual con respecto a 2018.
– Exactamente la mitad de los 32 países participantes se sitúa por encima de la media de la UE28 y la otra mitad por debajo.
– La puntuación media de la madurez de los datos abiertos de la EU28+ es ligeramente inferior a la de la EU28: 62 %.
– 20 de los 32 países participantes se sitúan por encima de la media de la UE28+, y 12 por debajo.