Archivo de la etiqueta: Datos abiertos

Estado de los datos abiertos

“The State of the Union of Open Data” (3rd Ed.). The Data Foundation, 2019

Texto completo

The State of the Union of Open Data, que se basa en 33 entrevistas en profundidad con altos cargos de la administración pública y el sector privado. El informe de este año ha encuestado a los líderes del mundo de los datos abiertos sobre el panorama actual en tres categorías: normalización de datos, publicación e intercambio, y uso. El objetivo es informar al público sobre la historia y las tendencias actuales de los datos abiertos y destacar las perspectivas de los líderes de los datos abierto, y todo indica que los datos abiertos están avanzando. Sus beneficios son exponenciales: el uso de los datos abiertos puede aplicarse a muchos sectores diferentes de la sociedad y la administración, como la sanidad, la vivienda, la educación y la defensa nacional.

El aumento de la estandarización, el intercambio y, lo que es más importante, el uso de los datos abiertos ha dado lugar a una mayor eficiencia de los programas gubernamentales, una mayor transparencia y mejores resultados. Lo que ayudará a acelerar las mejoras en los programas y servicios gubernamentales y permitirá a los líderes de las agencias tomar mejores decisiones en aspectos tan decisivos cómo asignar los escasos recursos del gobierno.

Resultados clave:

  • Casi el 84% de los encuestados informaron de avances en la normalización de datos en su agencia u organización en el último año, en comparación con el 81,8% del año pasado.
  • Casi el 85 por ciento de los encuestados informaron de una mejora en la publicación o el intercambio de datos en su agencia u organización en el último año, frente al 76,2 por ciento del informe del año pasado.
  • Casi todos los encuestados, el 96,9%, afirman que el uso de datos para la toma de decisiones informadas y el conocimiento ha mejorado en su agencia u organización durante el último año.
  • El 93,6 por ciento de los encuestados indica que cree que la normalización, el intercambio y el uso de datos abiertos mejorarán en el futuro inmediato, en comparación con el 79,2 por ciento de los encuestados de 2017.
  • Los encuestados identifican la gestión interna como el principal beneficio de los datos abiertos, seguido de la transparencia y la automatización de los informes.

Desarrollo de Recursos de Datos Abiertos Vinculados Lingüísticamente para la Investigación Colaborativa de Datos en las Ciencias del Lenguaje

Development of Linguistic Linked Open Data Resources for Collaborative Data-Intensive Research in the Language Sciencesnull, . [e-Book] The MIT Press, 2019

Texto completo

Este libro es el producto de un taller internacional dedicado a abordar la accesibilidad a los datos en el campo de la lingüística. Por lo tanto, es vital para la misión del libro que su contenido sea de acceso abierto. La lingüística como campo permanece detrás de muchos otros en cuanto a manejo de datos y estrategias de accesibilidad. El problema es particularmente agudo en el subcampo de la adquisición de idiomas, en el que se necesitan archivos de sonido lingüísticos internacionales como referencia. Las preocupaciones de los lingüistas están muy vinculadas a la cantidad de información acumulada por los investigadores individuales a lo largo de los años, que sigue siendo fragmentada e inaccesible para la comunidad en general. Estas preocupaciones son compartidas por otros campos, pero la lingüística hasta la fecha ha visto pocos esfuerzos por abordarlas. Esta colección, emprendida por una serie de destacados expertos en la materia, representa un gran paso adelante. Su alcance internacional y la combinación interdisciplinaria de académicos/bibliotecarios/consultores de datos proporcionará una importante contribución al campo.


Estado de los Datos Abiertos 2020

Science, Digital; Hahnel, Mark; McIntosh Borrelli, Leslie; Hyndman, Alan; Baynes, Grace; Crosas, Merce; et al. (2020): The State of Open Data 2020. Digital Science. Report. https://doi.org/10.6084/m9.figshare.13227875.v2 

Texto completo

Informe

Conjunto de datos del informe y preguntas de la encuesta

The State of Open Data examina las actitudes y experiencias de los investigadores que trabajan con datos abiertos, compartiéndolos, reutilizándolos y redistribuyéndolos.

La encuesta de este año recibió alrededor de 4.500 respuestas de la comunidad de investigadores y se centró adicionalmente en las prácticas de investigación tras la pandemia de COVID-19. En ella se preguntaba a los investigadores cómo estaba repercutiendo la pandemia en su capacidad de llevar a cabo investigaciones, y sus opiniones sobre la reutilización de los datos y la colaboración.

Entre las principales conclusiones de COVID-19 figuran las siguientes:

  • Un tercio (32%) de los investigadores académicos informaron que su investigación había sido “extremadamente” o “muy” impactada por el brote de COVID-19.
  • Las disciplinas más afectadas por COVID-19 fueron las que trabajaban en Química (47%), Biología (39%), Medicina (36%) y Ciencia de los Materiales (36%). El menor nivel de impacto se registró en Humanidades y Ciencias Sociales (20%)
  • El 43% de los encuestados ya han utilizado o es probable que reutilicen su subvención en cierta medida para la investigación de COVID-19
  • La mitad de los encuestados considera que el bloqueo es “extremadamente” o “algo” probable que resulte en la reutilización de los datos abiertos proporcionados por otros laboratorios, y el 65% espera reutilizar sus propios datos.
  • Más de un tercio de los investigadores dicen que esperan ver más colaboración como resultado de COVID-19; para aquellos en países como Brasil e India donde el impacto de COVID-19 en la investigación parece significativo, alrededor de la mitad esperan que la colaboración aumente como resultado.
  • El número de encuestados que nunca hacen un plan de gestión de datos se redujo a la mitad del 30% al 15%
  • En 2018, el 60% de los encuestados nunca había oído hablar de los principios FAIR, este año ese número se redujo al 39% y la familiaridad general ha aumentado del 15% al 24%.
  • El 55% de los encuestados consideraron que el intercambio de datos debería ser parte de los requisitos para la concesión de subvenciones
  • El 29% de los encuestados no saben quién cubriría los costos de hacer que sus datos de investigación estén en libre acceso
  • Sólo el 13% de los encuestados consideraron que los investigadores reciben actualmente suficiente crédito por compartir datos, mientras que el 59% consideró que recibieron muy poco crédito.

¿Utilizan los investigadores datos de investigación abiertos?

Quarati, A. , Raffaghelli, J. E. “Do Researchers Use Open Research Data? Exploring the Relationships Between Usage Trends and Metadata Quality Across Scientific Disciplines From the Figshare Case“. Journal of Information Science
Article First Published Online October 4, 2020

Texto completo

Los datos de investigación abiertos (ORD) se han considerado un motor de transparencia científica. Sin embargo, también se ha señalado la fricción de datos, como fenómeno de subutilización de datos por varias causas. Un factor que a menudo se cuestiona por el bajo uso de ORD es la calidad de la ORD y los metadatos asociados. 

Este trabajo tiene como objetivo ilustrar el uso de ORD, publicado por el repositorio científico de Figshare, en relación con su disciplina científica, su tipo y en comparación con la calidad de sus metadatos. Considerando todos los recursos de Figshare y realizando una evaluación de la calidad programática de sus metadatos, nuestro análisis destacó dos aspectos. 

En primer lugar, independientemente del dominio científico considerado, la mayoría de las ORD están infrautilizadas, pero con casos excepcionales que concentran la atención de la mayoría de los investigadores. Segundo, No hubo evidencia de que el uso de ORD esté asociado con buenas prácticas de publicación de metadatos. Estos dos hallazgos abrieron una reflexión sobre las posibles causas de tal fricción de datos.

Publicar en el ecosistema de la ciencia abierta

Así será la transición editorial a la ciencia abierta

Antunes, M. L.; Sanches, T.; Lopes, C. y Alonso-Arévalo, J. (2020). Publicar en el ecosistema de la ciencia abierta. Cuadernos de Documentación Multimedia, 31, e71449.

Texto completo

La difusión del conocimiento científico se materializa en su escritura, publicación y circulación. La Ciencia Abierta es, por su la naturaleza, una plataforma para el diálogo, fomentando más intercambios y estimulando a los investigadores adaptar sus prácticas de publicación y difusión, lo que les permitirá reducir los costes, la mejora de los contenidos académicos, así como el fomento de una mayor circulación y generación del conocimiento. El objetivo es la realización de propuestas sobre las acciones que los investigadores deben llevar a cabo en el ámbito de la investigación como conversación, es decir, la integración de la escritura académica en la Ciencia Abierta y el intercambio de datos y resultados de la investigación. Finalmente se reflexiona sobre los actuales retos de la Ciencia Abierta para los investigadores y el mundo académico.

Covid-19: cómo el intercambio de datos sin precedentes ha llevado a una investigación de brotes más rápida que nunca

 

Virology Lab Work As Europe On Coronavirus High Alert

 

Covid-19: How unprecedented data sharing has led to faster-than-ever outbreak research Horizon, 23 March 2020 by Ian Le Guillou

Ver completo.

“El impulso hacia la ciencia abierta, los datos abiertos y los preprints realmente ha cambiado la forma en que experimentamos el discurso científico en este brote en comparación con los anteriores”, dijo el profesor Richard Neher, de la Universidad de Basilea, Suiza.

Los avances en la secuenciación de genes han permitido a los científicos rastrear y monitorear la pandemia de COVID-19 más rápido que cualquier brote anterior. Sin embargo, las lagunas en nuestro conocimiento de cómo funcionan los coronavirus ha dificultado la comprensión de lo que hace especial al nuevo coronavirus.

 

Cuando se identificó el nuevo coronavirus (conocido formalmente como SARS-CoV-2) en China en enero, los científicos de todo el mundo estaban listos para responder. Toda la composición genética del virus, o genoma, se publicó en línea en cuestión de días. En comparación, durante el brote de coronavirus del SARS en 2003, esto tomó casi tres meses, después de que la enfermedad se atribuyera originalmente a la clamidia

Los avances en la tecnología han reducido significativamente el costo de la secuenciación de genes y las máquinas ahora son lo suficientemente pequeñas como para caber en la palma de su mano. Esto ha facilitado la secuenciación de una gran cantidad de muestras en todo el mundo.

‘Puede ver en las secuencias cómo se propaga el virus, la velocidad a la que se propaga y estimar la cantidad de personas infectadas. A medida que tenemos más y más secuencias, los números son cada vez más precisos ”, dijo la profesora Anne-Mieke Vandamme de KU Leuven, Bélgica.

La secuenciación de próxima generación, o NGS, puede generar enormes cantidades de datos, y el desafío es encontrar formas de analizarlos adecuadamente.

Una de las herramientas desarrolladas, llamada Genome Detective, puede tomar los datos sin procesar de la máquina de secuenciación, filtrar los resultados de los no virus, juntar el genoma y usarlo para identificar el virus. No se basa en conjeturas o hipótesis anteriores, por lo que incluso puede identificar virus que no se han visto antes. Esto se utilizó para confirmar el primer caso de COVID-19 en Bélgica, identificándolo como un coronavirus relacionado con el SARS.

El poder de la secuenciación de genes proviene de comparar los resultados en diferentes casos. El profesor Vandamme dice que ha sido ‘fantástico’ ver el nivel de colaboración internacional: ‘Hay mucho más intercambio de datos y secuencias en línea … en comparación con el pasado porque tenemos muchas más herramientas de intercambio en línea disponibles’.

Una de estas herramientas es NextStrain, un recurso en línea que utiliza datos del genoma para monitorear la evolución de los organismos que causan enfermedades como los virus en tiempo real. Ha rastreado varios brotes, incluidos el zika, el ébola y el dengue, e incluso se ha utilizado para informar la política de la Organización Mundial de la Salud sobre la gripe estacional.

Los trabajos de investigación generalmente tardan meses en publicarse, un eón en la carrera actual para enfrentar la pandemia. La necesidad de compartir información rápidamente ha alentado un mayor intercambio de ‘preprints, borradores de documentos que aún no han sido revisados ​​por pares.

“El impulso hacia la ciencia abierta, los datos abiertos y los preprints realmente ha cambiado la forma en que experimentamos el discurso científico en este brote en comparación con los anteriores”, dijo el profesor Richard Neher, de la Universidad de Basilea, Suiza, que lidera el proyecto NextStrain.

Impacto económico del Open Data

 

captura-6

The Economic Impact of Open Data: Opportunities for value creation in Europe”. Capegnini, 2020

Texto completo

 

Los datos abiertos hacen referencia a la información recopilada, elaborada o encargada por organismos públicos que puede utilizarse, modificarse y compartirse libremente por cualquier persona. Entre sus ventajas están un aumento en la transparencia y responsabilidad gubernamental, así como beneficios financieros tangibles para los ciudadanos, negocios y la sociedad civil

 

El estudio destaca las oportunidades cuantificables que ofrecen la utilización y la reutilización de series de datos abiertos, como el incremento de la eficiencia, la reducción de costes y ayuda para la consecución de objetivos sociales y medioambientales. El informe se ha elaborado a petición de la Comisión Europea en el marco de la iniciativa del Portal Europeo de Datos bajo la dirección de Capgemini Invent

El estudio de Capgemini publicado en 2015 para el lanzamiento del Portal Europeo de Datos estimó un valor de 75.700 millones de euros en volumen de mercado para Open Data en 2020, con un aumento significativo de aproximadamente un 37% entre 2016 y 2020. En este contexto, la Unión Europea lanzó el Portal Europeo de Datos, que recopila información sobre los datos disponibles en cada país europeo. Hasta la fecha, engloba 35 países, 82 catálogos, enlaces a casi un millón de conjuntos de datos en toda Europa y ofrece una serie de recursos de aprendizaje y ejemplos de uso de datos abiertos.

Esta edición del estudio, publicado por primera vez en 2015, examina de qué forma los datos abiertos (open data) pueden crear valor económico de múltiples formas. En concreto, muestra que el open data puede ser beneficioso en diversos sectores, de formas distintas y para una variedad de usuarios como empresas, administraciones públicas y ciudadanos. El informe revela también que los datos abiertos permiten un acceso más sencillo y rápido a un volumen mayor de información, contribuyendo así a mejorar el proceso de toma de decisiones. Estas son las principales conclusiones del estudio:

Dimensión del mercado de datos abiertos: En un escenario conservador de crecimiento, el tamaño del mercado de datos abiertos en la UE27+ llegará a los 199.510 millones de euros en 2025. En un marco optimista, la cifra alcanzaría los 334.200 millones; una diferencia de 143.690 millones de euros.

Empleo en el ámbito del open data: También se espera que crezca el número de personas que trabaja con el movimiento de datos abiertos. Según las previsiones, en 2025, este sector puede llegar hasta los 1,97 millones empleados directos e indirectos en un escenario optimista, 884.000 más que ahora —el escenario conservador augura alcanzar 1,12 millones de empleos—. Si en 2025 el valor creado por cada empleado superase los 169.000 euros (tal y como ocurrió en 2019), el tamaño del mercado de datos abiertos podría ser incluso mayor del previsto.

Incremento de la eficiencia y reducción de los costes gracias a los datos abiertos: El valor creado por los datos abiertos no se limita exclusivamente a los beneficios económicos. Los datos abiertos no solo ayudan a las empresas y las administraciones públicas a generar más ingresos por la creación de nuevos servicios y a reducir costes gracias a una mayor eficiencia en el trabajo, sino que también pueden ayudar a salvar vidas, ahorrar tiempo, conservar el medio ambiente y mejorar la transferencia de conocimientos a través de servicios lingüísticos.

Oportunidades para alcanzar el pleno potencial de los datos abiertos: Si se examina la creación de valor del open data, puede observarse que las oportunidades no solo residen en el tamaño de la fuerza de trabajo, sino, también, en la forma en que se crea y puede crearse valor en el futuro. Para ello es necesario que haya un suministro adecuado de series de datos abiertos. En la actualidad, existe un gran volumen de datos aptos para su publicación como open data, pero que todavía no están abiertos, lo que supone perder una oportunidad potencial. Al mismo tiempo, muchas series de datos no son adecuadas para su libre disponibilidad en su forma original, porque son confidenciales o porque contienen datos personales, como es el caso de los historiales médicos, y que se deben someter a un proceso de agregación o anonimización antes de que puedan ser distribuidos.

Esther Huyer, consultora de Capgemini Invent e investigadora jefe y autora del informe, ha señalado: “El open data está ahí para enriquecer nuestros proyectos basados en datos, permitir la adopción de decisiones informadas y mejorar nuestros procesos, servicios y productos. El potencial económico se materializa cuando incrementamos nuestro nivel de conocimiento y competencia para descubrir y aprovechar oportunidades. Debemos explorar y mejorar los enfoques dados a la reutilización de datos, ajustándolos a principios éticos y de sostenibilidad, dándoles la utilidad requerida y combinando potencialmente datos abiertos con datos personales, compartidos o de fuentes participativas”.

Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad

 

datos-abiertos-2-1024x899-1

 

Cadena Vela, Susana G. Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad. Tesis Universidad de Alicante, 2019

Texto completo

Haz clic para acceder a tesis_susana_graciela_cadena_vela.pdf

Los portales donde se publican datos abiertos son una oportunidad para democratizar el acceso a la información generada por las instituciones del sector público, así como potenciar su reutilización. Esta reutilización de datos abiertos permite el desarrollo de nuevos productos y servicios digitales, creando oportunidades de desarrollo social y económico. Sin embargo, la reutilización de estos datos se enfrenta con diversas barreras en su expansión, debido a diversos problemas relacionados con la calidad de datos que van desde la incompletitud de los datos hasta la falta de actualización de los mismos. En concreto, un criterio relevante de calidad de datos abiertos es la comprensibilidad, ya que un proceso de interpretación errónea de los datos abiertos provocará ambigüedades o malentendidos que desmotivará su reutilización. Por esta razón, un aspecto importante en el acceso a los datos abiertos son sus metadatos, es decir aquellos datos que describen el contenido del conjunto de datos abiertos, cuya finalidad es facilitar su comprensión. Con el fin de mejorar la comprensibilidad de los datos abiertos, las propuestas actuales se centran en la evaluación de los datos ya publicados, no existiendo propuestas que evalúen cómo se puede mejorar la comprensibilidad de los datos abiertos desde los sistemas de información de origen del dato. Esta tesis doctoral revisa y analiza los trabajos de investigación en datos abiertos mediante el desarrollo de un mapeo sistemático, incluyendo un análisis de barreras en la reutilización de datos abiertos, así como buenas prácticas y estándares aplicables al proceso de publicación de datos en formatos abiertos. Este análisis sistemático de trabajos previos de investigación ha servido como punto de partida para la definición de un marco de referencia que permita la publicación de datos abiertos comprensibles. En este marco de referencia se considera la comprensibilidad de los datos abiertos mediante la gestión de los metadatos desde las mismas fuentes de datos en los sistemas de información de origen, incluyendo el concepto de fichero de datos maestros de apertura. Finalmente, cabe destacar que, a través de la aplicación del método de investigación-acción, se ha validado el marco de referencia, utilizando entrevistas y grupos de discusión con varios administradores de portales de datos abiertos.

 

Tecnologías emergentes y datos abiertos: Inteligencia Artificial

30e68744ab73e1ef663a5602785fdeaa

 

Alejandro Alija. Tecnologías emergentes y datos abiertos: Inteligencia Artificial. Madrid: Gobierno de España, 2020

Texto completo

PDF

DOC

 

El primer informe de la serie está dedicado a la Inteligencia Artificial. Podemos definir la Inteligencia Artificial (IA) como la capacidad de una máquina para imitar la inteligencia humana. Esta tecnología tendrá un gran impacto en nuestras vidas, mediante dos vías: la automatización de tareas cotidianas, rutinarias y peligrosas y el aumento de las capacidades humanas, ayudando a potenciar la fuerza del trabajo del futuro.

 

Los buenos datos y los malos datos

 

612bxt6u4til

 

Good Data. Edited by Angela Daly, S. Kate Devitt and Monique Mann. Institute of Network Cultures, Amsterdam, 2019. ISBN 978-94-92302-27-4

Texto completo

PDF

ePub

 

Alejándose del fuerte cuerpo de críticas a las omnipresentes prácticas de “malos datos” tanto por parte de los gobiernos como de los actores privados en la economía digital globalizada, este libro pretende pintar un cuadro alternativo, más optimista pero aún pragmático, del futuro de los datos. Los autores examinan y proponen prácticas, valores y principios de “buenos datos” desde una perspectiva interdisciplinaria e internacional. Desde las ideas de soberanía y justicia de los datos, hasta los manifiestos por el cambio y los llamados al activismo, esta colección abre una conversación multifacética sobre los tipos de futuros que queremos ver, y presenta pasos concretos sobre cómo podemos empezar a realizar buenos datos en la práctica.