Archivo de la etiqueta: Datos abiertos

Impulso europeo a los datos abiertos y su continuidad en el programa Digital Europe

European Health and Digital Executive Agency; European Commission (2025). Public open data: CEF Telecom projects at a glance. Publications Office of the European Union. ISBN 978-92-95239-44-9.

Texto completo

Se ofrece una visión general de los proyectos de datos públicos abiertos financiados en el marco del programa CEF Telecom (2014-2020) y los sectores o ámbitos en los que se desarrolló cada proyecto, mostrando algunos proyectos y su impacto. Además, esta ficha informativa tiene por objeto describir cómo el programa Europa Digital tomó el relevo y apoya los espacios comunes europeos de datos. Los datos públicos abiertos son un servicio que facilita y armoniza el acceso a conjuntos de datos creados y gestionados por organismos públicos de toda la UE. El objetivo general es la mejora de las infraestructuras de servicios digitales y el desarrollo de productos y servicios de información basados en la reutilización y la combinación de datos en poder de actores públicos y comerciales de toda la UE. Los datos públicos son toda la información que los organismos públicos producen, recopilan o pagan. Esta información es importante para su reutilización en nuevos productos y servicios. Al abrir los datos públicos, se promovió la participación de los ciudadanos y los expertos en la vida política y social.

Datos listos para la IA: consideraciones clave para la ciencia abierta y responsable

McBride, Vanessa; Natalia Norori; Denisse Albornoz. Data and AI for Science: Key Considerations. Working Paper, International Science Council, septiembre de 2025. DOI: 10.24948/2025.11

Texto completo

El informe ofrece una visión amplia y crítica del cruce entre inteligencia artificial, datos y ciencia, destacando que solo mediante la combinación de apertura, responsabilidad y cooperación internacional se podrá aprovechar plenamente el potencial de la IA en beneficio del conocimiento y la sociedad.

El informe explora cómo la inteligencia artificial está transformando la práctica científica y qué condiciones deben cumplirse para que los datos puedan aprovecharse de manera efectiva, ética y sostenible. La noción central es la de datos “AI-ready”, es decir, conjuntos de datos preparados para ser procesados y reutilizados por sistemas de IA en beneficio de la investigación. Este concepto implica que los datos no solo deben estar disponibles, sino también estructurados, limpios, interoperables y documentados de manera adecuada.

Una parte importante del documento se centra en la calidad e interoperabilidad de los datos. La ciencia abierta ha impulsado normas como FAIR (Findable, Accessible, Interoperable, Reusable), pero el uso de IA añade nuevas exigencias. Por ejemplo, los algoritmos requieren datos con metadatos consistentes, esquemas comunes y estándares de anotación que permitan la reutilización automática. Además, se subraya que la preparación de datos para IA debe considerar la reducción de sesgos y garantizar la inclusión de voces y contextos diversos, para evitar reproducir inequidades existentes en los resultados científicos.

Otro eje del informe son las dimensiones éticas, sociales y ambientales. Los autores advierten que el entrenamiento y uso de grandes modelos de IA conlleva altos costes energéticos y huellas de carbono significativas, por lo que la sostenibilidad debe integrarse en la planificación de infraestructuras científicas. En paralelo, se examinan los riesgos para la privacidad, la seguridad y la soberanía de los datos, especialmente en campos sensibles como la biomedicina o las ciencias sociales. Estos retos requieren marcos sólidos de gobernanza que equilibren apertura y protección.

El informe también vincula la preparación de datos para IA con la agenda de la ciencia abierta. Se argumenta que los principios de transparencia, accesibilidad y colaboración resultan esenciales para garantizar que la IA potencie la ciencia de manera inclusiva y global. Se destacan casos prácticos en los que repositorios, proyectos colaborativos y consorcios internacionales han logrado implementar buenas prácticas de datos AI-ready, sirviendo como ejemplos para otras disciplinas.

Finalmente, se presentan recomendaciones estratégicas:

  • Consolidar marcos normativos y estándares internacionales, como FAIR-R y Croissant.
  • Invertir en infraestructuras digitales y capacidad de cómputo adecuadas para la investigación con IA.
  • Fortalecer la capacitación en gestión de datos e inteligencia artificial.
  • Reconocer institucionalmente la labor de quienes trabajan en la preparación y curación de datos.
  • Garantizar la equidad y la inclusividad en las políticas sobre datos e IA, evitando que el acceso desigual a recursos tecnológicos aumente las brechas entre regiones y comunidades científicas.

Repositorios de Datos Abiertos: guía para la selección y depósito

F1000Research. «Open Data Repositories.» Think F1000Research, febrero de 2021. PDF. https://think.f1000research.com/wp-content/uploads/2021/02/F1000Research-Open-Data-Repositories.pdf.

Los repositorios de datos abiertos constituyen un componente esencial del ecosistema de investigación científica contemporánea. El depósito de datos en repositorios públicamente accesibles y reconocidos que asignan identificadores globalmente persistentes garantiza que los conjuntos de datos permanezcan disponibles tanto para humanos como para máquinas en un formato utilizable en el futuro.

1. Repositorios de Acceso Controlado

En casos donde el intercambio abierto de datos no es factible debido a consideraciones éticas o de confidencialidad, los repositorios de acceso controlado proporcionan una solución viable. Estos permiten el acceso a datos sensibles a través de usuarios autenticados, dependiendo de los permisos otorgados por los participantes del estudio y las aprobaciones del comité ético.

2. Repositorios Específicos por Disciplina

Los repositorios específicos por disciplina ofrecen conocimiento especializado del dominio y experiencia en curación para tipos particulares de datos. Dado que los datos de investigación varían considerablemente entre disciplinas, estos repositorios proporcionan ventajas significativas al hacer que los datos sean más visibles para otros miembros de la comunidad de investigación específica.

3. Repositorios Institucionales

Muchas instituciones ofrecen apoyo a sus empleados para la gestión y depósito de datos. Los repositorios institucionales que aceptan conjuntos de datos proporcionan administración y custodia, ayudando a asegurar que los conjuntos de datos se preserven y sean accesibles a largo plazo.

4. Repositorios Generales de Datos

Los repositorios generales de datos aceptan conjuntos de datos independientemente de la disciplina o institución. Estos repositorios admiten una amplia variedad de tipos de archivos y son particularmente útiles cuando no existe un repositorio específico por disciplina.

Tipos de Repositorios de Datos

1. Repositorios de Acceso Controlado

En casos donde el intercambio abierto de datos no es factible debido a consideraciones éticas o de confidencialidad, los repositorios de acceso controlado proporcionan una solución viable. Estos permiten el acceso a datos sensibles a través de usuarios autenticados, dependiendo de los permisos otorgados por los participantes del estudio y las aprobaciones del comité ético.

2. Repositorios Específicos por Disciplina

Los repositorios específicos por disciplina ofrecen conocimiento especializado del dominio y experiencia en curación para tipos particulares de datos. Dado que los datos de investigación varían considerablemente entre disciplinas, estos repositorios proporcionan ventajas significativas al hacer que los datos sean más visibles para otros miembros de la comunidad de investigación específica.

3. Repositorios Institucionales

Muchas instituciones ofrecen apoyo a sus empleados para la gestión y depósito de datos. Los repositorios institucionales que aceptan conjuntos de datos proporcionan administración y custodia, ayudando a asegurar que los conjuntos de datos se preserven y sean accesibles a largo plazo.

4. Repositorios Generales de Datos

Los repositorios generales de datos aceptan conjuntos de datos independientemente de la disciplina o institución. Estos repositorios admiten una amplia variedad de tipos de archivos y son particularmente útiles cuando no existe un repositorio específico por disciplina.

Características Importantes de los Repositorios

Versionado

Algunos repositorios permiten cambios en los conjuntos de datos depositados a través del versionado. La selección de un repositorio que incluya esta característica proporciona flexibilidad para agregar nuevos datos, reestructurar y realizar mejoras al conjunto de datos. Cada versión del conjunto de datos es identificable de manera única y se mantiene, lo que permite a otros encontrar, acceder, reutilizar y citar cualquier versión específica que requieran.

Metadatos

Para facilitar la descubribilidad, los datos deben describirse utilizando metadatos apropiados. El contenido y formato de los metadatos a menudo está guiado por una disciplina específica y/o repositorio a través del uso de un estándar de metadatos. Independientemente del repositorio elegido, al depositar datos es importante completar tantos campos como sea posible, ya que esta información generalmente contribuye a los registros de metadatos.

Software y Código

El software y el código constituyen productos de investigación importantes. Además de utilizar un sistema de control de versiones como GitHub, se debe depositar el código fuente en un repositorio de datos donde se le asigne un identificador único. El uso de tal repositorio garantiza que el código esté abierta y permanentemente disponible.

Consideraciones Especiales

Plataformas de Reproducibilidad

Cuando se tienen tanto datos como código, se debe considerar el uso de una plataforma de reproducibilidad como Code Ocean. Depositar datos y código en tal plataforma significa que otros pueden ejecutar fácilmente los análisis, promoviendo así la reproducibilidad computacional.

Advertencias Importantes

El alojamiento de datos únicamente en un sitio web de laboratorio o como parte del material suplementario de una publicación dificulta la capacidad de encontrar y reutilizar los datos. Además, el lugar donde se depositan los datos dependerá de los factores legales y éticos aplicables, quién financió el trabajo y dónde se espera publicar.

Proceso de Selección de Repositorio

El documento proporciona un flujo de trabajo para la selección de repositorios basado en las siguientes preguntas clave:

  1. ¿Contienen los datos información personal o sensible que no puede ser completamente anonimizada?
  2. ¿Existe un repositorio específico por disciplina para el conjunto de datos?
  3. ¿El repositorio institucional acepta datos?

Este proceso de decisión guía hacia el tipo de repositorio más apropiado para cada situación específica.

Recursos Adicionales

El documento hace referencia a herramientas útiles para la identificación de repositorios apropiados, incluyendo Re3Data, FAIRsharing, FAIR Repository Finder, y recursos para hacer el código citable, así como cajas de herramientas para datos y código.

Datos del censo de EE.UU.: conceptos y aplicaciones en apoyo de la investigación

Frank Donnelly “US Census Data: Concepts and Applications for Supporting Research” Library Technology Reports vol. 58, no. 4 (May/June 2022)

Texto completo

Más que un simple recuento decenal, el censo de EE.UU. es una colección de conjuntos de datos de alta calidad, geográficamente detallados y gratuitos y abiertos que describen las características demográficas y socioeconómicas de la nación de forma continua. Este número de Library Technology Reports (vol. 58, nº 4), «US Census Data: Concepts and Applications for Supporting Research», ofrece a los lectores un curso intensivo sobre el censo: aprenda sobre los conceptos en los que se organiza el censo, los conjuntos de datos clave, el acceso a los datos en línea y a través de secuencias de comandos mediante API, y consideraciones sobre el uso de SIG, datos históricos y microdatos. Los bibliotecarios adquirirán conocimientos que podrán utilizar para ayudar a los miembros de sus comunidades con los datos del censo y verán cómo se puede utilizar el censo para la planificación y la investigación bibliotecaria.

Uso de datos abiertos para los servicios públicos (informe)

«Using Open Data for Public Services (Report)». Accedido 26 de agosto de 2023.

Texto completo

Este documento explora cómo se puede utilizar los datos abiertos en la prestación de servicios públicos y su potencial para la colaboración, la resolución conjunta de problemas y la innovación abierta. Destaca dónde se han liberado datos abiertos por parte de instituciones del sector público y sus efectos en la entrega de servicios públicos.

La naturaleza del sector público es compleja, al igual que las áreas de política de las que es responsable. Al mismo tiempo, se presentan nuevas posibilidades debido a la cambiante naturaleza de los datos.

Este documento recoge la investigación del ODI sobre diferentes formas de entender los impactos de la liberación de datos abiertos para los servicios públicos, al tiempo que captura la complejidad de la prestación de servicios públicos.

Se ha visualizado los datos abiertos en un ecosistema para identificar oportunidades de datos abiertos en el sector público. Al adoptar este enfoque, desarrollamos tres patrones generales de uso de datos abiertos en los servicios públicos.

Patrones generales de uso de datos abiertos:

  • Patrón 1 utiliza datos abiertos para aumentar el acceso a servicios para ciudadanos u organizaciones.
  • Patrón 2 utiliza datos abiertos para planificar la prestación de servicios públicos y hacer más eficientes las cadenas de prestación de servicios; los beneficiarios directos son los comisionados, gerentes y trabajadores de servicios públicos de primera línea.
  • Patrón 3 utiliza datos abiertos para informar la formulación de políticas; los beneficiarios directos son representantes electos, formuladores de políticas y ciudadanos que desean influir en las políticas.

Hasta el momento, se han desarrollado recomendaciones prácticas para una serie de actores con el fin de apoyar un mayor uso de datos abiertos en la prestación de servicios públicos.

Las recomendaciones prácticas para un mayor uso de datos abiertos en los servicios públicos se centran en:

  • Colaboración organizativa
  • Infraestructura tecnológica, habilidades digitales y alfabetización
  • Infraestructura de datos
  • Normas abiertas para datos
  • Apoyo de nivel superior
  • Redes entre pares
  • Intermediarios
  • Enfoque en problemas

Manifiesto sobre los datos abiertos de ODI


Open Data Institute (ODI) es una organización sin fines de lucro que se dedica a promover y facilitar el uso de datos abiertos en todo el mundo. Fue fundada en 2012 en el Reino Unido por Sir Tim Berners-Lee y Nigel Shadbolt, dos figuras influyentes en el campo de la tecnología y la web semántica.

La misión del ODI es abogar por la apertura y accesibilidad de los datos, lo que implica que los datos deben estar disponibles para ser utilizados y compartidos de manera libre y sin restricciones innecesarias. Esto no solo incluye datos gubernamentales, sino también datos de diversas fuentes, como empresas, organizaciones sin fines de lucro y más.

El ODI trabaja en colaboración con gobiernos, empresas y otras instituciones para promover políticas y prácticas de datos abiertos. Proporciona capacitación, recursos y apoyo para ayudar a las organizaciones a comprender y aprovechar los datos abiertos de manera efectiva. Además, el ODI promueve la investigación, la innovación y la creación de herramientas y tecnologías que faciliten el uso y la compartición de datos abiertos.

MANIFIESTO

El Manifiesto del Open Data Institute (ODI) es una declaración fundamental que establece los principios y valores centrales de la organización en relación con los datos abiertos y su impacto en la sociedad:

INFRAESTRUCTURA: Los sectores y las sociedades deben invertir y proteger la infraestructura de datos en la que confían. Los datos abiertos son el fundamento de esta infraestructura vital emergente.

CAPACIDAD: Todos deben tener la oportunidad de comprender cómo se pueden usar y se están usando los datos. Necesitamos alfabetización en datos para todos, habilidades en ciencia de datos y experiencia en el uso de datos para ayudar a resolver problemas.

INNOVACIÓN: Los datos deben inspirar y alimentar la innovación. Pueden permitir que empresas, startups, gobiernos, individuos y comunidades creen productos y servicios, impulsando el crecimiento económico y la productividad.

EQUIDAD: Todos deben beneficiarse de manera justa de los datos. El acceso a los datos y la información promueve la competencia justa y los mercados informados, y capacita a las personas como consumidores, creadores y ciudadanos.

ÉTICA: Las personas y las organizaciones deben usar los datos de manera ética. Las decisiones tomadas sobre qué datos se recopilan y cómo se utilizan no deben ser injustas, discriminatorias ni engañosas.

COMPROMISO: Todos deben poder participar en hacer que los datos funcionen para todos nosotros. Las organizaciones y comunidades deben colaborar en cómo se utilizan y se accede a los datos para ayudar a resolver sus problemas.

Repensar el impacto de los datos abiertos: un primer paso hacia una evaluación europea del impacto de los datos abiertos

                                             

Publications Office of the European Union, Ooijen, C., Osimo, D., Regeczi, D., et al., Rethinking the impact of open data : a first step towards a European impact assessment for open data, Publications Office of the European Union, 2023, https://data.europa.eu/doi/10.2830/911822

Este informe es el primero de una serie de cuatro cuyo objetivo es establecer una metodología estándar para la evaluación del impacto de los datos abiertos que pueda utilizarse en toda Europa. Este ejercicio es clave porque no existe una definición coherente del impacto de los datos abiertos.

La falta de una base conceptual sólida ha hecho más difícil para los portales de datos demostrar su valor a través de pruebas empíricas. También pone en entredicho la capacidad de la UE para comprender y comparar los resultados de los distintos Estados miembros. La mayoría de los artículos académicos que buscan explorar el impacto de los datos hacen referencia a los marcos de datos abiertos existentes, siendo los de madurez de datos abiertos (ODM) y barómetro de datos abiertos (ODB) los más frecuentemente representados.

Estos dos marcos distinguen entre distintos tipos de impacto, y ambos mencionan en particular el impacto social, político y económico. El ODM también incluye en su marco el impacto medioambiental. A veces, estos marcos divergen de las propias recomendaciones de la Comisión Europea sobre la mejor manera de medir el impacto, como se explica en secciones específicas de las directrices para legislar mejor y la caja de herramientas para legislar mejor. Ayudan a responder a una pregunta fundamental para los responsables políticos: ¿son mayores los beneficios que se obtienen que los costes de recopilar y distribuir datos (abiertos)? En futuros informes de esta serie se estudiará cómo adaptar mejor los marcos existentes, como el MDD, a estas directrices de importancia crítica.

Del Estudio Economic Impact of Open Data: Opportunities for value creation in Europe (2020)

Por último, el informe también examina ejemplos y reflexiones sobre la reutilización de datos abiertos en las organizaciones. A continuación se resumen las principales conclusiones

  • La especificación e implementación de conjuntos de datos de alto valor como parte de la nueva Directiva de Datos Abiertos es una oportunidad prometedora para abordar las demandas de calidad y cantidad de los datos abiertos.
  • Abordar las demandas de calidad y cantidad es importante, pero no suficiente para alcanzar todo el potencial de los datos abiertos.
  • Los reutilizadores de datos abiertos tienen que ser conscientes y capaces de comprender y aprovechar su potencial.
  • La creación de valor de los datos abiertos forma parte del reto más amplio de la transformación de competencias y procesos: un proceso largo cuyo cambio e impacto no siempre son fáciles de observar y medir.
  • Las iniciativas sectoriales y la colaboración entre los sectores público y privado fomentan la creación de valor.
  • La combinación de datos abiertos con datos personales, compartidos o procedentes de crowdsourcing es vital para hacer realidad un mayor crecimiento del mercado de datos abiertos.
  • Para los distintos retos, debemos explorar y mejorar múltiples enfoques de reutilización de datos que sean éticos, sostenibles y adecuados a su finalidad.

Comprender el impacto económico, gubernamental, social y medioambiental de los datos abiertos.

Publications Office of the European Union, Carsaniga, G., Dogger, J., Regeczi, D., The use case observatory : a 3-year monitoring of 30 reuse cases to understand the economic, governmental, social and environmental impact of open data. Volume I, Publications Office of the European Union, 2023, https://data.europa.eu/doi/10.2830/57907

El observatorio de casos de uso es un proyecto de investigación que realiza un seguimiento de 30 casos de reutilización a lo largo de 3 años -de 2022 a 2025- para evaluar cómo se crea impacto con los datos abiertos, compartir los retos y logros de los casos de reutilización de datos abiertos y contribuir al debate sobre la metodología de evaluación del impacto de los datos abiertos. Este informe es el primero de tres volúmenes.

El segundo y el tercer informe se publicarán en 2024 y 2025. Para cada uno de los casos de reutilización incluidos en este informe, se realizaron entrevistas con sus promotores y se agruparon en cuatro dimensiones de impacto principales: económica, gubernamental, social y medioambiental. Las entrevistas sobre casos de reutilización con impacto económico muestran cómo se utilizan los datos abiertos para ayudar a las empresas a identificar licitaciones públicas prometedoras y a solicitar puestos de trabajo y otras oportunidades profesionales. Los casos de reutilización con impacto gubernamental demuestran que los datos abiertos pueden aumentar la transparencia de los procesos políticos y fortalecer la democracia.

Como parte del ámbito del impacto social, los casos de reutilización de este informe utilizan los datos abiertos para mejorar la salud pública e incentivar una sociedad más inclusiva.

Por último, varios casos de reutilización crean un impacto medioambiental mediante el control de la calidad del aire y el apoyo a la conservación de los bosques. Estimar el impacto de los casos de reutilización es un reto complejo. La medición de los beneficios precisos para la economía, el gobierno, la sociedad o el medio ambiente requiere una cantidad sustancial de investigación. La mayoría de los casos de reutilización miden su impacto con estadísticas web. Sin embargo, el número de visitantes únicos o el número de visualizaciones de una página web sólo sirven como estimación aproximada del impacto que se crea a través de los datos abiertos. Además, la imposibilidad de compartir información precisa sobre los ingresos o el número de clientes de las pequeñas y medianas empresas puede dificultar la estimación del impacto de los casos de reutilización de datos abiertos, ya que los competidores podrían utilizar esa información en su beneficio.

Informe de madurez de los datos abiertos 2022 (2023)

Publications Office of the European Union, Assen, M., Cecconi, G., Carsaniga, G., et al., Open data maturity report 2022, Publications Office of the European Union, 2023, https://data.europa.eu/doi/10.2830/70973

La evaluación de la madurez de los datos abiertos 2022 sirve de referencia para el desarrollo de los países europeos en el ámbito de los datos abiertos. En este octavo informe anual consecutivo de data.europa.eu (antes Portal Europeo de Datos) participan 35 países, entre ellos los 27 Estados miembros de la UE, 3 países de la Asociación Europea de Libre Comercio (AELC) (Islandia, Noruega y Suiza), 4 países candidatos (Albania, Montenegro, Serbia y Ucrania) y Bosnia y Herzegovina. Este informe pretende ayudar a los países participantes a comprender mejor su nivel de madurez, captar sus progresos a lo largo del tiempo, encontrar áreas de mejora y comparar su madurez con la de otros países. Además, el estudio ofrece una visión general de las mejores prácticas aplicadas en toda Europa que podrían transferirse a otros contextos nacionales y locales.

Prácticas de datos en investigación en relación con los incentivos y obligaciones de las políticas públicas de ciencia abierta

Célya Gruson-Daniel, Groupe Projet Réussir L’Appropriation De La Science Ouverte. Summary of the study : Adapting Open Science. [Research Report] Comité pour la science ouverte. 2022, pp.29 Pages

Texto completo

Este resumen del informe del proyecto «Successfully appropriating open science Project» presenta de forma más condensada el contexto, la metodología y los resultados de un estudio sobre prácticas de datos en investigación. ¿Cómo apoyar la evolución de las prácticas asociadas a los datos en relación con los incentivos y obligaciones de las políticas públicas de ciencia abierta?