Archivo de la categoría: Acceso abierto

Valor de los metadatos para los datos de investigación

Strecker, Dorothea (2025). How permanent are metadata for research data? Understanding changes in DataCite metadata. arXiv:2412.05128v2 (13 de diciembre de 2025)

Texto completo

El artículo analiza en profundidad hasta qué punto los metadatos de los datos de investigación pueden considerarse permanentes una vez que se les asigna un identificador persistente (DOI) a través de DataCite. En el contexto de la ciencia abierta, los metadatos son fundamentales porque permiten que los conjuntos de datos sean localizables, accesibles, interpretables y reutilizables. Sin embargo, a diferencia de los catálogos bibliotecarios tradicionales, los metadatos de los datos de investigación se crean y mantienen en entornos muy diversos, con prácticas desiguales y, en muchos casos, con un mantenimiento limitado a lo largo del tiempo. El estudio parte de la hipótesis de que, aunque los DOIs están pensados para ser persistentes, los metadatos que los acompañan pueden cambiar de forma significativa después de su publicación inicial.

Para examinar esta cuestión, el trabajo se centra en el análisis de millones de registros de metadatos asociados a conjuntos de datos publicados en 2021, observando su evolución durante los dos años siguientes. El enfoque metodológico se basa en el uso de información de procedencia de metadatos, lo que permite identificar qué elementos cambian, con qué frecuencia y en qué momento. Este enfoque empírico aporta una visión poco habitual en los estudios sobre metadatos, ya que no se limita a evaluar la calidad en un momento concreto, sino que estudia los cambios a lo largo del tiempo.

Los resultados muestran que la mayoría de los metadatos permanecen estables, lo que indica que, en términos generales, pueden considerarse suficientemente fiables para tareas como análisis bibliométricos o estudios de infraestructura científica. No obstante, una proporción relevante de registros sí experimenta modificaciones. Estas modificaciones suelen ser incrementales y puntuales, y afectan sobre todo a elementos como los nombres de los creadores, las descripciones del conjunto de datos o la incorporación de identificadores relacionados. En cambio, otros campos clave —como el título o el año de publicación— rara vez se modifican, lo que refuerza la idea de una estructura básica bastante fija.

El análisis temporal revela que los cambios se concentran en las primeras fases tras la publicación del DOI, lo que sugiere que muchos ajustes responden a correcciones o mejoras iniciales más que a un mantenimiento continuo a largo plazo. Además, el estudio detecta diferencias notables entre repositorios, lo que indica que no existe una práctica homogénea en la gestión de metadatos: algunos repositorios tienden a revisar y actualizar más sus registros, mientras que otros apenas los modifican una vez publicados.

En la discusión, el artículo plantea una reflexión crítica sobre el concepto de “permanencia” aplicado a los metadatos. Aunque estos son relativamente estables, no muestran una evolución sostenida que acompañe el ciclo de vida completo de los datos de investigación. Esto limita su potencial para reflejar nuevos usos, citas, relaciones o contextos científicos emergentes. El trabajo sugiere que, para mejorar la reutilización y el valor a largo plazo de los datos, sería necesario repensar las políticas y prácticas de mantenimiento de metadatos, promoviendo una actualización más activa y coherente.

Frontiers FAIR² Data Management recupera la ciencia perdida: cómo la IA transforma los datos invisibles en conocimiento reutilizable

Frontiers. “90% of Science Is Lost. This New AI Just Found It.” ScienceDaily, October 13, 2025. https://www.sciencedaily.com/releases/2025/10/251013040314.htm

Una gran cantidad de datos de investigación valiosos permanecen sin utilizar, atrapados en laboratorios o perdidos en el tiempo. Frontiers pretende cambiar esta situación con FAIR Data Management, un innovador sistema impulsado por IA que hace que los conjuntos de datos sean reutilizables, verificables y citables. Al unir la curación, el cumplimiento, la revisión por pares y la visualización interactiva en una sola plataforma, FAIR² permite a los científicos compartir su trabajo de forma responsable y obtener reconocimiento.

La gran mayoría de los datos generados nunca se reutilizan ni contribuyen de forma significativa a nuevos descubrimientos. Según la evaluación citada, una proporción abrumadora de datos —hasta un 90 %— queda atrapada en laboratorios, no se comparte adecuadamente o se pierde en archivos inaccesibles, lo que frena el progreso en áreas críticas como la medicina, el cambio climático y la tecnología. Este desperdicio de información no solo reduce la eficiencia de la investigación global, sino que también limita la reproducibilidad de los estudios y la capacidad de construir sobre trabajos previos, una componente fundamental del método científico moderno.

Para enfrentar este desafío, la editorial y organización científica Frontiers ha desarrollado un sistema innovador denominado Frontiers FAIR² Data Management, que combina herramientas avanzadas de inteligencia artificial con principios sólidos de gestión de datos. El objetivo principal de esta plataforma es aplicar de manera automatizada y a gran escala los principios FAIR (findable, accessible, interoperable, reusable — en español: localizable, accesible, interoperable y reutilizable) y expandirlos en un marco que garantice la compatibilidad con sistemas de IA y la integridad ética de los conjuntos de datos. Al integrar procesos de curación, revisión por pares, visualización interactiva y certificación dentro de un único sistema impulsado por IA, FAIR² pretende transformar conjuntos de datos “perdidos” en recursos útiles y citables que puedan impulsar nuevas investigaciones, acelerar descubrimientos y reconocer adecuadamente el trabajo de los investigadores.

El funcionamiento práctico de FAIR² va más allá de simplemente archivar datos. Cuando un científico somete sus resultados a este sistema, no solo se asegura de que los datos sean estructurados y completos, sino que también recibe una salida múltiple: un paquete de datos certificado, un artículo de datos revisado y citable, herramientas de visualización interactiva y un certificado FAIR² que respalda la calidad y reutilización del conjunto. Esta estrategia integral busca eliminar las barreras tradicionales para el intercambio de datos y fomentar una cultura científica en la que cada conjunto de datos tenga el potencial de generar conocimiento adicional, reducir el tiempo entre descubrimiento y aplicación práctica, y asegurar que las inversiones en investigación rindan un impacto mucho mayor del que logran actualmente.

OASPA redefine el acceso abierto: de medir porcentajes a fomentar la participación inclusiva

Legge, Malavika. “Embracing the Complexity of ‘100% OA’: From Percentage to Participation.” Open Access Scholarly Publishers Association (OASPA), November 4, 2025. https://www.oaspa.org/news/embracing-the-complexity-of-100-oa-from-percentage-to-participation/

Inicialmente, OASPA se propuso la meta de alcanzar el «siguiente 50 %» – es decir, más del 50 % de los artículos académicos publicados en acceso abierto. Sin embargo, la experiencia de 2025 mostró que contar únicamente el porcentaje subestima otras dimensiones críticas del ecosistema de la publicación académica, por lo que la organización ha transitado hacia una perspectiva que prioriza la participación en el intercambio académico abierto.

La autora señala que OASPA ha identificado cinco grandes problemas que están impidiendo que el acceso abierto evolucione de manera equitativa y eficaz:

  1. modelos de negocio inequitativos,
  2. falta de financiación,
  3. un enfoque excesivo en artículos de investigación (excluyendo otros tipos de output),
  4. la mercantilización de los resultados, y
  5. la falta de coordinación entre actores.

Además, se distinguen tres barreras entrelazadas que limitan la participación: la exclusión geográfica y económica, la hegemonía lingüística y la fragmentación disciplinaria. Estas barreras muestran que el sistema de publicación científica está optimizado para escala, eficiencia y estandarización, pero no necesariamente para diversidad, inclusión o relevancia contextual.

Al adoptar la noción de participación, OASPA propone que la métrica de “100 % de publicaciones en OA” debe entenderse como un objetivo más amplio que implique que todos los investigadores, disciplinas, regiones, lenguas y tipos de resultado —no solo artículos de revistas de prestigio— tengan la posibilidad de publicar, compartir y reutilizar su trabajo en un entorno verdaderamente abierto.

Finalmente, el artículo subraya que alcanzar ese enfoque más rico y plural no será cuestión de aplicar estrategias simples y prescriptivas. En cambio, se requiere reconocer la incertidumbre, practicar la transparencia sobre lo que aún no se sabe, y coordinar responsabilidades entre todos los agentes del ecosistema académico. OASPA se compromete con metas a corto, medio y largo plazo que apoyen esa transición hacia una participación más integrada en el acceso abierto.

Para alguien con tu perfil —interesada en bibliotecas, ciencia de la información, acceso abierto y políticas editoriales— este artículo ofrece una mirada crítica y estratégica sobre cómo redefinir métricas, políticas y prácticas para hacer que la OA no solo sea mayor en volumen, sino más diversa, inclusiva y transformadora.

Cómo aborda el movimiento de «ciencia abierta» la mala conducta científica

Kingsley, Danny. “Show Your Working: How the ‘Open Science’ Movement Tackles Scientific Misconduct.” The Conversation, 31 de marzo de 2025. https://theconversation.com/show-your-working-how-the-open-science-movement-tackles-scientific-misconduct-249020

El movimiento de ciencia abierta —que incluye no solo acceso libre a artículos científicos, sino también la transparencia en datos, protocolos, software y todos los aspectos del proceso investigativo— se presenta como una estrategia clave para combatir la mala praxis científica.

El artículo analiza cómo ciertas estructuras en el mundo académico —como la presión por publicar (“publish or perish”), los rankings universitarios internacionales y el prestigio basado en la producción de artículos— fomentan incentivos perversos que pueden desencadenar comportamientos ilícitos o poco éticos. En este contexto, florecen prácticas como las editoriales depredadoras (“predatory publishers”) o las fábricas de artículos (“paper mills”), que generan papers de baja calidad o fraudulentos para beneficio económico o académico.

Kingsley argumenta que trabajar de manera abierta ayuda a mejorar la integridad de la ciencia de varias formas: al permitir revisar datos, registrar ensayos clínicos, publicar protocolos antes de realizar los estudios, etc. Estas medidas no evitan que algunos actúen mal, pero sí dificultan que lo hagan sin ser detectados.

Entre las estrategias que el autor destaca para fortalecer la integridad científica desde la ciencia abierta se encuentran:

  • El registro previo de protocolos y objetivos de estudios, de modo que las modificaciones posteriores queden explícitas.
  • La apertura de los conjuntos de datos, el código y los materiales metodológicos para revisión externa.
  • El uso de publicación de preprints y revisiones abiertas, de modo que el escrutinio ocurra antes y después de la evaluación formal.
  • La creación de incentivos institucionales que reconozcan y premien la transparencia, la reproducibilidad y los esfuerzos de colaboración.

Con su enfoque en la transparencia, la ciencia abierta ofrece parte de la solución al creciente problema de la mala conducta científica. Sin embargo, para que la ciencia abierta cumpla su potencial se requiere un cambio profundo de paradigma cultural: no basta con adoptar tecnologías, sino modificar incentivos institucionales, políticas y normas para premiar la transparencia, la reproducibilidad y la responsabilidad. Ejemplos internacionales, como programas nacionales de ciencia abierta en Europa y acciones coordinadas en Australia, se citan como señales alentadoras.

Impulso europeo a los datos abiertos y su continuidad en el programa Digital Europe

European Health and Digital Executive Agency; European Commission (2025). Public open data: CEF Telecom projects at a glance. Publications Office of the European Union. ISBN 978-92-95239-44-9.

Texto completo

Se ofrece una visión general de los proyectos de datos públicos abiertos financiados en el marco del programa CEF Telecom (2014-2020) y los sectores o ámbitos en los que se desarrolló cada proyecto, mostrando algunos proyectos y su impacto. Además, esta ficha informativa tiene por objeto describir cómo el programa Europa Digital tomó el relevo y apoya los espacios comunes europeos de datos. Los datos públicos abiertos son un servicio que facilita y armoniza el acceso a conjuntos de datos creados y gestionados por organismos públicos de toda la UE. El objetivo general es la mejora de las infraestructuras de servicios digitales y el desarrollo de productos y servicios de información basados en la reutilización y la combinación de datos en poder de actores públicos y comerciales de toda la UE. Los datos públicos son toda la información que los organismos públicos producen, recopilan o pagan. Esta información es importante para su reutilización en nuevos productos y servicios. Al abrir los datos públicos, se promovió la participación de los ciudadanos y los expertos en la vida política y social.

La avalancha de bots de inteligencia artificial desafía la sostenibilidad de los repositorios académicos

Washington, Jamie. “AI bots swarm UDSpace for information.” Library, Museums and Press, University of Delaware, 29 de septiembre de 2025. https://library.udel.edu/news/2025/09/29/ai-bots-swarm-udspace/

La Universidad de Delaware ha detectado un fenómeno inesperado en su repositorio institucional, UDSpace: una avalancha de bots de inteligencia artificial que acceden masivamente a su contenido.

Estos bots, diseñados para recopilar información y entrenar modelos de lenguaje, realizan miles de consultas automatizadas que han llegado a ralentizar el sistema y, en algunos casos, a dejarlo temporalmente inaccesible.

El atractivo de UDSpace radica en la gran cantidad de materiales académicos de alta calidad que alberga —tesis, artículos científicos, informes y otros documentos de investigación—, lo que lo convierte en una fuente muy valiosa para las empresas que desarrollan inteligencia artificial. Sin embargo, el patrón de comportamiento de los bots ha resultado extremadamente agresivo: generan peticiones a una velocidad imposible para los usuarios humanos y saturan el servidor, desbordando las capacidades de respuesta del repositorio.

Ante esta situación, el equipo técnico de la biblioteca probó inicialmente medidas básicas como bloquear direcciones IP o responder a los bots fingiendo que los documentos no existían. Pero estas estrategias solo sirvieron para que los ataques se intensificaran. En mayo de 2025, se optó por una solución más avanzada: un sistema que identifica las solicitudes automatizadas y las bloquea en la capa de entrada, antes de que lleguen al servidor. De esta forma, los usuarios legítimos pueden seguir accediendo sin problema mientras los bots reciben un mensaje de acceso prohibido.

Aunque esta estrategia ha logrado reducir la presión sobre UDSpace, el problema refleja una tendencia global. Cada vez más repositorios académicos y bibliotecas digitales se enfrentan a un dilema entre mantener el acceso abierto al conocimiento y proteger sus sistemas de un uso automatizado que amenaza con colapsar sus infraestructuras. El caso de la Universidad de Delaware muestra hasta qué punto el auge de la inteligencia artificial está obligando a las instituciones académicas a repensar la gestión y defensa de sus recursos digitales.

Resiliencia abierta en los consorcios de bibliotecas: análisis del panorama de la iniciativa ORBIT (construyendo infraestructura juntos)

Lippincott, Sarah; Skinner, Katherine; Collister, Lauren; Wu, Chrys. Open resilience: Building infrastructure together (ORBIT) landscape scan. Version v1. Zenodo, 29 de septiembre de 2025. https://doi.org/10.5281/zenodo.17193778

El informe analiza cómo se financia, organiza y colabora la infraestructura abierta (open infrastructure, OI) — fundamental para la comunicación académica y la ciencia abierta — en Estados Unidos. Su objetivo es identificar oportunidades para fortalecer la infraestructura abierta mediante una inversión coordinada y una visión compartida, superando las divisiones institucionales y los proyectos aislados.

Los consorcios de bibliotecas en EE. UU. ofrecen un marco de colaboración esencial que permite a las instituciones académicas alcanzar objetivos de preservación, acceso, innovación y educación, que serían imposibles de lograr individualmente. El informe revela que estos consorcios se han convertido en un pilar fundamental para mitigar la escasez de recursos y las interrupciones en los servicios de sus miembros. Las entrevistas con líderes de consorcios destacan los desafíos urgentes que enfrentan (consolidación de proveedores, reducción de la capacidad institucional y presiones políticas y financieras), así como las oportunidades para una acción colectiva audaz.

El estudio realiza un análisis panorámico del ecosistema institucional y organizativo, con especial atención a los consorcios bibliotecarios académicos y a su manera de invertir en infraestructura abierta. La metodología parte de la revisión de iniciativas recientes y de los modelos de colaboración desarrollados en este ámbito.

Los resultados muestran que la financiación de la infraestructura abierta suele ser puntual, fragmentada y dependiente de proyectos específicos, lo que limita la sostenibilidad y la planificación a largo plazo. Además, se observa que las interdependencias entre plataformas, proyectos y actores no se aprovechan plenamente, lo que genera riesgos de duplicación de esfuerzos y de fragilidad en servicios esenciales. El informe también destaca la ausencia de una estrategia coordinada de inversión, ya que la mayoría de los actores tienden a operar de manera aislada dentro de sus propios marcos institucionales.

Entre las conclusiones, se recomienda promover marcos de gobernanza comunes, estándares interoperables y mecanismos de colaboración que permitan compartir recursos y capacidades. Asimismo, se subraya la necesidad de establecer fuentes de financiación sostenibles que garanticen el mantenimiento y la expansión de la infraestructura abierta. El documento insiste en fomentar redes de cooperación entre bibliotecas, universidades, consorcios y desarrolladores, con el fin de coordinar estrategias, evitar duplicaciones y distribuir responsabilidades. Finalmente, propone identificar servicios clave y plataformas esenciales que puedan beneficiarse de manera especial de inversiones colectivas, actuando como puntos de palanca para todo el ecosistema.

La Universidad de Columbia Británica (UBC) replantea la sostenibilidad de sus suscripciones académicas y cancela acuerdos con Sage y PLOS

University of British Columbia Library. 2025. An Update from the University Librarian: Rethinking the Sustainability of Our Subscription Model. September 17, 2025. https://about.library.ubc.ca/2025/09/17/an-update-from-the-university-librarian-rethinking-the-sustainability-of-our-subscription-model/

La Universidad de Columbia Británica (UBC) enfrenta un reto creciente: el costo de las suscripciones a revistas académicas (especialmente los grandes paquetes de editoriales privadas) se ha vuelto insostenible, debido al aumento de precios, inflación y fluctuaciones en el tipo de cambio USD/CAD. Aproximadamente el 40 % del presupuesto de colecciones de UBC se destina a acuerdos con cinco editoriales con fines de lucro: Elsevier, Springer, Taylor & Francis, Wiley y Sage.

Para manejar estos desafíos, UBC Library ha decidido que a partir del 31 de diciembre de 2025 dejará de mantener el acuerdo de “todos los títulos” (all-titles) con la editorial Sage. Esto implica que solo los artículos antiguos incluidas-los de los archivos (“backfiles”) de Sage seguirán siendo inmediatamente accesibles, mientras que los artículos nuevos de revistas de Sage a los que ya no se les renueve la suscripción deberán obtenerse mediante préstamo interbibliotecario, lo que normalmente tomará de uno a dos días.

Otra medida paralela es la finalización del acuerdo con Public Library of Science (PLOS). UBC había cubierto desde 2023 los costes de procesamiento de artículo (APC) para autores de UBC en las revistas PLOS, de modo que esos autores tenían esos cargos completamente eximidos (“waived”). A partir de finales de 2025, UBC regresará al modelo anterior en el que los autores usarán sus propios fondos de investigación para cubrir esos costes.

Estas decisiones afectan a todos los usuarios de la biblioteca UBC (campus Vancouver y Okanagan). Aunque implican una pérdida de conveniencia para algunos, la universidad argumenta que son necesarias para asegurar la sostenibilidad financiera del presupuesto de colección, alinear los gastos con el uso real de los títulos, y también por motivos de principios: UBC considera que el modelo actual no está alineado con sus valores institucionales ni con la realidad financiera.

Datos listos para la IA: consideraciones clave para la ciencia abierta y responsable

McBride, Vanessa; Natalia Norori; Denisse Albornoz. Data and AI for Science: Key Considerations. Working Paper, International Science Council, septiembre de 2025. DOI: 10.24948/2025.11

Texto completo

El informe ofrece una visión amplia y crítica del cruce entre inteligencia artificial, datos y ciencia, destacando que solo mediante la combinación de apertura, responsabilidad y cooperación internacional se podrá aprovechar plenamente el potencial de la IA en beneficio del conocimiento y la sociedad.

El informe explora cómo la inteligencia artificial está transformando la práctica científica y qué condiciones deben cumplirse para que los datos puedan aprovecharse de manera efectiva, ética y sostenible. La noción central es la de datos “AI-ready”, es decir, conjuntos de datos preparados para ser procesados y reutilizados por sistemas de IA en beneficio de la investigación. Este concepto implica que los datos no solo deben estar disponibles, sino también estructurados, limpios, interoperables y documentados de manera adecuada.

Una parte importante del documento se centra en la calidad e interoperabilidad de los datos. La ciencia abierta ha impulsado normas como FAIR (Findable, Accessible, Interoperable, Reusable), pero el uso de IA añade nuevas exigencias. Por ejemplo, los algoritmos requieren datos con metadatos consistentes, esquemas comunes y estándares de anotación que permitan la reutilización automática. Además, se subraya que la preparación de datos para IA debe considerar la reducción de sesgos y garantizar la inclusión de voces y contextos diversos, para evitar reproducir inequidades existentes en los resultados científicos.

Otro eje del informe son las dimensiones éticas, sociales y ambientales. Los autores advierten que el entrenamiento y uso de grandes modelos de IA conlleva altos costes energéticos y huellas de carbono significativas, por lo que la sostenibilidad debe integrarse en la planificación de infraestructuras científicas. En paralelo, se examinan los riesgos para la privacidad, la seguridad y la soberanía de los datos, especialmente en campos sensibles como la biomedicina o las ciencias sociales. Estos retos requieren marcos sólidos de gobernanza que equilibren apertura y protección.

El informe también vincula la preparación de datos para IA con la agenda de la ciencia abierta. Se argumenta que los principios de transparencia, accesibilidad y colaboración resultan esenciales para garantizar que la IA potencie la ciencia de manera inclusiva y global. Se destacan casos prácticos en los que repositorios, proyectos colaborativos y consorcios internacionales han logrado implementar buenas prácticas de datos AI-ready, sirviendo como ejemplos para otras disciplinas.

Finalmente, se presentan recomendaciones estratégicas:

  • Consolidar marcos normativos y estándares internacionales, como FAIR-R y Croissant.
  • Invertir en infraestructuras digitales y capacidad de cómputo adecuadas para la investigación con IA.
  • Fortalecer la capacitación en gestión de datos e inteligencia artificial.
  • Reconocer institucionalmente la labor de quienes trabajan en la preparación y curación de datos.
  • Garantizar la equidad y la inclusividad en las políticas sobre datos e IA, evitando que el acceso desigual a recursos tecnológicos aumente las brechas entre regiones y comunidades científicas.

OpenAlex y OJS: hacia la indexación universal

Chavarro, Diego; Juan Pablo Alperin; y John Willinsky. 2025. “On the Open Road to Universal Indexing: OpenAlex and Open Journal Systems.” Quantitative Science Studies (abril de 2025). https://doi.org/10.1162/qss.a.17/132192

Se analiza cómo OpenAlex indexa revistas que utilizan el sistema de gestión editorial de código abierto Open Journal Systems (OJS), lo que refleja dos iniciativas de software libre enfocadas en expandir la participación en la producción académica.

A partir de una base de datos de 47 625 revistas OJS activas, se observa que el 71 % de estas revistas tienen al menos un artículo indexado en OpenAlex. Además, el estudio destaca que el papel de los DOI proporcionados por Crossref es central: el 97 % de las revistas que emplean DOIs de Crossref están incluidas en OpenAlex, lo que sugiere que la disponibilidad de estos identificadores persistentes es clave para aparecer en el índice.

No obstante, esta dependencia tecnológica también manifiesta inequidades estructurales: las revistas con recursos limitados —en especial aquellas provenientes de países de bajos ingresos (que representan el 47 % del total de revistas OJS) y aquellas publicadas en idiomas distintos al inglés (entre el 55 % y 64 % de las revistas OJS)— presentan una representación significativamente menor en OpenAlex. El estudio plantea implicaciones teóricas importantes sobre cómo la infraestructura académica perpetúa tales disparidades, argumentando que incluso bases de datos bibliográficas de acceso abierto como OpenAlex deben abordar activamente las barreras financieras, infraestructurales y lingüísticas para promover un índice más equitativo a nivel mundial.