Archivo de la etiqueta: Metadatos

Valor de los metadatos para los datos de investigación

Strecker, Dorothea (2025). How permanent are metadata for research data? Understanding changes in DataCite metadata. arXiv:2412.05128v2 (13 de diciembre de 2025)

Texto completo

El artículo analiza en profundidad hasta qué punto los metadatos de los datos de investigación pueden considerarse permanentes una vez que se les asigna un identificador persistente (DOI) a través de DataCite. En el contexto de la ciencia abierta, los metadatos son fundamentales porque permiten que los conjuntos de datos sean localizables, accesibles, interpretables y reutilizables. Sin embargo, a diferencia de los catálogos bibliotecarios tradicionales, los metadatos de los datos de investigación se crean y mantienen en entornos muy diversos, con prácticas desiguales y, en muchos casos, con un mantenimiento limitado a lo largo del tiempo. El estudio parte de la hipótesis de que, aunque los DOIs están pensados para ser persistentes, los metadatos que los acompañan pueden cambiar de forma significativa después de su publicación inicial.

Para examinar esta cuestión, el trabajo se centra en el análisis de millones de registros de metadatos asociados a conjuntos de datos publicados en 2021, observando su evolución durante los dos años siguientes. El enfoque metodológico se basa en el uso de información de procedencia de metadatos, lo que permite identificar qué elementos cambian, con qué frecuencia y en qué momento. Este enfoque empírico aporta una visión poco habitual en los estudios sobre metadatos, ya que no se limita a evaluar la calidad en un momento concreto, sino que estudia los cambios a lo largo del tiempo.

Los resultados muestran que la mayoría de los metadatos permanecen estables, lo que indica que, en términos generales, pueden considerarse suficientemente fiables para tareas como análisis bibliométricos o estudios de infraestructura científica. No obstante, una proporción relevante de registros sí experimenta modificaciones. Estas modificaciones suelen ser incrementales y puntuales, y afectan sobre todo a elementos como los nombres de los creadores, las descripciones del conjunto de datos o la incorporación de identificadores relacionados. En cambio, otros campos clave —como el título o el año de publicación— rara vez se modifican, lo que refuerza la idea de una estructura básica bastante fija.

El análisis temporal revela que los cambios se concentran en las primeras fases tras la publicación del DOI, lo que sugiere que muchos ajustes responden a correcciones o mejoras iniciales más que a un mantenimiento continuo a largo plazo. Además, el estudio detecta diferencias notables entre repositorios, lo que indica que no existe una práctica homogénea en la gestión de metadatos: algunos repositorios tienden a revisar y actualizar más sus registros, mientras que otros apenas los modifican una vez publicados.

En la discusión, el artículo plantea una reflexión crítica sobre el concepto de “permanencia” aplicado a los metadatos. Aunque estos son relativamente estables, no muestran una evolución sostenida que acompañe el ciclo de vida completo de los datos de investigación. Esto limita su potencial para reflejar nuevos usos, citas, relaciones o contextos científicos emergentes. El trabajo sugiere que, para mejorar la reutilización y el valor a largo plazo de los datos, sería necesario repensar las políticas y prácticas de mantenimiento de metadatos, promoviendo una actualización más activa y coherente.

Inteligencia artificial y catalogación en bibliotecas

Getaneh Alemu, Anna Maria Tammaro; Navigating the artificial intelligence frontier on cataloguing and metadata work in libraries: an interview with Getaneh AlemuDigital Library Perspectives 20 August 2025; 41 (3): 587–592. https://doi.org/10.1108/DLP-08-2025-208

Se reflexiona sobre cómo la inteligencia artificial (IA) está transformando la catalogación. Plantea que la relación ideal entre la IA y los representantes humanos debe basarse en la complementariedad, más que en la sustitución. Según el autor, las máquinas pueden hacerse cargo de tareas repetitivas y estructuradas —como la clasificación inicial o el etiquetado automático—, mientras que los bibliotecarios y catalogadores deben conservar el papel de brindar juicio experto, interpretación contextual y garantía de calidad, elementos que aún son difícilmente automatizables

Además, Alemu insiste en que la implementación responsable de la IA en entornos bibliotecarios debe partir de los principios éticos de transparencia y precisión. Es fundamental que los sistemas automatizados actúen con transparencia, de modo que los usuarios puedan entender cómo se generan los metadatos y qué criterios siguen los algoritmos

La entrevista también destaca una visión esperanzadora para el futuro: la IA no debería percibirse como una amenaza, sino como una herramienta para potenciar la eficiencia, liberando a los profesionales de la biblioteconomía de labores mecánicas para enfocarse en aspectos más complejos y creativos de su labor. Alemu vislumbra un ecosistema en que la tecnología permita una mejor organización del conocimiento, sin sacrificar la supervisión humana ni el cuidado por la calidad bibliográfica.

La postura de Alemu subraya la necesidad de un enfoque equilibrado: integrar la IA como aliada, no como reemplazo, reforzando el rol humano a través de la ética, la transparencia y la experiencia profesional en catalogación y metadatos.

Análisis comparativo de chatbots de IA para la extracción de metadatos en bibliotecas universitarias

González-Espinoza, Alfredo, Dom Jebbia, y Haoyong Lan. «Metadata Augmentation Using NLP, Machine Learning and AI-Chatbots: A ComparisonarXiv, abril 25, 2025. https://arxiv.org/abs/2504.17189

El estudio ofrece un análisis exhaustivo sobre el uso de herramientas de inteligencia artificial (IA) y aprendizaje automático para la tarea de recogida de metadatos, especialmente en el contexto de bibliotecas universitarias. Los avances recientes en estas tecnologías han permitido que tareas repetitivas, como la clasificación de documentos y la curación de datos, sean más automatizadas, lo que puede optimizar significativamente los flujos de trabajo en instituciones como las bibliotecas. Sin embargo, el desarrollo y la integración efectiva de estas herramientas en entornos de trabajo reales aún enfrentan desafíos importantes.

Los autores, Alfredo González-Espinoza, Dom Jebbia y Haoyong Lan, quienes son parte del equipo de Bibliotecas Universitarias en la Universidad Carnegie Mellon, realizan un estudio comparativo entre diferentes enfoques para la extracción de metadatos. En particular, se enfocan en el uso de chatbots comerciales basados en IA y su capacidad para realizar tareas de clasificación de documentos con datos limitados. Además, comparan estos resultados con los obtenidos mediante métodos tradicionales de aprendizaje automático y procesamiento de lenguaje natural (PLN), como XGBoost y el ajuste fino de BERT.

El análisis revela que, aunque los chatbots de IA muestran un rendimiento similar entre ellos, superan a los métodos de aprendizaje automático que fueron probados, especialmente cuando los chatbots se entrenan utilizando datos locales. Este hallazgo es significativo, ya que sugiere que, en situaciones con datos limitados, las soluciones basadas en IA pueden ser más efectivas que los enfoques tradicionales. Sin embargo, los autores también subrayan que, a pesar de su facilidad de uso en comparación con los métodos de programación tradicionales, los chatbots aún presentan retos para los usuarios en términos de obtener resultados útiles. A pesar de que la interacción con los chatbots puede parecer más accesible, los resultados no siempre son confiables y pueden requerir ajustes adicionales.

Un hallazgo preocupante del estudio fue la identificación de errores conceptuales alarmantes en algunos chatbots, tales como la incapacidad de contar correctamente el número de líneas de los textos de entrada. Curiosamente, algunos chatbots justificaron estos errores como «errores humanos», lo que resalta la necesidad de mejorar la precisión y la comprensión de estos sistemas. Este tipo de error pone en duda la fiabilidad de los chatbots de IA para tareas que requieren una precisión absoluta, como la clasificación de metadatos en bibliotecas, donde los detalles son cruciales.

A pesar de estos problemas, los autores concluyen que la información proporcionada en su estudio es valiosa para bibliotecarios y curadores de datos que deseen explorar el uso de herramientas de IA en la curación de datos o en el aumento de metadatos. Aunque los resultados no son concluyentes sobre la eficacia total de los chatbots de IA para la clasificación de metadatos, el artículo ofrece una visión importante sobre las ventajas y limitaciones de estas herramientas emergentes. En este sentido, el estudio puede servir como base para futuras investigaciones y como guía para los profesionales que están considerando integrar estas tecnologías en sus prácticas diarias.

El Grupo Operativo de Colaboración para el Enriquecimiento de Metadatos (COMET) publica su Llamamiento a la Acción de la Comunidad

Buttrick, Adam. 2025. «The Collaborative Metadata Enrichment Taskforce (COMET) Releases Their Community Call to ActionUpstream, marzo 4, 2025. https://upstream.force11.org/the-collaborative-metadata-enrichment-taskforce-comet-releases-their-community-call-to-action

El Collaborative Metadata Enrichment Taskforce (COMET) ha publicado una convocatoria comunitaria para impulsar la colaboración en el enriquecimiento de metadatos, invitando a organizaciones e individuos a contribuir con recursos como financiación, experiencia técnica, metadatos e infraestructura. El objetivo de COMET es fortalecer y mejorar la calidad y completitud de los metadatos vinculados a los identificadores persistentes (PID), fundamentales para el seguimiento, la evaluación y la interoperabilidad en el ecosistema de la investigación académica y científica.

COMET nació en octubre de 2024 como respuesta a los debates surgidos durante dos importantes eventos internacionales: la conferencia FORCE2024, celebrada en Los Ángeles, y el Congreso de Información de Investigación Abierta en París. En estas reuniones, distintos actores del ámbito académico, institucional y editorial coincidieron en la necesidad urgente de adoptar estrategias colaborativas, lideradas por la propia comunidad, para resolver los problemas asociados a la calidad y estandarización de los metadatos.

A partir de estas discusiones iniciales, COMET evolucionó para convertirse en un grupo de trabajo formal dentro de la red FORCE11, contando actualmente con la participación de más de 50 representantes de universidades, organismos gubernamentales, editoriales académicas, agencias financiadoras e infraestructuras tecnológicas. Gracias a esta diversidad, se ha logrado publicar una visión común para un marco de trabajo colaborativo destinado al enriquecimiento de los metadatos, así como organizar sesiones participativas para identificar necesidades específicas de uso, definición de productos, requerimientos técnicos y estructuras de gobernanza adecuadas.

Ahora, COMET hace un llamado a la comunidad global para que participe en la siguiente fase del proyecto mediante distintas modalidades de colaboración:

  • Aportaciones en especie: Incorporando personal técnico que pueda contribuir de manera parcial o por proyectos, especialmente con experiencia en flujos de trabajo de enriquecimiento de metadatos y liderazgo en gobernanza y políticas. Esto permitiría integrar y coordinar esfuerzos ya existentes, evitando la duplicación de tareas entre instituciones que actualmente trabajan por separado en la mejora de metadatos.
  • Apoyo financiero: Para garantizar la sostenibilidad del proyecto a largo plazo, se requieren fondos destinados al desarrollo de la infraestructura técnica central, así como al diseño, implementación y prueba de modelos de curación de metadatos y a la creación de estructuras de gobernanza sólidas y abiertas. Los financiadores, además de su contribución económica, podrán desempeñar un papel estratégico en la configuración del futuro del enriquecimiento de metadatos, asegurando que los principios de equidad, apertura y sostenibilidad sean prioritarios.
  • Contribución de metadatos y participación en proyectos piloto: Organizaciones con experiencia previa en enriquecimiento de metadatos pueden aportar datos enriquecidos de sus propios flujos de trabajo, participar en proyectos piloto que evalúen la infraestructura técnica de COMET y colaborar en el diseño de métricas que permitan medir la calidad de los metadatos.

Este esfuerzo cobra especial relevancia en un contexto donde aumenta la presión sobre las organizaciones para cumplir con exigencias de acceso abierto, seguimiento de resultados y evaluación del impacto de la investigación. Estas obligaciones, cuando se afrontan de manera individual, resultan costosas y complejas. COMET ofrece una alternativa cooperativa, donde la mejora de los metadatos se entiende como una responsabilidad compartida entre toda la comunidad científica y académica, maximizando beneficios comunes y reduciendo cargas individuales.

Finalmente, COMET invita a todas las organizaciones interesadas a sumarse a esta iniciativa antes del 1 de mayo de 2025, especificando los recursos que pueden ofrecer, su experiencia previa en enriquecimiento de metadatos y su disposición a participar en las estructuras de gobernanza. Para más información y para registrar la participación, se ha habilitado un formulario en el sitio web de COMET y se llevará a cabo un seminario web informativo el próximo 5 de marzo de 2025.

En definitiva, COMET busca transformar la manera en que se enriquecen y gestionan los metadatos en la ciencia abierta, apostando por un modelo cooperativo, sostenible y transparente que permita a toda la comunidad beneficiarse de una infraestructura común al servicio del conocimiento global.

Informe de la Conferencia de París sobre Información Abierta para la Investigación

Information, Barcelona Declaration on Open Research. «Report of the Paris Conference on  Open Research Information». Zenodo, 8 de noviembre de 2024. https://doi.org/10.5281/zenodo.14054244.

Texto completo

Report of the Paris Conference on Open Research Information, describe los resultados de una conferencia celebrada en septiembre de 2024 en la Universidad de la Sorbona en París, donde se discutieron los próximos pasos para avanzar en la agenda de la Declaración de Barcelona sobre Información de Investigación Abierta. Durante el evento, que fue híbrido (presencial y en línea), participaron alrededor de 140 personas que compartieron avances y desafíos en la producción, gestión y uso de información de investigación abierta, y colaboraron en la elaboración de un plan de acción para los próximos años.

El primer día estuvo centrado en el intercambio de experiencias, mientras que el segundo se enfocó en la formulación de acciones concretas. En total, se presentaron 21 charlas, abarcando temas como las políticas universitarias y su implementación práctica, el papel de los financiadores y las organizaciones gubernamentales, las colaboraciones internacionales y las infraestructuras necesarias para respaldar la investigación abierta.

Entre las acciones prioritarias destacaron:

  1. Metadatos de artículos de revistas: Mejora en la estructuración y el intercambio de datos relacionados con los artículos de investigación.
  2. Metadatos de salidas de investigación en repositorios institucionales: Incluyendo preprints y repositorios de datos.
  3. Metadatos sobre la financiación: Establecer sistemas claros y abiertos para seguir el rastro del financiamiento de investigaciones.
  4. Sustitución de sistemas cerrados: Migrar de plataformas privadas a sistemas abiertos para gestionar la información de la investigación.
  5. Sostenibilidad de infraestructuras: Asegurar que las infraestructuras que soportan la investigación abierta sean viables a largo plazo.
  6. Evaluación de los datos abiertos: Crear marcos para medir los beneficios de los datos abiertos en la investigación.

Al final de la conferencia, se implementó un marco de teoría del cambio para clasificar las acciones en cuatro categorías: recolección de información, marcos y análisis, principios y directrices, y implementación y monitoreo. Esto permitirá construir una hoja de ruta concreta para coordinar las actividades de los próximos años.

Las organizaciones están invitadas a participar en los grupos de trabajo que llevarán adelante estas acciones a partir de 2025, con un enfoque en la colaboración y la coordinación global para fortalecer la investigación abierta. Se ha solicitado a las organizaciones interesadas que se inscriban antes del 30 de noviembre de 2024.

Metadatos de alta calidad: Una responsabilidad y una oportunidad colectivas.

Buttrick, Adam. «High-Quality Metadata: A Collective Responsibility and OpportunityUpstream, August 13, 2024. https://upstream.force11.org/high-quality-metadata/

La comunidad y las herramientas relacionadas con los Identificadores de Objetos Digitales (DOI, por sus siglas en inglés) dependen de metadatos de alta calidad para establecer conexiones y mejorar la eficiencia. Sin embargo, el modelo actual, donde las mejoras en estos metadatos se limitan a sus creadores o se realizan dentro de silos a nivel de servicio, perpetúa un sistema con importantes lagunas, ineficiencias y desconexiones. Pero este no tiene por qué ser el caso. Al construir de manera colaborativa sistemas abiertos, robustos y escalables para enriquecer los metadatos DOI, la comunidad puede aprovechar su trabajo colectivo para superar estas barreras y mejorar el estado e interconexión de la información de investigación.

La construcción del corpus de metadatos DOI a lo largo de los años ha enseñado a la comunidad una lección importante: cuando se trabaja en conjunto para definir cómo debería existir la infraestructura y cómo se desea mejorarla, se logran mejores resultados que cuando este trabajo se realiza de manera aislada. La administración colectiva de las fuentes compartidas de verdad permite tomar decisiones correctas para el mayor número posible de personas.

El enriquecimiento comunitario de los metadatos DOI presenta desafíos significativos, aunque no insuperables. La reunión inicial en Los Ángeles reafirmó el interés de la comunidad en abordar este desafío de manera conjunta, tal como se ha hecho con otras iniciativas de infraestructura exitosas. A través de la colaboración y el uso de la experiencia compartida, es posible construir un sistema de información de investigación mejor y más conectado. UC3 continuará con estas discusiones críticas e invita a la comunidad a mantenerse involucrada.

Declaración Conjunta sobre los Derechos de Metadatos de las Bibliotecas

Joint Statement on the Metadata Rights of Libraries. ICOLC, 2023

Texto completo

La Declaración Conjunta sobre los Derechos de Metadatos de las Bibliotecas, publicada el 21 de marzo de 2023 por ALA Core e ICOLC, insta a todas las organizaciones, tanto con fines de lucro como sin fines de lucro, a proteger los derechos e intereses de las bibliotecas para usar, reutilizar, adaptar, agregar y compartir metadatos que describan las colecciones bibliotecarias en beneficio del interés público, sin restricción ni limitación.

El documento resalta que los metadatos y los servicios de metadatos que describen las colecciones de bibliotecas son fundamentales para apoyar el descubrimiento de contenido, la creación de conocimiento y las misiones públicas de las bibliotecas. Se reconoce que los metadatos que describen las colecciones bibliotecarias generalmente no son objeto de derechos de autor y deben considerarse libremente compartibles y reutilizables en la mayoría de los casos.

Se enfatiza que las bibliotecas han creado metadatos sobre sus colecciones con la intención explícita de que se compartan, reutilicen y modifiquen abiertamente de manera no restringida para promover el acceso a la información. Estos metadatos son esenciales para las misiones educativas y sin fines de lucro de las bibliotecas, ya que facilitan el descubrimiento y acceso a los materiales de la biblioteca, apoyan la colaboración entre bibliotecas, contribuyen a la toma de decisiones informadas sobre compras de bibliotecas y permiten observar las tendencias en el uso de metadatos a nivel regional y mundial.

Sin embargo, se señala que las tendencias actuales de la industria están obstaculizando los derechos y la capacidad de innovación y colaboración de las bibliotecas al restringir el uso, la reutilización y el intercambio de metadatos. Se destaca la presión del mercado que limita las opciones de servicios de metadatos asequibles y las restricciones impuestas en el uso de metadatos en colaboraciones, plataformas, tipos de sistemas y proveedores.

Enlace a la declaración original de ICOLC (26 de agosto de 2022): https://icolc.net/statements/icolc-statement-metadata-rights-libraries

Buenas prácticas en el registro de metadatos para las revistas científicas

Buenas prácticas en el registro de metadatos para las revistas científicas. CAICYT – CONICET, 2023

Información completa

Los metadatos describen objetos digitales, como por ejemplo los artículos de una revista. Garantizan una identificación precisa del contenido de una revista y pueden mejorar la capacidad de descubrimiento, el acceso, la difusión, la preservación y, posiblemente, el impacto de la investigación.

Existen dos herramientas interesantes para trabajar con los metadatos en las revistas electrónicas:

1 – Introduction and Background: Better Practices in Journal Metadata: Esta guía explica cómo crear metadatos precisos de títulos de revistas, números de revistas y artículos de revistas en Open Journal Systems (OJS) y cómo evitar y corregir errores comunes.

2 – Manual de indización en OJS. Buenas prácticas para la región latinoamericana: Este Manual fue desarrollado por el Grupo de interoperabilidad y visibilidad para las revistas científicas latinoamericanas, conformadas por 8 universidades pertenecientes a la Red de Macrouniversidades de América Latina y el Caribe

Otros recursos de interés:
· Crossref. Metadata best practices.
https://www.crossref.org/documentation/principles-practices/best-practices/
· DOAJ Application Guide for OJS Journals.
https://docs.pkp.sfu.ca/doaj/en/
· Evaluación de metadatos en revistas científicas con MetaMetrics. Manuel Alejandro Flores Chávez y Edgar Durán Muñoz
https://www.youtube.com/watch?v=fDV58hyz-G0
· La importancia de la calidad de los metadatos para la visibilidad de las revistas científicas. Andrés Guzmán
https://www.youtube.com/watch?v=jNo4D7m2bOw

Estándares de identificación y metadatos en la industria editorial

«Identifier and Metadata Standards in the Publishing Industry». International Publishers Association, 28 de octubre de 2021.

Texto completo

Este informe fue encargado en febrero de 2021 por la Asociación Internacional de Editores (IPA) y la Federación Internacional de Organizaciones de Derechos de Reproducción (IFRRO).

Su objetivo es proporcionar una visión general de alto nivel de la implementación de estándares técnicos en las cadenas de valor y suministro de la industria editorial a nivel global, con un énfasis particular en dónde podría ser necesario el desarrollo de la infraestructura de estándares para satisfacer las necesidades de algunos o todos los participantes en esas cadenas: creadores (autores, ilustradores, fotógrafos), editores, intermediarios de diversos tipos, organizaciones colectivas (particularmente Organizaciones de Gestión Colectiva, OGC); y consumidores (usuarios finales).

Datos y metadatos, sus debates teóricos y prácticos del ayer, del hoy y sus discusiones futuras

Rodríguez García, Ariel Alejandro (coord.). «Datos y metadatos, sus debates teóricos y prácticos del ayer, del hoy y sus discusiones futuras», México: IBI, 2023.

Texto completo

En la historia de la organización de la información, referirse a lo que son los datos y metadatos para los bibliotecólogos y estudiosos de la información tiene múltiples propósitos en su estudio, así como significados. Ambos términos hacen que nuestros pensamientos y saberes se vayan a muchos siglos atrás, porque discutir sobre su gestación, crecimiento y desarrollo ha sido, es y será un asunto en constante evolución.

La mayoría de las iniciativas que se han documentado sobre los metadatos regularmente ofrecen una solución técnica para representar y describir un recurso. Otras proposiciones tienen una carga excesiva de instrucciones reglamentadas para la estructuración de los datos.

El término metadato fue acuñado en la década de los sesenta del siglo pasado, con el propósito de nombrar la descripción de un conjunto de datos. Pero en la actualidad, referirse a los metadatos es hacerlo con el fin de señalar que existe un esquema formal de información acerca de cualquier tipo de recurso que está codificado digitalmente. Además, es posible afirmar que los metadatos se pueden usar para organizar, controlar, transferir, establecer acuerdos y transmitir información de unos recursos con otros para ayudar eficientemente en el descubrimiento y la recuperación de información.