Archivo de la etiqueta: DOI

Millones de artículos académicos en riesgo de desaparecer del Internet: un estudio revela lagunas en la preservación digital

Millions of research papers at risk of disappearing from the Internet. En: Bandiera_abtest: a Cg_type: News Subject_term: Information technology, Scientific community, Publishing [en línea], 2024. [consulta: 3 mayo 2024]. Disponible en: https://www.nature.com/articles/d41586-024-00616-5.


Un estudio sobre más de siete millones de publicaciones digitales sugiere que más de una cuarta parte de los artículos académicos no están siendo archivados y preservados adecuadamente. Esto indica que los sistemas de preservación en línea no están manteniendo el ritmo del crecimiento de la producción investigativa.

Martin Eve, investigador de literatura, tecnología y publicación en la Universidad de Birkbeck, Londres, señala que la cadena de notas al pie es esencial para la epistemología científica y de investigación. Sin embargo, más de dos millones de artículos con identificadores digitales únicos (DOI) no aparecían en archivos digitales importantes, a pesar de tener un DOI activo.

El estudio examinó si 7.438,037 obras con DOI estaban archivadas. Solo el 58% de los DOI referenciaban obras almacenadas en al menos un archivo digital. Esto plantea desafíos significativos para la preservación digital, especialmente para editoriales pequeñas que pueden carecer de recursos.

El análisis sugiere medidas para mejorar la preservación digital, como requisitos más estrictos en las agencias de registro de DOI y una mayor conciencia del problema entre editores e investigadores. Eve destaca la importancia de garantizar la sostenibilidad a largo plazo del ecosistema de investigación.

¿Cuán confiables son los DOI? Un 3% de los enlaces DOI fallan

Crossref, «What, though, do we actually know about the state of persistence of these links?,» Crossref Blog, acceso el 3 de marzo de 2024, https://www.crossref.org/blog/what-do-we-know-about-dois/.

Crossref guarda metadatos de aproximadamente 150 millones de artefactos académicos. Estos van desde artículos de revistas revisados por pares hasta libros académicos y entradas de blog científico. De hecho, en medio de tal heterogeneidad, el único factor singular que une a estos elementos es que se les ha asignado un identificador de objeto de documento (DOI, por sus siglas en inglés); una cadena de identificación única que se puede utilizar para resolver a un recurso relacionado con dichos metadatos (a menudo, aunque no siempre, una copia del trabajo identificado por los metadatos).

Pero, ¿qué sabemos realmente sobre el estado de persistencia de estos enlaces? ¿Cuántos DOIs se resuelven correctamente? ¿Cuántas páginas de destino, al otro extremo de la resolución del DOI, contienen la información que se supone que debe estar allí, incluido el título y el propio DOI? ¿Cómo podemos averiguarlo?

Hablemos de las estadísticas de resolución. Otros estudios, que examinan los enlaces generales en la web, han encontrado una tasa de descomposición de enlaces de aproximadamente del 60% al 70% en un período de diez años (Lessig, Zittrain y Albert 2014; Stox 2022). La tasa de resolución de DOIs que tenemos, con el 97% de los enlaces resueltos (o una tasa de descomposición de enlaces del 3%), es mucho mejor y más sólida que un enlace web en general.

¿Es un 3% un número bueno o malo? Es más sólido que la web en general, pero aún significa que, de cada 100 DOIs, casi 3 no se resolverán. Además, no podemos determinar si estos DOIs se están resolviendo al objetivo correcto, excepto mediante el uso de métricas de detección de metadatos (¿están el título y el DOI en la página de destino, lo cual solo podríamos detectar a una tasa mucho más baja?). Es completamente posible que un sitio web se resuelva con una respuesta HTTP 200 (OK), pero que la página en cuestión sea algo muy diferente a lo que el usuario esperaba, un fenómeno llamado deriva de contenido. Un buen ejemplo es el secuestro de dominios, donde un nombre de dominio expira y empresas de spam los compran. Estos todavía se resuelven a una página web, pero en lugar de un artículo sobre ARN, por ejemplo, el usuario recibe anuncios de mangueras de soldadura de caucho. Dicho esto, otros estudios también son propensos a esto y no hay garantía de que la deriva de contenido no afecte a una gran proporción de enlaces supuestamente buenos en los otros estudios también.

¿Qué es un DOI y para que sirve?

.

Los DOIs o Identificadores de Objetos Digitales se han convertido en algo omnipresente en nuestro ecosistema académico hasta el punto de que la mayoría de los investigadores de hoy en día están al menos vagamente familiarizados con la idea.

.

Cualquier contenido académico puede perder su URL, y aparecer la frase «Error 404» es decir, que el link es inaccesible porque el documento fue borrado o cambiado en cualquier momento. Para solucionar este problema nació el DOI de Crossref: un identificador persistente

Los DOIs son un identificador único y persistente para los artículos, pero tener un DOI no tiene relación con la calidad del artículo. Pero, utilizar el DOI para buscar la URL es más fiable que enlazar con la URL directamente. La idea es que cada vez que la ubicación del contenido académico en la web cambia, el propietario del contenido está obligado a actualizar el enlace al que resuelve el DOI. Por lo tanto, siempre que apuntemos al DOI, se nos enviará a la URL correcta actualizada, lo que reduce la perdida de enlaces.

La actualización de la resolución del DOI puede deberse a un cambio en la estructura interna del sitio web del editor, pero también puede deberse a que el propietario del contenido venda la revista a otro editor.

A menudo se asume que cada contenido único se registra con uno y sólo un DOI y, aunque esto suele ser cierto, hay excepciones. El propio análisis de Crossref en 2020 detectó un 0,8% de duplicados. Hay varias razones para ello. Por ejemplo, si un editor adquiere el control de una revista existente, debería comprobar que el control de los dois correspondientes se transfiere a ellos también y actualizar los enlaces de acuerdo, sin embargo, algunos editores pueden simplemente acuñar sus propios DOIs que lleva a esa duplicación.

Los DOI en general se utilizan hoy en día para algo más que para resolver contenidos. Por un lado, para cumplir la simple función de ser un ID persistente, es necesario mantener metadatos para cada DOI. Como mínimo se necesitaría el DOI y la URL a la que resolver. Obviamente, el DOI también estaría asociado a los metadatos habituales que describen el objeto digital, por ejemplo, el título, el autor, etc.

Pero, además, los metadatos asociados a cada DOI se han ampliado para abarcar múltiples aspectos del objeto, lo que ha dado lugar a interesantes e importantes servicios creados en torno a ellos, como el apoyo a las actualizaciones/comprobaciones de retracción, las comprobaciones de plagio y la búsqueda de citas.

El aspecto clave es que los DOIs pueden expresar relaciones entre DOIs y dado que los DOIs pueden ser usados para una variedad de objetos más allá de los artículos publicados en revistas, como por ejemplo para conjuntos de datos, preprints, revisiones por pares, subvenciones y más, se obtienen muchas posibilidades interesantes.

Por ejemplo, puede vincular un conjunto de datos con un DOI de Datacite a un artículo publicado de la revista Version of Record con un DOI de Crossref. O podría vincular un preprint con un DOI de Crossref con otro DOI de Crossref para la versión publicada del registro.

Una vez que se dispone de una red de objetos de investigación conectados entre sí, podemos crear redes de objetos académicos, lo que Crossref denomina un «nexo de investigación de artículos» que puede utilizarse para realizar consultas para responder a preguntas relevantes. Y, por supuesto, los DOI son sólo un tipo de de identificadores persistentes (PID) . Los DOI pueden incluir otros PID en sus campos, como ORCID para los autores y ROR para las afiliaciones, y al recopilar las relaciones entre dichos PID, se obtiene el gráfico de PID.

En resumen:

  1. Los DOIs no son emitidos sólo por Crossref, existen otras agencias de registro de DOIs*
  2. Los DOIs no se refieren sólo a los enlaces, sino también a los metadatos
  3. Los DOIs de Crossref tienen muchos servicios más allá del registro de contenidos para enlazar, por ejemplo, la comprobación de similitud, Crossmark
  4. Los DOIs permiten el registro de contenidos no sólo de artículos de revistas sino también de contenidos publicados (preprints, blogs) y más.
  5. Los DOIs de Crossref permiten crear relaciones entre los DOIs, por ejemplo, de preprints a VoR (Version of Record), de conjuntos de datos a artículos de revistas, de informes de revisión por pares a artículos, etc.

En realidad, hay 12 agencias de registro de DOI (RA) que pueden registrar o «acuñar» DOIs. La más famosa y popular utilizada por los editores de revistas es Crossref, por supuesto, pero también puede encontrar DOIs registrados de Datacite y raramente otros DOIs de otros como CNKI y Airiti (contenido de China), KISTI (coreano), JaLC (Japón).

Basado en: «5 Things You May Not Know about DOIs or Why There Is More to DOIs than Meets the Eye». Accedido 30 de agosto de 2022. http://musingsaboutlibrarianship.blogspot.com/2022/04/5-things-you-may-not-know-about-dois-or.html.

Los identificadores persistentes conectan un registro académico con muchas versiones

Persistent Identifiers Connect a Scholarly Record with Many Versions by Cynthia Hudson-Vitale and Judy Ruttenberg | ACRL February 18, 2021

Texto completo

En los últimos meses, hemos visto a grandes editoriales comerciales expresar una renovada preocupación por que el acceso abierto verde (OA) —compartir manuscritos de autor en repositorios abiertos— amenaza el registro académico dado qur múltiples versiones socavan la “versión del registro” (VOR). Los editores están presentando dos argumentos al respecto: (1) que múltiples versiones «inferiores» causarán confusión a los investigadores (y no estarán vinculadas a otros activos relacionados como datos y código) y, (2) que si los financiadores de investigación financian la ruta dorada (publicación en revistas de acceso abierto) y permitien que los autores compartan su trabajo en repositorios abiertos, la disponibilidad gratuita de manuscritos amenazará el flujo de financiación de esta ruta, que los editores necesitan para mantener la «versión de registro».

Cuando los editores hablan de investigación y erudición vinculadas solo en términos de la transición del mercado al acceso abierto, es una visión inherentemente limitante de la investigación académica. En este contexto, la preocupación por la versión del registro refleja un interés comercial, no un valor académico. Como estrategia de gestión, insistir en solo versiones de registro alojadas por el editor no se alinea con un flujo de trabajo de investigación moderno que incluye múltiples herramientas y repositorios potenciales. Recientemente, varios editores han expresado su preocupación por la «versión de registro» con respecto a la » Estrategia de retención de derechos » de PlanS . Sin embargo, como se señaló en la respuesta de la cOAlition S, establecer y mantener relaciones con otras versiones de artículos o recursos de investigación ya ha demostrado ser exitoso en comunidades disciplinarias y académicas.

Mientras que la versión impresa publicada del artículo de investigación fue una vez la fuente autorizada de la investigación, los nuevos modos de publicación y la publicación de otros resultados de la investigación (preprints, protocolos, datos, código, etc.) han hecho que el término «versión de registro» todo menos irrelevante. El panorama de las comunicaciones académicas ya se ha trasladado a lo que Herbert Van de Sompel, Bianca Kramer y Jeroen Bosman llaman un «registro de versiones«, donde los identificadores persistentes (PID) mejoran la capacidad de descubrimiento y la vinculación de los resultados de la investigación independientemente de dónde se alojen esos resultados.

Sin embargo, esto no debe causar confusión a los investigadores, ya que estas versiones y activos se pueden vincular mediante identificadores persistentes. A través de la utilización de los identificadores persistentes digitales PID (como DOIPURLsORCIDROR, y RRIDs) los activos de investigación distribuidos pueden ser descubiertos y vinculados entre sí, y han afirmado relaciones.

La insistencia continua en la «versión del registro», incluido el uso de la fecha VOR en lugar de la fecha de publicación para calcular los factores de impacto de la revista, es también un intento sutil de algunos editores comerciales de continuar ejerciendo control sobre todo el ecosistema de comunicaciones académicas y ser vistos. como autoridades únicas o administradores de publicaciones de investigación. Por lo tanto, existe una necesidad imperiosa de cambiar el diálogo de una única «versión de registro» a un «registro de versiones» que abarque múltiples versiones y resultados, y deje espacio para un entorno de publicación más diverso e inclusivo.

Las bibliotecas desempeñan un papel clave en la asociación en todo el ecosistema académico para garantizar un acceso equitativo y duradero al registro académico completo, trabajando con creadores, editores y organismos de estándares, y en diferentes modelos comerciales. Así que adoptemos el «registro de versiones» y promocionemos los PID para conectar los resultados de la investigación entre sí y con otros trabajos relacionados.

La asignación de identificadores DOI a los capítulos de libros intensifican el descubrimiento y cita de la investigación

 

cambridge_companions_book_doi

Radomski, Bartosz. Book chapter DOIs emerge as a new key tool in research discovery. Open Science, 2020.

Texto completo

 

¿La forma más fácil de hacer que un libro sea visible? Incluir identificadores únicos para cada uno de sus capítulos. Los libros que tienen dos en cada uno sus capítulos son más visibles y también se citan más.

 

Un DOI (Digital Object Identifier) es una forma de identificar un objeto digital (por ejemplo un artículo electrónico de una revista, un capítulo de un libro electrónico…) sin importar su URL, de forma que si ésta cambia, el objeto sigue teniendo la misma identificació

Desde el lanzamiento los servicios de indexación expandidos deScienceOpen en noviembre de 2019, ScienceOpen ha rastreado las citas de más de 820.000 libros y capítulos de libros, lo que ofrece una gran cantidad de datos para trabajar. De la cantidad total de contenido del libro, los capítulos de libros representan alrededor del 80%. Una presencia tan fuerte en la plataforma ScienceOpen no es una coincidencia: los capítulos de libros equipados con DOI como identificadores persistentes son más fáciles de rastrear y, por lo tanto, se convierten en una herramienta clave en el descubrimiento de investigaciones de publicaciones de libros.

En una muestra aleatoria de 5341 registros, con más de 3157 libros (59%)  estos fueron citados con menos o igual frecuencia en su conjunto, en comparación con los libros con DOI a nivel de ccapítulo. Sin embargo, 653 libros (12% de la muestra total) que tenían asignado un identificador DOI por capítulos fueron más  citados. En conclusión, según estos datos, los libros con capítulos DOI tienen constantemente más citas, independientemente de su fecha de publicación.

Dado que los investigadores usan comúnmente listas de publicaciones de libros y artículos como herramienta de descubrimiento, los DOI a nivel de capítulo hacen que la información más granular sea más fácil de encontrar y citar.

Además incluir un DOI a un capítulo hace que un registro esté más fácilmente disponible para las búsquedas de información específica en el espacio digital, que es el punto de partida para la comunicación científica, promoción y ventas.

Las citas de capítulos vinculados, además de referencias, perfiles de autores y palabras clave, conectan profundamente los libros con otros contenidos dentro del entorno de descubrimiento, creando una nube contextual que fomenta una mayor exploración. Esto permite a los editores crear un flujo adicional de difusión del conocimiento, así como un canal de promoción y ventas.

Los DOI no son el único tipo de metadatos que los editores pueden usar para que su contenido se visible. Otro recurso poderoso es un resumen. Su utilidad, tanto para la capacidad de descubrimiento de contenido como para la comunicación científica, difícilmente puede cuestionarse. La disponibilidad de un resumen es a menudo crucial para que el conocimiento fluya. Sin embargo, cuando se trata de capítulos de libros, incluir resúmenes no es una práctica tan común como se puede suponer inicialmente. Esto es aún más sorprendente porque los argumentos a favor de incluir el resumen como parte de los metadatos se aplica universalmente:

  1. Los trabajos con resúmenes son más reconocibles.
  2. Es más probable que los lectores seleccionen y vean contenido con resúmenes.

 

Uso de ORCID, DOI y otros identificadores abiertos en la evaluación de investigación

frma-03-00028-g001

Haak LL, Meadows A and Brown J (2018) Using ORCID, DOI, and Other Open Identifiers in Research EvaluationFront. Res. Metr. Anal. 3:28. doi: 10.3389/frma.2018.00028

Texto completo

 

En este trabajo, se discute el uso de identificadores persistentes en la evaluación de la investigación – para los individuos, sus contribuciones y las organizaciones que los patrocinan y financian su trabajo. Los sistemas de identificación global se encuentran en una posición única para compilar los datos de todas  las interacciones,  movilidad y colaboración global que se produce en torno a un documento de investigación. Al aprovechar las conexiones entre las infraestructuras locales y los recursos de información globales, los evaluadores pueden mapear las fuentes de datos que antes no estaban disponibles o que requerían de una mano de obra que podría ser prohibitiva.

Se consideran identificadores persistentes aquellos sistemas normalizados tales como ORCID iDs y DOIs, que están siendo incorporados en los flujos de trabajo de investigación a través de la ciencia, la tecnología, la ingeniería, las artes y las matemáticas; cómo esto está afectando la disponibilidad de datos para propósitos de evaluación; y proporcionamos ejemplos de evaluaciones que están aprovechando los identificadores. También se discute la importancia de la procedencia y la preservación para establecer la confianza en la fiabilidad y confiabilidad de los datos y las relaciones, y en la disponibilidad a largo plazo de los metadatos que describen los objetos y sus interrelaciones. Se concluye  con una discusión sobre las oportunidades y riesgos del uso de identificadores en los procesos de evaluación.

oaDOI: El DOI de las versiones en abierto de los artículos

Las bibliotecas del MIT está ofreciendo una nueva manera de acceder al contenido académico a través de oadoi. org, portal que indexa millones de artículos, y ofrece versiones de texto completo en libre acceso a través de una API abierta. oaDOI es una contribución a una infraestructura de acceso abierto que dirige a los lectores a nuevas versiones de artículos con el objetivo de democratizar el acceso a la información.

¿Cómo funciona? El  motor de búsqueda de BASE OA permite ver si hay una copia del artículo en la ruta verde de acceso abierto. BASE indiza 90mil+ documentos abiertos de más de 4000 repositorios mediante la recolección de metadatos OAI-PMH. Estos datos permiten acceder  artículo de acceso abierto a servicios como Unpaywall, una extensión gratuita del navegador que permite pasar por alto los paywalls de los artículos académicos. En el caso de las bibliotecas que usan SFX oaiDOI permite encontar el texto completo abierto cuando no hay acceso por suscripción; más de 600 bibliotecas de todo el mundo lo usan.

Quienes gestionan este servicio son Impactstory.com, una organización sin fines de lucro que trabaja para hacer la ciencia más abierta y reutilizable en línea.

 

 

Estándares de interoperabilidad para objetos digitales de investigación

medical-device-interoperability

Sansone, S.-A. and P. Rocca-Serra (2016). [e-Book] Interpolaribility Standards – Digital Objects in their own right. London, Welcome Trust. Texto completo: https://ndownloader.figshare.com/files/6530586

Revisión encargada por Wellcome Trust enfocada en estándares de interoperabilidad para productos de investigación digital.

Identificadores persistentes: CrossRef, DOI, OpenURL, SFXTecnologías que garantizan la identificación, el acceso y la preservación de los documentos digitales

27291059171_1d74637936_o_d

“RESOLVERS”: CrossRef, DOI, OpenURL, SFXTecnologías que garantizan la identificación, el acceso y la preservación de los documentos digitales

Las URLs no son enlaces persistentes. Uno de los puntos principales es resolver el problema que un entorno tan variable como el digital produce.• Cada día se pierden miles de enlaces y esto hace que documentos referenciados en motores de búsqueda y bases de datos no se encuentren Un estudio publicado en Science determinó que se perdían el 13 % de los enlaces a los artículos con más de 27 meses