Archivo de la etiqueta: Identificadores persistentes

Sustentabilidad de contenidos e infraestructura abiertos

Sustaining Open Content and Infrastructure. Research Library Issues, no. 302 (2021)

Texto completo

En mayo de 2021, Microsoft anunció que cerraría sus Servicios Académicos de Microsoft (MAS) a finales de año. La noticia de esta decisión resonó en la comunidad académica abierta, suscitando preguntas y preocupaciones entre los numerosos interesados que confiaban en el servicio gratuito para el seguimiento de las actividades de investigación en diversos contextos.

En un momento en que el descubrimiento de la investigación es más necesario que nunca, también se está volviendo más complicado. La labor de seguimiento e identificación de las publicaciones y otros resultados de la investigación se desarrolla en un contexto de mayor complejidad tecnológica, motivaciones y prioridades contrapuestas y recursos limitados. Como ejemplifica el caso de Microsoft, uno de los retos y riesgos fundamentales en el panorama de las infraestructuras académicas es la disponibilidad imprevisible de las plataformas y servicios de los que dependemos para realizar este trabajo.

Cuando estas plataformas y servicios desaparecen, ¿qué nos queda? Estos retos y riesgos podrían superarse o al menos mitigarse si la infraestructura académica se construye con componentes abiertos que puedan persistir más allá de su embalaje. “The Principles of Open Scholarly Infrastructure” (POSI), que se esbozaron inicialmente en 2015 y que están experimentando un renacimiento en 2021, proporcionan un conjunto de directrices para la infraestructura abierta para la investigación y las comunicaciones académicas. Dentro de este marco, la infraestructura abierta es una estrategia para la sostenibilidad. Utilizando los principios POSI como telón de fondo, se examina un ingrediente esencial de la infraestructura abierta: los identificadores persistentes, o PID y las inversiones en los servicios que los soportan, pueden permitir el descubrimiento de los resultados de la investigación y promover la sostenibilidad de los datos y la información.

Las bibliotecas de investigación tienen la oportunidad de adoptar un enfoque «centrado en los PID» para rastrear, compartir y publicar la investigación. Los PID tienen el potencial de abordar los puntos débiles, aumentar la eficiencia y ahorrar tiempo. Promover la implementación de los PID abiertos y los metadatos asociados a ellos sirve al objetivo más amplio de mejorar la conectividad de la información. Aunque este artículo no pretende ofrecer una discusión exhaustiva de las muchas complejidades de la financiación, el mantenimiento y la conexión de la multiplicidad de sistemas académicos, ni promete un estudio exhaustivo de todos los identificadores persistentes, queremos compartir nuestra perspectiva de primera mano sobre la dinámica de la construcción y la planificación de la infraestructura académica abierta y sostenible y queremos esbozar ideas y estrategias para abogar específicamente por la prioridad de los PID abiertos y los metadatos abiertos para garantizar la sostenibilidad de la investigación.

¿Qué es un DOI y para que sirve?

.

Los DOIs o Identificadores de Objetos Digitales se han convertido en algo omnipresente en nuestro ecosistema académico hasta el punto de que la mayoría de los investigadores de hoy en día están al menos vagamente familiarizados con la idea.

.

Cualquier contenido académico puede perder su URL, y aparecer la frase «Error 404» es decir, que el link es inaccesible porque el documento fue borrado o cambiado en cualquier momento. Para solucionar este problema nació el DOI de Crossref: un identificador persistente

Los DOIs son un identificador único y persistente para los artículos, pero tener un DOI no tiene relación con la calidad del artículo. Pero, utilizar el DOI para buscar la URL es más fiable que enlazar con la URL directamente. La idea es que cada vez que la ubicación del contenido académico en la web cambia, el propietario del contenido está obligado a actualizar el enlace al que resuelve el DOI. Por lo tanto, siempre que apuntemos al DOI, se nos enviará a la URL correcta actualizada, lo que reduce la perdida de enlaces.

La actualización de la resolución del DOI puede deberse a un cambio en la estructura interna del sitio web del editor, pero también puede deberse a que el propietario del contenido venda la revista a otro editor.

A menudo se asume que cada contenido único se registra con uno y sólo un DOI y, aunque esto suele ser cierto, hay excepciones. El propio análisis de Crossref en 2020 detectó un 0,8% de duplicados. Hay varias razones para ello. Por ejemplo, si un editor adquiere el control de una revista existente, debería comprobar que el control de los dois correspondientes se transfiere a ellos también y actualizar los enlaces de acuerdo, sin embargo, algunos editores pueden simplemente acuñar sus propios DOIs que lleva a esa duplicación.

Los DOI en general se utilizan hoy en día para algo más que para resolver contenidos. Por un lado, para cumplir la simple función de ser un ID persistente, es necesario mantener metadatos para cada DOI. Como mínimo se necesitaría el DOI y la URL a la que resolver. Obviamente, el DOI también estaría asociado a los metadatos habituales que describen el objeto digital, por ejemplo, el título, el autor, etc.

Pero, además, los metadatos asociados a cada DOI se han ampliado para abarcar múltiples aspectos del objeto, lo que ha dado lugar a interesantes e importantes servicios creados en torno a ellos, como el apoyo a las actualizaciones/comprobaciones de retracción, las comprobaciones de plagio y la búsqueda de citas.

El aspecto clave es que los DOIs pueden expresar relaciones entre DOIs y dado que los DOIs pueden ser usados para una variedad de objetos más allá de los artículos publicados en revistas, como por ejemplo para conjuntos de datos, preprints, revisiones por pares, subvenciones y más, se obtienen muchas posibilidades interesantes.

Por ejemplo, puede vincular un conjunto de datos con un DOI de Datacite a un artículo publicado de la revista Version of Record con un DOI de Crossref. O podría vincular un preprint con un DOI de Crossref con otro DOI de Crossref para la versión publicada del registro.

Una vez que se dispone de una red de objetos de investigación conectados entre sí, podemos crear redes de objetos académicos, lo que Crossref denomina un «nexo de investigación de artículos» que puede utilizarse para realizar consultas para responder a preguntas relevantes. Y, por supuesto, los DOI son sólo un tipo de de identificadores persistentes (PID) . Los DOI pueden incluir otros PID en sus campos, como ORCID para los autores y ROR para las afiliaciones, y al recopilar las relaciones entre dichos PID, se obtiene el gráfico de PID.

En resumen:

  1. Los DOIs no son emitidos sólo por Crossref, existen otras agencias de registro de DOIs*
  2. Los DOIs no se refieren sólo a los enlaces, sino también a los metadatos
  3. Los DOIs de Crossref tienen muchos servicios más allá del registro de contenidos para enlazar, por ejemplo, la comprobación de similitud, Crossmark
  4. Los DOIs permiten el registro de contenidos no sólo de artículos de revistas sino también de contenidos publicados (preprints, blogs) y más.
  5. Los DOIs de Crossref permiten crear relaciones entre los DOIs, por ejemplo, de preprints a VoR (Version of Record), de conjuntos de datos a artículos de revistas, de informes de revisión por pares a artículos, etc.

En realidad, hay 12 agencias de registro de DOI (RA) que pueden registrar o «acuñar» DOIs. La más famosa y popular utilizada por los editores de revistas es Crossref, por supuesto, pero también puede encontrar DOIs registrados de Datacite y raramente otros DOIs de otros como CNKI y Airiti (contenido de China), KISTI (coreano), JaLC (Japón).

Basado en: «5 Things You May Not Know about DOIs or Why There Is More to DOIs than Meets the Eye». Accedido 30 de agosto de 2022. http://musingsaboutlibrarianship.blogspot.com/2022/04/5-things-you-may-not-know-about-dois-or.html.

Los identificadores descentralizados (DID) v1.0 se convierten en una recomendación del W3C

Decentralized Identifiers (DIDs) v1.0 becomes a W3C Recommendation. W3C, 2022

Texto completo

El Consorcio de la World Wide Web (W3C) ha anunciado que los Decentralized Identifiers (DID) v1.0 son ya una norma oficial de la Web. Este nuevo tipo de identificador verificable, que no requiere un registro centralizado, permitirá tanto a los individuos como a las organizaciones tener un mayor control de su información y relaciones en línea, a la vez que proporciona mayor seguridad y privacidad.

Hay un análogo histórico a este anuncio en la evolución de los números de teléfono móvil. Al principio eran propiedad del operador de telefonía móvil y se «alquilaban» al individuo. Esto obligaba a los individuos a cambiar de número si cambiaban de compañía. Con la adopción de la portabilidad del número de teléfono móvil, los individuos pueden ahora «llevar sus números con ellos» cuando cambian de compañía.

Lo mismo ocurre con la mayoría de las direcciones de correo electrónico y de las redes sociales hoy en día: no son «propiedad» de los individuos y deben ser cambiadas si el individuo cambia de proveedor. En cambio, los identificadores descentralizados del W3C pueden ser controlados por las personas u organizaciones que los crean, son portátiles entre proveedores de servicios y pueden durar todo el tiempo que su controlador quiera seguir utilizándolos.

Además, los DID tienen la propiedad única de permitir al controlador verificar la propiedad del DID mediante criptografía. Esto puede permitir a cualquier controlador de un DID -un individuo, una organización, una comunidad en línea, un gobierno, un dispositivo IoT- realizar transacciones en línea más fiables. Para los individuos en particular, los DID pueden devolverles el control de sus datos personales y su consentimiento, y también permitir relaciones de confianza bidireccionales más respetuosas en las que se evite la falsificación, se respete la privacidad y se mejore la usabilidad.

Fundamentalmente, los identificadores descentralizados son un nuevo tipo de identificador globalmente inequívoco que puede utilizarse para identificar a cualquier sujeto (por ejemplo, una persona, una organización, un dispositivo, un producto, una ubicación, incluso una entidad abstracta o un concepto). Cada DID se resuelve en un documento DID que contiene el material criptográfico y otros metadatos para controlar el DID. Los pilares fundamentales de la especificación DID son 1) Los DID no requieren una agencia central de emisión (descentralizados), 2) Los DID no requieren el funcionamiento continuo de una organización subyacente (persistentes), 3) El control de los DID, y la información a la que están asociados, puede ser demostrado criptográficamente (verificable), y 4) Los metadatos de los DID pueden ser descubiertos (resolubles).

Hacia la participación de los investigadores en los sistemas de información para la investigación

Lee, Dong Joon, et al. Towards Researcher Participation in Research Information Systems. mayo de 2016. oaktrust.library.tamu.edu,

Texto completo

Este póster presenta un estudio de colaboración en curso apoyado por la beca de investigación LIS de OCLC/ALISE. Incluye principalmente la descripción y el diseño de la investigación de este estudio.

El proyecto explora la participación de los investigadores en los sistemas de gestión de identidades de investigación (por ejemplo, Google Scholar, ResearchGate, ORCID). Sobre la base de conocimientos de cómo diseñar soluciones fiables, eficientes y escalables para los sistemas, motivar a los investigadores a participar en los sistemas, y contribuir al desarrollo del sistema en entornos de bibliotecas digitales. La identificación y determinación precisa de la identidad de investigación son esenciales para la agrupación, vinculación, agregación y recuperación eficaces de la erudición digital; la evaluación de la productividad de la investigación y el impacto de los individuos, grupos e instituciones; y la identificación de la experiencia y las habilidades.

Existen muchos sistemas de gestión de la identidad de los investigadores procedentes de editoriales, bibliotecas, universidades, motores de búsqueda y agregadores de contenidos, con diferentes modelos de datos, cobertura y calidad. Aunque la curación del conocimiento por parte de profesionales suele producir resultados de la máxima calidad, puede no ser escalable debido a su elevado coste. La literatura sobre comunidades en línea muestra que las comunidades de curación por pares que tienen éxito y son capaces de atraer y retener a suficientes participantes pueden proporcionar soluciones de curación de conocimientos escalables de una calidad comparable a la de los contenidos curados por profesionales.

Por lo tanto, el éxito de los sistemas de gestión de identidades de investigación en línea puede depender del número de colaboradores y usuarios que sean capaces de reclutar, motivar y comprometerse con la curación de datos de identidades de investigación.

Los resultados de esta investigación exploratoria incluirán, entre otros, una teoría cualitativa de las prácticas de información y datos de identidad de los investigadores, un modelo o modelos cuantitativos de las prioridades de los investigadores para los diferentes datos y servicios de identidad de investigación en línea, los factores que pueden afectar a su participación y compromiso con los sistemas de gestión de identidad de investigación en línea, y sus motivaciones para participar en la curación de datos de identidad de investigación. Los resultados del estudio pueden mejorar en gran medida nuestros conocimientos sobre el diseño de los modelos de datos/metadatos de identidad de investigación, los servicios, las actividades de garantía de calidad y los mecanismos de contratación y retención de investigadores para el suministro y mantenimiento de datos de identidad.

Cómo crear un perfil en ORCID

Cómo crear un perfil en ORCID

Los identificadores persistentes surgen para solucionar el problema de los cambios de ubicación y/o nombre de los archivos en Internet. Su objetivo es redireccionar a los documentos, aunque estos hayan cambiado de ubicación en la red (cambio de URL). ORCID es un proyecto abierto, sin ánimo de lucro, comunitario, que ofrece un sistema para la identificación inequívoca de investigadores y un método claro para vincular las actividades de investigación y los productos de estos identificadores.  

  • ORCID es aceptado por organizaciones y editores científicos tan importantes como Nature, Elsevier, Thomson-Reuters, CrossRef, Springer, Wiley, etc.
  • El identificador único ORCID es independiente y normalizado de acuerdo con la norma ISO 27729:2012. Consta de 16 dígitos que forman un código único, persistente asociado a cada autor registrado en ORCID.
  • Se trata de un código único personal sincronizado con los diferentes identificadores de cada investigador en los principales portales académicos
  • El identificador único ORCID permitirá a cada investigador conectar directamente con sus IDs en Scopus, WOK (Web of Knowledge), CrossRef y transferir los datos de sus publicaciones de manera automática desde estos portales hacia ORCID,

Qué implica la ruptura de hiprenlaces en la web: estudio de la deriva de enlaces y contenidos en The New York Times.

Zittrain, Jonathan, John Bowers, and Clare Stanton. «The Paper of Record Meets an Ephemeral Web: An Examination of Linkrot and Content Drift within The New York Times.» Library Innovation Lab, Harvard Law School, 2021

Ver completo

Los hipervínculos son una herramienta poderosa para los periodistas y sus lectores. Para profundizar en el contexto de un artículo, basta con un clic. Pero los hipervínculos son un arma de doble filo: a pesar de lo ilimitado de Internet, lo que se encuentra en la Red también puede modificarse, desplazarse o desaparecer por completo.

La fragilidad de la Red supone un problema para cualquier área de trabajo o interés que dependa de los registros escritos. La pérdida de material de referencia, los impactos negativos en el SEO y el secuestro malicioso de valiosos outlinks son algunos de los efectos adversos de una URL rota. Y lo que es más importante, deja los artículos de décadas pasadas como cáscaras vacías de lo que fueron, desvinculados de su fuente y contexto originales. En un estudio de 2014, por ejemplo, unos investigadores descubrieron que casi la mitad de los hipervínculos de las opiniones del Tribunal Supremo conducían a contenidos que habían cambiado desde su publicación original o habían desaparecido de Internet.

Esta decadencia, a menudo irreversible, de los contenidos web se conoce comúnmente como linkrot. Es similar al problema relacionado con la deriva del contenido, o los cambios típicamente no anunciados -retiros, adiciones, sustituciones- en el contenido de una determinada URL.

Este estudio examinó los hipervínculos en los artículos del New York Times, desde el lanzamiento del sitio web del Times en 1996 hasta mediados de 2019, desarrollados sobre la base de un conjunto de datos que nos proporcionó el Times. La sustancial deriva de enlaces y contenidos que se econtró refleja las dificultades inherentes a la vinculación a largo plazo de enlaces de una web volátil. The Times, en particular, es un abanderado del periodismo digital con buenos recursos y una sólida estructura de archivo institucional. Su interés por afrontar el reto del linkrot indica que aún no se ha entendido ni abordado de forma exhaustiva en todo el ámbito.

Se descubrió que de los 553.693 artículos incluidos en el estudio -es decir, que incluían URLs en nytimes.com- había un total de 2.283.445 hipervínculos que apuntaban a contenidos fuera de nytimes.com. El 72% de ellos eran «enlaces profundos» con una ruta a una página específica, como example.com/article, que es donde se centró el análisis (en lugar de simplemente example.com, que componía el resto del conjunto de datos). De estos enlaces profundos, el 25% de los enlaces eran completamente inaccesibles. La putrefacción de los enlaces se hizo más común con el tiempo: el 6 por ciento de los enlaces de 2018 se habían corrompido, en comparación con el 43 por ciento de los enlaces de 2008 y el 72 por ciento de los enlaces de 1998. El 53% de todos los artículos que contenían enlaces profundos tenían al menos un enlace fallido.

Ciertas secciones del Times mostraron tasas mucho más altas de URLs podridas. Los enlaces de la sección de deportes, por ejemplo, muestran una tasa de putrefacción relativa de alrededor del 36%, frente al 13% de The Upshot. Esta diferencia tiene que ver, en gran parte, con el tiempo. La edad media de un enlace en The Upshot es de 1.450 días, frente a los 3.196 días de la sección de deportes.

Enlaces rotos por secciones

ORCID llega a los 10 millones de perfiles

Después de 8 años de trayectoria ORCID llega a los 10000000 de perfiles. A fines de 2012, solo tres meses después de que lanzamos el registro ORCID, disponía de casi 50.000 investigadores ya se habían registrado para obtener un iD . Diez meses después de eso, el récord de ORCID creciera a casi 250,000 (¡con 80 miembros!) En dos años se llegó a 1,000,000 de iD , y nueve meses después de eso, en 2015,  1.5 millones de iD . 

Desde 2015 la plataforma ha estado creciendo constantemente superando incluso las más altas expectativas:

  • En 2015, el récord creció en 788.650 registros,
  • En 2016, por 1.068.295
  • En 2017, 1.388.796
  • En 2018, creció en 1.585.851
  • En 2019, por 2.006.672, y
  • En 2020 (hasta ahora), 2,293,631! 

Y la semana pasada, ORCID alcanzó otro hito importante: ¡10 millones de ORCID iD registrados! 

¿Qué es y cómo funciona ORCID?. Planeta Biblioteca 2020/10/21.

La imagen tiene un atributo ALT vacío; su nombre de archivo es paloma_marinarraiza-copia.jpg

Qué es y cómo funciona ORCID. Planeta Biblioteca 2020/10/21.

con Paloma Marín Arraiza

ESCUCHAR EL PROGRAMA

Ir a descargar

Paloma Marín Arraiza es licenciada en física por la Universidad de Granada (España) y máster en Información y Comunicación Científica por la misma universidad. Realizó su doctorado en Ciencia de la Información en la Universidad Estatal Paulista – UNESP (Brasil). Ha trabajado en la Biblioteca Nacional Alemana de Ciencia y Tecnología en Hannover (Alemania), en su portal de videos cientíticos, TIB-AV/Portal y en el biblioteca de la Universidad Técnica de Viena (Austria), tratando temas de identificadores persistentes (PIDs). Actualmente es Engagement Lead para Europa en ORCID y trabaja directamente con instituciones que implementen ORCID en sus sistemas. Asimismo, colabora con el programa de posgrado en Ciencia de la Información de la UNESP con una asignatura sobre Ciencia Abierta y Gestión de Datos de Investigación. Hemos hablado con Paloma sobre todas cuestiones relacionadas con el identificador de investigadores persistente ORCID

Informe anual ORCID de 2019 (2020)

 

screen20shot202020-03-1820at202_55_1220pm

 

ORCID Releases 2019 Annual Report, ORCID, 2020

Texto completo

Tutorial para crear un perfil en ORCID

Durante 2019s e registraron 1.957.249 nuevos usuarios para una identificación ORCID, lo que supone un total de 7.763.812 usuarios al final del año. Alrededor de 5.400 investigadores crean una identificación cada día, lo que supone un aumento del 8% con respecto a 2018 Más del 40% de los registros – 3.219.135 – tienen una conexión con al menos otro identificador.

¿Qué es el ORCID?

ORCID (en inglés «Open Researcher and Contributor ID», en español Identificador Abierto de Investigador y Colaborador) es un código alfanumérico, no comercial, que identifica de manera única a científicos y otros autores académicos

Proporciona tres servicios esenciales:

  • Un identificador único de investigadores
  • Un conjunto de API para permitir a los investigadores conectar su iD con sus afiliaciones y contribuciones, y
  • Una base de datos para almacenar estas conexiones.

 

Documentos relacionados