Archivo de la etiqueta: Metadatos

Datos y metadatos, sus debates teóricos y prácticos del ayer, del hoy y sus discusiones futuras

Rodríguez García, Ariel Alejandro (coord.). «Datos y metadatos, sus debates teóricos y prácticos del ayer, del hoy y sus discusiones futuras», México: IBI, 2023.

Texto completo

En la historia de la organización de la información, referirse a lo que son los datos y metadatos para los bibliotecólogos y estudiosos de la información tiene múltiples propósitos en su estudio, así como significados. Ambos términos hacen que nuestros pensamientos y saberes se vayan a muchos siglos atrás, porque discutir sobre su gestación, crecimiento y desarrollo ha sido, es y será un asunto en constante evolución.

La mayoría de las iniciativas que se han documentado sobre los metadatos regularmente ofrecen una solución técnica para representar y describir un recurso. Otras proposiciones tienen una carga excesiva de instrucciones reglamentadas para la estructuración de los datos.

El término metadato fue acuñado en la década de los sesenta del siglo pasado, con el propósito de nombrar la descripción de un conjunto de datos. Pero en la actualidad, referirse a los metadatos es hacerlo con el fin de señalar que existe un esquema formal de información acerca de cualquier tipo de recurso que está codificado digitalmente. Además, es posible afirmar que los metadatos se pueden usar para organizar, controlar, transferir, establecer acuerdos y transmitir información de unos recursos con otros para ayudar eficientemente en el descubrimiento y la recuperación de información.

Datos de la colección de libros digitales de la Library of Congress

Selected Digitized Books collection

Esta es una colección creciente de libros seleccionados y otros materiales de las Colecciones Generales de la Biblioteca del Congreso que se han puesto a disposición abiertamente. La mayoría de los materiales de esta colección se publicaron en los Estados Unidos antes de la década de 1930 y están en inglés. La colección presenta miles de obras de ficción, incluidos libros destinados a niños, adultos jóvenes y otras audiencias. También hay algunos materiales en idiomas extranjeros que se publicaron en otros países.

Este conjunto de datos comprende 166 218 archivos .txt y JSON que contienen texto completo de 90 414 libros en la colección de libros digitalizados seleccionados de loc.gov. El texto se creó como parte de los flujos de trabajo de digitalización utilizando tecnologías de reconocimiento óptico de caracteres (OCR). El conjunto de datos se creó utilizando la API JSON/YAML de loc.gov para obtener los metadatos y una aplicación de gestión de datos y procesamiento de flujo de trabajo interno para extraer el texto completo asociado de un LCCN. Los metadatos comprenden todos los libros digitalizados seleccionados.

Los libros de esta colección son de dominio público y son libres de usar y reutilizar.

Línea de crédito: Biblioteca del Congreso

Perfiles de aplicación de metadatos en bibliotecas

Theodore Gerontakos and Benjamin Riesenberg  «Metadata Application Profiles«. Library Technology Reports vol. 57, no. 6 (August/September 2021

Texto completo

En Library Technology Reports (vol. 57, n.º 6), «Metadata Application Profiles», los perfiles de aplicación de metadatos (MAP) se analizan en dos amplias categorías según se adhieran o no a las prácticas de datos enlazados. Existe una amplia gama de propósitos para los PAM, incluyendo la implementación de metadatos y la interoperabilidad. Los MAP tienen cuatro componentes: la aplicación, las entidades, las propiedades y los valores. Los creadores de MAP reúnen los componentes de MAP a partir de fuentes ya existentes, como ontologías, esquemas, esquemas de codificación de vocabulario y esquemas de codificación de sintaxis. Los creadores pueden presentar los MAP en formatos legibles para el ser humano, para la máquina o híbridos. Varios ejemplos en el texto demuestran características específicas de los MAP.

Declaración de ICOLC sobre los derechos de los metadatos de las bibliotecas

ICOLC Statement on the Metadata Rights of Libraries. The International Coalition of Library Consortia (ICOLC) sept 2022

Ver completo

Los metadatos y los servicios de metadatos que describen las colecciones de las bibliotecas son fundamentales para apoyar el descubrimiento de contenidos, la creación de conocimiento y las misiones públicas de las bibliotecas.

Los metadatos que describen las colecciones de las bibliotecas no suelen estar sujetos a derechos de autor, y deberían considerarse libremente compartibles y reutilizables en la mayoría de las circunstancias. Sin embargo, algunos agentes de la industria restringen los derechos de las bibliotecas a utilizar dichos metadatos mediante términos contractuales e influencia en el mercado. Esta actividad restrictiva no está en consonancia con las necesidades de las bibliotecas ni con su misión pública y no lucrativa.

Los firmantes de este documento instan a todas las organizaciones, con o sin ánimo de lucro, a defender los derechos e intereses de las bibliotecas para utilizar, reutilizar, adaptar, agregar y compartir los metadatos que describen las colecciones de las bibliotecas para servir al interés público, sin restricciones ni limitaciones.

Los metadatos bibliográficos de las bibliotecas suelen proporcionar una descripción factual del contenido y las colecciones que las bibliotecas ponen a disposición de sus usuarios. Por ejemplo: los registros bibliográficos pueden contener el título de un libro, el autor, el año de publicación, los encabezamientos de materia y otros campos. Estos metadatos pueden variar en cuanto a su exhaustividad y descriptividad, pero no suelen considerarse una expresión creativa.

Las bibliotecas llevan mucho tiempo creando metadatos sobre sus colecciones con la intención explícita de que sean compartidos, reutilizados y modificados abiertamente y sin restricciones para promover el acceso a la información. Los metadatos que describen las colecciones de las bibliotecas son fundamentales para las misiones educativas y sin ánimo de lucro de las bibliotecas en su funcionamiento, tanto cotidiano como estratégico. Permiten a los usuarios descubrir y acceder a los materiales de la biblioteca, apoyan la colaboración entre bibliotecas, ayudan a la gestión de toma de decisiones de compra de la biblioteca, permiten a las bibliotecas observar las tendencias de uso de los metadatos a nivel regional y mundial, y apoyan el análisis de las tendencias y convenciones de catalogación.

Dada la importancia de que las bibliotecas utilicen, reutilicen y compartan libremente estos metadatos, las tendencias actuales del sector son preocupantes. Las opciones limitadas de servicios de metadatos asequibles, junto con las restricciones impuestas al uso, reutilización y compartición de metadatos entre colaboraciones, plataformas, tipos de sistemas y proveedores, están impidiendo los derechos de las bibliotecas y su capacidad de innovar y colaborar para servir a sus usuarios de forma eficaz. La presión que limita el mercado y que permite e impone cualquier práctica monopolística, ya sea a través de contratos comerciales o de políticas, es antitética al propósito de las bibliotecas y margina a las bibliotecas que no cuentan con fondos suficientes.

El 13 de junio de 2022, OCLC registró una denuncia (demanda) en la que solicitaba medidas cautelares y permanentes y daños y perjuicios contra Clarivate y sus filiales, ProQuest y Ex Libris, con el fin de detener los esfuerzos de Clarivate por crear un nuevo servicio de catalogación sin coste para las bibliotecas.

Según la demanda, este nuevo servicio, MetaDoor, competiría directamente con OCLC y, según OCLC, conduciría a un uso indebido de los registros. OCLC también alegó que Clarivate estaba animando a los clientes de OCLC a incumplir sus contratos con OCLC al proporcionar metadatos de la biblioteca en forma de registros bibliográficos a este servicio alternativo.

Un aspecto central de esta demanda es el uso y el intercambio por parte de las bibliotecas de sus registros de catálogo y de los metadatos que describen sus libros y otros materiales de la colección. Los empleados individuales de las bibliotecas de entornos públicos y privados sin ánimo de lucro crearon estos registros y los han aportado a la comunidad bibliotecaria a través de las plataformas de OCLC. Las bibliotecas pagan suscripciones a OCLC con la intención de que estos datos aportados se pongan a disposición de otras bibliotecas para su uso, reutilización e intercambio. Las bibliotecas se convierten en miembros de OCLC cuando compran o se suscriben a cualquiera de los servicios de OCLC. Los servicios de OCLC proporcionan a las bibliotecas formas de aprovechar el trabajo de metadatos de otros y de hacer que las existencias de la biblioteca sean localizables en el servicio WorldCat de OCLC. Si bien las bibliotecas pagan tarifas considerables a OCLC y a otros proveedores por servicios que incluyen la deduplicación, la identificación y la mejora, no lo hacen con la intención de que sus registros queden aislados o se restrinja su reutilización. Independientemente de quién haya contribuido a los registros descriptivos, los registros individuales generalmente no son susceptibles de derechos de autor, ni es de interés público que se restrinja su uso.

Las bibliotecas pretenden que los metadatos que describen sus colecciones estén disponibles de forma gratuita y puedan ser descubiertos por todos sus usuarios, incluidos los de otras bibliotecas con las que comparten. Las bibliotecas dedican su trabajo a crear y mejorar los registros bibliográficos con el fin de permitir el descubrimiento de los contenidos de la biblioteca y apoyar a las sociedades en la búsqueda del conocimiento para el beneficio compartido. El trabajo que supone la creación de los registros del catálogo de la biblioteca fue, en muchos casos, financiado con fondos públicos para el uso público. Estos registros no se crearon con el fin de obtener beneficios corporativos o sostenibilidad fiscal, aunque las empresas pueden desarrollar servicios mejorados que dependen de estos datos. Cualquier interés corporativo que afirme el derecho a limitar o determinar cómo las bibliotecas pueden utilizar, reutilizar o compartir los registros que han creado lo hace en contradicción directa con las necesidades articuladas de las bibliotecas, y en contra del interés público.

(Des)obediencia en las sociedades digitales: perspectivas sobre el poder de los algoritmos y los datos

Neuburg, Klaus, et al. (Dis)Obedience in Digital Societies: Perspectives on the Power of Algorithms and Data: 37. 2022.

Texto completo

Los algoritmos no deben considerarse como una estructura técnica, sino como un fenómeno social: se incrustan, de forma todavía muy sutil, en nuestro sistema político y social. Los algoritmos moldean el comportamiento humano en varios niveles: influyen no sólo en la recepción estética del mundo, sino también en el bienestar y la interacción social de sus usuarios. Actúan e intervienen en un contexto político y social. Como los algoritmos influyen en el comportamiento individual en estas situaciones sociales y políticas, su poder debería ser objeto de un discurso crítico, o incluso llevar a la desobediencia activa y a la necesidad de contar con herramientas y métodos adecuados que puedan utilizarse para romper el poder algorítmico

Norma NISO sobre Requisitos de Metadatos Bibliográficos de Libros Electrónicos en la Cadena de Suministro de Venta, Publicación, Descubrimiento, Entrega y Preservación

E-Book Bibliographic Metadata Requirements in the Sale, Publication, Discovery, Delivery, and Preservation Supply Chain (NISO RP-29-2022). NISO, 2022

Texto completo

Este documento, elaborado por el Grupo de Trabajo de Metadatos de Libros Electrónicos y aprobado por NISO Information Creation & Curation Topic Committee, incorpora los comentarios recibidos de editores, minoristas, bibliotecas, proveedores de servicios, organismos de conservación y otros que utilizan metadatos de libros electrónicos.

La práctica recomendada se centra en varias áreas clave para los metadatos de los libros electrónicos: la definición de los requisitos mínimos para la venta, el descubrimiento, la entrega, la gestión de las existencias electrónicas y la preservación; la identificación de la mejor manera de transmitir los metadatos a través de la cadena de suministro; las actualizaciones de los títulos y las existencias; el desarrollo de reglas para la duplicación de los metadatos de los libros electrónicos; y la puesta en común de una serie de ejemplos de aplicación de la práctica recomendada.

La práctica recomendada se centra en los elementos clave de los metadatos -títulos, nombres, fechas, identificadores de libros y materias- para permitir las funciones básicas de los metadatos de los libros electrónicos que se aplican en todas las organizaciones interesadas: identificar un libro, hacer coincidir los registros del mismo libro o versión y distinguir los registros que se refieren a diferentes libros o versiones. El objetivo es proporcionar principios y ejemplos que apoyen la comprensión compartida y, en la medida de lo posible, la alineación de las prácticas de metadatos de libros electrónicos en todos los sectores, complementando las mejores prácticas y directrices de libros electrónicos existentes, como las publicadas por BISG, EDItEUR y W3C.

La aplicación de estas recomendaciones beneficiará a toda la comunidad del libro electrónico, desde los autores hasta los lectores, pasando por los editores, los minoristas, los vendedores y las bibliotecas.

Mejores prácticas en los metadatos de las revistas

Better Practices in Journal Metadata. Coalition Publica, 2021

Better Practices in Journal Metadata

Metadata Feedback for Coalition Publica

Los metadatos son un aspecto esencial de la publicación académica. Garantizan la identificación precisa del contenido de una revista y pueden mejorar la capacidad de descubrimiento, el acceso, la difusión, la preservación y, posiblemente, el impacto de la investigación.

Dado el importante papel de los metadatos en la publicación académica digital, Coalition Publica se complace en anunciar la publicación de dos importantes informes elaborados por su Grupo de Trabajo sobre Metadatos.

  • La guía Better Practices in Journal Metadata debería ser un recurso inestimable para los editores de revistas que utilizan OJS, así como para los proveedores de alojamiento que los apoyan. Esta guía se añadirá al PKP Docs Hub, donde se mantendrá en cooperación con la comunidad de usuarios de PKP.
  • El informe técnico Metadata Feedback for Coalition Publica proporciona una valiosa visión sobre las nuevas tendencias en los metadatos de las publicaciones académicas que Coalition Publica puede necesitar integrar en los próximos años.

El Grupo de Trabajo de Metadatos fue convocado a principios de 2019 con un mandato de dos años para:

  • Proporcionar orientación y asesoramiento sobre las mejores prácticas para la calidad de los metadatos en las revistas académicas alojadas en la biblioteca para garantizar una mayor capacidad de descubrimiento, especialmente para el servicio de difusión de Coalition Publica;
  • Desarrollar procedimientos y documentación para guiar a los bibliotecarios y editores en la asistencia a las revistas en la creación de metadatos de alta calidad;
  • Proporcionar recomendaciones al Comité de Operaciones de Coalition Publica para mejorar y fomentar mejores metadatos en las plataformas de PKP y Érudit.

El lado oscuro de Google: historia y futuro de la industria de los metadatos

Macchia, María Grazia, Giuseppe Mai, y colectivo Ippolita. El lado oscuro de Google: Historia y futuro de la industria de los metadatos. Barcelona : Virus Editorial, 2010., 2010

Texto completo

Entre las bondades que Google difunde de sí misma no están las 133 webs censuradas en Europa, el sometimiento a las presiones censoras del Gobierno chino o la cancelación de la publicidad del grupo ecologista Oceana 36 para evitar problemas con uno de sus inversores: la Royal Caribbean Cruise Lines. Solo tres ejemplos de como Google Corporation viola los principios de neutralidad y libertad de acceso y expresión en la Red para salvaguardar sus propios intereses. La imagen sobria y luminosa de su página principal oculta un reverso más prosaico y turbio en el que se adentra El lado oscuro de Google. «Don’t be evil» (no seas malo), el lema de cabecera de la multinacional que quiso ser un «gigante bueno», entra en abierta contradicción con la agresividad de su política empresarial. El fichaje multimillonario del directivo de Microsoft Kai Fu-Lee, depositario de importantes secretos industriales, o la oferta de 50 millones de dólares a AOL a cambio de romper su contrato con Yahoo!, muestran hasta qué punto Google ha asimilado las reglas de juego de las grandes corporaciones. Pero en su estrategia de expansión, Google también se aprovecha de la filosofía del software libre para su propio beneficio. Hace un uso selectivo del código abierto para modificar programas cuyas mejoras no hace públicas, pone a disposición libre de los programadores herramientas que le permiten controlar y apropiarse del trabajo realizado con ellas, y ofrece a sus trabajadores un 20% del tiempo de trabajo para investigaciones propias, que pasan a ser propiedad exclusiva de la empresa. Desde que en 1996 Larry Page y Sergei Brin desarrollaron uno de los algoritmos más famosos y mejor guardados del mundo, el Page Rank(TM), Google ha consolidado su carácter de gran empresa hasta convertirse en el principal aspirante al monopolio de la información en la era digital. Esto, en parte, ha sido posible gracias a los gigantescos ingresos proporcionados por un modelo de publicidad personalizada, basada en los perfiles que la máquina Google dibuja de los usuarios, utilizando el rastro que éstos dejan con el empleo diario del buscador y otros servicios de uso gratuito. El colectivo Ippolita muestra la clara ambición hegemónica de Google y, con ella, uno de los principales peligros de nuestra era: la concentración en unas pocas manos del acceso a la información y la tecnología, poniendo en riesgo un sinfín de derechos ya coartados en el mundo material y seriamente amenazados en el espacio virtual.

¿Cómo funciona internet y los motores de búsqueda? Planeta Biblioteca 2021/05/19.

¿Cómo funciona internet y los motores de búsqueda?

Planeta Biblioteca 2021/05/19.

ESUCHAR EL PROGRAMA

Ir a descargar

Presentación PPS

Los buscadores web funcionan mediante la “orden” de búsqueda con palabras clave, imágenes o voz. Primero el usuario introduce los datos, acto seguido, los motores de búsqueda responden con un listado de páginas web relacionado con el contenido buscado. Para ello la herramienta utiliza los comúnmente denominados “robots”, o “spiders”, que rastrean todas las páginas web para crear una gran base de datos con la que proporcionar toda la información al usuario

La transición a la siguiente generación de metadatos

Karen Smith-Yoshimura. La transición a la siguiente generación de metadatos: informe OCLC Reesearch, 2021. Traducción
Iván Pérez Marinas. Departamento de Proceso Técnico. Biblioteca Nacional de España

Texto completo

El OCLC Research Library Partners Metadata Managers Focus Group (Grupo de Debate de Gestores de Metadatos de los Socios de Bibliotecas de Investigación), creado en 1993, es uno de los grupos que más han perdurado en el OCLC Research Library Partnership (RLP; Sociedad de Bibliotecas de Investigación), una red internacional de bibliotecas de investigación. El Focus Group aporta un foro para que directivos que se ocupan de crear y gestionar metadatos en sus instituciones compartan información sobre asuntos de interés común e identifiquen problemas de gestión de metadatos.

El presente informe, La transición a la siguiente generación de metadatos, sintetiza
seis años (2015-2020) de debates del OCLC Research Library Partners Metadata Managers Focus Group y lo que se podría pronosticar para la “siguiente generación de
metadatos”. Todos los debates del Focus Group están impregnados de la firme creencia de que los metadatos subyacen en todas las opciones de búsqueda y descubrimiento independientemente del formato, ahora y en el futuro.

Sin embargo, los metadatos están cambiando. Tanto por motivos conceptuales como por cuestiones técnicas, pronto va a quedar obsoleta la gestión de metadatos de formato específico que se basan en cadenas de caracteres suministradas en registros bibliográficos que sólo son entendidas por sistemas bibliotecarios. Las innovaciones en
biblioteconomía están presionando en las prácticas habituales de la gestión de metadatos para que éstas evolucionen, ya que a los bibliotecarios se les está exigiendo que proporcionen metadatos para muchos más recursos de varios tipos y que colaboren en proyectos institucionales o multiinstitucionales con menos personal. El presente informe indica cómo están evolucionando los metadatos y examina el impacto que esta transición puede tener en servicios bibliotecarios, planteando preguntas como:

  • ¿Por qué cambian los metadatos?
  • ¿Cómo cambia el proceso de creación?
  • ¿Cómo cambian los metadatos en sí?
  • ¿Qué impacto tendrán estos cambios en los futuros requisitos de personal y cómo pueden prepararse las bibliotecas?