Archivo de la etiqueta: Gestión de la colección

La Universidad de Yale se asocia con la Oficina de Publicaciones del Gobierno de EE. UU. para preservar la información gubernamental

Library Technology. «GPO Partners with Yale University Library to Preserve Government InformationLibrary Technology, March 6, 2025. https://librarytechnology.org/pr/31139

La Oficina de Publicaciones del Gobierno de los EE. UU. (GPO) ha firmado un Memorando de Acuerdo con la Biblioteca de Derecho Lillian Goldman de la Universidad de Yale para que se convierta en un «Preservation Steward» o responsable de la preservación.

El término Preservation Stewards hace referencia a bibliotecas o instituciones que tienen el compromiso de preservar y conservar los documentos oficiales del gobierno, especialmente aquellos en formato impreso, para garantizar su disponibilidad a largo plazo. Este programa fue establecido por la U.S. Government Publishing Office (GPO) para asegurar el acceso público continuado a la información gubernamental, tanto en formatos físicos como digitales, en un mundo cada vez más digitalizado.

Los Preservation Stewards desempeñan un papel clave en el mantenimiento de colecciones de documentos del gobierno federal, asegurando que los materiales sean correctamente almacenados, conservados y accesibles para futuras generaciones. Además, muchas de estas bibliotecas también sirven como socias de acceso digital, proporcionando plataformas y servicios en línea para facilitar el acceso remoto a estos recursos.

En estos días la Oficina de Publicaciones del Gobierno de los EE. UU. (GPO) ha firmado un Memorando de Acuerdo con la Biblioteca de Derecho Lillian Goldman de la Universidad de Yale para que se convierta en un «Preservation Steward» o responsable de la preservación. Este acuerdo tiene como objetivo ayudar a las bibliotecas a gestionar eficientemente la preservación de documentos gubernamentales en la era digital, garantizando el acceso público continuo a documentos del gobierno de los EE. UU. en formato impreso. A través de esta iniciativa, la biblioteca de Yale, junto con otras más de 60 en todo el país, contribuirá significativamente a la conservación de documentos impresos y proporcionará acceso digital a la información gubernamental. La GPO, que produce y distribuye información del gobierno federal, ve en esta colaboración una manera esencial de asegurar el acceso fácil y permanente a los documentos gubernamentales, vital para la democracia de EE. UU.

A través del acuerdo, muchas bibliotecas también sirven como socios de acceso digital que proporcionan acceso digital a la información del Gobierno. En la actualidad hay más de 60 bibliotecas que actúan como Preservation Stewards en todo Estados Unidos. Estas bibliotecas tienen la responsabilidad de preservar los documentos impresos del gobierno federal, asegurando que la información pública continúe estando disponible para el acceso de los ciudadanos, tanto en formato físico como digital. El objetivo de esta red es garantizar que la información gubernamental se conserve adecuadamente para las generaciones futuras, en un esfuerzo conjunto con la GPO. Las bibliotecas participantes en este programa también proporcionan acceso digital a la información gubernamental, contribuyendo significativamente a la preservación y la accesibilidad de los documentos oficiales.

La Biblioteca Pública de Boston amplía el acceso a sus colecciones mediante digitalización e inteligencia artificial

Boston Public Library. 2024. “Boston Public Library Expands Access to Collections through AI-Enhanced Digitization.” Boston Public Library. https://www.bpl.org/news/boston-public-library-expands-access-to-collections-through-ai-enhanced-digitization/.

La Biblioteca Pública de Boston (BPL) ha iniciado un ambicioso proyecto de digitalización para hacer accesibles cientos de miles de materiales históricos previamente inaccesibles al público. Mediante herramientas de inteligencia artificial (IA), la iniciativa busca modernizar los procesos de digitalización y mejorar el acceso y la exploración de las colecciones de la biblioteca.

La Biblioteca Pública de Boston (BPL) ha iniciado un ambicioso proyecto de digitalización a gran escala para hacer accesibles al público cientos de miles de artículos históricos previamente inaccesibles. Este esfuerzo multietapa busca modernizar los procesos de digitalización e integrar herramientas de inteligencia artificial (IA) para ampliar el acceso y la capacidad de descubrimiento de sus vastas colecciones.

Desde su fundación en 1848, la BPL ha acumulado una amplia variedad de materiales, incluyendo libros, documentos gubernamentales, mapas y periódicos. Aunque se han realizado esfuerzos de digitalización en el pasado, la magnitud de las colecciones ha dificultado su acceso completo al público. Este nuevo proyecto pretende cambiar esa realidad, proporcionando al público nuevas formas de descubrir e interactuar con los extensos fondos de la biblioteca.

Una colaboración destacada en este proyecto es con la Institutional Data Initiative (IDI) de la Biblioteca de la Facultad de Derecho de Harvard. Esta iniciativa de investigación trabaja con instituciones de conocimiento, desde bibliotecas y museos hasta grupos culturales y agencias gubernamentales, para refinar y publicar sus colecciones como datos accesibles. La IDI y la BPL explorarán procesos que equilibren la tecnología de IA con la experiencia curatorial al mejorar los metadatos de las colecciones y modernizar el programa de digitalización de la BPL para ampliar el acceso.

Además, la BPL cuenta con el apoyo de la iniciativa NextGenAI de OpenAI, lo que refuerza su compromiso de garantizar que las tecnologías emergentes de IA sirvan a una amplia gama de usuarios, desde investigadores académicos hasta aprendices de por vida. Este respaldo es parte de un esfuerzo más amplio para asegurar que las bibliotecas públicas puedan aprovechar las oportunidades que ofrece la IA, mejorando y optimizando sus servicios para beneficiar tanto a los usuarios como a los profesionales de las bibliotecas.

Este proyecto de la BPL refleja una tendencia más amplia en el mundo bibliotecario hacia la adopción de la IA para mejorar la accesibilidad y la eficiencia. Por ejemplo, la Biblioteca de la Facultad de Derecho de Harvard, a través de la IDI, ha publicado recientemente un conjunto de datos de alta calidad de casi un millón de libros de dominio público. Este conjunto de datos está disponible para que cualquier persona lo utilice en el entrenamiento de grandes modelos de lenguaje y otras herramientas de IA, lo que subraya el potencial de la IA para transformar la gestión y el acceso a los recursos bibliotecarios.

OCLC implementa un modelo de Inteligencia Artificial para la detección y eliminación de duplicados en los registros bibliográficos de WorldCat

OCLC. «Implementing AI to Further Scale and Accelerate WorldCat De-Duplication.» Última modificación 4 de febrero de 2025. https://www.oclc.org/en/news/announcements/2025/ai-worldcat-deduplication.html.

OCLC ha implementado un modelo de aprendizaje automático para la detección y eliminación de duplicados en los registros bibliográficos de WorldCat, como parte de sus esfuerzos continuos para mejorar la calidad de los datos y la experiencia de búsqueda para los usuarios de la red global de bibliotecas. La iniciativa comenzó en agosto de 2023, cuando se introdujo el primer modelo de aprendizaje automático para identificar duplicados de libros impresos en inglés, con el apoyo de la comunidad de catalogadores, quienes participaron en ejercicios de etiquetado de datos. Este proceso resultó en la eliminación de alrededor de 5,4 millones de registros duplicados de libros impresos en varios idiomas como inglés, francés, alemán, italiano y español.

El modelo de inteligencia artificial de OCLC se ha optimizado y extendido para abarcar todos los formatos, lenguajes y escrituras de WorldCat, utilizando los datos etiquetados por la comunidad para entrenar y ajustar el algoritmo. Tras una extensa fase de pruebas internas y la colaboración de bibliotecas miembros de WorldCat, se iniciará el 11 de febrero de 2025 una prueba piloto que involucrará la fusión de 500,000 pares de registros duplicados de libros impresos en inglés, que son la categoría más numerosa y la que ha recibido más pruebas hasta ahora.

Después de este primer ensayo, se evaluarán los resultados antes de realizar nuevas pasadas de eliminación de duplicados para los libros impresos en inglés. Una vez completada esta fase, OCLC continuará con la eliminación de duplicados en otros formatos, como materiales no bibliográficos y libros en idiomas distintos al inglés. Se recomienda a las bibliotecas que no usen WorldShare Management Services habilitar las actualizaciones de WorldCat en WorldShare Collection Manager para garantizar que reciban los registros actualizados.

Este esfuerzo, que combina la labor manual de los bibliotecarios con la tecnología avanzada de inteligencia artificial, ha logrado importantes avances en la reducción de duplicados en WorldCat. La eliminación de duplicados es una de las formas más efectivas de mejorar la calidad de WorldCat, y este enfoque automatizado permitirá a las bibliotecas ahorrar tiempo valioso y proporcionar una experiencia más precisa y eficiente para los usuarios, además de avanzar en la misión global de las bibliotecas.

Libros basura generados por IA ya está en tu biblioteca pública

Maiberg, Emanuel. «AI-Generated Slop Is Already In Your Public Library404 Media, 4 de febrero de 2025. https://www.404media.co/ai-generated-slop-is-already-in-your-public-library-3/

Los bibliotecarios están enfrentando un problema creciente en las bibliotecas públicas de EE. UU. con respecto a los libros de baja calidad generados por inteligencia artificial (IA). Estos libros están siendo incluidos en los catálogos digitales de bibliotecas públicas, lo que obliga a los bibliotecarios a revisar una gran cantidad de material para identificar qué libros son generados por IA y cuáles son escritos por humanos.

Las plataformas Hoopla y OverDrive, que gestionan los libros electrónicos en muchas bibliotecas, están facilitando la inclusión de estos títulos, sin que los bibliotecarios tengan un control efectivo sobre la selección. Aunque Hoopla ofrece un catálogo muy amplio, esto también significa que los bibliotecarios deben lidiar con contenido de baja calidad, incluyendo libros escritos o generados por IA con poca o ninguna supervisión. Este tipo de contenido es conocido como «slop» o «basura de IA», y se ha convertido en un problema debido a la falta de curaduría en las plataformas. Algunos de estos libros, aunque no presentan información peligrosa, están mal escritos y tienen una presentación pobre.

Los bibliotecarios expresan su preocupación por la cantidad creciente de contenido de IA en sus catálogos, ya que los usuarios pueden no ser conscientes de que están leyendo material generado por IA. Además, esto genera un gasto innecesario para las bibliotecas, que deben pagar por libros de baja calidad. Los bibliotecarios piden mayor transparencia y control en el proceso de selección de los libros, y sugieren que los libros generados por IA deben estar claramente identificados en los catálogos para que los usuarios sepan que no fueron escritos por autores humanos.

Uso de la Inteligencia Artificial y el Aprendizaje Automático en la British Library

Ridge, Mia. «AI (and Machine Learning, etc) with British Library CollectionsBritish Library Digital Scholarship Blog, December 2024. https://blogs.bl.uk/digital-scholarship/2024/12/ai-and-machine-learning-etc-with-british-library-collections.html

British Library está utilizando IA y AA para mejorar la accesibilidad, la organización y el análisis de sus colecciones, facilitando la investigación en el campo del patrimonio cultural digital. A través de una combinación de proyectos internos y colaboraciones externas, la biblioteca no solo está mejorando sus propias colecciones, sino también contribuyendo al debate sobre el uso ético y responsable de estas tecnologías en la preservación y difusión del conocimiento cultural.

La inteligencia artificial (IA) y el aprendizaje automático (AA) están transformando el campo de la investigación y el acceso a colecciones culturales y académicas. En la British Library, estas tecnologías se utilizan para enriquecer las colecciones, mejorando su accesibilidad y usabilidad en la investigación computacional. La biblioteca ha llevado a cabo una serie de proyectos internos y colaboraciones externas, además de capacitar a su personal para implementar IA y AA de manera ética y responsable.

La British Library ha sido un socio clave en el proyecto FRAIM de la Universidad de Sheffield (2024), centrado en la implementación responsable de la IA. Esto se refleja en su Estrategia de IA y Guía Ética, que subraya la importancia de utilizar estas tecnologías de manera que respeten la privacidad, la equidad y la transparencia. Además, la biblioteca ha promovido el debate sobre IA, fomentando la alfabetización en IA y datos para ayudar a los usuarios a comprender cómo se crean los modelos de aprendizaje automático y los conjuntos de datos.

Uno de los principales usos de la IA en la biblioteca es la transcripción de textos, un proceso fundamental para hacer que los libros y manuscritos digitalizados sean más accesibles para la búsqueda y el análisis. Herramientas como Transkribus y eScriptorium se han utilizado para transcribir texto manuscrito y impreso en una variedad de alfabetos y escrituras, lo que facilita el acceso a obras históricas y lingüísticas. Ejemplos de proyectos destacados incluyen el uso de Transkribus para el reconocimiento de texto manuscrito árabe y la automatización de la transcripción de libros bengalíes antiguos.

Además de estos proyectos internos, la British Library ha colaborado con otras instituciones para explorar el uso de IA y AA en el análisis de grandes volúmenes de datos. Un proyecto significativo fue Living with Machines (2018-2023), en colaboración con el Alan Turing Institute, que utilizó IA y ciencia de datos para analizar periódicos, libros y mapas históricos y comprender el impacto de la Revolución Industrial en las personas comunes. Este proyecto empleó diversas técnicas de IA, como la expansión léxica, la visión computacional y la clasificación de datos, y produjo más de 100 resultados en el repositorio de investigación de la biblioteca.

Internamente, la biblioteca también ha experimentado con IA en tareas específicas de catalogación y organización de colecciones. Un ejemplo de esto es el proyecto Languid: Language Identification Project (2020), en el que se utilizó IA para identificar y añadir códigos de idioma a más de 3 millones de registros de catálogo. Otro proyecto importante fue Flyswot (2021), que entrenó un modelo de aprendizaje automático para identificar imágenes de manuscritos digitalizados mal etiquetadas como «flysheets».

Además de los proyectos de investigación internos y las colaboraciones, la British Library ha puesto a disposición su Research Repository, que contiene conjuntos de datos útiles para entrenar modelos de IA. Entre estos recursos, destaca su colección de imágenes en Flickr Commons, que ha sido utilizada en proyectos como SherlockNet, que emplea redes neuronales convolucionales para etiquetar y describir automáticamente las imágenes de la colección.

No es posible conservar todo en bibliotecas, se impone la gestión colectiva de colecciones

Ian Bogus, Rachel Frick. «Stewarding the Collective Collection: An Analysis of Print Retention Data in the US and Canada». OCLC, 11 de noviembre de 2024.

Texto completo

La «colección compartida» (shared print) es un enfoque colaborativo entre bibliotecas para gestionar el riesgo asociado con la conservación de materiales impresos, especialmente aquellos que son retenidos por un número reducido de instituciones. Su objetivo no es garantizar la conservación de todos los ejemplares de manera perpetua, sino trabajar juntas para alcanzar un umbral aceptable de riesgo, asegurando la preservación de títulos clave a nivel colectivo. A lo largo de los últimos años, este enfoque ha ganado relevancia debido a la limitación de recursos y el creciente volumen de publicaciones, lo que hace que sea inviable que todas las bibliotecas retengan copias de manera indefinida.

Uno de los mayores desafíos para la colección compartida es la falta de datos confiables y granulados que ayuden a las bibliotecas a tomar decisiones informadas sobre qué materiales deben ser conservados y cuáles pueden ser descartados o redistribuidos. La información disponible actualmente sobre las copias únicas o escasamente retenidas es limitada, lo que plantea incertidumbre sobre cómo abordar la escasez tanto de recursos como de títulos. Este vacío en los datos puede dificultar la toma de decisiones para las bibliotecas, que necesitan priorizar los materiales con más valor intelectual o histórico.

Además, hay una preocupación sobre el tiempo, los recursos humanos y financieros necesarios para mantener este esfuerzo. La cantidad de materiales que necesitan ser conservados puede ser abrumadora, y no todas las bibliotecas tienen la capacidad para asumir estos compromisos de retención. Por ejemplo, en muchas ocasiones, las bibliotecas más pequeñas o especializadas podrían no tener los recursos para retener ciertos ejemplares, lo que genera una tensión en cuanto a la distribución de las cargas de conservación.

La evolución de la infraestructura tecnológica en las bibliotecas podría ofrecer soluciones a estos problemas. En el futuro, se prevé que se desarrolle tecnología que facilite la migración de materiales escasamente retenidos desde bibliotecas más pequeñas hacia bibliotecas más grandes que tengan la capacidad para conservarlas. Esta transferencia de materiales podría ayudar a preservar materiales valiosos y difíciles de encontrar, evitando su pérdida.

Sin embargo, para que esta infraestructura funcione de manera efectiva, es necesario un enfoque robusto de gestión de datos. En la actualidad, los flujos de trabajo de catalogación y organización de la información en bibliotecas están diseñados principalmente para servir a las necesidades locales, lo que limita su eficacia a la hora de abordar desafíos a nivel colectivo. Por ello, se hace imperativo que los flujos de trabajo de metadatos sean revisados y adaptados a un contexto más amplio, para que puedan cumplir con los requerimientos de la conservación colectiva. Los esfuerzos para mejorar la calidad de los metadatos deben ser una prioridad para garantizar que la información sobre los materiales conservados sea precisa y esté bien organizada.

Una parte clave de la colección compartida es la identificación de títulos adecuados para su conservación colectiva. Dado que el número de materiales a conservar es limitado, es necesario reducir el alcance de la colección compartida y centrarse en aquellos títulos que tengan un valor intelectual significativo y que estén escasamente disponibles en otras colecciones. Este enfoque permite concentrar los esfuerzos en los materiales que más se beneficiarán de la conservación conjunta.

Sin embargo, incluso con una reducción en el número de títulos seleccionados, muchos de ellos seguirán siendo escasamente retenidos. Esto plantea un problema adicional, ya que los materiales que se seleccionan para la conservación colectiva no necesariamente estarán disponibles de manera accesible para todos los investigadores. La distribución de estos materiales sigue siendo un desafío importante, y se necesitarán más esfuerzos colaborativos para garantizar que se mantenga la integridad de las colecciones y se pueda acceder a los materiales importantes.

La mejora de los flujos de trabajo de metadatos es una de las acciones fundamentales para asegurar el éxito de la colección compartida. Los metadatos no solo permiten un seguimiento eficiente de los materiales, sino que también facilitan la búsqueda y el acceso a estos dentro de un sistema compartido. La calidad de los metadatos tiene un impacto directo en la capacidad de las bibliotecas para gestionar de manera efectiva los materiales compartidos. Por ello, es crucial que las bibliotecas inviertan en la mejora de sus flujos de trabajo de metadatos, adaptándolos a las necesidades de una colección colectiva.

Aprender y utilizar la colección oculta digitalizada

«Learning from and Making Use of Digitized Hidden Collections • CLIR». s. f. CLIR. Accedido 9 de octubre de 2024. 

Descargar

Esta publicación contiene el discurso de apertura y una selección de presentaciones del Simposio sobre Digitalización de Colecciones Ocultas (DHC) de 2022, un evento culminante del programa de Digitalización de Colecciones Especiales y Archivos Ocultos. Este programa fue financiado por la Fundación Mellon y publicó convocatorias para nuevos solicitantes entre 2015 y 2020. El simposio de dos días reunió a más de 135 participantes, con ponentes de 23 proyectos financiados con subvenciones, tanto pasados como actuales. Sus contribuciones abordaron el tema del simposio: «Lo hemos digitalizado, ¿y ahora qué? Aprender de las colecciones ocultas digitalizadas y utilizarlas».

Las bibliotecas de la Universidad Mcgill inauguran un centro de colecciones innovador: una nueva era en la conservación y recuperación sostenible de libros

«McGill University Libraries Unveil Game-Changing Collections Centre: A New Era in Sustainable Book Preservation and Retrieval», Newsroom, accedido 7 de octubre de 2024, https://www.mcgill.ca/newsroom/channels/news/mcgill-university-libraries-unveil-game-changing-collections-centre-new-era-sustainable-book-360169.

«Bibliotecas de la Universidad McGill Inauguran un Centro de Colecciones Innovador: Una Nueva Era en la Conservación y Recuperación Sostenible de Libros»

El 1 de octubre de 2024, la Universidad McGill inauguró su nuevo Centro de Colecciones, un hito histórico como su primer proyecto de diseño y construcción, que establece un nuevo estándar en conservación y sostenibilidad en Quebec. Ubicado en Valleyfield, el centro ocupa 4.200 metros cuadrados y cuenta con un revolucionario sistema automatizado de recuperación que puede almacenar 2.38 millones de libros. Esta instalación utiliza el sistema AutoStore©, convirtiendo a las bibliotecas de McGill en las únicas del mundo en emplear esta tecnología para el almacenamiento y recuperación de libros.

El centro será el nuevo núcleo del servicio de recuperación y entrega de libros de McGill, albergando materiales antiguos y significativos que son menos frecuentemente consultados. Esta iniciativa reafirma el compromiso de McGill de preservar y facilitar el acceso a sus valiosas colecciones, al tiempo que libera espacio en las estanterías del campus para fomentar entornos colaborativos de estudio e investigación.

La sostenibilidad es un pilar fundamental del Centro de Colecciones, que ha recibido la certificación LEED Gold por su compromiso con la conservación de energía, la reducción del uso de agua y el impacto ambiental mínimo. El sistema automatizado, que opera con seis robots, es extremadamente eficiente energéticamente. Además, el edificio cuenta con medidas avanzadas para prevenir infiltraciones de agua, inundaciones y incendios, asegurando la protección de las colecciones de McGill.

Guylaine Beaudry, Decana de Bibliotecas de McGill, destacó que este proyecto transformador garantiza que el conocimiento acumulado desde 1845 permanezca accesible para la comunidad actual y las futuras generaciones. La inauguración del Centro representa un paso importante en la estrategia de sostenibilidad y cambio climático de la universidad.

Desarrollo cooperativo de colecciones: prácticas actuales entre bibliotecas de la ARL para colecciones de estudios regionales

Vetruba, Brian, y David Faust. «Cooperative Collection Development: Current Practices among ARL Libraries for Area Studies Collections». portal: Libraries and the Academy 24, n.o 3 (2024): 487-517. https://muse.jhu.edu/pub/1/article/931769.

El artículo «Cooperative Collection Development: Current Practices among ARL Libraries for Area Studies Collections» analiza el desarrollo cooperativo de colecciones (CCD) para estudios regionales y colecciones de idiomas extranjeros en bibliotecas de la Asociación de Bibliotecas de Investigación (ARL), basado en una encuesta realizada en 2020. Los autores, Brian Vetruba y David Faust, recopilaron detalles sobre iniciativas de colección cooperativa (CCI) en estas bibliotecas y las actitudes de los encuestados hacia el CCD.

La mayoría de los participantes tienen una opinión favorable sobre el CCD, destacando el acceso a una gama más amplia de materiales y el ahorro de costos como razones principales. No obstante, mencionan desafíos como el trabajo y el tiempo requeridos para gestionar las CCI. Este estudio proporciona una visión general de cómo las bibliotecas construyen colecciones colaborativas y los beneficios y desafíos percibidos del CCD, ofreciendo información útil para bibliotecarios y administradores que consideren cómo desarrollar mejor colecciones de estudios regionales y de idiomas extranjeros.

Más allá de las colecciones de la biblioteca

Renaville, François [0000-0003-1453-1040, y Fabienne [0000-0002-1408-5207 Prosmans, eds. Beyond the Library Collections : Proceedings of the 2022 Erasmus Staff Training Week at ULiège Library. Presses universitaires de Liège, 2023.

Texto completo

Ninguna biblioteca puede comprar o conservar todo lo que necesitan sus usuarios. Llega un momento en que los bibliotecarios tienen que poner en común sus recursos y colaborar para proporcionar acceso a lo que no tienen: La colaboración y la asociación, el almacenamiento centralizado y compartido de colecciones, los proyectos de digitalización, el préstamo interbibliotecario y el uso compartido de recursos, la compra bajo demanda, la PDA y la EBA son, en particular, la clave del éxito. La edición de 2022 de la semana de formación del personal Erasmus Mobility organizada en la Biblioteca de la Universidad de Lieja se centró en los servicios, proyectos y políticas que las bibliotecas pueden desplegar y promover para aumentar y facilitar el acceso a materiales que no pertenecen a sus fondos impresos o electrónicos. Más de 20 bibliotecarios, gestores e investigadores en biblioteconomía comparten sus experiencias y visiones en este libro.