Uso de la Inteligencia Artificial y el Aprendizaje Automático en la British Library

Ridge, Mia. «AI (and Machine Learning, etc) with British Library CollectionsBritish Library Digital Scholarship Blog, December 2024. https://blogs.bl.uk/digital-scholarship/2024/12/ai-and-machine-learning-etc-with-british-library-collections.html

British Library está utilizando IA y AA para mejorar la accesibilidad, la organización y el análisis de sus colecciones, facilitando la investigación en el campo del patrimonio cultural digital. A través de una combinación de proyectos internos y colaboraciones externas, la biblioteca no solo está mejorando sus propias colecciones, sino también contribuyendo al debate sobre el uso ético y responsable de estas tecnologías en la preservación y difusión del conocimiento cultural.

La inteligencia artificial (IA) y el aprendizaje automático (AA) están transformando el campo de la investigación y el acceso a colecciones culturales y académicas. En la British Library, estas tecnologías se utilizan para enriquecer las colecciones, mejorando su accesibilidad y usabilidad en la investigación computacional. La biblioteca ha llevado a cabo una serie de proyectos internos y colaboraciones externas, además de capacitar a su personal para implementar IA y AA de manera ética y responsable.

La British Library ha sido un socio clave en el proyecto FRAIM de la Universidad de Sheffield (2024), centrado en la implementación responsable de la IA. Esto se refleja en su Estrategia de IA y Guía Ética, que subraya la importancia de utilizar estas tecnologías de manera que respeten la privacidad, la equidad y la transparencia. Además, la biblioteca ha promovido el debate sobre IA, fomentando la alfabetización en IA y datos para ayudar a los usuarios a comprender cómo se crean los modelos de aprendizaje automático y los conjuntos de datos.

Uno de los principales usos de la IA en la biblioteca es la transcripción de textos, un proceso fundamental para hacer que los libros y manuscritos digitalizados sean más accesibles para la búsqueda y el análisis. Herramientas como Transkribus y eScriptorium se han utilizado para transcribir texto manuscrito y impreso en una variedad de alfabetos y escrituras, lo que facilita el acceso a obras históricas y lingüísticas. Ejemplos de proyectos destacados incluyen el uso de Transkribus para el reconocimiento de texto manuscrito árabe y la automatización de la transcripción de libros bengalíes antiguos.

Además de estos proyectos internos, la British Library ha colaborado con otras instituciones para explorar el uso de IA y AA en el análisis de grandes volúmenes de datos. Un proyecto significativo fue Living with Machines (2018-2023), en colaboración con el Alan Turing Institute, que utilizó IA y ciencia de datos para analizar periódicos, libros y mapas históricos y comprender el impacto de la Revolución Industrial en las personas comunes. Este proyecto empleó diversas técnicas de IA, como la expansión léxica, la visión computacional y la clasificación de datos, y produjo más de 100 resultados en el repositorio de investigación de la biblioteca.

Internamente, la biblioteca también ha experimentado con IA en tareas específicas de catalogación y organización de colecciones. Un ejemplo de esto es el proyecto Languid: Language Identification Project (2020), en el que se utilizó IA para identificar y añadir códigos de idioma a más de 3 millones de registros de catálogo. Otro proyecto importante fue Flyswot (2021), que entrenó un modelo de aprendizaje automático para identificar imágenes de manuscritos digitalizados mal etiquetadas como «flysheets».

Además de los proyectos de investigación internos y las colaboraciones, la British Library ha puesto a disposición su Research Repository, que contiene conjuntos de datos útiles para entrenar modelos de IA. Entre estos recursos, destaca su colección de imágenes en Flickr Commons, que ha sido utilizada en proyectos como SherlockNet, que emplea redes neuronales convolucionales para etiquetar y describir automáticamente las imágenes de la colección.