Uso de la Inteligencia Artificial y el Aprendizaje Automático en la British Library

Ridge, Mia. «AI (and Machine Learning, etc) with British Library CollectionsBritish Library Digital Scholarship Blog, December 2024. https://blogs.bl.uk/digital-scholarship/2024/12/ai-and-machine-learning-etc-with-british-library-collections.html

British Library está utilizando IA y AA para mejorar la accesibilidad, la organización y el análisis de sus colecciones, facilitando la investigación en el campo del patrimonio cultural digital. A través de una combinación de proyectos internos y colaboraciones externas, la biblioteca no solo está mejorando sus propias colecciones, sino también contribuyendo al debate sobre el uso ético y responsable de estas tecnologías en la preservación y difusión del conocimiento cultural.

La inteligencia artificial (IA) y el aprendizaje automático (AA) están transformando el campo de la investigación y el acceso a colecciones culturales y académicas. En la British Library, estas tecnologías se utilizan para enriquecer las colecciones, mejorando su accesibilidad y usabilidad en la investigación computacional. La biblioteca ha llevado a cabo una serie de proyectos internos y colaboraciones externas, además de capacitar a su personal para implementar IA y AA de manera ética y responsable.

La British Library ha sido un socio clave en el proyecto FRAIM de la Universidad de Sheffield (2024), centrado en la implementación responsable de la IA. Esto se refleja en su Estrategia de IA y Guía Ética, que subraya la importancia de utilizar estas tecnologías de manera que respeten la privacidad, la equidad y la transparencia. Además, la biblioteca ha promovido el debate sobre IA, fomentando la alfabetización en IA y datos para ayudar a los usuarios a comprender cómo se crean los modelos de aprendizaje automático y los conjuntos de datos.

Uno de los principales usos de la IA en la biblioteca es la transcripción de textos, un proceso fundamental para hacer que los libros y manuscritos digitalizados sean más accesibles para la búsqueda y el análisis. Herramientas como Transkribus y eScriptorium se han utilizado para transcribir texto manuscrito y impreso en una variedad de alfabetos y escrituras, lo que facilita el acceso a obras históricas y lingüísticas. Ejemplos de proyectos destacados incluyen el uso de Transkribus para el reconocimiento de texto manuscrito árabe y la automatización de la transcripción de libros bengalíes antiguos.

Además de estos proyectos internos, la British Library ha colaborado con otras instituciones para explorar el uso de IA y AA en el análisis de grandes volúmenes de datos. Un proyecto significativo fue Living with Machines (2018-2023), en colaboración con el Alan Turing Institute, que utilizó IA y ciencia de datos para analizar periódicos, libros y mapas históricos y comprender el impacto de la Revolución Industrial en las personas comunes. Este proyecto empleó diversas técnicas de IA, como la expansión léxica, la visión computacional y la clasificación de datos, y produjo más de 100 resultados en el repositorio de investigación de la biblioteca.

Internamente, la biblioteca también ha experimentado con IA en tareas específicas de catalogación y organización de colecciones. Un ejemplo de esto es el proyecto Languid: Language Identification Project (2020), en el que se utilizó IA para identificar y añadir códigos de idioma a más de 3 millones de registros de catálogo. Otro proyecto importante fue Flyswot (2021), que entrenó un modelo de aprendizaje automático para identificar imágenes de manuscritos digitalizados mal etiquetadas como «flysheets».

Además de los proyectos de investigación internos y las colaboraciones, la British Library ha puesto a disposición su Research Repository, que contiene conjuntos de datos útiles para entrenar modelos de IA. Entre estos recursos, destaca su colección de imágenes en Flickr Commons, que ha sido utilizada en proyectos como SherlockNet, que emplea redes neuronales convolucionales para etiquetar y describir automáticamente las imágenes de la colección.

Las pruebas demuestran que la herramienta de búsqueda ChatGPT es vulnerable a la manipulación y el engaño

Evershed, Nick. «ChatGPT Search Tool Vulnerable to Manipulation and Deception, Tests ShowThe Guardian, December 24, 2024. https://www.theguardian.com/technology/2024/dec/24/chatgpt-search-tool-vulnerable-to-manipulation-and-deception-tests-show

La herramienta de búsqueda de ChatGPT, impulsada por inteligencia artificial (IA), presenta vulnerabilidades que permiten manipular los resultados y devolver información errónea o incluso maliciosa, según una investigación realizada por The Guardian. La prueba reveló que el sistema es susceptible a la manipulación mediante el uso de contenido oculto en las páginas web, lo que podría alterar las respuestas de ChatGPT, un proceso conocido como «inyección de instrucciones» o «prompt injection». Esta técnica permite que terceros modifiquen el comportamiento de la IA, logrando, por ejemplo, que ChatGPT devuelva reseñas positivas de productos a pesar de que el sitio web contenga opiniones negativas.

En las pruebas realizadas, ChatGPT fue dirigido a páginas web falsas que imitaban las de productos, como una cámara, con el objetivo de analizar las respuestas generadas por la IA. Cuando las páginas contenían texto oculto con instrucciones para proporcionar una evaluación favorable, incluso cuando los comentarios reales eran negativos, la herramienta de IA generaba respuestas completamente positivas, manipulando así la percepción del producto. Además, en algunos casos, la inserción de texto oculto que no incluía instrucciones explícitas también modificaba las respuestas, favoreciendo una evaluación positiva mediante reseñas falsas.

La preocupación de los expertos en seguridad es significativa. Jacob Larsen, investigador de ciberseguridad, advirtió que si el sistema de búsqueda de ChatGPT se lanzara en su estado actual, existiría un «alto riesgo» de que se crearan sitios web diseñados específicamente para engañar a los usuarios y manipular los resultados de búsqueda. Sin embargo, también señaló que la funcionalidad de búsqueda es relativamente nueva y está disponible solo para usuarios premium, por lo que OpenAI probablemente esté trabajando en la corrección de estos problemas.

Las librerías japonesas colaboran con las bibliotecas para sobrevivir

Jiji. «Japanese Bookstores Collaborate with Libraries for SurvivalThe Japan Times, December 30, 2024. https://www.japantimes.co.jp/news/2024/12/30/national/japanese-bookstores-collaborate-libraries-survival/

En Japón, algunas librerías están colaborando con bibliotecas para sobrevivir ante el auge de las compras en línea, lo que ha provocado el cierre de muchas librerías. Hisamido, una librería en Machida, Tokio, implementó un servicio que permite a los clientes tomar prestados y devolver libros de las bibliotecas municipales en su tienda, lo que ha aumentado sus ventas y el uso de las bibliotecas.

El gobierno japonés planea apoyar estas colaboraciones mediante una encuesta en el año fiscal 2025 para abordar la preocupación de que las bibliotecas poseen múltiples copias de los mismos libros, afectando las ventas. Con los resultados, se discutirán medidas para mejorar la situación.

Entre 2013 y 2023, el número de librerías en Japón disminuyó de 15.,602 a 10.918, y en noviembre de 2024, 28% de los municipios no tenían librerías. Shuichi Matsuki, de la Fundación de la Industria Editorial Japonesa, expresó preocupación por el acceso limitado de los niños a diversos libros.

La colaboración entre librerías y bibliotecas ha demostrado ser beneficiosa, ya que aumenta la conveniencia para los usuarios y fomenta las ventas de libros relacionados. El Ministerio de Educación ha iniciado un proyecto para apoyar estos esfuerzos y promover modelos similares a través de los gobiernos locales.

Uso de grandes modelos lingüísticos como herramientas de inteligencia artificial en la investigación académica y la publicación entre los investigadores

Mishra, Tanisha, Edward Sutanto, Rini Rossanti, Nayana Pant, Anum Ashraf, Akshay Raut, Germaine Uwabareze, Ajayi Oluwatomiwa, y Bushra Zeeshan. «Use of Large Language Models as Artificial Intelligence Tools in Academic Research and Publishing Among Global Clinical ResearchersScientific Reports 14, no. 31672 (2024). https://doi.org/10.1038/s41598-024-81370-6.

El articulo explora el creciente uso de los Modelos de Lenguaje de Gran Escala (LLMs) en la investigación académica, particularmente en el ámbito clínico. Los autores analizan cómo estos modelos, como el Generative Pre-trained Transformer (GPT), están siendo empleados para tareas como la revisión de literatura, el cribado de resúmenes y la redacción de manuscritos.

El estudio se basa en una encuesta transversal aplicada a 226 investigadores médicos y paramédicos de 59 países, formados en el programa de Certificación en Investigación de Harvard Medical School entre 2020 y 2024. Los resultados muestran que el 87.6% de los encuestados estaban al tanto de los LLMs, y aquellos con mayor conocimiento tendían a tener un mayor número de publicaciones indexadas en PubMed.

Entre los encuestados conscientes de los LLMs, el 18.7% los había utilizado principalmente para corrección gramatical y formateo, aunque una proporción significativa no reconoció explícitamente su uso en sus publicaciones. La percepción general sobre el impacto futuro de los LLMs es mayormente positiva, con el 50.8% de los encuestados anticipando un impacto beneficioso en el proceso de publicación, especialmente en la corrección gramatical, revisión y edición, redacción y revisión de literatura.

El estudio también revela preocupaciones éticas, ya que el 58.1% de los encuestados opinó que las revistas deberían permitir el uso de IA en la investigación, mientras que el 78.3% cree que se deben establecer regulaciones para evitar abusos. Los autores enfatizan la necesidad de desarrollar directrices y un marco ético para gobernar el uso de la IA en la investigación académica, abordando los desafíos actuales y asegurando un uso responsable de estas herramientas avanzadas.

Una propuesta legislativa busca retirar fondos a las bibliotecas públicas que prohíban libros

KRQE News. «Legislative Bill Would Cut Funding for New Mexico Public Libraries That Ban BooksKRQE, January 4, 2025. https://www.krqe.com/news/politics-government/legislature/legislative-bill-would-cut-funding-for-new-mexico-public-libraries-that-ban-books/.

La representante estatal de Nuevo México, Kathleen Cates, ha reintroducido una propuesta legislativa que busca retirar fondos a las bibliotecas públicas que prohíban libros. Esta iniciativa, que casi fue aprobada en la sesión legislativa de 2024, pretende garantizar que las bibliotecas públicas no censuren materiales, protegiendo así el acceso de los niños a diversos contenidos. Cates enfatiza que el proyecto no forma parte de una «guerra cultural», sino que busca salvaguardar las bibliotecas y el derecho a la información.

El proyecto de ley propone que las bibliotecas públicas adopten la Declaración de Derechos de la Biblioteca de la Asociación Americana de Bibliotecas de 2019. Esta declaración establece principios fundamentales sobre la libertad intelectual y el acceso equitativo a la información. Al exigir su adopción, la legislación busca asegurar que las bibliotecas no excluyan materiales basándose en contenido político, social o religioso.

La censura de libros en Estados Unidos ha sido un tema recurrente, especialmente en relación con obras que abordan temas LGBTQ+. Por ejemplo, «Gender Queer» de Maia Kobabe ha sido uno de los libros más desafiados en los últimos años debido a su contenido explícito y temas de identidad de género

La propuesta de Cates se enmarca en un contexto más amplio de debates sobre la censura y la libertad de expresión en las bibliotecas públicas. La Asociación Americana de Bibliotecas y otras organizaciones abogan por el acceso libre y sin restricciones a la información, considerando que la censura socava los principios democráticos y el derecho del público a la información.

Se espera que la reintroducción de este proyecto de ley genere debates significativos en la próxima sesión legislativa de Nuevo México, ya que aborda cuestiones fundamentales sobre la libertad intelectual, la censura y el papel de las bibliotecas públicas en la sociedad.

La Antibiblioteca de Umberto Eco: El valor de los libros no leídos

Maria Popova, «Umberto Eco’s Antilibrary: Why Unread Books Are More Valuable to Our Lives than Read Ones», The Marginalian (blog), 24 de marzo de 2015, https://www.themarginalian.org/2015/03/24/umberto-eco-antilibrary/.

La idea de la «antibiblioteca», propuesta por Nassim Nicholas Taleb en El cisne negro, se basa en la relación del escritor Umberto Eco con los libros. Dueño de una biblioteca personal de 30.000 volúmenes, Eco distinguía entre visitantes según su reacción ante su colección. Algunos preguntaban cuántos libros había leído, mientras que otros comprendían que el valor de su biblioteca no residía en los libros ya leídos, sino en los no leídos: herramientas para explorar lo desconocido y expandir el conocimiento.

Taleb argumenta que una biblioteca personal debe contener tantas obras como sea posible sobre temas que el propietario aún no conoce. Los libros no leídos, que miran al lector «de forma amenazante», simbolizan la creciente conciencia de la propia ignorancia a medida que se aprende más. Este concepto, llamado «antibiblioteca», subraya que cuanto más sabemos, más nos damos cuenta de lo que nos falta por aprender.

El ensayo conecta esta idea con el término japonés tsundoku, que describe el hábito de acumular libros sin leer, y con la relación humana entre el conocimiento y la ignorancia. A menudo tratamos el conocimiento como un bien personal o una herramienta de estatus, pero Taleb sugiere adoptar la mentalidad de un «antiescolar»: alguien que valora lo que no sabe y evita tratar su conocimiento como una posesión.

«El escritor Umberto Eco pertenece a esa pequeña clase de eruditos enciclopédicos, perspicaces y aburridos. Poseedor de una gran biblioteca personal (con treinta mil libros), divide a los visitantes en dos categorías: los que reaccionan con un «¡Vaya! Signore professore dottore Eco, ¡qué biblioteca tiene usted! ¿Cuántos de estos libros ha leído?» y los otros -una minoría muy pequeña- que entienden que una biblioteca privada no es un apéndice para aumentar el ego, sino una herramienta de investigación. Los libros leídos tienen mucho menos valor que los no leídos. La biblioteca debería contener tanto de lo que no sabes como te permitan tus medios económicos, los tipos de interés de las hipotecas y el ajustado mercado inmobiliario actual. Acumularás más conocimientos y más libros a medida que envejezcas, y el creciente número de libros sin leer en las estanterías te mirará amenazadoramente. En efecto, cuanto más sepas, mayores serán las filas de libros sin leer. Llamemos a esta colección de libros sin leer antilibrería.»

Eco también reflexionó sobre la necesidad humana de llenar vacíos de conocimiento, incluso imaginando mundos ficticios, como en su Enciclopedia de tierras imaginarias. Según Taleb, esto refleja una tendencia a subestimar el valor de las sorpresas y lo desconocido, mientras sobreestimamos lo que creemos saber.

La antibiblioteca invita a cambiar nuestra relación con el conocimiento, enfocándonos en las posibilidades de descubrimiento, aceptando lo incierto y abrazando la humildad intelectual.

Si los bibliotecarios fueran honestos

Si los bibliotecarios fueran honestos,
no sonreirían, ni actuarían
acogedores. Dirían,
Tienes que tener cuidado. Aquí
monstruos. Dirían,
Estas habitaciones albergan paganos
y herejes, asesinos y
maníacos, ilusos, desesperados,
y disolutos. Dirían,
Estos libros contienen el conocimiento
de la muerte, el deseo y la decadencia,
traición, sangre y más sangre;
cada uno es una caja de Pandora, así que ¿por qué
querrías abrir una.
Pondrían señales
advirtiendo que el contacto
podría resultar en cambios de humor,
cambios severos en la visión,
y efectos que alteran la mente.
Si los bibliotecarios fueran honestos
admitirían que las estanterías
pueden ser más seductoras e
que el porno. Al fin y al cabo,
una vez que has visto unos cuantos
pechos, vaginas y penes,
más es simplemente más,
una banalidad reconfortante,
pero los estantes de una biblioteca
contienen novedades sensacionales,
una mezcla escandalosa y permisiva
de Malcolm X, Marx, Melville,
Merwin, Millay, Milton, Morrison,
y cualquiera puede echarles un vistazo,
llevárselos a casa o a algún rincón
donde pueden ser corrompidos
e impregnarse de ideas.
Si los bibliotecarios fueran honestos,
dirían: «Nadie
pasa tiempo aquí sin ser
cambiado. Quizá deberías
irte a casa. Mientras puedas.

Joseph Mills

La biblioteca, la comunidad silenciosa de los libros

«Aunque la biblioteca estaba en silencio, podían surgir conversaciones susurradas en los estantes -quizá dos de ustedes buscaban el mismo libro antiguo, los mismos volúmenes encuadernados de Brain de 1890- y las conversaciones podían desembocar en amistades. Todos los que estábamos en la biblioteca leíamos nuestros propios libros, absortos en nuestros propios mundos, y sin embargo había una sensación de comunidad, incluso de intimidad. El aspecto físico de los libros -junto con sus lugares y sus vecinos en las estanterías- formaba parte de esta camaradería: manejar los libros, compartirlos, pasárselos unos a otros, incluso ver los nombres de los lectores anteriores y las fechas en que sacaron los libros.»

Oliver Sacks

Widener es la gran biblioteca insumergible

Imagen: Sala de Lectura Loker Biblioteca Widener Universidad de Harvard, Cambridge

«Dotada por la afligida madre de Harry Elkins Widener, licenciado en Harvard y bibliófilo que se hundió con el Titanic, Widener es la Gran Biblioteca Insumergible. Sus diez niveles contienen cincuenta y siete millas de estanterías, suficientes para albergar unos 4,6 millones de volúmenes encuadernados, más o menos. Las estanterías son grandes armaduras de hierro forjado que soportan el peso del edificio; la biblioteca está literalmente sostenida por sus libros. Poblada no sólo de bibliotecarios, usuarios y profesores, sino también de carpinteros, mensajeros, cocineros, contables, estudiantes y bibliotecarios a tiempo parcial, webmasters, administradores de redes y consultores de recursos humanos, es la ciudad-estado en el centro de una confederación de noventa y tantas colecciones de escuelas y departamentos de Harvard, que suman unos 14 millones de volúmenes; en conjunto, constituyen la mayor biblioteca académica que el mundo haya conocido.»

«Library: An Unquiet History» de Matthew Battles.

Cómo escribir y publicar un artículo científico


Gastel, Barbara, y Robert A. Day. 2016. How to Write and Publish a Scientific Paper. 8th ed. Santa Barbara, CA: ABC-CLIO.

Texto completo

La obra es una guía integral para investigadores y académicos que desean escribir y publicar trabajos científicos. En su octava edición, ofrece consejos prácticos, estrategias y ejemplos para desarrollar artículos claros, concisos y efectivos.

El libro se organiza en secciones que abarcan desde la preparación inicial hasta la publicación y difusión de los resultados. Algunos de los temas principales incluyen:

1. Estructura del artículo científico: Explica el formato estándar IMRaD (Introducción, Métodos, Resultados y Discusión), resaltando la importancia de cada sección y cómo elaborarlas eficazmente.

2. Proceso de escritura: Proporciona técnicas para planificar, redactar y revisar manuscritos, destacando la importancia de la precisión y la claridad.

3. Citas y referencias: Detalla cómo dar crédito a las fuentes de manera adecuada para evitar el plagio y respetar las normas éticas.

4. Publicación científica: Aborda cómo seleccionar la revista adecuada, manejar el proceso de revisión por pares y responder a comentarios de revisores y editores.

5. Comunicación científica: Ofrece consejos para la preparación de presentaciones orales, posters y propuestas de proyectos.

6. Aspectos éticos: Discute cuestiones como la autoría, el plagio, el manejo de datos y la duplicación de publicaciones.

El libro es especialmente útil para investigadores jóvenes y para aquellos que no son hablantes nativos de inglés, ya que incluye recomendaciones sobre escritura científica en este idioma. La obra combina teoría, práctica y anécdotas, ofreciendo una referencia esencial para quienes buscan destacar en el ámbito académico.