Archivo de la etiqueta: Procesos técnicos

Inteligencia artificial en los procesos técnicos bibliotecarios: fundamentos y aplicaciones prácticas

LOPEZOSA, Carlos. Inteligencia artificial en los procesos técnicos bibliotecarios: fundamentos y aplicaciones prácticas. Informe. Universitat de Barcelona, 2026. Consulta del 12 de enero de 2026. https://hdl.handle.net/2445/225202

Texto completo

Se analiza cómo la inteligencia artificial (IA) está transformando y puede seguir transformando los procesos técnicos dentro de las bibliotecas y centros de documentación. El estudio se centra en profundizar en los fundamentos conceptuales de la IA, sus aplicaciones principales y los desafíos que plantea su adopción responsable en contextos bibliotecarios.

El informe analiza el impacto creciente de la inteligencia artificial en las bibliotecas, centrándose especialmente en los procesos técnicos tradicionales. Parte de la idea de que la IA, y en particular los modelos de lenguaje de gran tamaño, ya forman parte del ecosistema informacional y están modificando de manera profunda la forma en que se gestionan, describen y organizan los recursos documentales. El texto ofrece una aproximación clara a los fundamentos conceptuales de la IA, explicando su funcionamiento general y su relevancia para el ámbito bibliotecario y documental.

A lo largo del trabajo se examinan las principales aplicaciones prácticas de la inteligencia artificial en tareas como la catalogación, la gestión y normalización de metadatos y el enriquecimiento semántico de los registros bibliográficos. El autor muestra cómo estas tecnologías permiten automatizar procesos repetitivos, detectar inconsistencias y mejorar la calidad descriptiva de los fondos, lo que repercute directamente en una mejor recuperación de la información. No obstante, se insiste en que la IA debe entenderse como una herramienta de apoyo y no como un sustituto del criterio profesional del personal bibliotecario.

El documento también aborda la integración de la IA en los flujos de trabajo técnicos, destacando su utilidad como sistema de asistencia avanzada para el análisis de datos, la generación de informes y la toma de decisiones técnicas. Desde esta perspectiva, la inteligencia artificial se presenta como un recurso estratégico que puede aumentar la eficiencia y liberar tiempo para tareas de mayor valor intelectual, siempre que exista una supervisión humana adecuada.

Un apartado relevante del estudio está dedicado a los retos éticos, legales y organizativos que plantea el uso de la IA en bibliotecas. Se analizan cuestiones como la protección de datos personales, la seguridad de la información y el riesgo de sesgos algorítmicos, subrayando la necesidad de una evaluación crítica y continua de estas herramientas. El texto advierte sobre los peligros de una dependencia tecnológica excesiva y reclama políticas claras que garanticen un uso responsable, transparente y alineado con los valores profesionales de la biblioteconomía.

Como conclusión, el informe propone un modelo de adopción híbrida de la inteligencia artificial, en el que la tecnología complementa el trabajo humano sin sustituirlo. Se defiende una incorporación progresiva y reflexiva de la IA en los procesos técnicos bibliotecarios, basada en la formación del personal, la supervisión ética y la adaptación a las necesidades reales de cada institución. De este modo, la IA se concibe como un instrumento para mejorar la calidad del servicio bibliotecario y reforzar su papel en la gestión del conocimiento en la era digital.

Despidos de catalogadores y calidad de los metadatos generados por IA en bibliotecas

Olson, Mike. «Beyond Classification: The Human Cost of Library and Information Labor Under Digital CapitalismThe Scholarly Kitchen, 26 de agosto de 2025. https://scholarlykitchen.sspnet.org/2025/08/26/guest-post-beyond-classification-the-human-cost-of-library-and-information-labor-under-digital-capitalism

A través de ejemplos como los 80 despidos en OCLC y la eliminación de 425 puestos en la Universidad Northwestern, se destaca cómo la reducción de personal especializado en catalogación afecta negativamente la calidad de los metadatos y la accesibilidad de las colecciones.

Los recientes despidos en OCLC, la organización sin fines de lucro con sede en Dublín, Ohio, que administra el Sistema Decimal Dewey y WorldCat, ofrecen una visión clara del futuro precario del trabajo en bibliotecas y gestión de información. En julio de 2025, OCLC confirmó la reducción de aproximadamente 80 puestos en su fuerza laboral de Ohio central, citando “cambios en los requisitos de habilidades técnicas, creciente influencia de la inteligencia artificial y cambios continuos en la educación superior y las bibliotecas”.

Mientras OCLC cita la IA como justificación para los recortes de personal, también ha anunciado que está desarrollando herramientas de IA para el procesamiento de metadatos. Aquí radica la paradoja de nuestra época: los mismos avances tecnológicos que se celebran por su eficiencia están eliminando la experiencia humana que crea los metadatos de alta calidad de los que dependen estos sistemas para funcionar.

El trabajo en bibliotecas ejemplifica lo que Maurizio Lazzarato identifica como “trabajo inmaterial”: un trabajo que produce contenido informativo y estandarización cultural, convirtiéndose en directamente productivo para el capitalismo digital a través de sistemas controlados por proveedores que agregan y monetizan metadatos estandarizados.

La desvalorización de la experiencia en catalogación se hace visible cuando las instituciones eliminan estos puestos durante recortes presupuestarios. El anuncio de despidos en la Universidad Northwestern, que afectó a 425 puestos, incluyó a Violet Fox, una de las voces principales en catalogación crítica y creadora del Cataloging Lab. El despido de Fox es particularmente significativo: su trabajo en prácticas de descripción reparativa ejemplifica el tipo de conocimiento especializado en catalogación que las instituciones están eliminando precisamente cuando más se necesita. Catalogadores como Fox realizan el trabajo invisible de desafiar los sistemas de clasificación coloniales, asegurando que los encabezamientos de materia reflejen las necesidades de la comunidad y no términos genéricos de proveedores, haciendo que las colecciones sean accesibles y manteniendo la calidad de los metadatos que permite la investigación académica.

La promesa de la IA en catalogación es seductora: procesamiento más rápido, reducción del trabajo manual, liberando a los trabajadores para tareas “más importantes”. Sin embargo, experimentos recientes de la Biblioteca del Congreso muestran que los modelos de lenguaje grande obtuvieron solo un 26% de F1 al predecir encabezamientos de la Biblioteca del Congreso, y los modelos de clasificación de materias solo un 35% de precisión. Esto revela un cambio fundamental en el trabajo de catalogación: los catalogadores ahora se concentran en entrenar, evaluar y curar resultados algorítmicos, proporcionando retroalimentación para sistemas incapaces de replicar la experiencia humana, el conocimiento cultural y la comprensión contextual necesarios para metadatos de calidad.

Olson argumenta que la automatización, en lugar de mejorar la eficiencia, está desplazando la experiencia humana necesaria para crear metadatos precisos y culturalmente sensibles. Esta tendencia refleja una transformación más amplia en la educación superior, donde las instituciones se enfocan en la eficiencia y la rentabilidad, a menudo a expensas de la diversidad cultural y la equidad.

El autor concluye que la pérdida de control institucional sobre la organización bibliográfica y la dependencia de sistemas de descubrimiento controlados por proveedores externos están erosionando la autonomía y la misión pública de las bibliotecas. Advierte que, sin una reflexión crítica y una acción concertada, el trabajo bibliotecario esencial podría desaparecer, con consecuencias negativas para la accesibilidad y la justicia en la información.

Inteligencia artificial y catalogación en bibliotecas

Getaneh Alemu, Anna Maria Tammaro; Navigating the artificial intelligence frontier on cataloguing and metadata work in libraries: an interview with Getaneh AlemuDigital Library Perspectives 20 August 2025; 41 (3): 587–592. https://doi.org/10.1108/DLP-08-2025-208

Se reflexiona sobre cómo la inteligencia artificial (IA) está transformando la catalogación. Plantea que la relación ideal entre la IA y los representantes humanos debe basarse en la complementariedad, más que en la sustitución. Según el autor, las máquinas pueden hacerse cargo de tareas repetitivas y estructuradas —como la clasificación inicial o el etiquetado automático—, mientras que los bibliotecarios y catalogadores deben conservar el papel de brindar juicio experto, interpretación contextual y garantía de calidad, elementos que aún son difícilmente automatizables

Además, Alemu insiste en que la implementación responsable de la IA en entornos bibliotecarios debe partir de los principios éticos de transparencia y precisión. Es fundamental que los sistemas automatizados actúen con transparencia, de modo que los usuarios puedan entender cómo se generan los metadatos y qué criterios siguen los algoritmos

La entrevista también destaca una visión esperanzadora para el futuro: la IA no debería percibirse como una amenaza, sino como una herramienta para potenciar la eficiencia, liberando a los profesionales de la biblioteconomía de labores mecánicas para enfocarse en aspectos más complejos y creativos de su labor. Alemu vislumbra un ecosistema en que la tecnología permita una mejor organización del conocimiento, sin sacrificar la supervisión humana ni el cuidado por la calidad bibliográfica.

La postura de Alemu subraya la necesidad de un enfoque equilibrado: integrar la IA como aliada, no como reemplazo, reforzando el rol humano a través de la ética, la transparencia y la experiencia profesional en catalogación y metadatos.

¡La IA revoluciona las bibliotecas! catalogar libros puede ser ahora 183 veces más rápido (y 64 veces más barato)

Chisaba‑Pereira, Cristian‑Alejandro; Herrera‑Calero, Ricardo; Niño‑Neira, Saúl‑Alejandro; Hurtado‑Ortiz, Britney‑Alejandra. Datalogación: evaluación de herramientas de inteligencia artificial basadas en el Modelo Extenso de Lenguaje (Large Language Model) para la automatización de la descripción de libros.” Infonomy 3, no. 4 (18 julio 2025). Accedido 31 julio 2025.

Texto completo

La catalogación bibliotecaria ha sido históricamente uno de los procesos más importantes y laboriosos en las bibliotecas, permitiendo describir y organizar el conjunto de obras y recursos que se evidencian en catálogos, índices, directorios y tesauros. Con el surgimiento de la inteligencia artificial y específicamente de los Modelos Extensos de Lenguaje (Large Language Models), surge la oportunidad de transformar radicalmente estos procesos tradicionales, generando tanto oportunidades como desafíos significativos para la profesión bibliotecológica.

La catalogación tradicional de libros representa un proceso complejo y laborioso que requiere que los bibliotecarios analicen minuciosamente cada documento para crear registros bibliográficos detallados y precisos. En este contexto, la catalogación automatizada ha emergido como una solución tecnológica prometedora. En la catalogación automatizada se utiliza el ISBN del libro o ISSN de la revista para hacer la búsqueda y se incorpora la información obtenida en la ficha del libro.

Los Modelos de Lenguaje Extenso (Large Language Models) han abierto nuevas posibilidades en el ámbito bibliotecario, particularmente en la generación automatizada de descripciones y metadatos de libros. Estos sistemas de inteligencia artificial tienen la capacidad de procesar y analizar grandes volúmenes de texto de manera simultánea, extrayendo información relevante como resúmenes del contenido, palabras clave temáticas, clasificación por materias e información bibliográfica estructurada. La aplicación de estos modelos permite no solo acelerar el proceso de catalogación, sino también mantener un nivel de consistencia y precisión que puede ser difícil de lograr mediante procesos completamente manuales.

La implementación de sistemas automatizados en bibliotecas ofrece beneficios significativos en términos de eficiencia y calidad. La automatización de bibliotecas permite reducir los errores tanto en la catalogación como en la clasificación de los materiales, mediante el uso de sistemas informáticos que faciliten y optimicen estos procesos. Esta reducción de errores es particularmente importante considerando el volumen creciente de material bibliográfico que las bibliotecas modernas deben procesar y mantener actualizado.

Utilizando cinco libros seleccionados por el sistema bibliotecario de la Universidad Distrital Francisco José de Caldas, los autores analizaron el rendimiento de estas herramientas en términos de tiempo, costos, calidad y volumen de catálogo. La investigación implementó una metodología comparativa rigurosa para evaluar el desempeño de cuatro herramientas de inteligencia artificial basadas en Large Language Models versus el trabajo de un catalogador humano experto. Las herramientas evaluadas fueron ChatGPT 3.5, ChatGPT 4.0, Gemini de Google y Copilot de Microsoft. La selección de libros para el análisis incluyó tres bestsellers: «1984» de George Orwell, «Cien años de soledad» de Gabriel García Márquez, y «Macroeconomics» de Andrew B. Abel; además de dos obras frontlist publicadas en 2024: «En agosto nos vemos» de Gabriel García Márquez y «Piedra, ficción, memoria: Etnografías del lugar memorativo» de Adrián Serna Dimas.

El análisis se realizó desde tres perspectivas fundamentales: tiempo de catalogación, costos asociados y calidad de la descripción bibliográfica. Para la evaluación de calidad se utilizó el estándar Resource Description and Access (RDA) con nivel de descripción 1, que incluye áreas como título y subtítulo, edición, pie de imprenta, descripción física y número normalizado ISBN. Las pruebas se realizaron utilizando el software ALEPH500 con protocolo MARC21, asegurando la comparabilidad y estandarización de los resultados.

Los resultados obtenidos revelan diferencias dramáticas entre el desempeño humano y el de las herramientas de inteligencia artificial: los modelos automatizados catalogaron 183 veces más rápido que una persona, pudieron catalogar 187 veces más libros y el costo salarial estimado para un catalogador humano resultó ser 64 veces mayor que el uso de IA. En términos de tiempo, el catalogador humano requirió un promedio de 24 minutos y 51 segundos para completar la descripción de cada libro, incluyendo tiempo de descripción (15:23 minutos) y tiempo de transcripción (09:28 minutos). En contraste, los aplicativos de IA completaron la misma tarea en un promedio de apenas 8 segundos, lo que representa que la catalogación asistida por IA es 183 veces más rápida que la realizada por una persona.

En cuanto a la cantidad de campos descritos, el catalogador humano generó un promedio de 55 campos MARC21 por obra, mientras que las herramientas de IA produjeron un promedio de 21 campos. Esta diferencia significativa refleja la capacidad del experto humano para aplicar criterios profesionales, normas de catalogación y estándares de calidad que las IA aún no logran replicar completamente. Sin embargo, los campos generados por las IA mostraron coherencia y utilidad práctica para procesos de catalogación básica.

El análisis económico presenta resultados igualmente impactantes. El costo de catalogación por libro realizada por el catalogador humano se calculó en 14.275 pesos colombianos (aproximadamente 3.36 USD), mientras que el uso de IA representa un costo prácticamente nulo cuando se utilizan versiones gratuitas, o significativamente menor cuando se considera el costo de suscripción. A nivel anual, el salario del catalogador representa 65.761.896 pesos colombianos versus 1.020.516 pesos colombianos para el uso de IA, lo que significa que el costo de catalogación humana es 64 veces más elevado.

Entre las herramientas evaluadas, ChatGPT en sus versiones 3.5 y 4.0 mostró el mejor desempeño, proporcionando resultados más precisos y aplicables al ejercicio de catalogación. ChatGPT 4.0 se identificó como la herramienta más idónea al momento de la investigación. Copilot también demostró capacidades satisfactorias para generar texto plano utilizable en editores de registros MARC21. En contraste, Gemini presentó limitaciones significativas, entregando resultados menos favorables al explicar cada etiqueta MARC21 en lugar de proporcionar código MARC21 completo en texto plano.

La investigación proyecta que un catalogador humano trabajando 2.080 horas anuales (40 horas semanales) podría catalogar aproximadamente 4.992 libros por año. En contraste, las herramientas de IA podrían procesar hasta 936.000 libros en el mismo período, representando una capacidad 187 veces superior. Estos números ilustran el potencial transformador de la tecnología para abordar los desafíos de procesamiento masivo de colecciones bibliográficas que enfrentan las bibliotecas modernas.

Esto demuestra una extraordinaria eficiencia operativa a favor de los sistemas automatizados, abriendo posibilidades para escalar los procesos bibliográficos en contextos con recursos limitados.

En cuanto a la calidad de la descripción, si bien las herramientas LLM presentaron resultados rápidos y voluminosos, los autores reconocieron la necesidad de supervisión para garantizar la precisión y la coherencia de los datos generados. Si bien se observa que los modelos pueden replicar adecuadamente los formatos bibliográficos, aún existe un margen de error en aspectos como las atribuciones, los metadatos específicos y la coherencia editorial, especialmente en la cobertura de las primeras publicaciones o en títulos recientes. Los datos bibliográficos de libros recientes, novedades editoriales o frontlist frecuentemente son inventados por las IA o presentan errores significativos. Esto sugiere que las IA tienen limitaciones en el acceso a información bibliográfica actualizada y pueden generar datos ficticios cuando no tienen acceso a información precisa.

Las herramientas también muestran variabilidad en la capacidad de integrar estándares y normas de catalogación profesional. Mientras pueden acelerar procesos y facilitar la cantidad de registros, generan dudas sobre la calidad y coherencia de los datos bibliográficos producidos, especialmente en comparación con el trabajo realizado por profesionales que comprenden completamente las reglas de catalogación, normas y estándares especializados.

El estudio concluye que estas tecnologías representan una oportunidad significativa para transformar los procesos de catalogación en bibliotecas y sistemas de información. Sin embargo, es importante tener en cuenta que su adopción requiere una implementación responsable, con estrategias que incluyan supervisión humana, validación de metadatos y procedimientos claros para la corrección de errores. Solo así se podrá aprovechar su potencial sin comprometer la integridad de la información bibliográfica.

Chewy Decimal System: una crítica satírica a la clasificación decimal en bibliotecas

Video humorístico compartido en el blog Kottke.org, en el que se presenta la propuesta del divulgador científico Hank Green, quien argumenta que la forma en la que están organizados las bibliotecas es ineficiente y frustrante para los usuarios. Como solución, sugiere reorganizarlos siguiendo una lógica inspirada en el sistema de clasificación bibliotecario, al que llama irónicamente el “Chewy Decimal System” (Sistema Decimal Masticable), parodiando el Dewey Decimal System usado en bibliotecas.

El artículo también sirve como una crítica indirecta a dicho sistema bibliotecario. Se menciona que muchos bibliotecarios no lo aprecian, ya que fue diseñado en el siglo XIX con una visión eurocentrista y colonial, reflejando prejuicios como:

  • Priorizar el cristianismo en la clasificación religiosa.
  • Colocar a los pueblos indígenas en la sección de historia como si fueran del pasado.
  • Separar arbitrariamente animales salvajes y domésticos.

Además, se cuestiona su utilidad para niños, ya que exige comprensión de decimales antes de que se enseñen en la escuela, y se señala que existen sistemas alternativos más intuitivos, aunque su implementación es costosa.

La propuesta de Hank Green es, en esencia, un comentario satírico sobre la rigidez de los sistemas organizativos tradicionales, tanto en bibliotecas como en supermercados, y una invitación a repensar cómo organizamos la información (o los productos) en función de la experiencia del usuario.

Papeles que suenan: el tratamiento de los fondos documentales de música durante el último quindenio

Assunção, Clara, Paulo Castagna, María José González Ribot, Antonio Álvarez Cañibano e Isabel Lozano Martínez. Papeles que suenan: el tratamiento de los fondos documentales de música durante el último quindenio. Salamanca: Catedral de Salamanca, 2023

Texto completo

El libro Papeles que suenan. El tratamiento de los fondos documentales de música durante el último quindenio (Salamanca: Catedral de Salamanca, 2023) es una recopilación de ponencias presentadas en una mesa redonda organizada por la Catedral de Salamanca con motivo del XV aniversario de la publicación de El archivo de los sonidos. Esta obra analiza la evolución de la archivística musical en Iberoamérica durante los últimos quince años, abordando temas como la gestión de archivos musicales en Portugal y Brasil, los desafíos de la era digital para los centros de documentación musical, y la documentación musical en el Portal de Archivos Españoles (PARES). Además, se incluye un dossier fotográfico que complementa visualmente los contenidos tratados

Este libro forma parte de la colección «Extravagantes» de la Catedral de Salamanca y está disponible para su descarga gratuita en el siguiente enlace: Catedral de Salamanca+1SALAMANCArtv

Análisis comparativo de chatbots de IA para la extracción de metadatos en bibliotecas universitarias

González-Espinoza, Alfredo, Dom Jebbia, y Haoyong Lan. «Metadata Augmentation Using NLP, Machine Learning and AI-Chatbots: A ComparisonarXiv, abril 25, 2025. https://arxiv.org/abs/2504.17189

El estudio ofrece un análisis exhaustivo sobre el uso de herramientas de inteligencia artificial (IA) y aprendizaje automático para la tarea de recogida de metadatos, especialmente en el contexto de bibliotecas universitarias. Los avances recientes en estas tecnologías han permitido que tareas repetitivas, como la clasificación de documentos y la curación de datos, sean más automatizadas, lo que puede optimizar significativamente los flujos de trabajo en instituciones como las bibliotecas. Sin embargo, el desarrollo y la integración efectiva de estas herramientas en entornos de trabajo reales aún enfrentan desafíos importantes.

Los autores, Alfredo González-Espinoza, Dom Jebbia y Haoyong Lan, quienes son parte del equipo de Bibliotecas Universitarias en la Universidad Carnegie Mellon, realizan un estudio comparativo entre diferentes enfoques para la extracción de metadatos. En particular, se enfocan en el uso de chatbots comerciales basados en IA y su capacidad para realizar tareas de clasificación de documentos con datos limitados. Además, comparan estos resultados con los obtenidos mediante métodos tradicionales de aprendizaje automático y procesamiento de lenguaje natural (PLN), como XGBoost y el ajuste fino de BERT.

El análisis revela que, aunque los chatbots de IA muestran un rendimiento similar entre ellos, superan a los métodos de aprendizaje automático que fueron probados, especialmente cuando los chatbots se entrenan utilizando datos locales. Este hallazgo es significativo, ya que sugiere que, en situaciones con datos limitados, las soluciones basadas en IA pueden ser más efectivas que los enfoques tradicionales. Sin embargo, los autores también subrayan que, a pesar de su facilidad de uso en comparación con los métodos de programación tradicionales, los chatbots aún presentan retos para los usuarios en términos de obtener resultados útiles. A pesar de que la interacción con los chatbots puede parecer más accesible, los resultados no siempre son confiables y pueden requerir ajustes adicionales.

Un hallazgo preocupante del estudio fue la identificación de errores conceptuales alarmantes en algunos chatbots, tales como la incapacidad de contar correctamente el número de líneas de los textos de entrada. Curiosamente, algunos chatbots justificaron estos errores como «errores humanos», lo que resalta la necesidad de mejorar la precisión y la comprensión de estos sistemas. Este tipo de error pone en duda la fiabilidad de los chatbots de IA para tareas que requieren una precisión absoluta, como la clasificación de metadatos en bibliotecas, donde los detalles son cruciales.

A pesar de estos problemas, los autores concluyen que la información proporcionada en su estudio es valiosa para bibliotecarios y curadores de datos que deseen explorar el uso de herramientas de IA en la curación de datos o en el aumento de metadatos. Aunque los resultados no son concluyentes sobre la eficacia total de los chatbots de IA para la clasificación de metadatos, el artículo ofrece una visión importante sobre las ventajas y limitaciones de estas herramientas emergentes. En este sentido, el estudio puede servir como base para futuras investigaciones y como guía para los profesionales que están considerando integrar estas tecnologías en sus prácticas diarias.

Chatbots de IA y catalogación por materias: una prueba de rendimiento

​Dobreski, Brian, and Christopher Hastings. «AI Chatbots and Subject Cataloging: A Performance Test.» Library Resources & Technical Services 69, no. 2 (2025): https://doi.org/10.5860/lrts.69n2.8440

Se analiza el uso de chatbots basados en inteligencia artificial (IA) para realizar tareas de catalogación temática en bibliotecas. En un contexto donde las tecnologías basadas en modelos de lenguaje están en expansión, y las bibliotecas exploran nuevas formas de integrar herramientas digitales para optimizar sus flujos de trabajo, este estudio aporta evidencia empírica al debate sobre si los chatbots gratuitos como ChatGPT, Gemini y Copilot pueden asumir tareas complejas de catalogación, en particular la asignación de encabezamientos de materia y números de clasificación.

Los autores enmarcan su investigación en el creciente interés que ha despertado la IA en el mundo bibliotecario. Numerosos profesionales han empezado a experimentar con estas herramientas en áreas como servicios de referencia, gestión de colecciones y asesoría a lectores. Sin embargo, en el área específica de la catalogación temática, persisten dudas significativas sobre la precisión, fiabilidad y utilidad de los chatbots. La catalogación por materias implica analizar el contenido intelectual de los recursos para identificar su “aboutness” o tema central, y luego representar ese contenido mediante sistemas normativos como el Library of Congress Subject Headings (LCSH), el Library of Congress Classification (LCC) y el Dewey Decimal Classification (DDC). Estos sistemas son altamente estructurados, complejos y requieren formación especializada para ser utilizados con precisión.

Para poner a prueba las capacidades de los chatbots, los investigadores diseñaron un experimento basado en el libro didáctico Essential Classification de Vanda Broughton, una obra ampliamente reconocida en el ámbito de la catalogación. De este libro se extrajeron una serie de ejercicios reales de catalogación que fueron transformados en 98 preguntas, diseñadas para ser comprensibles incluso para estudiantes principiantes. Estas preguntas fueron clasificadas en tres categorías: 50 sobre LCSH, 25 sobre LCC y 23 sobre DDC. Las preguntas fueron presentadas directamente a los chatbots en su versión gratuita, sin uso de ingeniería de prompts ni ajustes en la formulación, con el objetivo de simular una interacción básica y accesible para cualquier bibliotecario sin experiencia técnica avanzada.

Las respuestas obtenidas por los tres chatbots fueron evaluadas minuciosamente y comparadas con las soluciones propuestas por el texto de Broughton. Para determinar su calidad, se tomaron en cuenta criterios como exactitud, validez dentro del sistema de clasificación, adecuación al tema y presencia de errores evidentes o alucinaciones (es decir, invenciones de términos o números inexistentes). Los resultados fueron reveladores. En el caso de los ejercicios de clasificación Dewey (DDC), el desempeño general fue bajo en todos los modelos. ChatGPT logró la puntuación más alta con un 26% de respuestas correctas o aceptables, mientras que Gemini obtuvo un 17% y Copilot apenas un 9%. Los errores comunes incluyeron el uso de números demasiado amplios, números correspondientes a temas incorrectos y, en algunos casos, números inexistentes.

El panorama fue aún más desalentador en la asignación de números de clasificación de la Biblioteca del Congreso (LCC). Gemini mostró un rendimiento particularmente deficiente, con una tasa de éxito del 4%, frente al 20% de ChatGPT y el 24% de Copilot. En esta categoría, los errores fueron más graves: se detectaron alucinaciones frecuentes de números inexistentes, uso incorrecto de clases generales, y asignaciones sin fundamento temático adecuado. Además, las herramientas mostraron una preocupante tendencia a reutilizar códigos ya vistos en preguntas anteriores para temas completamente diferentes, un comportamiento que pone en duda la capacidad de los chatbots para mantener consistencia temática.

En cuanto a la asignación de encabezamientos de materia LCSH, los resultados mostraron diferencias más marcadas entre los modelos. ChatGPT destacó en esta categoría, alcanzando un 54% de aciertos entre respuestas correctas, cercanas o aceptables. Gemini quedó atrás con un 26%, y Copilot tuvo el rendimiento más bajo con un 10%. Aunque la mayoría de las respuestas contenían múltiples encabezamientos sugeridos, los investigadores evaluaron el mejor de cada caso para determinar la puntuación final. ChatGPT no solo generó una mayor cantidad de encabezamientos por pregunta (promedio de 6), sino que también mostró una tasa más alta de validez semántica y estructural (63% de todos los encabezamientos sugeridos eran válidos según el sistema LCSH). Sin embargo, también cometió errores notables, como omitir subdivisiones esenciales o proponer encabezamientos demasiado generales.

Un hallazgo interesante fue la divergencia en los tipos de errores cometidos por cada chatbot. Por ejemplo, Gemini tendía a agregar subdivisiones innecesarias o inventadas, muchas veces encerradas entre corchetes, lo que indicaba inseguridad en la elección de términos. Copilot, por otro lado, proponía encabezamientos muy generales o usaba una estrategia facetada sin combinarlos en una sola cadena coherente, lo que podría hacerlo más apto para sistemas como FAST en lugar de LCSH. ChatGPT, aunque más preciso, también incurría en errores típicos de omisión o simplificación excesiva.

Los autores argumentan que, aunque ningún chatbot fue capaz de reemplazar el juicio experto del catalogador, ChatGPT mostró un nivel de rendimiento que sugiere un potencial moderado como herramienta de apoyo, especialmente en la generación de encabezamientos de materia. Sin embargo, recalcan que la intervención humana sigue siendo indispensable para verificar la existencia y pertinencia de los términos propuestos, así como para ajustar los resultados a las reglas específicas de cada sistema. De hecho, la utilidad real de estas herramientas podría residir más en su capacidad para ofrecer un punto de partida que en su aptitud para realizar tareas completas de forma autónoma.

El estudio no estuvo exento de limitaciones importantes, como el uso exclusivo de versiones gratuitas de los chatbots, la falta de interacción iterativa o de re-prompting, y el hecho de evaluar solo una respuesta por pregunta, lo cual puede dar una imagen más positiva de la real capacidad de estas herramientas. Además, los ejercicios seleccionados estaban diseñados para formar estudiantes en proceso de aprendizaje, y no necesariamente para ser evaluados bajo criterios estrictos de rendimiento profesional.

A modo de cierre, los autores señalan varias líneas prometedoras para futuras investigaciones. Entre ellas se incluyen la repetición del estudio con versiones futuras o de pago de los chatbots, la incorporación de ingeniería de prompts más compleja, y la comparación del rendimiento entre chatbots, catalogadores novatos y catalogadores que utilizan IA como apoyo. También sugieren explorar el uso de chatbots con otros sistemas de clasificación más simples o especializados, como FAST o MeSH, que podrían ser más compatibles con las limitaciones de las herramientas actuales.

En conclusión, este estudio ofrece una valiosa contribución al debate sobre el uso de IA en bibliotecas, evidenciando que aunque los chatbots no están listos para asumir tareas de catalogación temática de forma autónoma, podrían desempeñar un papel útil si son usados con criterio profesional. La clave está en combinar el potencial de la IA con el conocimiento experto del personal bibliotecario, así como en fomentar una alfabetización en IA que permita a los profesionales utilizar estas herramientas de manera crítica, efectiva y ética en el contexto de la gestión de la información.

ChatGPT ya es capaz de catalogar libros en formato Marc 21

ChatGPT puede ayudarte a crear un registro MARC 21 de manera manual, proporcionando el formato correcto y ayudándote a organizar los campos de manera adecuada.

A continuación os proporciono un ejemplo de cómo sería el registro en formato MARC 21 para el libro Luisa Mora Villarejo, Un legado común: las donaciones recibidas en el siglo XXI en la Biblioteca Islámica «Félix María Pareja» (Agencia Española de Cooperación Internacional para el Desarrollo, 2023), Para ello he copiado la información textual del catálogo y lo he pegado en ChatGPT, pidiendo que me elabore un registro MARC 21 de este libro. El resultado es este:

=LDR  01716cam a2200361 i 4500
=001 0000000001
=005 20231211
=008 231211s2023 sp 000 0 spa
=020 ## $a 9788483471937
=020 ## $a 109-23-042-X
=035 ## $a (NIPO) 0000000001
=035 ## $a (DL) M 33141-2023
=041 0# $a spa
=100 1# $a Mora Villarejo, Luisa, $e autor.
=245 10 $a Un legado común : $b las donaciones recibidas en el siglo XXI en la Biblioteca Islámica 'Félix María Pareja' / $c Luisa Mora Villarejo.
=260 ## $a Madrid : $b Agencia Española de Cooperación Internacional para el Desarrollo, Ministerio de Asuntos Exteriores, Unión Europea y Cooperación, $c 2023.
=300 ## $a 184 p. : $b il. col. ; $c 24 cm.
=490 1# $a Ciencias y humanismo (Agencia Española de Cooperación Internacional)
=504 ## $a Bibliografía: p. 155-159.
=520 ## $a El libro aborda las donaciones recibidas en el siglo XXI por la Biblioteca Islámica 'Félix María Pareja', destacando las bibliotecas personales donadas por figuras del arabismo y la cooperación cultural entre España y los países árabes.
=650 0# $a Agencia Española de Cooperación Internacional para el Desarrollo. $v Biblioteca.
=650 0# $a Bibliotecas $x Historia.
=650 0# $a Cooperación cultural de España.
=650 0# $a Arabistas españoles.
=650 0# $a Relaciones España-Países árabes.
=650 0# $a Colecciones especiales.
=710 2# $a Agencia Española de Cooperación Internacional para el Desarrollo, $e emisor.
=830 0# $a Ciencias y humanismo (Agencia Española de Cooperación Internacional)
=856 41 $u http://creativecommons.org/licenses/by-nc-sa/4.0/ $z Licencia Creative Commons - Attribution, Non-Commercial, ShareAlike (BY-NC-SA)

La herramienta también nos explica que es cada uno de los campos.

Explicación de los campos principales:

  • =245: Título completo, en este caso incluye el título y subtítulo del libro.
  • =260: Información de publicación, que incluye el lugar de publicación, el editor y la fecha de publicación.
  • =300: Descripción física del libro, que indica el número de páginas y el tamaño.
  • =504: Nota bibliográfica que incluye la bibliografía.
  • =520: Resumen o sinopsis del contenido del libro.
  • =650: Descriptores de temas que ayudan a clasificar el libro, en este caso relacionados con bibliotecas, makerspaces e innovación.
  • =852: Información sobre la ubicación del libro, en este caso, una biblioteca central.

Este es un ejemplo de cómo se podría estructurar el registro de este libro en un sistema de catalogación MARC 21 para una biblioteca.

Reglas de catalogación de la IASA para la descripción de registros sonoros y documentos audiovisuales relacionados

Texto completo

El Manual para la descripción de registros sonoros y documentos audiovisuales relacionados es una obra recopilada y editada por el Grupo Redactor de IASA bajo la dirección de Mary Milano. La versión en español fue traducida y adaptada con nuevos ejemplos por María del Pilar Gallego Cuadrado, de la Biblioteca Nacional.

ANABAD ha puesto a disposición de los profesionales de la documentación estas reglas de catalogación, originalmente publicadas por la International Association of Sound and Audiovisual Archives (IASA), para mejorar la normalización del trabajo en el ámbito de los documentos sonoros y audiovisuales. La traducción incluye ejemplos adaptados al mundo de habla hispana, enriqueciendo la utilidad del manual para los profesionales del sector.