Archivo de la etiqueta: Catalogación

Herramientas de Inteligencia Artificial aplicadas a la catalogación de bibliotecas para el año 2025

El contenido se divide en seis categorías principales que abarcan desde sistemas integrados comerciales hasta soluciones personalizadas y experimentales, destacando sus características, casos de uso, ventajas y limitaciones.

En el ámbito de las grandes plataformas, se mencionan el Ex Libris Alma AI Metadata Assistant y las herramientas de Machine Learning de OCLC. La primera está enfocada en bibliotecas universitarias para sugerir metadatos enriquecidos, destacando por su integración fluida con sistemas actuales, aunque requiere una suscripción. La segunda utiliza aprendizaje automático para la resolución de entidades en catalogación digital, caracterizándose por ser de código abierto pero aún en etapa experimental.

Por otro lado, instituciones académicas y gubernamentales lideran proyectos como el de la Biblioteca del Congreso y Harvard, que explora la descripción computacional y su integración con BIBFRAME para informes abiertos. Paralelamente, Harvard ha desarrollado una herramienta basada en GPT para bibliotecarios de Asia Oriental, la cual facilita sugerencias de encabezamientos de materia (LCSH) y análisis de temas mediante embeddings multilingües.

Finalmente, la infografía destaca soluciones más flexibles como las Custom Power Apps y los Chatbots de IA de uso general. Las Power Apps están diseñadas para bibliotecas pequeñas y materiales en idiomas asiáticos (CJK), ofreciendo modelos entrenables a pesar de estar en fase beta. Por su parte, los chatbots genéricos se utilizan para el prototipado rápido y la transliteración; aunque son muy versátiles, se advierte que su precisión puede ser inconsistente.

A continuación, se detallan los pros y contras de cada una de las 6 herramientas mencionadas en la infografía, para que puedas comparar sus ventajas y limitaciones:


1. Ex Libris Alma AI Metadata Assistant

  • Pros: Su principal ventaja es la integración fluida (seamless) con el sistema ILS (Sistema Integrado de Gestión Bibliotecaria) que ya utilizan muchas bibliotecas académicas.
  • Contras: Requiere obligatoriamente tener una suscripción activa a Alma, lo que representa un costo institucional elevado.

2. OCLC Machine Learning Tools

  • Pros: Se destaca por ser un ecosistema de catalogación abierta, lo que fomenta la colaboración entre instituciones.
  • Contras: Todavía se encuentra en una fase experimental, por lo que sus procesos podrían no ser totalmente estables o definitivos.

3. Library of Congress: Computational Description

  • Pros: Ofrece informes abiertos (open reports), lo que permite transparencia en cómo se generan los metadatos bajo el estándar BIBFRAME.
  • Contras: Al ser un proyecto de exploración institucional, su implementación práctica fuera de la Biblioteca del Congreso puede ser compleja o limitada.

4. Custom Power Apps AI Cataloging

  • Pros: Es una solución altamente personalizada para materiales CJK (chino, japonés y coreano), permitiendo entrenar modelos específicos.
  • Contras: Se encuentra en fase beta, lo que implica que aún está en desarrollo y puede presentar errores de funcionamiento.

5. LCSH Recommendation GPT (Harvard)

  • Pros: Muy eficiente para el análisis de materias multilingües, ayudando a traductores y catalogadores con términos complejos de encabezamiento de materia (LCSH).
  • Contras: (Aunque no se detalla explícitamente en el cuadro rojo, se infiere que depende de la precisión del modelo GPT de turno y del contexto específico de Harvard).

6. General-Purpose AI Chatbots (ChatGPT, etc.)

  • Pros: Son herramientas extremadamente versátiles que sirven para prototipado rápido, traducción y transliteración de diversos idiomas.
  • Contras: Tienen una precisión inconsistente. Al ser modelos generales, pueden cometer errores factuales («alucinaciones») en la creación de registros bibliográficos.

Catalogar con inteligencia artificial: retos y límites de la IA en los metadatos

Bryant, Rebecca y Annette Dortmund. “Striking the Right Balance: Opportunities and Challenges of AI in Metadata Workflows.Hanging Together, OCLC Research Library Partnership, 2025. https://hangingtogether.org/striking-the-right-balance-opportunities-and-challenges-of-ai-in-metadata-workflows/

La inteligencia artificial (IA) tiene un gran potencial para mejorar los flujos de trabajo de metadatos, ya que ofrece herramientas para aumentar la eficiencia, mejorar la búsqueda y abordar retos que llevan mucho tiempo presentes en las bibliotecas. Sin embargo, como ocurre con cualquier tecnología transformadora, la adopción de la IA requiere una reflexión profunda sobre sus limitaciones, sus implicaciones éticas y su impacto en la práctica profesional. La clave está en encontrar el equilibrio adecuado, uno que aproveche las capacidades de la IA y, al mismo tiempo, mantenga la calidad y los estándares profesionales de los que dependen las bibliotecas.

Entre abril y junio de 2024, la OCLC Research Library Partnership (RLP) convocó al Grupo de Trabajo sobre la Gestión de la IA en los Flujos de Trabajo de Metadatos. Este grupo de trabajo reunió a gestores de metadatos para explorar cómo se podría integrar la IA en los flujos de trabajo de catalogación, colecciones especiales y repositorios institucionales. A lo largo de estos debates, los bibliotecarios y archiveros expresaron tanto entusiasmo como cautela sobre la adopción de la IA, y surgieron una serie de temas transversales, ideas que van más allá de los flujos de trabajo específicos y destacan las oportunidades y los retos de la adopción responsable de la IA en las bibliotecas.

Un tema fundamental en todos los debates fue la importancia crítica de la calidad de los metadatos. Los participantes en los grupos de trabajo afirmaron de manera sistemática que crear registros utilizando IA es contraproducente si los recursos no se describen con precisión o si se induce a error a los usuarios. Este énfasis en la calidad no es un obstáculo para la adopción de la IA, sino un marco para su implementación responsable.

A partir de las conclusiones del grupo de trabajo “Managing AI in Metadata Workflows” de la OCLC, se destacan varias tensiones: por un lado, la IA ofrece eficiencia, puede automatizar tareas repetitivas y liberar tiempo para que los catalogadores se centren en trabajos de mayor valor; por otro, se plantea la necesidad de preservar la calidad de los metadatos, evitar “alucinaciones” (errores de la IA), y mantener el control humano mediante revisiones.

Se plantearon repetidamente varias consideraciones relacionadas con la calidad:

  • Alucinaciones que introducen información falsa en los registros del catálogo.
  • Resultados inconsistentes a partir de entradas idénticas, lo que socava la fiabilidad.
  • Puntuaciones de confianza poco fiables que no siempre reflejan con precisión la calidad del contenido generado por la IA.
  • Fallos en el reconocimiento de entidades, en los que los resultados generados por la IA pueden parecer sintácticamente correctos, pero no identifican a la persona, el lugar o la organización correctos.

Sin embargo, estos retos están impulsando innovaciones productivas en lugar de suponer barreras insuperables. El enfoque de OCLC para la deduplicación basada en IA en WorldCat demuestra cómo se pueden abordar las preocupaciones sobre la calidad mediante enfoques híbridos que combinan la eficiencia de la IA con la experiencia humana. OCLC ha colaborado estrechamente con la comunidad de catalogación para ayudar a validar la comprensión de su modelo de aprendizaje automático de los registros duplicados en WorldCat. Hasta la fecha, OCLC ha eliminado más de 9 millones de registros duplicados de WorldCat gracias a este modelo de IA, que seguimos probando y perfeccionando. El proceso incluye protocolos de toma de decisiones conservadores y supervisión humana para casos complejos, lo que demuestra cómo la IA puede ampliar el trabajo de calidad en lugar de comprometerlo.

Una cuestión recurrente es la dificultad de los modelos actuales para entender contexto cultural o terminología especializada, lo que puede llevar a imprecisiones semánticas. Además, se discute cómo los roles profesionales están cambiando: la IA puede encargarse del volumen bajo, pero los especialistas siguen siendo indispensables para revisar, validar y ajustar los resultados. Esto implica diseñar nuevos perfiles profesionales con habilidades para evaluar salidas de IA y para intervenir cuando la máquina se equivoca.

El texto también profundiza en los aspectos éticos: subraya la importancia de la transparencia (se debe dejar constancia de cuándo un metadato ha sido generado por IA), la trazabilidad y los estándares para gestionar la autoría de la IA. Además, apunta a las preocupaciones medioambientales relacionadas con el consumo energético de los modelos de IA y reclama una implementación sostenible. El análisis termina señalando que no se trata de sustituir al profesional, sino de colaborar con la IA de manera que se potencien sus fortalezas sin sacrificar rigor, equidad ni responsabilidad.

Cuando la inteligencia artificial reemplaza la experiencia: bibliotecas y catalogación en riesgo

Olson, Mike. «Beyond Classification: The Human Cost of Library and Information Labor Under Digital CapitalismThe Scholarly Kitchen, 26 de agosto de 2025. https://scholarlykitchen.sspnet.org/2025/08/26/guest-post-beyond-classification-the-human-cost-of-library-and-information-labor-under-digital-capitalism/

Las bibliotecas y su personal se ven afectados por la automatización, la externalización y la mercantilización del trabajo informativo en la era del capitalismo digital.

Se destaca cómo la consolidación de proveedores y la automatización mediante inteligencia artificial están eliminando el trabajo invisible que sostiene los sistemas bibliotecarios. Por ejemplo, la reciente reducción de personal en OCLC, la organización sin fines de lucro que gestiona el Sistema Dewey y WorldCat, refleja una contradicción fundamental en la valoración de la experiencia en catalogación: mientras que la organización cita la inteligencia artificial como justificación para los recortes laborales, también está desarrollando herramientas de inteligencia artificial para el procesamiento de metadatos. Esta contradicción pone de manifiesto cómo los avances tecnológicos celebrados por su eficiencia están borrando la experiencia humana que crea los metadatos de alta calidad de los que dependen estos sistemas para funcionar.

Además, el artículo señala que la mano de obra bibliotecaria ejemplifica lo que Maurizio Lazzarato identifica como «trabajo inmaterial»: trabajo que produce tanto contenido informativo como estandarización cultural, convirtiéndose en directamente productivo para el capitalismo digital a través de sistemas controlados por proveedores que agregan y monetizan metadatos estandarizados. La devaluación de la experiencia en catalogación se hace visible cuando las instituciones eliminan estos puestos durante los recortes presupuestarios. Por ejemplo, el despido de Violet Fox, una de las voces líderes en catalogación crítica y creadora del Cataloging Lab, ejemplifica el tipo de conocimiento especializado en catalogación que las instituciones están eliminando precisamente cuando más se necesita. Los catalogadores como Fox realizan el trabajo invisible de desafiar los sistemas de clasificación coloniales, asegurando que los encabezamientos de materia reflejen las necesidades de la comunidad en lugar de los términos genéricos proporcionados por los proveedores, haciendo que las colecciones sean descubribles y accesibles, y manteniendo la calidad de los metadatos que permite la investigación académica.

El artículo también destaca cómo los catálogos en línea actuales funcionan cada vez más como interfaces de sistemas de descubrimiento controlados por proveedores que agregan metadatos de múltiples fuentes con una supervisión local mínima. Esto representa una pérdida de autonomía institucional, ya que las decisiones sobre encabezamientos de materia, clasificación y referencias cruzadas se toman cada vez más en función de las necesidades de los proveedores en lugar de las necesidades de las colecciones y comunidades locales.

Despidos de catalogadores y calidad de los metadatos generados por IA en bibliotecas

Olson, Mike. «Beyond Classification: The Human Cost of Library and Information Labor Under Digital CapitalismThe Scholarly Kitchen, 26 de agosto de 2025. https://scholarlykitchen.sspnet.org/2025/08/26/guest-post-beyond-classification-the-human-cost-of-library-and-information-labor-under-digital-capitalism

A través de ejemplos como los 80 despidos en OCLC y la eliminación de 425 puestos en la Universidad Northwestern, se destaca cómo la reducción de personal especializado en catalogación afecta negativamente la calidad de los metadatos y la accesibilidad de las colecciones.

Los recientes despidos en OCLC, la organización sin fines de lucro con sede en Dublín, Ohio, que administra el Sistema Decimal Dewey y WorldCat, ofrecen una visión clara del futuro precario del trabajo en bibliotecas y gestión de información. En julio de 2025, OCLC confirmó la reducción de aproximadamente 80 puestos en su fuerza laboral de Ohio central, citando “cambios en los requisitos de habilidades técnicas, creciente influencia de la inteligencia artificial y cambios continuos en la educación superior y las bibliotecas”.

Mientras OCLC cita la IA como justificación para los recortes de personal, también ha anunciado que está desarrollando herramientas de IA para el procesamiento de metadatos. Aquí radica la paradoja de nuestra época: los mismos avances tecnológicos que se celebran por su eficiencia están eliminando la experiencia humana que crea los metadatos de alta calidad de los que dependen estos sistemas para funcionar.

El trabajo en bibliotecas ejemplifica lo que Maurizio Lazzarato identifica como “trabajo inmaterial”: un trabajo que produce contenido informativo y estandarización cultural, convirtiéndose en directamente productivo para el capitalismo digital a través de sistemas controlados por proveedores que agregan y monetizan metadatos estandarizados.

La desvalorización de la experiencia en catalogación se hace visible cuando las instituciones eliminan estos puestos durante recortes presupuestarios. El anuncio de despidos en la Universidad Northwestern, que afectó a 425 puestos, incluyó a Violet Fox, una de las voces principales en catalogación crítica y creadora del Cataloging Lab. El despido de Fox es particularmente significativo: su trabajo en prácticas de descripción reparativa ejemplifica el tipo de conocimiento especializado en catalogación que las instituciones están eliminando precisamente cuando más se necesita. Catalogadores como Fox realizan el trabajo invisible de desafiar los sistemas de clasificación coloniales, asegurando que los encabezamientos de materia reflejen las necesidades de la comunidad y no términos genéricos de proveedores, haciendo que las colecciones sean accesibles y manteniendo la calidad de los metadatos que permite la investigación académica.

La promesa de la IA en catalogación es seductora: procesamiento más rápido, reducción del trabajo manual, liberando a los trabajadores para tareas “más importantes”. Sin embargo, experimentos recientes de la Biblioteca del Congreso muestran que los modelos de lenguaje grande obtuvieron solo un 26% de F1 al predecir encabezamientos de la Biblioteca del Congreso, y los modelos de clasificación de materias solo un 35% de precisión. Esto revela un cambio fundamental en el trabajo de catalogación: los catalogadores ahora se concentran en entrenar, evaluar y curar resultados algorítmicos, proporcionando retroalimentación para sistemas incapaces de replicar la experiencia humana, el conocimiento cultural y la comprensión contextual necesarios para metadatos de calidad.

Olson argumenta que la automatización, en lugar de mejorar la eficiencia, está desplazando la experiencia humana necesaria para crear metadatos precisos y culturalmente sensibles. Esta tendencia refleja una transformación más amplia en la educación superior, donde las instituciones se enfocan en la eficiencia y la rentabilidad, a menudo a expensas de la diversidad cultural y la equidad.

El autor concluye que la pérdida de control institucional sobre la organización bibliográfica y la dependencia de sistemas de descubrimiento controlados por proveedores externos están erosionando la autonomía y la misión pública de las bibliotecas. Advierte que, sin una reflexión crítica y una acción concertada, el trabajo bibliotecario esencial podría desaparecer, con consecuencias negativas para la accesibilidad y la justicia en la información.

Inteligencia artificial y catalogación en bibliotecas

Getaneh Alemu, Anna Maria Tammaro; Navigating the artificial intelligence frontier on cataloguing and metadata work in libraries: an interview with Getaneh AlemuDigital Library Perspectives 20 August 2025; 41 (3): 587–592. https://doi.org/10.1108/DLP-08-2025-208

Se reflexiona sobre cómo la inteligencia artificial (IA) está transformando la catalogación. Plantea que la relación ideal entre la IA y los representantes humanos debe basarse en la complementariedad, más que en la sustitución. Según el autor, las máquinas pueden hacerse cargo de tareas repetitivas y estructuradas —como la clasificación inicial o el etiquetado automático—, mientras que los bibliotecarios y catalogadores deben conservar el papel de brindar juicio experto, interpretación contextual y garantía de calidad, elementos que aún son difícilmente automatizables

Además, Alemu insiste en que la implementación responsable de la IA en entornos bibliotecarios debe partir de los principios éticos de transparencia y precisión. Es fundamental que los sistemas automatizados actúen con transparencia, de modo que los usuarios puedan entender cómo se generan los metadatos y qué criterios siguen los algoritmos

La entrevista también destaca una visión esperanzadora para el futuro: la IA no debería percibirse como una amenaza, sino como una herramienta para potenciar la eficiencia, liberando a los profesionales de la biblioteconomía de labores mecánicas para enfocarse en aspectos más complejos y creativos de su labor. Alemu vislumbra un ecosistema en que la tecnología permita una mejor organización del conocimiento, sin sacrificar la supervisión humana ni el cuidado por la calidad bibliográfica.

La postura de Alemu subraya la necesidad de un enfoque equilibrado: integrar la IA como aliada, no como reemplazo, reforzando el rol humano a través de la ética, la transparencia y la experiencia profesional en catalogación y metadatos.

¡La IA revoluciona las bibliotecas! catalogar libros puede ser ahora 183 veces más rápido (y 64 veces más barato)

Chisaba‑Pereira, Cristian‑Alejandro; Herrera‑Calero, Ricardo; Niño‑Neira, Saúl‑Alejandro; Hurtado‑Ortiz, Britney‑Alejandra. Datalogación: evaluación de herramientas de inteligencia artificial basadas en el Modelo Extenso de Lenguaje (Large Language Model) para la automatización de la descripción de libros.” Infonomy 3, no. 4 (18 julio 2025). Accedido 31 julio 2025.

Texto completo

La catalogación bibliotecaria ha sido históricamente uno de los procesos más importantes y laboriosos en las bibliotecas, permitiendo describir y organizar el conjunto de obras y recursos que se evidencian en catálogos, índices, directorios y tesauros. Con el surgimiento de la inteligencia artificial y específicamente de los Modelos Extensos de Lenguaje (Large Language Models), surge la oportunidad de transformar radicalmente estos procesos tradicionales, generando tanto oportunidades como desafíos significativos para la profesión bibliotecológica.

La catalogación tradicional de libros representa un proceso complejo y laborioso que requiere que los bibliotecarios analicen minuciosamente cada documento para crear registros bibliográficos detallados y precisos. En este contexto, la catalogación automatizada ha emergido como una solución tecnológica prometedora. En la catalogación automatizada se utiliza el ISBN del libro o ISSN de la revista para hacer la búsqueda y se incorpora la información obtenida en la ficha del libro.

Los Modelos de Lenguaje Extenso (Large Language Models) han abierto nuevas posibilidades en el ámbito bibliotecario, particularmente en la generación automatizada de descripciones y metadatos de libros. Estos sistemas de inteligencia artificial tienen la capacidad de procesar y analizar grandes volúmenes de texto de manera simultánea, extrayendo información relevante como resúmenes del contenido, palabras clave temáticas, clasificación por materias e información bibliográfica estructurada. La aplicación de estos modelos permite no solo acelerar el proceso de catalogación, sino también mantener un nivel de consistencia y precisión que puede ser difícil de lograr mediante procesos completamente manuales.

La implementación de sistemas automatizados en bibliotecas ofrece beneficios significativos en términos de eficiencia y calidad. La automatización de bibliotecas permite reducir los errores tanto en la catalogación como en la clasificación de los materiales, mediante el uso de sistemas informáticos que faciliten y optimicen estos procesos. Esta reducción de errores es particularmente importante considerando el volumen creciente de material bibliográfico que las bibliotecas modernas deben procesar y mantener actualizado.

Utilizando cinco libros seleccionados por el sistema bibliotecario de la Universidad Distrital Francisco José de Caldas, los autores analizaron el rendimiento de estas herramientas en términos de tiempo, costos, calidad y volumen de catálogo. La investigación implementó una metodología comparativa rigurosa para evaluar el desempeño de cuatro herramientas de inteligencia artificial basadas en Large Language Models versus el trabajo de un catalogador humano experto. Las herramientas evaluadas fueron ChatGPT 3.5, ChatGPT 4.0, Gemini de Google y Copilot de Microsoft. La selección de libros para el análisis incluyó tres bestsellers: «1984» de George Orwell, «Cien años de soledad» de Gabriel García Márquez, y «Macroeconomics» de Andrew B. Abel; además de dos obras frontlist publicadas en 2024: «En agosto nos vemos» de Gabriel García Márquez y «Piedra, ficción, memoria: Etnografías del lugar memorativo» de Adrián Serna Dimas.

El análisis se realizó desde tres perspectivas fundamentales: tiempo de catalogación, costos asociados y calidad de la descripción bibliográfica. Para la evaluación de calidad se utilizó el estándar Resource Description and Access (RDA) con nivel de descripción 1, que incluye áreas como título y subtítulo, edición, pie de imprenta, descripción física y número normalizado ISBN. Las pruebas se realizaron utilizando el software ALEPH500 con protocolo MARC21, asegurando la comparabilidad y estandarización de los resultados.

Los resultados obtenidos revelan diferencias dramáticas entre el desempeño humano y el de las herramientas de inteligencia artificial: los modelos automatizados catalogaron 183 veces más rápido que una persona, pudieron catalogar 187 veces más libros y el costo salarial estimado para un catalogador humano resultó ser 64 veces mayor que el uso de IA. En términos de tiempo, el catalogador humano requirió un promedio de 24 minutos y 51 segundos para completar la descripción de cada libro, incluyendo tiempo de descripción (15:23 minutos) y tiempo de transcripción (09:28 minutos). En contraste, los aplicativos de IA completaron la misma tarea en un promedio de apenas 8 segundos, lo que representa que la catalogación asistida por IA es 183 veces más rápida que la realizada por una persona.

En cuanto a la cantidad de campos descritos, el catalogador humano generó un promedio de 55 campos MARC21 por obra, mientras que las herramientas de IA produjeron un promedio de 21 campos. Esta diferencia significativa refleja la capacidad del experto humano para aplicar criterios profesionales, normas de catalogación y estándares de calidad que las IA aún no logran replicar completamente. Sin embargo, los campos generados por las IA mostraron coherencia y utilidad práctica para procesos de catalogación básica.

El análisis económico presenta resultados igualmente impactantes. El costo de catalogación por libro realizada por el catalogador humano se calculó en 14.275 pesos colombianos (aproximadamente 3.36 USD), mientras que el uso de IA representa un costo prácticamente nulo cuando se utilizan versiones gratuitas, o significativamente menor cuando se considera el costo de suscripción. A nivel anual, el salario del catalogador representa 65.761.896 pesos colombianos versus 1.020.516 pesos colombianos para el uso de IA, lo que significa que el costo de catalogación humana es 64 veces más elevado.

Entre las herramientas evaluadas, ChatGPT en sus versiones 3.5 y 4.0 mostró el mejor desempeño, proporcionando resultados más precisos y aplicables al ejercicio de catalogación. ChatGPT 4.0 se identificó como la herramienta más idónea al momento de la investigación. Copilot también demostró capacidades satisfactorias para generar texto plano utilizable en editores de registros MARC21. En contraste, Gemini presentó limitaciones significativas, entregando resultados menos favorables al explicar cada etiqueta MARC21 en lugar de proporcionar código MARC21 completo en texto plano.

La investigación proyecta que un catalogador humano trabajando 2.080 horas anuales (40 horas semanales) podría catalogar aproximadamente 4.992 libros por año. En contraste, las herramientas de IA podrían procesar hasta 936.000 libros en el mismo período, representando una capacidad 187 veces superior. Estos números ilustran el potencial transformador de la tecnología para abordar los desafíos de procesamiento masivo de colecciones bibliográficas que enfrentan las bibliotecas modernas.

Esto demuestra una extraordinaria eficiencia operativa a favor de los sistemas automatizados, abriendo posibilidades para escalar los procesos bibliográficos en contextos con recursos limitados.

En cuanto a la calidad de la descripción, si bien las herramientas LLM presentaron resultados rápidos y voluminosos, los autores reconocieron la necesidad de supervisión para garantizar la precisión y la coherencia de los datos generados. Si bien se observa que los modelos pueden replicar adecuadamente los formatos bibliográficos, aún existe un margen de error en aspectos como las atribuciones, los metadatos específicos y la coherencia editorial, especialmente en la cobertura de las primeras publicaciones o en títulos recientes. Los datos bibliográficos de libros recientes, novedades editoriales o frontlist frecuentemente son inventados por las IA o presentan errores significativos. Esto sugiere que las IA tienen limitaciones en el acceso a información bibliográfica actualizada y pueden generar datos ficticios cuando no tienen acceso a información precisa.

Las herramientas también muestran variabilidad en la capacidad de integrar estándares y normas de catalogación profesional. Mientras pueden acelerar procesos y facilitar la cantidad de registros, generan dudas sobre la calidad y coherencia de los datos bibliográficos producidos, especialmente en comparación con el trabajo realizado por profesionales que comprenden completamente las reglas de catalogación, normas y estándares especializados.

El estudio concluye que estas tecnologías representan una oportunidad significativa para transformar los procesos de catalogación en bibliotecas y sistemas de información. Sin embargo, es importante tener en cuenta que su adopción requiere una implementación responsable, con estrategias que incluyan supervisión humana, validación de metadatos y procedimientos claros para la corrección de errores. Solo así se podrá aprovechar su potencial sin comprometer la integridad de la información bibliográfica.

Adopción de prácticas críticas de catalogación y auditorías de diversidad

Anderson, Jessica K., y Yan Quan Liu. “Adopting Critical Cataloging Practices Post Diversity Audit: Connecting the Community to Your Collection.” Library Resources & Technical Services 69, no. 3 (2025). https://doi.org/10.5860/lrts.69n3.8498

Las bibliotecas públicas son instituciones que conectan a las personas con los recursos. Sin embargo, no todos los usuarios se ven reflejados en los libros seleccionados, y otros tienen dificultades para encontrar resultados relevantes en el catálogo debido a términos de búsqueda obsoletos o problemáticos. Dos estrategias emergentes para abordar estos problemas son las auditorías de diversidad y la catalogación crítica.

El artículo aborda cómo transformar las prácticas de catalogación tradicionales para crear colecciones más inclusivas y accesibles después de realizar auditorías de diversidad. Este trabajo representa un enfoque integral que conecta la evaluación crítica de colecciones con la implementación práctica de cambios significativos en los sistemas de organización del conocimiento.

Las auditorías de diversidad han emergido como herramientas fundamentales para evaluar la representación en las colecciones bibliotecarias. Estas auditorías constituyen un inventario sistemático diseñado para analizar y medir el rango de experiencias, representaciones diversas y puntos de vista encontrados dentro de los recursos bibliotecarios. El proceso proporciona datos concretos y objetivos que informan el desarrollo estratégico de colecciones, asegurando que las bibliotecas mantengan una representación apropiada y equitativa de diversas comunidades y perspectivas. Sin embargo, el verdadero desafío comienza después de completar la auditoría, cuando las instituciones deben traducir los hallazgos en acciones concretas y sostenibles.

La catalogación crítica emerge como el marco teórico y práctico que guía esta transformación. Este enfoque se centra en las implicaciones éticas de los metadatos bibliotecarios, la catalogación y las prácticas de clasificación, estándares e infraestructura. La catalogación crítica examina cómo las prácticas tradicionales pueden perpetuar sesgos sistemáticos, exclusiones y representaciones problemáticas que limitan el acceso equitativo a la información. Este enfoque reconoce que los sistemas de catalogación no son neutrales, sino que reflejan las perspectivas y sesgos de quienes los crearon, frecuentemente excluyendo o marginalizando ciertas comunidades y formas de conocimiento.

Se detallan las metodologías disponibles para realizar auditorías de diversidad, incluyendo el método de búsqueda en catálogo, el método de lista de verificación y el método de inspección de libros. Cada metodología presenta ventajas y desventajas únicas, y la elección del método depende de los recursos disponibles, el alcance de la colección y los objetivos específicos de la institución. La comprensión profunda de estas metodologías es crucial para implementar cambios efectivos en las prácticas de catalogación posteriores a la auditoría.

La implementación post-auditoría representa el núcleo del trabajo de Anderson y Liu. Una vez identificadas las brechas de diversidad y los sesgos sistemáticos en la catalogación, las bibliotecas deben desarrollar estrategias específicas para abordar estas deficiencias. Esto incluye la revisión crítica de los términos de materia, la actualización de descripciones bibliográficas para incluir perspectivas más amplias, y la implementación de prácticas de catalogación que reconozcan y valoren diferentes formas de conocimiento y experiencia cultural. El proceso requiere no solo cambios técnicos, sino también un compromiso institucional con la equidad y la inclusión.

La conexión entre la comunidad y la colección constituye el objetivo final de estas prácticas críticas de catalogación. Las mejoras en la catalogación deben traducirse en mayor accesibilidad y relevancia para diversas comunidades de usuarios. Esto implica crear metadatos que faciliten el descubrimiento de recursos por parte de usuarios que tradicionalmente han sido marginalizados por los sistemas de catalogación convencionales. La catalogación crítica busca eliminar barreras y crear puentes entre los recursos disponibles y las necesidades diversas de las comunidades servidas.

La importancia de este trabajo radica en su capacidad para proporcionar una guía práctica y fundamentada para bibliotecas que han completado auditorías de diversidad pero necesitan orientación sobre cómo implementar cambios significativos. El artículo conecta la evaluación teórica con la aplicación práctica, ofreciendo un marco de trabajo que las instituciones pueden adaptar a sus contextos específicos. Esta conexión entre teoría y práctica es esencial para crear cambios sostenibles en las prácticas bibliotecarias.

El contexto profesional más amplio de este trabajo incluye el movimiento hacia prácticas más equitativas e inclusivas en la bibliotecología. Las auditorías de diversidad se han convertido en herramientas esenciales para evaluar y mejorar las colecciones bibliotecarias, pero su valor real se materializa cuando se traducen en acciones concretas que benefician a las comunidades servidas. El trabajo de Anderson y Liu contribuye significativamente a este movimiento al proporcionar un marco práctico para la implementación de cambios post-auditoría.

En conclusión, este artículo representa una contribución valiosa al campo de la bibliotecología crítica, ofreciendo tanto fundamentos teóricos como orientación práctica para bibliotecas comprometidas con la equidad y la inclusión. La adopción de prácticas críticas de catalogación post-auditoría de diversidad no es simplemente una mejora técnica, sino una transformación fundamental en la forma en que las bibliotecas conceptualizan su rol en la democratización del acceso al conocimiento y la información.

Análisis comparativo de chatbots de IA para la extracción de metadatos en bibliotecas universitarias

González-Espinoza, Alfredo, Dom Jebbia, y Haoyong Lan. «Metadata Augmentation Using NLP, Machine Learning and AI-Chatbots: A ComparisonarXiv, abril 25, 2025. https://arxiv.org/abs/2504.17189

El estudio ofrece un análisis exhaustivo sobre el uso de herramientas de inteligencia artificial (IA) y aprendizaje automático para la tarea de recogida de metadatos, especialmente en el contexto de bibliotecas universitarias. Los avances recientes en estas tecnologías han permitido que tareas repetitivas, como la clasificación de documentos y la curación de datos, sean más automatizadas, lo que puede optimizar significativamente los flujos de trabajo en instituciones como las bibliotecas. Sin embargo, el desarrollo y la integración efectiva de estas herramientas en entornos de trabajo reales aún enfrentan desafíos importantes.

Los autores, Alfredo González-Espinoza, Dom Jebbia y Haoyong Lan, quienes son parte del equipo de Bibliotecas Universitarias en la Universidad Carnegie Mellon, realizan un estudio comparativo entre diferentes enfoques para la extracción de metadatos. En particular, se enfocan en el uso de chatbots comerciales basados en IA y su capacidad para realizar tareas de clasificación de documentos con datos limitados. Además, comparan estos resultados con los obtenidos mediante métodos tradicionales de aprendizaje automático y procesamiento de lenguaje natural (PLN), como XGBoost y el ajuste fino de BERT.

El análisis revela que, aunque los chatbots de IA muestran un rendimiento similar entre ellos, superan a los métodos de aprendizaje automático que fueron probados, especialmente cuando los chatbots se entrenan utilizando datos locales. Este hallazgo es significativo, ya que sugiere que, en situaciones con datos limitados, las soluciones basadas en IA pueden ser más efectivas que los enfoques tradicionales. Sin embargo, los autores también subrayan que, a pesar de su facilidad de uso en comparación con los métodos de programación tradicionales, los chatbots aún presentan retos para los usuarios en términos de obtener resultados útiles. A pesar de que la interacción con los chatbots puede parecer más accesible, los resultados no siempre son confiables y pueden requerir ajustes adicionales.

Un hallazgo preocupante del estudio fue la identificación de errores conceptuales alarmantes en algunos chatbots, tales como la incapacidad de contar correctamente el número de líneas de los textos de entrada. Curiosamente, algunos chatbots justificaron estos errores como «errores humanos», lo que resalta la necesidad de mejorar la precisión y la comprensión de estos sistemas. Este tipo de error pone en duda la fiabilidad de los chatbots de IA para tareas que requieren una precisión absoluta, como la clasificación de metadatos en bibliotecas, donde los detalles son cruciales.

A pesar de estos problemas, los autores concluyen que la información proporcionada en su estudio es valiosa para bibliotecarios y curadores de datos que deseen explorar el uso de herramientas de IA en la curación de datos o en el aumento de metadatos. Aunque los resultados no son concluyentes sobre la eficacia total de los chatbots de IA para la clasificación de metadatos, el artículo ofrece una visión importante sobre las ventajas y limitaciones de estas herramientas emergentes. En este sentido, el estudio puede servir como base para futuras investigaciones y como guía para los profesionales que están considerando integrar estas tecnologías en sus prácticas diarias.

Revisión de los Principios Internacionales de Catalogación (ICP) de IFLA

International Cataloguing Principles (ICP) Worldwide Review IFLA, 2025

borrador revisada de los ICP

El grupo de trabajo de los Principios Internacionales de Catalogación (ICP) ha presentado la versión revisada de los Principios, aprobada en 2025 por la Sección de Catalogación de la IFLA. Actualmente, se ha lanzado una revisión mundial para recopilar comentarios de todas las comunidades e individuos interesados.

Para comprender completamente el propósito y alcance de la revisión, se invita a los participantes a leer la Declaración de Intención publicada en la página. A continuación, se puede acceder a la versión borrador revisada de los ICP.

Se agradecen especialmente los comentarios sobre los siguientes temas:

  • ¿Considera que el lenguaje del documento es fácil de entender desde el punto de vista de un hablante no nativo de inglés?
  • ¿Cree que la estructura del documento es clara y coherente?
  • ¿Está el propósito del documento claramente expresado?
  • ¿Le fue útil la declaración de intención para evaluar el documento?
  • Una vez aprobado, ¿cómo le gustaría que IFLA se comunicara sobre el documento en el futuro?

Envíe sus respuestas por correo electrónico en un documento PDF o MS Word adjunto a: melanie.roche@bnf.fr y christian.Aliverti@nb.admin.ch

OCLC implementa un modelo de Inteligencia Artificial para la detección y eliminación de duplicados en los registros bibliográficos de WorldCat

OCLC. «Implementing AI to Further Scale and Accelerate WorldCat De-Duplication.» Última modificación 4 de febrero de 2025. https://www.oclc.org/en/news/announcements/2025/ai-worldcat-deduplication.html.

OCLC ha implementado un modelo de aprendizaje automático para la detección y eliminación de duplicados en los registros bibliográficos de WorldCat, como parte de sus esfuerzos continuos para mejorar la calidad de los datos y la experiencia de búsqueda para los usuarios de la red global de bibliotecas. La iniciativa comenzó en agosto de 2023, cuando se introdujo el primer modelo de aprendizaje automático para identificar duplicados de libros impresos en inglés, con el apoyo de la comunidad de catalogadores, quienes participaron en ejercicios de etiquetado de datos. Este proceso resultó en la eliminación de alrededor de 5,4 millones de registros duplicados de libros impresos en varios idiomas como inglés, francés, alemán, italiano y español.

El modelo de inteligencia artificial de OCLC se ha optimizado y extendido para abarcar todos los formatos, lenguajes y escrituras de WorldCat, utilizando los datos etiquetados por la comunidad para entrenar y ajustar el algoritmo. Tras una extensa fase de pruebas internas y la colaboración de bibliotecas miembros de WorldCat, se iniciará el 11 de febrero de 2025 una prueba piloto que involucrará la fusión de 500,000 pares de registros duplicados de libros impresos en inglés, que son la categoría más numerosa y la que ha recibido más pruebas hasta ahora.

Después de este primer ensayo, se evaluarán los resultados antes de realizar nuevas pasadas de eliminación de duplicados para los libros impresos en inglés. Una vez completada esta fase, OCLC continuará con la eliminación de duplicados en otros formatos, como materiales no bibliográficos y libros en idiomas distintos al inglés. Se recomienda a las bibliotecas que no usen WorldShare Management Services habilitar las actualizaciones de WorldCat en WorldShare Collection Manager para garantizar que reciban los registros actualizados.

Este esfuerzo, que combina la labor manual de los bibliotecarios con la tecnología avanzada de inteligencia artificial, ha logrado importantes avances en la reducción de duplicados en WorldCat. La eliminación de duplicados es una de las formas más efectivas de mejorar la calidad de WorldCat, y este enfoque automatizado permitirá a las bibliotecas ahorrar tiempo valioso y proporcionar una experiencia más precisa y eficiente para los usuarios, además de avanzar en la misión global de las bibliotecas.