La Integración de la Inteligencia Artificial en las Bibliotecas: Análisis Comparativo y Perspectivas Estratégicas

Lo, Leo S., y Cynthia Hudson Vitale. «Evolving AI Strategies in Libraries: Insights from Two Polls of ARL Member Representatives over Nine Months». Association of Research Libraries, 28 de marzo de 2024.

Descargar

La llegada de nuevas tecnologías de inteligencia artificial (IA) más accesibles supone un momento crucial para las bibliotecas, que se encuentran ante un panorama lleno de oportunidades sin precedentes y de intrincados retos. En medio de esta rápida evolución tecnológica, las bibliotecas se encuentran en una encrucijada crucial. Para navegar eficazmente por esta transición, se realizaron dos encuestas rápidas entre los miembros de la Asociación de Bibliotecas de Investigación (ARL).

La primera, realizada en abril de 2023, ofreció una visión preliminar del terreno de la IA en las bibliotecas. Posteriormente, en diciembre de 2023, se llevó a cabo una segunda encuesta, que amplió esta investigación para proporcionar un análisis comparativo de la dinámica evolutiva de la utilización y el potencial de la IA en los servicios bibliotecarios. Este estudio examina meticulosamente y contrasta los resultados de estas dos encuestas para obtener una visión más profunda de cómo los líderes bibliotecarios están lidiando con las complejidades de la integración de la IA en sus operaciones y servicios. En concreto, pretende captar las perspectivas cambiantes sobre las posibles ramificaciones de la IA, evaluar el grado de exploración e integración de la IA en las bibliotecas y señalar las aplicaciones de la IA pertinentes para el panorama bibliotecario contemporáneo.

Dinámicas Interconectadas de Adopción y Exploración de IA

Las encuestas revelan un panorama complejo donde las actitudes hacia la IA influyen significativamente en la medida de su exploración e implementación dentro de las bibliotecas. El cambio desde un optimismo cauteloso sugiere una respuesta dinámica a las tecnologías emergentes. Esta progresión ilustra la adaptabilidad y capacidad de respuesta del sector, mientras las bibliotecas navegan entre la emoción de nuevas posibilidades y los desafíos pragmáticos de integrar la IA. El creciente entusiasmo por la IA, junto con un enfoque cauteloso, resalta un ecosistema diverso donde coexisten diferentes niveles de preparación para la IA, dando forma a la narrativa más amplia de la IA en las bibliotecas.

Integración Estratégica de la IA en las Bibliotecas

La diversidad de aplicaciones de IA identificadas en las encuestas subraya un enfoque estratégico y integral para la integración de la IA. Las bibliotecas están evolucionando de repositorios tradicionales de información a facilitadores activos del aprendizaje y la investigación mejorados por la IA. Este cambio es evidente en el creciente enfoque en el uso de la IA para mejorar las experiencias de usuario, apoyar la investigación y ampliar las ofertas educativas, lo que indica una alineación estratégica con los objetivos más amplios de las organizaciones.

Literacidad en IA y Consideraciones Éticas

Un énfasis consistente en la literacidad en IA y las consideraciones éticas en todas las encuestas apunta a un papel en evolución para las bibliotecas en el fomento de competencias digitales y en IA. El reconocimiento de la necesidad de equipar tanto al personal como a los usuarios con las habilidades para aprovechar eficazmente las tecnologías de IA es cada vez más importante. Además, el uso ético de la IA, incluidas las preocupaciones sobre la privacidad y el uso responsable, emerge como un área crítica de enfoque. Esto subraya la importancia de un enfoque equilibrado para la adopción de la IA, asegurando que los avances tecnológicos se alineen con los estándares éticos y respeten la privacidad del usuario.

Caminos Colaborativos y Compromiso Comunitario

Los hallazgos destacan la importancia de la colaboración y el compromiso comunitario en el viaje de la IA. Las bibliotecas no solo están adoptando tecnologías de IA, sino que también están dando forma activamente a su desarrollo y aplicación a través de asociaciones interdisciplinarias e iniciativas organizativas. Este enfoque colaborativo no solo ayuda en la adopción estratégica de IA, sino que también fomenta una cultura de aprendizaje e innovación compartida, posicionando a las bibliotecas como actores clave en el diálogo sobre la IA dentro de sus organizaciones y más allá.

Preparación para el Futuro

Las diferentes etapas de exploración de IA y la variedad de aplicaciones identificadas sugieren que las bibliotecas están en diferentes puntos en su viaje de IA. Esta diversidad subraya la necesidad de un diálogo continuo, investigación y compartición de mejores prácticas dentro de la comunidad bibliotecaria. La investigación futura y los estudios de caso serán cruciales para comprender el papel y el impacto de la IA en entornos bibliotecarios. Las bibliotecas, independientemente de su etapa actual en la adopción de IA, se beneficiarán de dicho conocimiento compartido, lo que les permitirá prepararse y adaptarse a las tendencias en evolución de la IA.

Conclusiones

El análisis comparativo de las encuestas de abril y diciembre de 2023 subraya la naturaleza dinámica de la integración de la inteligencia artificial en las bibliotecas, resaltando los avances significativos en la adopción de AI y el papel en evolución de las bibliotecas en un paisaje integrado con IA. Este estudio enfatiza la importancia de las bibliotecas en dar forma a la integración de tecnologías de AI en entornos académicos e investigativos, equilibrando la innovación con consideraciones éticas y realidades prácticas. A medida que las bibliotecas continúan adaptándose y liderando en este terreno cambiante, sus experiencias y estrategias desempeñarán un papel crucial en dar forma al discurso sobre el papel de la IA en la transformación del acceso a la información y la difusión del conocimiento.

Open science research

Open science research XIII / Editora Científica Digital (Organização). – Guarujá-SP:
Científica Digital, 2023

Texto completo

Este trabajo es el resultado de un proceso de colaboración entre profesores, estudiantes e investigadores que destacaron y cualificaron las discusiones en este espacio de formación. También es el resultado de movimientos y acciones interinstitucionales de fomento a la investigación que reúnen investigadores de las más diversas áreas del conocimiento y de diferentes Instituciones de Educación Superior públicas y privadas a escala nacional e internacional. Su objetivo es integrar acciones interinstitucionales nacionales e internacionales con redes de investigación orientadas a fomentar la formación continua de los profesionales de la educación a través de la producción y socialización del conocimiento en las diversas áreas del Conocimiento. Agradecemos a los autores por su compromiso, disponibilidad y dedicación para el desarrollo y conclusión de este trabajo. También esperamos que este trabajo sirva como herramienta didáctico-pedagógica para estudiantes, profesores de diferentes niveles de enseñanza en su trabajo y otros interesados en el tema.

Educación e inteligencia artificial: retos y diálogos en la época contemporánea

Educação e inteligência artificial: desafios e diálogos na contemporaneidade /
Organização de Walmir Fernandes Pereira. – Guarujá-SP: Científica Digital, 2024

Texto completo

Este trabajo es el resultado de un proceso de colaboración entre profesores, estudiantes e investigadores que destacaron y cualificaron las discusiones en este espacio de formación. También es el resultado de movimientos y acciones interinstitucionales de fomento a la investigación que reúnen investigadores de las más diversas áreas del conocimiento y de diferentes Instituciones de Educación Superior públicas y privadas a escala nacional e internacional. Su objetivo es integrar acciones interinstitucionales nacionales e internacionales con redes de investigación orientadas a fomentar la formación continua de los profesionales de la educación a través de la producción y socialización del conocimiento en las diversas áreas del Conocimiento. Agradecemos a los autores por su compromiso, disponibilidad y dedicación para el desarrollo y conclusión de este trabajo. También esperamos que este trabajo sirva como herramienta didáctico-pedagógica para estudiantes, profesores de diferentes niveles de enseñanza en su trabajo y otros interesados en el tema.

Bitácora de herramienta digitales: la inteligencia artificial en la investigación y las producciones académicas

Bitácora de herramienta digitales: la inteligencia artificial en la investigación y las producciones académicas / Jhonatan Hinojosa Mamani, Edison Catacora Lucana, Javier Elías Mamani Gamarra. – Guarujá-SP: Científica Digital, 2024.

Texto completo

En el transcurso de esta travesía por la convergencia entre la inteligencia artificial y la investigación científica, nos sumergimos en las profundidades conceptuales delineadas por pensadores que han esbozado las complejidades de este terreno intrincado. Seremos orientados por las teorías que han moldeado nuestra apreciación de cómo las herramientas digitales, potenciadas por la inteligencia artificial, reestructuran los cimientos esenciales de la investigación científica. Este análisis crítico nos invita a explorar las intersecciones entre el desarrollo tecnológico y las metodologías científicas, desentrañando la influencia de la inteligencia artificial en la evolución misma de la investigación y sus implicaciones epistemológicas.

Proyecto de tesis: guía práctica para investigación cuantitativa

Hinojosa Mamani, J, Mamani Gamarra, JE, Catacora Lucana, E. Proyecto de tesis: guía práctica para investigación cuantitativa. Editora Científica Digital, 2024

Texto completo

En la actualidad, es habitual escuchar la palabra proyecto en referencia a diversas actividades cotidianas. Por ejemplo, escuchamos a un arquitecto hablar sobre el proyecto de un edificio que tiene la intención de construir, a un empresario analizar detenidamente el proyecto de expansión de su empresa y a amigos discutir emocionados el proyecto de un viaje pendiente, entre otras situaciones comunes. En este contexto, el término «proyecto» en su sentido genérico se refiere principalmente a la planificación de una iniciativa.

Una revista científica publica una rata generada por inteligencia artificial con un pene gigantesco que se aprobó por un comité de revisión científica de Frontiers

Pearson, J. «Scientific Journal Publishes AI-Generated Rat with Gigantic Penis In Worrying Incident». Vice. February 15, 2024. https://www.vice.com/en/article/dy3jbz/scientific-journal-frontiers-publishes-ai-generated-rat-with-gigantic-penis-in-worrying-incident

Una revista científica publicó esta semana un artículo lleno de imágenes generadas por inteligencia artificial (IA) que carecían de sentido, incluyendo un diagrama erróneo de un pene de rata, en un episodio preocupante que refleja cómo la IA generativa está ingresando en la academia con efectos preocupantes.

El artículo, titulado «Funciones celulares de las células madre espermatogénicas en relación con la vía de señalización JAK/STAT«, fue publicado en la revista de acceso abierto Frontiers in Cell Development and Biology por investigadores de la Hospital de Hong Hui y la Universidad Jiaotong en China. Aunque el contenido del artículo en sí podría ser de interés específico para aquellos con un interés particular en las células madre de mamíferos pequeños, las figuras publicadas con el artículo son otra historia completamente diferente.

Una de las figuras incluye un diagrama de un pene de rata disecado, con texto garabateado y etiquetas incorrectas que sugieren que el pene de la rata es más del doble del tamaño de su cuerpo. Otras figuras generadas por IA en el artículo también presentan un abundante sinsentido textual y visual, como diagramas celulares que parecen más pizzas alienígenas que cualquier cosa relacionada con la biología. Es incierto cómo estas imágenes pudieron pasar por el proceso de edición, revisión por pares y publicación.

A pesar de que uno de los revisores del artículo señaló que no era su responsabilidad evaluar la precisión de las imágenes generadas por IA, la política de la revista Frontiers establece que el autor es responsable de verificar la precisión factual de cualquier contenido creado por la tecnología IA generativa. Esta discrepancia resalta la creciente preocupación sobre el manejo de la IA generativa en la investigación académica.

La tendencia creciente de la IA generativa en la academia preocupa a científicos y observadores, y algunas publicaciones, como Nature, han comenzado a adoptar políticas para abordar este problema. Nature, por ejemplo, prohibió el uso de IA generativa para imágenes y figuras en artículos el año pasado, citando riesgos para la integridad científica. Este incidente subraya la necesidad de que la comunidad científica establezca estándares claros y políticas efectivas para abordar los desafíos éticos y de calidad relacionados con el uso de la IA en la investigación.

Bibliotecarios contra las máquinas: ¿Es ChatGPT la encarnación de EMERAC?

Press, Gil. «Librarians Against The Machines: Is ChatGPT The Incarnation Of EMERAC?» Forbes. Accedido 28 de marzo de 2024. https://www.forbes.com/sites/gilpress/2023/04/30/librarians-against-the-machines-is-chatgpt-the-incarnation-of-emerac/.

A través de los años, la automatización ha transformado las bibliotecas, pero también ha abierto nuevas posibilidades de organización y acceso a la información. El surgimiento de ChatGPT y otros Modelos de Lenguaje Grandes (LLM) plantea preguntas sobre el papel futuro de la inteligencia artificial en la búsqueda y comprensión del conocimiento humano, como se ve en un estudio reciente que compara las respuestas de ChatGPT con las de los médicos.

«No pueden construir una máquina para hacer nuestro trabajo; hay demasiadas referencias cruzadas en este lugar», dice la bibliotecaria jefe (Katharine Hepburn) a sus ansiosos colegas del departamento de investigación cuando se contrata a un «ingeniero de métodos» (Spencer Tracy) para «mejorar la relación hombre-hora» en una gran empresa. Al final de la película «Su otra esposa» (Desk Set) (lanzada el 1 de mayo de 1957), demuestra su valía al ganarse, no sólo el corazón del ingeniero, sino también un concurso contra EMERAC, un «cerebro electrónico» del tamaño de una habitación, de aspecto siniestro.

Unos años antes de que los primeros «cerebros electrónicos» empezaran a automatizar el trabajo, Fremont Rider, bibliotecario de la Universidad de Wesleyan, publicó The Scholar and the Future of the Research Library (1944). Calculaba que el tamaño de las bibliotecas universitarias estadounidenses se duplicaba cada dieciséis años. Dado este ritmo de crecimiento, Rider especulaba con que la Biblioteca de Yale en 2040 tendría «aproximadamente 200.000.000 de volúmenes, que ocuparían más de 6.000 millas de estanterías… [requiriendo] una plantilla de catalogación de más de seis mil personas».

Algo parecido a lo que se predijo en los años 30, cuando las centralitas telefónicas automáticas sustituyeron a las centralitas asistidas por operadoras, que en poco tiempo se necesitarían más operadoras que chicas jóvenes aptas para el trabajo.

Esa «predicción» sirvió para justificar la automatización, ya que AT&T tuvo que explicar a sus clientes por qué tenían que hacer el trabajo que antes realizaba otro ser humano. La predicción de Rider sobre las bibliotecas y los bibliotecarios era correcta en cuanto al aumento del volumen de conocimientos almacenados en papel, pero no preveía que los «cerebros electrónicos» automatizarían parte del trabajo del conocimiento y proporcionarían almacenamiento digital para el creciente volumen de información. Y lo que es más importante, proporcionarán mejores medios para encontrar la información pertinente.

El afán por proporcionar a los buscadores de conocimiento el saber que buscan es mucho más antiguo que Google. En 1728, Ephraim Chambers, un fabricante de globos terráqueos londinense, publicó la Cyclopaedia, or, An Universal Dictionary of Arts and Sciences. Fue probablemente el primer intento de relacionar por asociación todos los artículos de una enciclopedia o, más en general, todos los componentes del conocimiento humano. En el prefacio, Chambers explica su innovador sistema de referencias cruzadas:

«Los antiguos lexicógrafos no han intentado nada parecido a una estructura en sus obras; ni parecen haber sido conscientes de que un diccionario era en cierta medida capaz de las ventajas de un discurso continuado. En consecuencia, no vemos nada parecido a un Todo en lo que han hecho …. Nos esforzamos por conseguirlo, considerando las diversas Materias [es decir, temas] no sólo de forma absoluta e independiente, en cuanto a lo que son en sí mismas, sino también de forma relativa, o como se relacionan entre sí. Ambas son tratadas como tantos Todoes, y tantas Partes de un Todo mayor; su Conexión con el cual, es señalada por una Referencia… Se abre una Comunicación entre las varias partes de la Obra; y los varios Artículos son en cierta medida reemplazados en su Orden natural de Ciencia, del cual el Técnico o Alfabético los había removido.»

Y justo antes de la llegada de los «cerebros electrónicos», Vannevar Bush escribió en As We May Think (1945): «Nuestra ineptitud para llegar a los registros se debe en gran medida a la artificialidad de los sistemas de indexación… La selección [es decir, la recuperación de información] por asociación, más que por indexación, aún puede mecanizarse».

¿Nos proporcionarán los «cerebros electrónicos» la recuperación de información por asociación? ¿Ayudarán a los bibliotecarios o servirán para sustituirlos?

En la década de 1960, la «amenaza» que suponían los ordenadores y la automatización para las bibliotecas se convirtió en una de las principales preocupaciones de los bibliotecarios. Paul Wasserman abría The Librarian and the Machine (1965) con la siguiente declaración: «Como si no fuera ya un problema suficiente para los administradores de bibliotecas que se esfuerzan por responder a las innumerables presiones e infinitas complejidades…. Un terror más nuevo e incluso más premonitorio [cursiva mía] … empezaba a emerger con mayor claridad. Me refiero al ordenador y al aparato de apoyo que lo acompaña».

Pero, al igual que Desk Set, su conclusión al final de su estudio de un año de duración es reconfortante: «Las máquinas pueden hacer hoy gran parte del trabajo del hombre con mayor rapidez y eficacia; pero no pueden hacer tan bien su trabajo intelectual».

¿Por qué era -y sigue siendo- siquiera concebible que un ordenador pueda hacer el trabajo del hombre, o más estrechamente, sustituir a un bibliotecario? ¿Porque la mayoría de nosotros suscribe fervientemente la alucinación de la «inteligencia general artificial» (AGI)? ¿Por nuestra «fascinación morbosa por la última forma de tecnología», por utilizar otra declaración de Wasserman en 1965?

En la película «Su otra esposa», en particular la afirmación sobre las referencias cruzadas, ha servido de fuente de inspiración y de grito de guerra para los bibliotecarios en sus encuentros con la creciente automatización y digitalización. Lo conocí cuando me incorporé en 1988 al departamento de investigación corporativa, parte de una magnífica red mundial de bibliotecas, de uno de los principales proveedores de «cerebros electrónicos», Digital Equipment Corporation (DEC).

El grupo para el que trabajaba no sólo contaba con bibliotecarios y muchos conocimientos en papel, sino también con información digitalizada y un equipo de expertos en recuperación de información (lo que diez años después empezamos a llamar «búsqueda»). Gestionaban una base de datos de artículos nuevos digitalizados («sistema de información competitiva» o SIC) y desarrollaron un software de búsqueda en bases de datos -lo que hoy llamamos «IA»- que podía distinguir entre «DEC» como nombre de la empresa y «Dec» como abreviatura de diciembre.

Tim Berners-Lee, preocupado como Bush y Chambers antes que él por la forma en que se organizaba la información, dejó obsoletos este tipo de primeros sistemas de búsqueda. Le entusiasmaba la idea de escapar de la «camisa de fuerza de los sistemas de documentación jerárquicos», escribió Berners-Lee en Weaving the Web: «Al poder referenciar todo con la misma facilidad, la web también podía representar asociaciones entre cosas que podían parecer no relacionadas pero que, por alguna razón, en realidad compartían una relación».

Con este salto imaginativo, Berners-Lee superó un escollo importante para todos los sistemas de recuperación de información anteriores: El sistema de clasificación predefinido en su núcleo. Esta idea era tan contraintuitiva que incluso durante los primeros años de la Web se intentó hacer precisamente eso: Clasificar (y organizar en taxonomías predefinidas) toda la información de la Web.

Google triunfó sobre Yahoo! y otros obsesionados con la taxonomía porque entendió el verdadero espíritu de la web. Los fundadores de Google fueron los primeros en aprovechar la perspicacia de Berners-Lee y construir su negocio de recuperación de información siguiendo de cerca las referencias cruzadas (es decir, los enlaces entre páginas) a medida que ocurrían, y correlacionar la relevancia con la cantidad de referencias cruzadas (es decir, la popularidad de las páginas según la cantidad de otras páginas que enlazaban con ellas).

La automatización, que reemplaza a los bibliotecarios y sus catálogos en fichas, ha sido el corazón del éxito de Google y su obsesión con la «escala», a medida que cada vez más conocimiento previamente basado en papel se digitalizaba y cada vez más información nacía digital.

Pero esta automatización también ha llevado a la ampliación, a apoyar nuestro pensamiento creando una nueva forma de organizar la información del mundo, una que esté más en línea con nuestro proceso de pensamiento y más en línea con el volumen actual de información (valiosa e inútil) que es imposible de catalogar.

Chambers escribió sobre «los beneficios de un discurso continuado». Se refería a la «conversación» entre diferentes conceptos y temas, cómo se relacionan entre sí. ¿Presentan ChatGPT y otros Modelos de Lenguaje Grandes (LLM) una nueva realidad en la que las computadoras y sus sistemas de búsqueda de información conversan con sus usuarios y los incitan a formular consultas más precisas? ¿Y cuánto del «trabajo intelectual» del hombre (y con qué calidad) podrá hacer la inteligencia artificial (IA)?

Aquí hay un ejemplo reciente para considerar, sobre las conversaciones entre pacientes y sus médicos. Un nuevo estudio comparó la calidad y empatía de las respuestas a preguntas de pacientes para médicos vs ChatGPT. «Los resultados para la calidad y empatía de las respuestas de ChatGPT fueron bastante sorprendentes», escribe Eric Topol. En cuanto a la calidad, los evaluadores (ciegos a la fuente) prefirieron la respuesta de ChatGPT el 79% del tiempo. La proporción de respuestas empáticas o muy empáticas fue del 45.1% para el chatbot frente al 4.6% para los médicos.

Topol concluye que los resultados «reflejan nuevas posibilidades emocionantes tanto para médicos como para pacientes que no habíamos visto antes en la historia de la atención médica. Todo está bajo el título general de usar máquinas para hacer que los humanos sean más humanos».

Dudo que las máquinas puedan hacer que los humanos sean más humanos. Pero pueden mejorar todos los tipos de trabajo de conocimiento y pueden mejorar drásticamente nuestras conversaciones con los trabajadores del conocimiento.

Se estima que al menos 60.000 artículos de todos los publicados en 2023 podrían haber sido asistidos por Inteligencia Artificial

Gray, Andrew. «ChatGPT “contamination”: estimating the prevalence of LLMs in the scholarly literature». arXiv, 25 de marzo de 2024. https://doi.org/10.48550/arXiv.2403.16887.

El uso de ChatGPT y herramientas similares de Large Language Model (LLM) en la comunicación académica y la publicación académica ha sido ampliamente discutido desde que se volvieron fácilmente accesibles para una audiencia general a fines de 2022.

Las herramientas de Modelos de Lenguaje Grande (LLM) ofrecen una forma de generar grandes cantidades de texto de calidad razonablemente alta automáticamente, en respuesta a indicaciones humanas. Aunque estas herramientas han estado disponibles durante algunos años, el lanzamiento de ChatGPT 3.5 a finales de 2022, que ofrece una interfaz fácil y amplia publicidad para la herramienta, las hizo disponibles y visibles para el público en general. Desde entonces, ha habido una amplia discusión sobre su uso en las comunicaciones académicas. El entusiasmo inicial de que podrían reemplazar de manera confiable la mayoría de las formas de escritura seria, incluidos los intentos de enumerarlas como autores en documentos, ha sido reemplazado por una comprensión más matizada de sus capacidades y sus considerables limitaciones.

A fines de 2023, las encuestas encontraron que el 30% de los investigadores había utilizado herramientas para ayudar a escribir manuscritos, y muchos editores habían comenzado a ofrecer orientación sobre su uso. Por ejemplo, Wiley permite el uso de herramientas para desarrollar contenido, pero solo si los autores asumen plena responsabilidad por las declaraciones realizadas, y cuando este uso se divulga de manera transparente en el documento. Sin embargo, «las herramientas que se utilizan para mejorar la ortografía, la gramática y la edición general no están incluidas en el alcance de estas pautas».

El uso de LLMs para generar documentos fue ampliamente predicho después del lanzamiento, particularmente en «fábricas de documentos» (Paper Mills) que producen grandes cantidades de artículos de calidad deficiente. Sin embargo, es desafiante evaluar el efecto a gran escala. Algunos elementos distintivos de ChatGPT (como su conocida propensión a «alucinar» referencias) son difíciles de identificar que con el análisis caso por caso, y es probable que sean detectados por editores de todas formas.

Recientes investigaciones han identificado evidencia sólida de que ChatGPT y herramientas similares están siendo utilizados por investigadores para generar revisiones por pares para documentos de conferencias en el campo de la inteligencia artificial. Sin embargo, no se encontraron indicios de un patrón similar en las revisiones por pares para el portafolio de revistas de Nature.

Para identificar potencialmente documentos asistidos por LLM, se han identificado palabras conocidas por estar desproporcionadamente asociadas con textos generados por LLM. Estas palabras pueden ser señales de un aumento en el uso de texto generado por LLM en la literatura en su conjunto.

El estudio ha analizado la prevalencia de ciertas palabras clave y ha encontrado un aumento significativo en el uso de estas palabras en 2023, indicativo del posible uso extendido de LLM en la escritura académica. Se estima que al menos 60.000 artículos publicados en 2023 podrían haber sido asistidos por LLM, representando ligeramente más del 1% de todos los artículos académicos publicados.

Se han observado implicaciones significativas tanto para la integridad de la investigación como para el desarrollo futuro de los LLMs. Es importante abordar estas implicaciones para garantizar la calidad y la integridad de la investigación académica en el futuro.

¿Puede la Inteligencia artificial sustituir a los catalogadores humanos?


La catalogación bibliográfica con inteligencia artificial (IA) mejora y automatiza el proceso de descripción de recursos bibliográficos mediante técnicas como procesamiento del lenguaje natural, clasificación automática y extracción de metadatos. Proyectos como BIBFRAME de la Biblioteca del Congreso de EE. UU., junto con iniciativas de Linked Data, exploran el potencial de la IA para integrar y enriquecer datos bibliográficos en la web semántica.

La catalogación bibliográfica con inteligencia artificial (IA) se refiere al uso de técnicas y algoritmos de IA para mejorar y automatizar el proceso de catalogación de recursos bibliográficos, como libros, artículos, documentos y otros medios de información. Hoy por hoy es posible pedir a ChatGPT que nos elabore una referencia bibliográfica en el formato que deseemos con solo poner la URL del recurso, pero ¿Es posible catalogar un libro con inteligencia artificial?

Estas son algunas formas en que la IA puede contribuir a la catalogación bibliográfica:

  1. Procesamiento del lenguaje natural (PLN): La IA puede analizar el contenido de los documentos utilizando técnicas de PLN para extraer información relevante, como temas, conceptos y términos clave.
  2. Clasificación automática: Los algoritmos de aprendizaje automático pueden clasificar automáticamente los documentos en categorías específicas basadas en su contenido, lo que facilita la organización y recuperación de la información.
  3. Extracción de metadatos: La IA puede identificar y extraer metadatos importantes de los documentos, como el título, autor, fecha de publicación, resumen, palabras clave, etc., lo que facilita la creación de registros bibliográficos completos y precisos.
  4. Normalización y enriquecimiento de datos: Los algoritmos de IA pueden normalizar los datos bibliográficos y enriquecerlos con información adicional, como enlaces a bases de datos externas, imágenes de portadas, reseñas de usuarios, etc.
  5. Asistencia en la asignación de materias: La IA puede ayudar en la asignación de términos de materias o encabezamientos de materias a los documentos, lo que mejora la precisión y coherencia de la catalogación temática.
  6. Detección de duplicados: Los algoritmos de IA pueden identificar duplicados y variantes de registros bibliográficos, lo que ayuda a mantener una base de datos bibliográfica limpia y libre de redundancias.

En todo el mundo, hay varios proyectos que están explorando el uso de inteligencia artificial en la catalogación bibliográfica y la gestión de información. Uno de estos proyectos es el Proyecto BIBFRAME, liderado por la Biblioteca del Congreso de los Estados Unidos. BIBFRAME (Bibliographic Framework Initiative) se centra en el desarrollo de un modelo de datos diseñado para reemplazar el formato MARC tradicional. Este modelo busca ser más compatible con la web semántica y permitir la integración de datos bibliográficos con otros recursos en línea. Dentro del proyecto BIBFRAME, se están realizando investigaciones sobre el uso de inteligencia artificial para mejorar la descripción y catalogación de recursos, lo que promete una gestión más eficiente y precisa de la información bibliográfica.

Además, existen proyectos de Linked Data en diversos lugares del mundo que están explorando el potencial de esta tecnología para mejorar la catalogación y la recuperación de información. Estos proyectos aprovechan las tecnologías de Linked Data para enriquecer y vincular datos bibliográficos con otros conjuntos de datos en la web. Ejemplos notables incluyen el proyecto Europeana y el Proyecto DBpedia, que están trabajando en la creación de infraestructuras para facilitar el acceso y la interoperabilidad de los datos bibliográficos a nivel mundial.

Asimismo, muchas bibliotecas están implementando sistemas de automatización que utilizan inteligencia artificial para mejorar la eficiencia de la catalogación y la gestión de colecciones. Estos sistemas incluyen herramientas de procesamiento del lenguaje natural para analizar y extraer metadatos de los documentos, así como algoritmos de aprendizaje automático para la clasificación y asignación de términos de sujetos. Esta automatización no solo agiliza el proceso de catalogación, sino que también mejora la calidad y coherencia de los registros bibliográficos, lo que beneficia tanto a los usuarios como a los profesionales de la información. En resumen, estos proyectos representan avances significativos en el uso de la inteligencia artificial para mejorar la gestión y el acceso a la información bibliográfica en todo el mundo.

El artículo «From ChatGPT to CatGPT: The Implications of Artificial Intelligence on Library Cataloging» de Richard Brzustowicz, publicado en «Information Technology and Libraries» en septiembre de 2023, explora el potencial de los modelos de lenguaje como ChatGPT para transformar la catalogación bibliotecaria. El autor demuestra, a través de experimentos con ChatGPT, su capacidad para generar registros MARC precisos utilizando RDA y otros estándares como Dublin Core Metadata Element Set. Si bien estos resultados muestran el potencial de ChatGPT para agilizar el proceso de creación de registros, también plantean cuestiones importantes relacionadas con los derechos de propiedad intelectual y el sesgo.

Aunque, si bien la inteligencia artificial (IA) puede automatizar muchas tareas asociadas con la catalogación bibliográfica, reemplazar completamente al catalogador humano con IA no es una perspectiva realista en el corto plazo. La catalogación bibliográfica requiere de un profundo entendimiento de los principios de la organización de la información, así como de la capacidad para interpretar contextos y comprender la semántica de los documentos. Aunque la IA puede ayudar en tareas específicas como la extracción de metadatos o la asignación de materias todavía hay aspectos del proceso de catalogación que requieren el juicio y la experiencia humanos.

En lugar de sustituir a los catalogadores humanos, la IA puede complementar su trabajo al automatizar tareas rutinarias y repetitivas, permitiéndoles concentrarse en actividades de mayor valor agregado, como la selección de recursos, la gestión de colecciones y la mejora de servicios de información para los usuarios. Por lo tanto, la IA puede ser una herramienta poderosa para mejorar la eficiencia y la precisión de la catalogación bibliográfica, pero no reemplazar completamente el papel del catalogador humano.

Bibliografía:

Tella, Adeyinka, Oluwole Akanmu Odunola, y Lawal W. O. «Cataloguing and Classification in the Era of Artificial Intelligence: Benefits, and Challenges from the Perspective of Cataloguing Librarians in Oyo State, Nigeria». Vjesnik Bibliotekara Hrvatske 66, n.o 1 (16 de mayo de 2023): 159-76. https://hrcak.srce.hr/clanak/448378

Brzustowicz, Richard. «From ChatGPT to CatGPT: The Implications of Artificial Intelligence on Library Cataloging». Information Technology and Libraries 42 (18 de septiembre de 2023). https://doi.org/10.5860/ital.v42i3.16295.

Eito Brun, Ricardo. «Inteligencia artificial, aprendizaje automático y control bibliográfico. Números cortos de la DDC – Hacia una clasificación basada en máquinas | Biblioteca Nacional de España». Accedido 28 de marzo de 2024. https://www.bne.es/es/blog/biblioteconomia/2022/05/23/inteligencia-artificial-aprendizaje-automatico-y-control-bibliografico-numeros-cortos-de-la-ddc-hacia-una-clasificacion-basada-en-maquinas.

«Inteligencia artificial en bibliotecas: oportunidades como usuarios, y posibles contribuciones | Biblioteca Nacional de España». Accedido 28 de marzo de 2024. https://www.bne.es/es/blog/biblioteconomia/2021/07/09/inteligencia-artificial-en-bibliotecas-oportunidades-como-usuarios-y-posibles-contribuciones.

Lowagie, Hannes. «One Automatic Cataloging Flow: Tests and First Results», 25 de julio de 2023. https://repository.ifla.org/handle/123456789/2686.

Miksa, Shawne D. «Cataloging Principles and Objectives: History and Development». Cataloging & Classification Quarterly 59, n.o 2-3 (13 de abril de 2021): 97-128. https://doi.org/10.1080/01639374.2021.1883173.

Mödden, Elisabeth «El impacto de la inteligencia artificial en las Bibliotecas Nacionales. – Asociación ABINIA», 28 de agosto de 2023. https://asociacionabinia.org/el-impacto-de-la-inteligencia-artificial-en-las-bibliotecas-nacionales/.

Directrices vivas sobre el uso responsable de la IA generativa en la investigación

Living guidelines on the responsible use of generative AI in research: ERA Forum
Stakeholders’ document. European Commission, 2024

Texto completo

La inteligencia artificial (IA) ha permeado nuestras vidas, transformando cómo vivimos y trabajamos. En los últimos años, ha ocurrido una aceleración rápida y disruptiva del progreso en IA, impulsada por avances significativos en la disponibilidad generalizada de datos, poder de cómputo y aprendizaje automático. Se han logrado avances notables, en particular, en el desarrollo de modelos fundamentales, es decir, modelos de IA entrenados en volúmenes extensos de datos no etiquetados. Esta innovación ha dado lugar a lo que se conoce como ‘IA de propósito general’, capaz de realizar una amplia gama de tareas, incluida la generación de diversos tipos de contenido nuevo (texto, código, datos, imágenes, música, voz, videos, etc.), comúnmente denominado ‘IA generativa’, generalmente basado en instrucciones (también conocidas como indicaciones) proporcionadas por el usuario. La calidad de la salida producida por estos modelos es tal que es difícil distinguirla del contenido generado por humanos.

La adopción generalizada y rápida de la IA generativa está creando mucha atención y amplias respuestas políticas e institucionales. La UE está liderando a nivel mundial con la Ley de IA, y se están llevando a cabo otros esfuerzos de gobernanza internacional. Estos incluyen el proceso de Hiroshima liderado por el G7 o la Declaración de Bletchley firmada después de la Cumbre de Seguridad de la IA.

La investigación es uno de los sectores que podría ser más significativamente interrumpido por la IA generativa. La IA tiene un gran potencial para acelerar el descubrimiento científico y mejorar la efectividad y el ritmo de los procesos de investigación y verificación. Ejemplos positivos del uso de estas herramientas por parte de los investigadores incluyen el apoyo a hablantes no nativos en la producción de textos en múltiples idiomas, la producción de resúmenes de texto a partir de diferentes fuentes en corpus extremadamente grandes de manera rápida y la recuperación automática y contextualización de un amplio cuerpo de conocimiento. Sin embargo, la tecnología también entraña el riesgo de abuso. Algunos riesgos se deben a las limitaciones técnicas de la herramienta, y otros tienen que ver con el uso (intencional o no intencional) de la herramienta de maneras que erosionan las prácticas de investigación sólidas. Otros riesgos para la investigación en Europa podrían derivarse de la naturaleza propietaria de algunas de las herramientas (por ejemplo, falta de apertura, tarifas para acceder al servicio, uso de datos de entrada) o de la concentración de propiedad.

El impacto de la IA generativa en la investigación y en varios aspectos del proceso científico requiere reflexión, por ejemplo, al trabajar con texto (resumir documentos, hacer lluvias de ideas o explorar ideas, redactar o traducir). En muchos aspectos, estas herramientas podrían dañar la integridad de la investigación y plantear preguntas sobre la capacidad de los modelos actuales para combatir prácticas científicas engañosas y desinformación.