Archivo de la categoría: Tecnologías de la información

El 95,7% de las principales revistas prohíben la inclusión de la Inteligencia Artificial Generativa como autor.

Ganjavi, Conner, Michael B. Eppler, Asli Pekcan, Brett Biedermann, Andre Abreu, Gary S. Collins, Inderbir S. Gill, y Giovanni E. Cacciamani. «Bibliometric Analysis of Publisher and Journal Instructions to Authors on Generative-AI in Academic and Scientific Publishing». arXiv, 21 de julio de 2023. https://doi.org/10.48550/arXiv.2307.11918.

El objetivo de esta investigación consiste en analizar las normas y orientaciones proporcionadas a los autores acerca del uso de herramientas basadas en Generative-AI (IAG), Generative Pretrained Models (GPTs) y Large Language Models (LLMs) en las 100 principales editoriales y revistas académicas de ciencias. Para llevar a cabo este estudio, se examinaron los sitios web de estas editoriales y revistas en el período comprendido entre el 19 y el 20 de mayo de 2023.

Entre las 100 editoriales más importantes, el 17% ofrecía orientación sobre el uso de IAG, de las cuales 12 (70,6%) se encontraban dentro de las 25 primeras. Además, el 95,7% de las revistas prohiben la inclusión de IAG como autor. Cuatro revistas (5,7%) tienen una prohibición explícita del uso de IAG para generar un manuscrito, mientras que 3 (17,6%) editores y 15 (21,4%) revistas indicaron que sus orientaciones solo se aplican al proceso de redacción.

En cuanto a la divulgación del uso de IAG, el 42,8% de las editoriales y el 44,3% de las revistas incluyeron criterios específicos. Hubo diversidad en la orientación sobre dónde incluir el uso de IAG, incluyendo los métodos, agradecimientos, carta de presentación o una nueva sección. También se observó variabilidad en la accesibilidad de las orientaciones sobre IAG y en la vinculación de estas instrucciones entre las revistas y editoriales y sus autores.

Además, algunas de las principales editoriales y revistas carecen de orientaciones sobre el uso de IAG por parte de los autores. Entre las que sí proporcionan orientación, existe una heterogeneidad significativa en los usos permitidos de la IAG y en la forma de revelar su utilización, persistiendo esta heterogeneidad incluso entre editoriales y revistas afiliadas en algunos casos.

La falta de normalización representa una problema para los autores y podría limitar la eficacia de estas directrices. Por lo tanto, se requieren directrices normalizadas para salvaguardar la integridad de la producción científica en un contexto donde la popularidad de la IAG sigue en aumento.

El Mercado del software para bibliotecas registra un aumento de la asistencia, los productos se mantienen y crece el interés por la IA

Breeding, Marshal «Trending Upward: Library Marketplace sees an attendance boost, mainstay products, and growing interest in AI», American Libraries Magazine. 19 de julio de 2023. https://americanlibrariesmagazine.org/?p=139205.

Con un total de 15.851 inscritos y casi 600 proveedores representados, la Conferencia y Exposición Anual 2023 de la American Library Association (ALA) (22-27 de junio) en Chicago siguió avanzando hacia las cifras de asistencia prepandémicas. El Library Marketplace, que sigue siendo el mayor encuentro del mundo de productos y servicios para bibliotecas de todo tipo, ofrece un lugar único para que los asistentes se pongan en contacto con los representantes de las empresas.

Desde enérgicas demostraciones y mascotas hasta regalos y juegos, los proveedores siguen invirtiendo en sus espacios de exposición para tener la oportunidad de interactuar con clientes actuales y potenciales. Además, muchas empresas actúan como patrocinadores, contribuyendo al éxito general de la Conferencia Anual y de la Asociación.

Aunque éste no ha sido un año de noticias de última hora en el sector de la tecnología bibliotecaria -las fusiones y adquisiciones parecen estar en un período de calma-, los proveedores han demostrado los avances y progresos graduales que han realizado en productos nuevos y emblemáticos.

Gestión de libros y material físico

Los pasillos dedicados a las editoriales estaban repletos de gente, que hacía cola para conseguir autógrafos y ejemplares de los últimos títulos. En los stands había desde grandes conglomerados mundiales hasta pequeños sellos independientes. Su popularidad puso de manifiesto que los libros impresos siguen reinando en las bibliotecas.

A pocos pasillos de distancia, los vendedores de tecnologías y productos que ayudan a las bibliotecas a gestionar libros y materiales físicos mostraron sus ofertas. Bibliotheca ofrece una amplia variedad de equipos de manipulación automatizada de materiales (AMH), incluidos quioscos de autoservicio y devolución, taquillas inteligentes y otras soluciones para optimizar las operaciones. Los productos de la empresa se integran con su servicio de préstamo digital cloudLibrary.

Lyngsoe Systems también ofrece una amplia gama de soluciones de gestión de materiales, incluidos sistemas de clasificación centralizada a gran escala. El sistema inteligente de gestión de material de la empresa es interoperable con muchos productos de sistemas integrados de bibliotecas (ILS), lo que permite un modelo eficiente de colecciones flotantes.

Otros proveedores que mostraron soluciones de gestión de inventario fueron Arcus, una solución RFID basada en la nube de la empresa australiana Adilam Technologies; FE Technologies, que presentó su sistema de taquillas inteligentes; mk Solutions, fabricante de los productos de autoservicio LibDispenser, LibLocker y Open Library; y D-Tech, con su amplia gama de productos AMH, incluidas las taquillas inteligentes (smart lockers).

Las taquillas inteligentes para bibliotecas son una solución tecnológica cada vez más popular que mejora la experiencia de los usuarios y el funcionamiento de las bibliotecas. Estas taquillas se utilizan para facilitar el proceso de préstamo y devolución de libros u otros materiales de la biblioteca de manera automatizada y sin necesidad de la intervención de personal bibliotecario.

Meescan mostró sus sistemas de autofacturación basados en la nube. EnvisionWare mostró sus productos, incluidos quioscos de autoservicio, sistemas informáticos y de reserva de salas, soluciones de procesamiento de pagos y otras herramientas de apoyo a las operaciones. Farber Specialty Vehicles estuvo presente para hablar con el personal de las bibliotecas sobre las configuraciones de los bibliobuses.

Las colecciones impresas necesitan una infraestructura especializada. LBS (Library Bureau Steel) expuso sus estanterías para bibliotecas, paneles terminales y productos relacionados. Iron Mountain y Clancy Relocation and Logistics promocionaron sus servicios para ayudar a las bibliotecas con el almacenamiento externo. Ziffit (parte de The World of Books Group) y Better World Books (propiedad de Internet Archive) mostraron a los bibliotecarios cómo pueden dar nueva vida a los materiales impresos a medida que salen de las colecciones, mediante la reventa y la donación.

Soluciones para contenidos y servicios digitales

Aunque los libros físicos siguen siendo un pilar básico, el interés por los libros electrónicos y otros contenidos digitales sigue creciendo. OverDrive, líder entre las bibliotecas públicas, ofrece a sus usuarios libros electrónicos de varias editoriales a través de sus aplicaciones Libby y Sora. Los competidores Bibliotheca (que fabrica cloudLibrary) y Baker & Taylor (que fabrica Axis 360) complementan la oferta de OverDrive en este ámbito.

Hoopla, una plataforma de streaming de Midwest Tape, mostró su colección de audiolibros, películas y música. Los visitantes del stand de Library Ideas conocieron los servicios de contenidos de la empresa, como Freegal (para música), iVox (para libros de cuentos inmersivos) y Freading (para préstamo de libros electrónicos).

Los principales proveedores y distribuidores de contenidos académicos -de gran interés para las bibliotecas universitarias y de investigación- estuvieron bien representados en el recinto ferial. Entre las editoriales con presencia destacada figuraban Elsevier, Oxford University Press, Sage, Springer Nature, Taylor & Francis y Wiley.

Además de las colecciones de fuentes primarias, Gale presentó sus bases de datos de literatura y negocios, colecciones de libros electrónicos y soluciones de aprendizaje. Coherent Digital destacó sus principales colecciones (entre ellas Africa Commons, History Commons y Policy Commons), junto con sus recientemente adquiridos Archivos Accesibles. Oable, una aplicación desarrollada por Knowledge Unlatched, ayuda a las instituciones a gestionar sus recursos de acceso abierto. ITHAKA, empresa matriz de la plataforma de revistas digitales JSTOR, el servicio de preservación digital Portico y la división de consultoría e investigación Ithaka S+R, ha integrado JSTOR con su plataforma Artstor para imágenes y otros soportes.

En los últimos años, las bibliotecas han redoblado sus esfuerzos por mejorar el acceso a los contenidos digitales, lo que ha suscitado un mayor interés por los equipos avanzados de digitalización. En su stand, DLSG (Digital Library Systems Group) presentó una amplia muestra de documentos históricos conservados a través de programas de digitalización de bibliotecas. Los escáneres BSCAN de la empresa facilitan el préstamo interbibliotecario y la entrega de documentos. Image Access, empresa matriz de DLSG, fabrica las populares series de escáneres de libros Bookeye y Click, equipos de digitalización de gran formato WideTEK y herramientas de flujo de trabajo para la digitalización rápida de materiales.

Indus International promocionó su escáner robotizado de paso de páginas que facilita la rápida digitalización de libros con una intervención mínima del operador. AM (parte de Sage y anteriormente conocida como Adam Matthew Digital) ofrece AM Quartex como solución integral para crear, gestionar y permitir el acceso a colecciones digitales. La empresa también concede licencias de acceso a su propio conjunto de recursos de fuentes primarias.

Más allá del LSP y el ILS

En el ámbito de los sistemas bibliotecarios, se presentó una interesante mezcla de opciones, incluidos productos patentados de larga tradición, servicios y soporte para soluciones de código abierto y complementos que mejoran las plataformas existentes.

Clarivate presentó varios productos de sus empresas adquiridas: Ex Libris mostró sus emblemáticas plataformas de servicios bibliotecarios Alma y Primo, así como Rapido, su aplicación para compartir recursos, y Leganto, un sistema de gestión de listas de recursos. Innovative presentó los nuevos productos Vega para el descubrimiento y la captación de clientes, que se integran con sus sistemas de información bibliotecaria Polaris y Sierra. ProQuest promocionó una amplia gama de bases de datos y colecciones de fuentes primarias, junto con su plataforma de libros electrónicos.

EBSCO Information Services destacó los servicios para FOLIO LSP de código abierto y los componentes que hacen de EBSCO FOLIO una opción completa para las bibliotecas universitarias. EBSCO también mostró su EBSCO Discovery Service, las bases de datos EBSCOhost y los servicios de suscripción a revistas.

SirsiDynix mostró su CloudSource OA -una solución de descubrimiento que optimiza el contenido de acceso abierto y los recursos educativos abiertos- además de su Symphony ILS y la suite de aplicaciones BLUEcloud.

The Library Corporation (TLC) ofrece los productos Library-Solution y CARL-X ILS. TLC expuso junto con su filial Tech Logic, especializada en equipos AMH, soluciones de autoservicio y otras tecnologías basadas en RFID.

Otros proveedores de ILS presentes en la sala de exposiciones fueron LibLime, que mostró su ILS Bibliovation; Auto-Graphics, que presentó su ILS VERSO y la plataforma de intercambio de recursos SHAREit; y Millonex, que mostró su ILS Simplicity orientado a las bibliotecas públicas.

Lyrasis es una organización sin ánimo de lucro que apoya el software de código abierto y las iniciativas impulsadas por la comunidad. Esto incluye el Proyecto Palace, una plataforma de libros electrónicos de código abierto y un mercado para la concesión de licencias de títulos. Lyrasis también apoya los proyectos de código abierto ArchivesSpace, BiblioLabs, DSpace, Fedora y Vivo.

Los visitantes del stand de OCLC conocieron los numerosos productos y servicios que ofrece la organización sin ánimo de lucro en nombre de la comunidad bibliotecaria en general. Además de WorldCat, el catálogo bibliotecario más grande del mundo, OCLC ofrece WorldShare Management Services y OCLC Wise para ayudar a las bibliotecas a administrar sus colecciones locales. La organización también presentó sus investigaciones e informes que apoyan la misión de las bibliotecas.

Muchos proveedores mostraron productos que se integran con los sistemas de gestión de bibliotecas o los mejoran. Shoutbomb ofrece un servicio de mensajería de texto interoperable con cualquier producto ILS, así como su servicio Text4Literacy, que permite a bibliotecas y escuelas enviar recordatorios a las familias para la lectura y otras actividades de alfabetización. StackMap promocionó herramientas para cartografiar espacios interiores y crear guías de orientación que ayuden a los usuarios a encontrar mejor los materiales.

Servicios para colecciones impresas y digitales

Otra categoría de proveedores se centra en la prestación de servicios de apoyo a la catalogación y otras operaciones bibliotecarias. Además de su mercado en línea para materiales bibliotecarios y el servicio de préstamo digital Axis 360, Baker & Taylor ha lanzado y mejorado recientemente su servicio de catalogación BTCat.

MARCIVE y Backstage Library Works ofrecen una amplia gama de servicios de catalogación, procesamiento de autoridades y proyectos de limpieza de bases de datos. Midwest Library Service ofrece servicios de desarrollo de colecciones, adquisiciones y catalogación. WT Cox Information Services presentó sus servicios de suscripción a publicaciones seriadas electrónicas e impresas.

Recollect, una empresa neozelandesa que exponía por primera vez en Annual, ofrece un sistema de gestión de colecciones digitales muy orientado a la participación de la comunidad.

Los usuarios de las bibliotecas en el punto de mira

Las tecnologías diseñadas para mejorar la experiencia del usuario de la biblioteca están muy solicitadas. BiblioCommons mostró sus últimas versiones de BiblioCore (una interfaz de descubrimiento), BiblioWeb (un entorno para desplegar sitios web), BiblioEvents (para gestionar y promocionar los programas de la biblioteca) y BiblioApps (para crear aplicaciones móviles para bibliotecas).

Library Market mostró su producto LibraryWebsite, que proporciona a los clientes una plantilla de sitio web moderna e intuitiva que puede actualizarse y mantenerse fácilmente. La empresa también ofrece LibraryCalendar para gestionar eventos y programar salas.

Communico presentó una vez más su remolque Tiny Library, un recinto que muestra el conjunto integrado de aplicaciones basadas en la nube de la empresa para servicios orientados a los usuarios. SOLUS mostró las últimas versiones de sus aplicaciones móviles e interfaces de descubrimiento.

Los proveedores también se centraron en productos que invitan a los usuarios a interactuar físicamente con la biblioteca. En el stand de Short Édition se presentó el Short Story Dispenser, un quiosco autónomo que imprime obras de ficción, no ficción y poemas y está pensado para instalarse en espacios públicos. International Library Services expuso sus quioscos AutoLend, que pueden colocarse fuera del edificio de la biblioteca y permiten a los usuarios consultar, guardar, tomar prestados y devolver materiales.

Crece el interés por la IA

El interés por la inteligencia artificial (IA) se ha disparado en el último año, impulsado por ChatGPT y otros servicios de IA generativa. Esta tecnología se está abriendo paso rápidamente en el ámbito bibliotecario.

Justo antes de la conferencia, Clarivate anunció una importante asociación con AI21 Labs, una empresa especializada en el procesamiento del lenguaje natural. Clarivate planea entrenar los componentes de AI21 en sus vastos activos de contenido para potenciar nuevos servicios en todas sus líneas de productos.

LibraryThing invitó a los visitantes del stand a probar Talpa Search, un catálogo bibliotecario basado en IA con una interfaz conversacional que pretende identificar artículos que no se encuentran fácilmente a través de las interfaces tradicionales basadas en palabras clave. Este catálogo experimental aún no se ofrece como producto, pero demuestra el potencial de la IA para transformar las búsquedas en bibliotecas.

OCLC mostró una versión beta de una función de recomendación de libros generada por IA en WorldCat. La función utiliza el servicio LibKey Discovery de Third Iron para conectar a los usuarios con artículos académicos. Third Iron también ofrece BrowZine, una interfaz fácil de usar para navegar y leer revistas electrónicas.

LaptopsAnytime, una empresa que ofrece quioscos de compra de portátiles en muchas configuraciones diferentes, hizo una demostración de su quiosco informático BRAINY. Este prototipo temático de IA permitía a los asistentes a la conferencia introducir sus propios mensajes de ChatGPT y DALL-E 2.

Oportunidades de aprendizaje y formación

Otro grupo de proveedores destacó los servicios de aprendizaje y formación continua que las bibliotecas pueden ofrecer a sus usuarios y empleados.

Brainfuse presentó una amplia selección de opciones de tutoría y ayuda con los deberes en línea diseñadas para bibliotecas, escuelas e instituciones de enseñanza superior. Asimismo, Mango presentó su plataforma de aprendizaje de idiomas. Las bibliotecas y organizaciones educativas pueden adquirir licencias de los más de 70 cursos de idiomas de Mango para sus usuarios y estudiantes.

Los cursos en línea de Library Juice Academy ofrecen desarrollo profesional para todo tipo de trabajadores de bibliotecas. Los visitantes del stand de Girls Who Code se informaron sobre la misión de la organización para ayudar a cerrar la brecha de género en la industria de la tecnología y cómo las bibliotecas pueden asociarse con ellos para establecer clubes en sus comunidades.

Hacer que las métricas cuenten

En esta era de toma de decisiones basada en datos, los productos que permiten a las bibliotecas medir y analizar el rendimiento son de gran interés.

LibraryIQ ha desarrollado una plataforma que recopila datos y proporciona informes y visualizaciones de una amplia gama de métricas de funcionamiento de las bibliotecas. Asimismo, Counting Opinions está especializada en ayudar a las bibliotecas a recopilar y analizar estadísticas operativas a través de sus portales LibPAS y LibStat. SimplyAnalytics presentó su plataforma web de visualización, cartografía y análisis de datos, utilizada por bibliotecas, instituciones educativas y empresas.

SenSource ha desarrollado una tecnología de sensores especializados que cuenta personas en edificios, transmite estos datos a los sistemas pertinentes y crea visualizaciones de la actividad de las multitudes. El producto se ha aplicado en muchos sectores, además de las bibliotecas. TRAF-SYS destacó su servicio de sensores de recuento de personas y el software de control de ocupantes SafeEntry. Ambas empresas utilizan sensores aéreos en lugar de vídeo, lo que evita posibles problemas de privacidad.

El pabellón de exposiciones de este año fue muy concurrido y productivo, con abundantes oportunidades para interactuar con la comunidad de proveedores. La magnitud de la exposición impide mencionar todas las empresas y productos, lo que quizá sea una buena señal para el regreso de Annual. Aunque la gestión de materiales físicos y contenidos digitales sigue siendo una prioridad para las bibliotecas, el interés por los productos de código abierto, orientados a los usuarios y de IA va en aumento.

Enlaces rotos: cómo las páginas web se pierden en el tiempo

Hirsch, Matt. «Link Rot: How Web Pages Are Lost to Time». Bold TV (blog), 15 de junio de 2023. https://boldtv.com/matthew-hirsch/2023/06/15/link-rot-how-web-pages-are-lost-to-time/.

Pérdida de enlaces: Cómo las páginas web se pierden en el tiempo

El 1 de enero de 2023, Internet cumplió 40 años. En los cuarenta años transcurridos desde su creación, los usuarios han subido una cantidad insondable de datos a la red mundial. Sólo en 2022, se subieron a la red 97 zettabytes (97 billones de gigabytes) de datos nuevos. Y esa cifra aumenta cada año. La mayoría considera Internet una especie de Biblioteca de Alejandría moderna. Se pueden encontrar respuestas a (casi) cualquier pregunta. Sin embargo, los enlaces a muchas páginas antiguas ya no funcionan. Estas páginas muertas han sucumbido a un fenómeno conocido como «link rot».

¿Qué causa la pérdida de enlaces y por qué es un problema importante?

Según The Verge, alrededor del 72% de los enlaces generados en 1998 han sucumbido por la rotura de enlaces. Varias razones pueden hacer que una URL (localizador uniforme de recursos) deje de funcionar y muestre el temido mensaje de «error 404». Por ejemplo, el propietario de una página web puede cambiar de host, el nombre del dominio ha caducado o el sitio se ha caído por completo.

Entonces, ¿por qué es un problema la rotura de enlaces? En 2023, nuestras vidas giran en torno a Internet. Según el Pew Research Center, el 85% de los estadounidenses afirma conectarse a Internet a diario. Y casi un tercio afirma utilizar la red constantemente. Y, sobre todo desde los albores de la era de las redes sociales, utilizamos Internet para conectar con amigos y familiares.

En la última década, hemos guardado muchos de nuestros mejores recuerdos en los servidores de Facebook (o de cualquier otra red social). Es probable que pase algún tiempo antes de que nuestros viejos perfiles sigan el camino de los dinosaurios. Sin embargo, es casi inevitable que ocurra (sobre todo si ya no utilizas la plataforma).

La pérdida de enlaces también causa estragos en periodistas, investigadores y académicos que intentan citar material antiguo. Por ejemplo, según Harvard, más del 70% de las páginas web estudiadas en una revista jurídica no enlazan con las fuentes originales. Cerca de la mitad de los enlaces de las opiniones del Tribunal Supremo de Estados Unidos estudiadas estaban rotos. Y cerca de tres cuartas partes de los enlaces examinados por los investigadores conducían a contenidos distintos de los que citaban. Además, un estudio de la Universidad Tecnológica de Nanyang, en Singapur, demostró que el problema afecta sobre todo a los enlaces «.edu», con un 36%.

¿Cómo podemos salvar nuestros datos?

Varias organizaciones y entidades sin ánimo de lucro se dedican a archivar datos antiguos en la Red. Internet Archive es una biblioteca digital fundada por el ingeniero informático Brewster Kahle en 1996. El público puede cargar y descargar libremente datos de su colección. También guarda páginas web antiguas ya desaparecidas y permite a cualquiera acceder a ellas a través de su navegador, Wayback Machine. En 2023, habrá 811 millones de páginas web antiguas archivadas en Wayback Machine.

Y en el ámbito académico, donde la perdidade enlaces es un problema más acuciante, Perma.cc es el servicio de archivo de referencia. Harvard Law School Library Innovation Lab fundó este archivo académico en 2013 como respuesta directa a este problema. Y en 2016, el Instituto de Servicios de Museos y Bibliotecas les concedió una subvención de 700.000 dólares para ampliar Perma.cc. Se diferencia de Wayback Machine en que no utiliza rastreadores web para recorrer Internet.

A nivel individual, lo mejor que puedes hacer para conservar tus recuerdos digitales es almacenarlos fuera de Internet. Las plataformas de redes sociales adoptan cada vez más políticas de eliminación de perfiles inactivos.

La mitad de los estudiantes admite haber utilizado ChatGPT u otras aplicaciones de inteligencia artificial para realizar la mayoría de sus tareas académicas

«Half of College Students Say Using AI Is Cheating | BestColleges». Accedido 21 de julio de 2023. https://www.bestcolleges.com/research/college-students-ai-tools-survey/.

Una encuesta reciente realizada a 1.000 estudiantes universitarios y de posgrado reveló datos alarmantes: el 43% de los estudiantes encuestados admitió haber utilizado ChatGPT u otras aplicaciones de inteligencia artificial similares; el 30% confesó haber recurrido a la inteligencia artificial para realizar la mayoría de sus tareas académicas; y el 17% aceptó haber presentado trabajos de curso generados por la inteligencia artificial sin editarlos o modificarlos. Algo más de la mitad de los estudiantes (51%) son consciente de que utilizar herramientas de IA para realizar trabajos y exámenes se considera trampa o plagio. Dos de cada diez (20%) no están de acuerdo y el resto se muestra neutral.

Entre los estudiantes que afirman haber utilizado herramientas de IA para sus tareas escolares, la mitad (50%) las utiliza para algunas partes, pero realiza la mayor parte por sí mismo. Tres de cada diez (30%) utilizan la IA para la mayor parte de su tarea, y el 17% la utiliza para completar una tarea y entregarla sin modificaciones.

Estos resultados ponen de manifiesto el impacto que la inteligencia artificial está teniendo en el ámbito educativo, pero también resaltan el creciente problema de la deshonestidad académica. La facilidad con la que se puede acceder y utilizar herramientas de IA para hacer trampas plantea desafíos éticos y académicos para las instituciones educativas y los educadores.

Es esencial abordar esta problemática y fomentar la integridad académica entre los estudiantes. Las instituciones educativas deben tomar medidas para concienciar sobre los riesgos de hacer trampas con la IA y promover una cultura de honestidad y responsabilidad en el aprendizaje. Asimismo, es importante desarrollar estrategias de detección y prevención efectivas para abordar esta situación y garantizar la equidad y la legitimidad en la evaluación del rendimiento estudiantil.

Resumen de datos

El 43% de los estudiantes universitarios ha utilizado ChatGPT o una aplicación de IA similar.
De los que han utilizado herramientas de IA, el 50% dice haberlas utilizado para ayudar a completar tareas o exámenes. Esto supone el 22% de todos los universitarios encuestados.
Sin embargo, la mayoría de los estudiantes universitarios (57%) no tienen intención de utilizar o seguir utilizando la IA para completar sus tareas escolares.
El 31% afirma que sus profesores, los materiales del curso o los códigos de honor de la escuela han prohibido explícitamente las herramientas de IA.
Más de la mitad de los estudiantes universitarios (54%) afirma que sus profesores no han hablado abiertamente del uso de herramientas de IA como ChatGPT.
6 de cada 10 universitarios (60%) afirman que sus profesores o centros de enseñanza no han especificado cómo utilizar las herramientas de IA de forma ética o responsable.
El 61% de los estudiantes universitarios cree que las herramientas de IA como ChatGPT se convertirán en la nueva normalidad.

Esta encuesta se llevó a cabo del 6 al 13 de marzo de 2023 y fue realizada por Pure Spectrum. Participaron en la encuesta 1.000 encuestados de todo el país que estaban matriculados en un programa de grado o posgrado presencial, en línea o híbrido. Los encuestados tenían entre 16 y 61 años, la mayoría (94%) entre 16 y 32 años, y estaban cursando estudios de grado, licenciatura, máster, doctorado o formación profesional.

¿Son fiables los detectores de texto generado por Inteligencia artificial?

Hines, Kristi. «Should You Trust An AI Detector?» Search Engine Journal, 18 de julio de 2023. https://www.searchenginejournal.com/should-you-trust-an-ai-detector/491949/.

La IA generativa está ganando terreno y se está utilizando cada vez más para crear diversos tipos de contenidos, como texto, imágenes, música y más. Esto ha llevado a una creciente preocupación sobre la fiabilidad de los detectores de IA para discernir entre contenidos generados por humanos y aquellos creados por algoritmos de inteligencia artificial. Turnitin resultó ser la herramienta más precisa en todos los enfoques, seguida de Compilatio y GPT-2 Output Detector.

Detectar y verificar si un contenido fue generado por una IA o por un ser humano es un desafío en constante evolución. A medida que la tecnología de IA avanza, también lo hacen las técnicas para ocultar la autoría de los contenidos generados por algoritmos. Esto puede plantear problemas en términos de veracidad, credibilidad y confiabilidad de la información que se comparte en línea. Para abordar esta preocupación, se han llevado a cabo diversos estudios para evaluar la eficacia de las herramientas de detección de IA en esta tarea. Estos estudios buscan mejorar y perfeccionar los algoritmos de detección y establecer métricas para evaluar su precisión.

Algunos enfoques utilizan marcadores específicos que pueden identificar ciertas características o patrones que son más comunes en contenidos generados por IA. Otros enfoques buscan analizar el estilo y la estructura de los textos o imágenes para identificar indicios de automatización.

¿Son parciales los detectores de IA? Los investigadores encontraron que los detectores de contenidos de IA, especialmente aquellos diseñados para identificar contenidos generados por modelos de lenguaje como GPT, pueden presentar un sesgo significativo en contra de los escritores no nativos de inglés. El estudio descubrió que estos detectores, diseñados para diferenciar entre contenidos generados por IA y contenidos generados por humanos, clasifican erróneamente muestras de escritura en inglés no nativo como generadas por IA, mientras que identifican con precisión muestras de escritura en inglés nativo.

Utilizando muestras de escritura de escritores nativos y no nativos, los investigadores descubrieron que los detectores clasificaban erróneamente más de la mitad de estas últimas muestras como generadas por IA. Los resultados sugieren que los detectores de GPT pueden penalizar involuntariamente a los escritores con expresiones lingüísticas limitadas, lo que subraya la necesidad de prestar más atención a la equidad y solidez de estas herramientas. Esto podría tener implicaciones significativas, sobre todo en contextos evaluativos o educativos, donde los hablantes no nativos de inglés podrían verse inadvertidamente penalizados.

Los investigadores también destacan la necesidad de seguir investigando para hacer frente a estos sesgos y perfeccionar los métodos de detección actuales para garantizar un panorama digital más equitativo y seguro para todos los usuarios.

En otro estudio sobre texto generado por IA, los investigadores documentan la optimización de ejemplos en contexto basada en la sustitución (SICO), que permite a los grandes modelos lingüísticos (LLM) como ChatGPT eludir la detección de los detectores de texto generado por IA. En el estudio se utilizaron tres tareas para simular situaciones reales de uso de los LLM en las que es crucial detectar el texto generado por IA: redacciones académicas, preguntas y respuestas abiertas y reseñas comerciales.

También se probó SICO frente a seis detectores representativos -incluidos modelos basados en la formación, métodos estadísticos y API- que superaron sistemáticamente a otros métodos en todos los detectores y conjuntos de datos.

Los investigadores comprobaron que SICO era eficaz en todos los escenarios de uso probados. En muchos casos, el texto generado por SICO era indistinguible del texto escrito por humanos. Sin embargo, también pusieron de relieve el posible mal uso de esta tecnología. Dado que SICO puede ayudar a que el texto generado por IA evada la detección, los actores malintencionados también podrían utilizarla para crear información engañosa o falsa que parezca escrita por humanos.

Ambos estudios señalan el ritmo al que el desarrollo de la IA generativa supera al de los detectores de texto de IA, y el segundo hace hincapié en la necesidad de una tecnología de detección más sofisticada.

Los investigadores de un tercer estudio recopilaron estudios anteriores sobre la fiabilidad de los detectores de IA, seguidos de sus datos, y publicaron varias conclusiones sobre estas herramientas.

Aydin & Karaarslan (2022) revelaron que iThenticate, una popular herramienta de detección de plagio, encontró altas tasas de coincidencia con el texto parafraseado por ChatGPT.

Wang et al. (2023) descubrieron que es más difícil detectar código generado por IA que contenido en lenguaje natural. Además, algunas herramientas mostraron sesgos, inclinándose por identificar el texto como generado por IA o escrito por humanos.

Pegoraro et al. (2023) descubrieron que detectar texto generado por ChatGPT es muy difícil, y que la herramienta más eficaz lograba una tasa de éxito inferior al 50%.

Van Oijen (2023) reveló que la precisión global de las herramientas en la detección de texto generado por IA era sólo de alrededor del 28%, y que la mejor herramienta lograba sólo un 50% de precisión. Por el contrario, estas herramientas eran más eficaces (alrededor del 83% de precisión) en la detección de contenido escrito por humanos.

Anderson et al. (2023) observaron que la paráfrasis reducía notablemente la eficacia del detector de salida GPT-2.

Utilizando 14 herramientas de detección de texto generadas por IA, los investigadores crearon varias docenas de casos de prueba en diferentes categorías, entre ellas:

Texto escrito por humanos.
Texto traducido.
Texto generado por IA.
Texto generado por IA con ediciones humanas.
Texto generado por IA con parafraseo de IA.

La mayoría de las herramientas probadas mostraron un sesgo hacia la clasificación precisa del texto escrito por humanos, en comparación con el texto generado o modificado por IA. El estudio destacó también el riesgo de falsas acusaciones y casos no detectados. Los falsos positivos fueron mínimos en la mayoría de las herramientas, excepto en GPT Zero, que presentó una tasa elevada.

Los casos no detectados eran preocupantes, sobre todo en el caso de los textos generados por IA que habían sido editados por personas o parafraseados por máquinas. La mayoría de las herramientas tenían dificultades para detectar este tipo de contenidos, lo que supone una amenaza potencial para la integridad académica y la imparcialidad entre los estudiantes. Turnitin resultó ser la herramienta más precisa en todos los enfoques, seguida de Compilatio y GPT-2 Output Detector.

Los investigadores sugieren que abordar estas limitaciones será crucial para implantar eficazmente herramientas de detección de texto generadas por IA en entornos educativos, garantizando la detección precisa de conductas indebidas y minimizando al mismo tiempo las acusaciones falsas y los casos no detectados.

¿Deberíamos confiar en las herramientas de detección de IA basándose en los resultados de estos estudios? Aunque los detectores de IA han demostrado cierta precisión a la hora de detectar texto generado por IA, también han mostrado sesgos, problemas de usabilidad y vulnerabilidades ante las técnicas de elusión Se necesitan mejoras para corregir los sesgos, aumentar la robustez y garantizar una detección precisa en diferentes contextos. La investigación y el desarrollo continuados son cruciales para fomentar la confianza en los detectores de IA y crear un panorama digital más equitativo y seguro.

Dos autores afirman que OpenAI «ingirió» sus libros para entrenar a ChatGPT, y es posible que se produzca una «oleada» de casos judiciales similares.

Rivera, Gabriel. «2 Authors Say OpenAI “ingested” Their Books to Train ChatGPT. Now They’re Suing, and a “Wave” of Similar Court Cases May Follow.» Business Insider. Accedido 19 de julio de 2023. https://www.businessinsider.com/openai-copyright-lawsuit-authors-chatgpt-trained-on-books-2023-7.

OpenAI se enfrenta a una demanda interpuesta por dos autores de renombre, Mona Awad y Paul Tremblay. Los autores acusan a OpenAI de violar la ley de propiedad intelectual al utilizar sus libros publicados para entrenar ChatGPT, el modelo de lenguaje de OpenAI, sin obtener su consentimiento.

La demanda, presentada a finales de junio, sostiene que el extenso modelo de lenguaje de ChatGPT «ingirió» el contenido protegido por derechos de autor de Mona Awad y Paul Tremblay. Los autores sostienen que la capacidad de ChatGPT para generar resúmenes detallados de sus obras sugiere que sus libros se incluyeron en los conjuntos de datos utilizados para entrenar la tecnología de IA.

Esta acción legal ejemplifica la tensión existente entre los creadores y las herramientas de IA generativa, que tienen la capacidad de producir texto e imágenes en cuestión de segundos. Muchos profesionales que trabajan en campos creativos expresan su preocupación por el impacto potencial del rápido avance de la tecnología en sus carreras y medios de vida. En consecuencia, estas preocupaciones están dando lugar cada vez más a desafíos legales.

Daniel Gervais, profesor de Derecho de la Universidad de Vanderbilt, señaló a Insider que la demanda presentada por los autores es uno de los varios casos de derechos de autor que han surgido en todo el país relacionados con herramientas de IA generativa. Sugiere que pueden surgir disputas legales similares en el futuro.

Gervais espera que muchos más autores demanden a las empresas que desarrollan grandes modelos de lenguaje y generative AI a medida que estos programas avancen y mejoren en la replicación del estilo de escritores y artistas. Él cree que es inminente una avalancha de desafíos legales que apuntan a la producción de herramientas como ChatGPT en todo el país.

Demostrar que los autores en el caso sufrieron daños económicos debido a las prácticas de recolección de datos de OpenAI, como alega la demanda, puede ser un desafío. Gervais dijo a Insider que ChatGPT podría haber obtenido el trabajo de Awad y Tremblay de fuentes alternativas distintas al material original de los autores, pero que era posible que el bot «ingiriera» sus libros como afirma la demanda.

Andres Guadamuz, experto en IA y derechos de autor en la Universidad de Sussex, expresó la misma preocupación, al decir a Insider que incluso si los libros están en los conjuntos de datos de entrenamiento de OpenAI, la compañía podría haber obtenido el trabajo a través de la recopilación legal de otro conjunto de datos.

Y demostrar que ChatGPT se habría comportado de manera diferente si nunca hubiera recopilado el trabajo de los autores es poco probable debido a la gran cantidad de datos que obtiene de la web, según afirmó Guadamuz a The Guardian.

The Authors Guild, un grupo de defensa con sede en Estados Unidos que apoya los derechos laborales de los escritores, publicó una carta abierta la semana pasada instando a los directores ejecutivos de las grandes empresas de tecnología y de IA a «obtener permiso» de los escritores para utilizar su trabajo con derechos de autor en la formación de programas de generative AI y «compensar justamente a los escritores». La organización informó a Insider que su carta ha recibido más de 2,000 firmas.

La demanda de Awad y Tremblay se presentó el mismo día en que OpenAI recibió otra denuncia legal, alegando que la compañía se apropió de «enormes cantidades de datos personales» que luego alimentó a ChatGPT. La denuncia de 157 páginas, que excluye los nombres completos de los 16 demandantes, critica a la compañía por absorber «prácticamente cada pieza de datos intercambiada en Internet que pudo obtener».

En cuanto a la demanda de Awad y Tremblay, presentada en un tribunal de distrito en el norte de California, los autores buscan daños y la restitución de lo que consideran ganancias perdidas.

El archivo de la demanda también presentó documentos que contenían resúmenes producidos por ChatGPT de las novelas de Awad «13 Ways of Looking at a Fat Girl» y «Bunny», así como de la novela de Tremblay «The Cabin at the End of the World». La novela de Tremblay fue adaptada a la película «Knock at the Cabin» dirigida por M. Night Shyamalan.

OpenAI y Awad no respondieron a las solicitudes de comentarios por parte de Insider. Un representante de Tremblay se negó a hacer comentarios.

¿Cómo decide ChatGPT qué debe escribir a continuación?

Sundar, Sindhu. «How Does ChatGPT Decide What to Say next? Here’s a Quick Explainer.» Business Insider. Accedido 17 de julio de 2023. https://www.businessinsider.com/how-ai-chatbots-like-chatgpt-work-explainer-2023-7.

Como modelo de lenguaje basado en IA, ChatGPT toma sus decisiones sobre qué decir a continuación en función de su entrenamiento en un amplio conjunto de datos. Durante el entrenamiento, se expone a enormes cantidades de texto en varios dominios y aprende patrones lingüísticos y contextuales. Cuando se le presenta un nuevo texto o una pregunta, el modelo intenta generar una respuesta coherente basada en la información que ha aprendido.

ChatGPT y otros chatbots basados en inteligencia artificial pueden hablar con frases fluidas y gramaticalmente correctas que incluso pueden tener un ritmo natural. Pero, según los expertos, no hay que confundir ese discurso bien ejecutado con el pensamiento, la emoción o incluso la intención.

Según los expertos, el funcionamiento de un chatbot es mucho más parecido al de una máquina que realiza cálculos matemáticos y análisis estadísticos para invocar las palabras y frases adecuadas según el contexto. Hay mucho entrenamiento en el backend -incluso por parte de anotadores humanos que también le dan retroalimentación- que ayuda a simular conversaciones funcionales.

Los robots como ChatGPT también se entrenan con grandes cantidades de conversaciones que han enseñado a las máquinas a interactuar con usuarios humanos. OpenAI, la empresa que está detrás de ChatGPT, afirma en su sitio web que sus modelos se instruyen a partir de información procedente de diversas fuentes, incluidos sus usuarios y material del que tiene licencia.

El proceso de toma de decisiones de ChatGPT implica una técnica llamada «aprendizaje por refuerzo». Durante el entrenamiento, el modelo es recompensado cuando produce respuestas coherentes y útiles, mientras que es penalizado por generar respuestas incorrectas o incoherentes. Esta retroalimentación ayuda a ajustar los parámetros internos del modelo y mejora su capacidad de generar respuestas pertinentes.

He aquí cómo funcionan estos chatbots:

Los chatbots de IA como ChatGPT de OpenAI se basan en grandes modelos lingüísticos, o LLM, que son programas entrenados en volúmenes de texto obtenidos de escritos publicados e información en línea, generalmente contenidos producidos por humanos.

Según los expertos, los sistemas se entrenan en series de palabras y aprenden la importancia de las palabras de esas series. Así, todo ese conocimiento adquirido no sólo sirve para entrenar grandes modelos lingüísticos sobre información objetiva, sino que les ayuda a adivinar patrones de habla y cómo se suelen utilizar y agrupar las palabras.

Los chatbots también reciben formación adicional de los humanos sobre cómo ofrecer respuestas adecuadas y limitar los mensajes perjudiciales. Cuando se pide a un chatbot que responda a una simple pregunta objetiva, el proceso de respuesta puede ser sencillo: Despliega un conjunto de algoritmos para elegir la frase más probable con la que responder. Y selecciona las mejores respuestas posibles en cuestión de milisegundos y, de entre ellas, presenta una al azar. (Por eso, hacer la misma pregunta varias veces puede generar respuestas ligeramente distintas).

También puede dividir las preguntas en varias partes, responder a cada una de ellas en secuencia y utilizar sus respuestas para terminar de responder.

Pero cuidado con lo que los chatbots no saben

¿Qué pasa cuando le haces una pregunta de la que no sabe la respuesta? Ahí es donde los chatbots crean más problemas debido a una característica inherente: no saben lo que no saben. Así que extrapolan lo que saben, es decir, hacen conjeturas.

Pero no te dicen que están adivinando, sino que simplemente presentan la información como un hecho. Cuando un chatbot inventa información que presenta a un usuario como un hecho, se llama «alucinación».

«Esto es lo que llamamos conocimiento del conocimiento o metacognición», explica William Wang, profesor asociado de informática en la Universidad de California en Santa Bárbara. También es codirector del grupo de procesamiento del lenguaje natural de la universidad.

Una imagen manipulada por IA del Pentágono explotando en llamas causó que bajara el mercado de valores de Estados Unidos

Una imagen con humo negro que se eleva al lado de un edificio de aspecto burocrático se difundió por las redes sociales el lunes por la mañana, con la afirmación de que mostraba una explosión cerca del Pentágono. En cuestión de minutos, una ola de cuentas de redes sociales, incluyendo algunas cuentas verificadas, compartieron la imagen falsa, amplificando aún más la confusión.

La publicación causó un breve sobresalto en el mercado de valores cuando rápidamente fueron recogidas por medios de comunicación fuera de Estados Unidos, antes de que los funcionarios intervinieran para aclarar que en realidad no había ocurrido ninguna explosión y que la foto era falsa.

Los expertos afirman que la imagen viral tenía señales evidentes de ser una falsificación generada por IA, y su popularidad subraya el caos cotidiano que estos programas, cada vez más sofisticados y de fácil acceso, pueden causar.

Hay muchas herramientas de IA generativa, como Midjourney, Dall-e 2 y Stable Diffusion, que pueden crear imágenes realistas con muy poco esfuerzo. Estas herramientas se entrenan observando grandes volúmenes de imágenes reales, pero rellenan los huecos con su propia interpretación cuando faltan datos de entrenamiento. Esto puede dar lugar a personas con extremidades adicionales y objetos que se transforman con su entorno.

Este incidente destaca las posibles amenazas que las imágenes generadas por IA pueden presentar en el ámbito de las redes sociales, donde se comparten rápidamente, así como la necesidad de un sistema de verificación en Twitter.

Con el auge de las imágenes generadas por inteligencia artificial, distinguir lo real de lo falso va a ser mucho más difícil.

Con la nueva versión de Photoshop lanzada la semana pasada, los usuarios ahora pueden manipular o agregar elementos a una imagen en cuestión de segundos, simplemente dando una instrucción al programa. La versión beta de la nueva función «Generative Fill» de Adobe llega después de varios avances en software de generación de imágenes durante el último año.

Se espera que esta función esté disponible para el público en general en la segunda mitad de 2023, lo que significa que podemos esperar estar inundados de imágenes cada falsas (Adobe cuenta con millones de usuarios de productos creativos).

«Nos estamos adentrando en un mundo en el que tú y yo ya no podemos creer que si vemos una imagen del Papa usando una chaqueta hinchada y caminando fuera del Vaticano, realmente sea él», dijo Maura Grossman, profesora investigadora en la escuela de ciencias de la computación de la Universidad de Waterloo, quien ha estado estudiando las implicaciones del mundo real de las imágenes generadas por IA. Ver video

La inteligencia artificial plantea un «riesgo de extinción», advierten ejecutivos y expertos en tecnología. En marzo, se creó una imagen del Papa con otro programa, Midjourney, y se publicó en Reddit. La imagen se compartió ampliamente en línea y muchos inicialmente creyeron que era real, ilustrando el poder y el peligro de esta tecnología.

Riesgos y recompensas

Esta tecnología tiene posibilidades emocionantes para aquellos en campos creativos (aunque hay obstáculos en esta etapa temprana y algunas de las imágenes claramente parecen manipuladas).

Sin embargo, también hará cada vez más difícil distinguir entre lo que es real y lo que no lo es. Justo la semana pasada, una imagen manipulada del Pentágono explotando en llamas causó que el mercado de valores de Estados Unidos bajara brevemente después de que varios medios internacionales la difundieran. Se alienta a los usuarios de la función de IA de Photoshop a utilizar lo que llaman «credenciales de contenido». Adobe describe las credenciales como una «etiqueta nutricional» para las imágenes, diseñada para dejar claro si un contenido fue generado o editado por IA.

101 ideas creativas para utilizar la inteligencia artificial en la educación.

Chrissi Nerantzi, Sandra Abbeglen, Marianna Karatsiori, & Antonio Martínez-Arboleda (Eds.). (2023). 101 creative ideas to use AI in education, A crowdsourced collection (2023 1.0) [Computer software]. Zenodo.

Texto completo

La experimentación está en el corazón del aprendizaje, la enseñanza y la erudición. Estar abiertos a ideas diversas nos ayudará a establecer conexiones novedosas que pueden conducir a nuevos descubrimientos y percepciones que contribuyan positivamente a nuestro mundo. Las ideas compartidas pueden estar en fase embrionaria, pero merece la pena seguir explorándolas mediante una indagación activa y creativa. Nos gustaría destacar la importancia de un uso responsable, crítico y ético de la IA en los entornos educativos y en general.

	Fernanda Guadalupe en Declaración de San Francisco s…
	La habilidad humana… en La habilidad humana que la IA…
	La “muerte” del inte… en Impacto real de la IA en el em…
	La IA en la revisión… en La IA en la revisión por …
	Google Ngram Viewer,… en Google Books Ngram Viewer: per…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca