Archivo de la categoría: Noticias

¿Está ChatGPT más cerca de un bibliotecario humano que de Google?

Brandom, David. ChatGPT: An AI OpenAI Like a Librarian, Search Google. [Gizmodo]. 2024-06-13. https://gizmodo.com/chatgpt-ai-openai-like-a-librarian-search-google-1850238908

El modelo predominante de acceso y recuperación de información antes de que los motores de búsqueda se convirtieran en la norma -bibliotecarios y expertos en la materia o en la búsqueda que proporcionaban información relevante- era interactivo, personalizado, transparente y autorizado. Hoy en día, los motores de búsqueda son la principal forma de acceder a la información, pero introducir unas cuantas palabras clave y obtener una lista de resultados ordenados por alguna función desconocida no es lo ideal.

Una nueva generación de sistemas de acceso a la información basados en inteligencia artificial, como Bing/ChatGPT de Microsoft, Google/Gemini y Meta/LLaMA, está cambiando el modo tradicional de entrada y salida de los motores de búsqueda. Estos sistemas son capaces de tomar frases completas e incluso párrafos como entrada y generar respuestas personalizadas en lenguaje natural.

Casi 4.000 empleos se perdieron el mes pasado a causa de la IA, según un informe
Nvidia afirma que su nuevo superordenador «cierra oficialmente la brecha digital». Las antiguas predicciones sobre IA demuestran que nuestras esperanzas y temores no son nuevos, aunque la tecnología sí lo sea

A primera vista, esto podría parecer lo mejor de ambos mundos: respuestas personales y personalizadas combinadas con la amplitud y profundidad del conocimiento en Internet. Pero como investigador que estudia los sistemas de búsqueda y recomendación, creo que el panorama es, en el mejor de los casos, contradictorio.

Los sistemas de IA como ChatGPT y Gemini se basan en grandes modelos lingüísticos. Un modelo lingüístico es una técnica de aprendizaje automático que utiliza una gran cantidad de textos disponibles, como artículos de Wikipedia y PubMed, para aprender patrones. En términos sencillos, estos modelos calculan qué palabra es probable que venga a continuación, dado un conjunto de palabras o una frase. De este modo, son capaces de generar frases, párrafos e incluso páginas que corresponden a una consulta de un usuario.

Gracias al entrenamiento sobre grandes volúmenes de texto, el ajuste fino y otros métodos basados en el aprendizaje automático, este tipo de técnica de recuperación de información funciona con bastante eficacia. Los grandes sistemas basados en modelos lingüísticos generan respuestas personalizadas para satisfacer las consultas de información. Los resultados han sido tan impresionantes que ChatGPT alcanzó los 100 millones de usuarios en un tercio del tiempo que tardó TikTok en llegar a ese hito. La gente lo ha utilizado no sólo para encontrar respuestas, sino para generar diagnósticos, crear planes de dieta y hacer recomendaciones de inversión.

Sin embargo, hay muchos inconvenientes. En primer lugar, consideremos lo que constituye el núcleo de un gran modelo lingüístico: un mecanismo mediante el cual conecta las palabras y, presumiblemente, sus significados. Esto produce un resultado que a menudo parece una respuesta inteligente, pero se sabe que los grandes sistemas de modelos lingüísticos producen declaraciones casi como loros sin una comprensión real. Así, aunque el resultado generado por estos sistemas pueda parecer inteligente, no es más que un reflejo de patrones subyacentes de palabras que la IA ha encontrado en un contexto apropiado.

Esta limitación hace que los grandes sistemas de modelos lingüísticos sean susceptibles de inventar o «alucinar» respuestas. Los sistemas tampoco son lo suficientemente inteligentes como para entender la premisa incorrecta de una pregunta y responder de todos modos a preguntas erróneas. Por ejemplo, cuando se le pregunta qué cara de presidente de EE.UU. aparece en el billete de 100 dólares, ChatGPT responde Benjamin Franklin sin darse cuenta de que Franklin nunca fue presidente y de que la premisa de que el billete de 100 dólares tiene la foto de un presidente de EE.UU. es incorrecta.

El problema es que, aunque estos sistemas se equivoquen sólo un 10% de las veces, no se sabe qué 10%. La gente tampoco tiene la capacidad de validar rápidamente las respuestas de los sistemas. Esto se debe a que estos sistemas carecen de transparencia: no revelan con qué datos se han entrenado, qué fuentes han utilizado para dar respuestas o cómo se generan esas respuestas.

Por ejemplo, puedes pedirle a ChatGPT que escriba un informe técnico con citas. Pero a menudo se inventa estas citas, «alucinando» tanto con los títulos de los artículos académicos como con los autores. Los sistemas tampoco validan la exactitud de sus respuestas. Esto deja la validación en manos del usuario, y los usuarios pueden no tener la motivación o las habilidades para hacerlo o incluso reconocer la necesidad de comprobar las respuestas de una IA. ChatGPT no sabe cuándo una pregunta no tiene sentido, porque no conoce ningún dato.

Aunque la falta de transparencia puede ser perjudicial para los usuarios, también es injusta para los autores, artistas y creadores de los contenidos originales de los que han aprendido los sistemas, ya que éstos no revelan sus fuentes ni proporcionan atribuciones suficientes. En la mayoría de los casos, los creadores no son compensados ni acreditados, ni se les da la oportunidad de dar su consentimiento.

Esto también tiene un aspecto económico. En un motor de búsqueda típico, los resultados se muestran con los enlaces a las fuentes. Esto no sólo permite al usuario verificar las respuestas y proporciona las atribuciones a esas fuentes, sino que también genera tráfico para esos sitios. Muchas de estas fuentes dependen de este tráfico para sus ingresos. Dado que los grandes sistemas de modelos lingüísticos producen respuestas directas, pero no las fuentes de las que proceden, creo que es probable que esos sitios vean disminuir sus fuentes de ingresos.

Por último, esta nueva forma de acceder a la información también puede restar poder a las personas y quitarles la oportunidad de aprender. Un proceso de búsqueda típico permite a los usuarios explorar el abanico de posibilidades para sus necesidades de información, lo que a menudo les lleva a ajustar lo que buscan. También les da la oportunidad de aprender qué hay ahí fuera y cómo se conectan las distintas piezas de información para realizar sus tareas. Y permite encuentros accidentales o serendipia.

Son aspectos muy importantes de la búsqueda, pero cuando un sistema produce los resultados sin mostrar sus fuentes ni guiar al usuario a través de un proceso, le priva de estas posibilidades.

Los grandes modelos lingüísticos suponen un gran avance en el acceso a la información, ya que ofrecen a las personas una forma de interactuar basada en el lenguaje natural, producir respuestas personalizadas y descubrir respuestas y patrones que a menudo resultan difíciles de imaginar para un usuario medio. Pero tienen graves limitaciones por la forma en que aprenden y construyen las respuestas. Sus respuestas pueden ser erróneas, tóxicas o sesgadas.

Aunque otros sistemas de acceso a la información también pueden adolecer de estos problemas, los sistemas de IA con grandes modelos lingüísticos también carecen de transparencia. Y lo que es peor, sus respuestas en lenguaje natural pueden contribuir a alimentar una falsa sensación de confianza y autoridad que puede resultar peligrosa para los usuarios desinformados.

OpenAI y Apple anuncian una colaboración para Integrar ChatGPT en las experiencias de Apple

«OpenAI and Apple Announce Partnership». Accedido 13 de junio de 2024. https://openai.com/index/openai-and-apple-announce-partnership/.

Apple está integrando ChatGPT en las experiencias dentro de iOS, iPadOS y macOS, permitiendo a los usuarios acceder a las capacidades de ChatGPT, incluyendo la comprensión de imágenes y documentos, sin necesidad de cambiar entre herramientas.

Siri también podrá utilizar la inteligencia de ChatGPT cuando sea útil. Los usuarios de Apple serán consultados antes de que cualquier pregunta se envíe a ChatGPT, junto con cualquier documento o foto, y luego Siri presentará la respuesta directamente.

Además, ChatGPT estará disponible en las Herramientas de Escritura de todo el sistema de Apple, para ayudar a los usuarios a generar contenido sobre cualquier tema que estén escribiendo. Los usuarios también podrán utilizar las herramientas de imágenes de ChatGPT para generar imágenes en una amplia variedad de estilos que complementen lo que están escribiendo.

Las protecciones de privacidad están integradas al acceder a ChatGPT dentro de Siri y Herramientas de Escritura: las solicitudes no son almacenadas por OpenAI y las direcciones IP de los usuarios están ocultas. Los usuarios también pueden optar por conectar su cuenta de ChatGPT, lo que significa que sus preferencias de datos se aplicarán bajo las políticas de ChatGPT.

La integración de ChatGPT, impulsada por GPT-4o, llegará a iOS, iPadOS y macOS a finales de este año. Los usuarios podrán acceder de forma gratuita sin crear una cuenta, y los suscriptores de ChatGPT podrán conectar sus cuentas y acceder a funciones pagas directamente desde estas experiencias.

Publicación de CiteScore 2023 (2024)

«CiteScore 2023: A comprehensive, clear and current metric for journal impact | Elsevier Scopus Blog». Accedido 13 de junio de 2024. https://blog.scopus.com/posts/citescore-2023-a-comprehensive-clear-and-current-metric-for-journal-impact.

Scopus anuncia el próximo lanzamiento de CiteScore 2023, una métrica que proporciona información sobre el impacto de las citas de las revistas.

Desarrollado por el equipo del International Center for the Study of Research (ICSR), CiteScore ofrece una evaluación equilibrada y completa de las contribuciones basadas en la investigación de una revista. CiteScore permite a investigadores, bibliotecarios, editores y oficinas de investigación tomar decisiones bien informadas sobre dónde publicar y estrategias de publicación.

Aspectos destacados del lanzamiento de CiteScore 2023:

  1. Cobertura ampliada: CiteScore 2023 incluye 29.777 títulos activos, con 2.212 títulos recibiendo su primer CiteScore. Esta cobertura más amplia asegura un conjunto de datos más completo para evaluar el impacto de las revistas.
  2. Más títulos de acceso abierto: El lanzamiento incluye 6.943 títulos de acceso abierto, con 52 de ellos clasificándose como número 1 en sus respectivas categorías, destacando la creciente importancia de la investigación de acceso abierto.
  3. Diversas categorías temáticas: CiteScore cubre 334 categorías temáticas, con Historia siendo el área más grande, comprendiendo 1.760 títulos. Esta diversidad permite a los usuarios explorar el impacto en varios campos.
  4. Títulos de alto impacto: CiteScore 2023 identifica 11.144 títulos con CiteScore pero sin Factor de Impacto en 2022. Entre ellos, 416 títulos están altamente clasificados en sus respectivas áreas, ubicándolos en el top 10%.
  5. Representación global: El 22% de las revistas CiteScore son publicaciones no en inglés en más de 50 idiomas, proporcionando una perspectiva global sobre el impacto de la investigación.
  6. Impacto creciente: 668 títulos experimentaron un aumento de CiteScore del 100% o más entre 2022 y 2023, mostrando la naturaleza dinámica del impacto de la investigación.

La metodología de CiteScore refleja el impacto de citación de las contribuciones basadas en la investigación de una revista con mayor estabilidad, consistencia en los períodos de tiempo utilizados, y permanece integral, actual, clara y gratuita. Fue desarrollada por el equipo del ICSR (International Center for the Study of Research), basado en una investigación de mercado extensa y según Scopus aprovecha las debilidades inherentes del JIF como métrica de citación a nivel de revista.

Normativa sobre accesibilidad de la web y las aplicaciones móviles

Branson, Katie. «Web and Mobile App Accessibility Regulations.» EDUCAUSE Review. Publicado el 10 de junio de 2024. Accedido el [fecha de acceso]. https://er.educause.edu/articles/2024/6/web-and-mobile-app-accessibility-regulations.

La reglamentación sobre accesibilidad web y de aplicaciones móviles, promulgada por el Departamento de Justicia de los Estados Unidos bajo el Título II de la Ley de Estadounidenses con Discapacidades (ADA por sus siglas en inglés), representa un hito significativo en el campo de la accesibilidad digital. Esta reglamentación, publicada en el Registro Federal el 24 de abril, establece requisitos claros y vinculantes para garantizar que los sitios web y las aplicaciones móviles de entidades públicas sean accesibles para personas con discapacidades.

El marco regulatorio final, que entrará en vigor en diferentes momentos dependiendo del tamaño de la entidad pública, establece como estándar de accesibilidad las Pautas de Accesibilidad al Contenido Web (WCAG) 2.1 nivel AA. Esto significa que todos los contenidos web y aplicaciones móviles proporcionados o puestos a disposición por entidades públicas, ya sea directamente o a través de terceros, deben ser accesibles y utilizables por personas con discapacidades.

Una de las características clave de esta reglamentación es la adopción formal de las WCAG 2.1 nivel AA como estándar. Las WCAG son pautas internacionales reconocidas para la accesibilidad web desarrolladas por el World Wide Web Consortium (W3C). El nivel AA de las WCAG establece criterios más avanzados que el nivel A y aborda una amplia gama de problemas de accesibilidad, lo que garantiza una experiencia de usuario inclusiva para personas con diversas discapacidades.

Además, la reglamentación proporciona plazos claros para el cumplimiento. Las entidades públicas grandes, definidas como aquellas con una población de más de 50,000 personas según el censo, tienen un plazo de dos años para cumplir con los requisitos de accesibilidad. Por otro lado, las entidades públicas pequeñas, con una población de menos de 50,000 personas, tienen tres años para cumplir.

Es importante destacar que la reglamentación final retiene ciertas excepciones limitadas para ciertos tipos de contenido, como contenido archivado, documentos electrónicos convencionales preexistentes y contenido de terceros. Sin embargo, una de las excepciones propuestas en la versión inicial de la regla para contenido de cursos protegido por contraseña fue completamente eliminada en la versión final.

En conclusión, la reglamentación sobre accesibilidad web y de aplicaciones móviles bajo el Título II de la ADA representa un paso importante hacia la inclusión digital. Proporciona un marco claro y vinculante para garantizar que las entidades públicas cumplan con los estándares de accesibilidad web, lo que contribuye a una sociedad más equitativa y accesible para todas las personas, independientemente de sus capacidades.

La «fiebre del oro» de la IA por los datos de entrenamiento de chatbots podría quedarse sin texto escrito por humanos

AP News. «AI “gold Rush” for Chatbot Training Data Could Run out of Human-Written Text», 6 de junio de 2024. https://apnews.com/article/ai-artificial-intelligence-training-data-running-out-9676145bac0d30ecce1513c20561b87d.

Los sistemas de inteligencia artificial, como ChatGPT, dependen de grandes cantidades de texto escrito por humanos disponible en línea para mejorar su rendimiento. Sin embargo, un estudio de Epoch AI advierte que las empresas tecnológicas podrían agotar el suministro de estos datos públicos entre 2026 y 2032. Esta situación se compara con una «fiebre del oro» que podría dificultar el progreso continuo en el campo de la IA.

A corto plazo, empresas como OpenAI y Google están buscando asegurar fuentes de datos de alta calidad, incluso pagando por ellos, como es el caso de los datos provenientes de foros como Reddit y medios de comunicación. Sin embargo, a largo plazo, no habrá suficientes nuevos blogs, artículos de noticias y comentarios en redes sociales para sostener el desarrollo de la IA. Esto podría llevar a depender de datos sensibles considerados privados, como correos electrónicos o mensajes de texto, o recurrir a datos sintéticos generados por los propios chatbots, los cuales son menos confiables.

Algunos expertos, como Nicolas Papernot, creen que no es necesario seguir entrenando modelos cada vez más grandes, sino enfocarse en modelos más especializados. Además, existe preocupación por el uso de datos generados por IA para entrenar más IA, lo que podría llevar a la «degradación del rendimiento» o «colapso del modelo». Sitios como Reddit y Wikipedia, así como editores de noticias y libros, están reconsiderando cómo se utilizan sus datos. Wikipedia, por ejemplo, permite el uso de sus entradas por parte de empresas de IA, pero subraya la necesidad de mantener incentivos para la creación de contenido humano.

Sam Altman, CEO de OpenAI, mencionó que aunque se está experimentando con datos sintéticos, es crucial que estos sean de alta calidad para evitar ineficiencias en el entrenamiento de modelos de IA. En resumen, el campo de la inteligencia artificial enfrenta un posible agotamiento de textos escritos por humanos para el entrenamiento de sus modelos, lo que plantea importantes desafíos y la necesidad de buscar soluciones alternativas para mantener el progreso tecnológico.

Los usuarios están cada vez más frustrados con la calidad de búsqueda de Google

Young man and woman frustrated looking at laptop screen
A young couple looks frustrated while trying to solve an issue on a laptop at home

ReShare, Author Project. «News Release: Project ReShare Launches ReShare Digital Software Development Initiative and Pledge Drive», 5 de junio de 2024. https://projectreshare.org/2024/06/05/news-release-reshare-digital/.

Los motores de búsqueda están destinados a ayudar a las personas a encontrar la información que desean o necesitan. Esta encuesta indica que los resultados y experiencias deficientes en los motores de búsqueda pueden estar fallando en ayudar a los usuarios a cumplir sus tareas, lo que los frustra.

Se preguntó a los encuestados cuál era la parte más frustrante del proceso de búsqueda de servicios en línea. Los tres principales fueron:

  1. Buscar entre los resultados de búsqueda: 26%
  2. Encontrar el término de búsqueda correcto: 22%
  3. Visitar múltiples sitios web: 21%

Estos son problemas que los resúmenes de inteligencia artificial de Google, ChatGPT y otros motores de respuestas podrán resolver algún día (¿pronto?). Sin embargo, la promesa completa de la inteligencia artificial generativa en la búsqueda aún no se ha realizado.

La mayoría de los encuestados dijeron que buscan más resultados de búsqueda en comparación con hace cinco años:

Más: 54% (19% «mucho más»; 35% «un poco más»). Menos: 27% (19% «un poco menos»; 8% «mucho menos»). Igual: 20%.

Una mayoría de los encuestados también dijo que pasa más tiempo buscando cuando busca servicios en línea:

Más tiempo: 51% (16% «mucho más»; 35% «un poco más»). Menos tiempo: 28% (18% «un poco menos»; 10% «mucho menos»). La misma cantidad de tiempo: 21%.

Los usuarios están cada vez más frustrados con la calidad de búsqueda de Google, y esto es una confirmación adicional de que no lo estamos imaginando, a pesar de que Google nos dice que a la gente le encantan los resúmenes de inteligencia artificial y los resultados de búsqueda. Google nos dijo que el uso de la búsqueda está aumentando debido a los resúmenes de inteligencia artificial, ¿pero es porque están investigando más a fondo o porque no pueden encontrar las respuestas correctas?

Solo el 12% de los encuestados dijo que los anuncios de búsqueda eran relevantes para ellos. Más encuestados dijeron que encuentran más anuncios relevantes en otros seis canales: televisión (41%), YouTube (37%), Facebook (32%), Instagram (32%), TikTok (19%), sitios web (18%).

Otros hallazgos. En las páginas de resultados del motor de búsqueda, el 35% de los encuestados dijo que omiten (supongo que pasan por alto) los anuncios para ir a los resultados del sitio web (orgánicos). Además:

El 33% busca fuentes/empresas que reconoce por nombre (hola, reconocimiento de marca). El 33% busca resultados con calificaciones de estrellas más altas. Menos sorprendente. Otros hallazgos de interés:

El 30% de los encuestados cree que los servicios que aparecen más arriba en los resultados de búsqueda suelen ser más relevantes. El 46% de los encuestados dijo que tener resultados «creíbles» haría que la experiencia de búsqueda fuera más agradable. El 86% de los encuestados cree que casi siempre, o más a menudo que no, pueden distinguir entre los resultados orgánicos y pagados. El 47% cree que es más fácil distinguir entre resultados orgánicos y pagados; el 37% piensa que es más difícil; el 16% cree que no es diferente en comparación con hace cinco años.

Pero. También es posible que algunos, o muchos, de los encuestados no sean los más expertos tecnológicamente.

La encuesta de 1.000 adultos estadounidenses fue diseñada para garantizar una representación nacional en términos de género, edad y región. Se llevó a cabo a fines de febrero por Scorpion, un proveedor de soluciones de marketing digital y tecnología, en colaboración con Dynata, una empresa de investigación de mercado independiente.

Principales tendencias en bibliotecas universitarias 2024

Committee, ACRL Research Planning and Review. «2024 Top Trends in Academic Libraries: A Review of the Trends and Issues | Research Planning and Review Committee | College & Research Libraries News», 7 de junio de 2024. https://doi.org/10.5860/crln.85.6.231.

El artículo revisa exhaustivamente las tendencias y problemas que han marcado la trayectoria de las bibliotecas universitarias en los últimos dos años. Se enfoca en áreas clave que incluyen la integración de la inteligencia artificial (IA), el diseño pedagógico abierto, la ciencia abierta y la reproducibilidad, el acceso abierto y la publicación equitativa, las prácticas de colección disruptivas y la reconcepción, la politización de las bibliotecas universitarias, la legislación contra la diversidad, equidad e inclusión, la libertad académica y la sindicalización, el lugar de trabajo postpandémico y los entornos de trabajo híbridos, los espacios tecnológicos y de fabricación, y el apoyo al bienestar estudiantil postpandémico. Se destacan los siguientes puntos principales:

  1. Inteligencia Artificial (IA) y Alfabetización en IA: La IA, especialmente herramientas como ChatGPT, ha generado un renovado interés en las bibliotecas universitarias. Se discuten las implicaciones potenciales de la IA y la necesidad de alfabetización en IA para bibliotecarios y estudiantes.
  2. Pedagogía abierta y diseño instruccional: Las bibliotecas están explorando cómo enriquecer el aprendizaje estudiantil a través de la pedagogía abierta, involucrando a los estudiantes en la creación de recursos educativos abiertos (OER) y proyectos de renovación.
  3. Ciencia Abierta y reproducibilidad: Se destaca el papel de las bibliotecas en la promoción de la ciencia abierta y la reproducibilidad de la investigación, así como su contribución a la infraestructura necesaria para avanzar en estos objetivos.
  4. Acceso Abierto y publicación equitativa: Se discute cómo las bibliotecas están abordando los desafíos de acceso abierto y equidad en la publicación universitaria, así como el papel de las nuevas herramientas y propuestas para apoyar una infraestructura de publicación basada en valores.
  5. Reconceptualización de prácticas de colección: Las bibliotecas están reconsiderando sus prácticas de adquisición y gestión de colecciones para promover la diversidad y la inclusión, así como para abordar los desafíos políticos y sociales en el entorno académico.
  6. Politización de las bibliotecas universitarias: Se examina cómo el clima político influye en las bibliotecas universitarias y cómo estas están navegando entre la neutralidad y el compromiso cívico, especialmente en temas de justicia social y equidad.
  7. Legislación Anti-DEI, Libertad académica y sindicalización: Se aborda el impacto de la legislación anti-DEI en las bibliotecas universitarias, así como el papel de la libertad académica y la sindicalización en la protección de los derechos de los bibliotecarios y el personal de biblioteca.
  8. Entornos de trabajo post-pandemia y ambientes de trabajo híbridos: Se discute cómo la pandemia ha llevado a una reevaluación de los entornos de trabajo en las bibliotecas universitarias, especialmente en relación con el equilibrio entre el trabajo remoto y presencial.
  9. Espacios de creación y tecnología: Se destaca la importancia de los espacios de creación (makerspaces) en las bibliotecas universitarias para fomentar la innovación y la colaboración estudiantil.
  10. Apoyo al bienestar estudiantil post-pandemia: Se examina cómo las bibliotecas están adoptando estrategias para apoyar el bienestar mental y emocional de los estudiantes, ofreciendo servicios y recursos que van más allá de la investigación académica.

Estos puntos reflejan las diversas áreas de enfoque y preocupación en las bibliotecas universitarias contemporáneas, así como los desafíos y oportunidades que enfrentan en un entorno en constante evolución.

V Concurso Municipal de Bandas de Salamanca. Viviendo en la era pop 2024/06/07

V Concurso Municipal de Bandas de Salamanca.

Viviendo en la era pop 2024/06/07

ESCUCHAR EL PROGRAMA

Ir a descargar

Esta semana hemos seleccionado algunos de los temas de los 26 grupos que participaron este año en el V Concurso Municipal de Bandas de Salamanca. Este será el primero de tres programas en los que presentaremos a todas las bandas. En esta ocasión, escucharemos las siguientes canciones:

  • The Third Rule – «Sacrifice»
  • Texas Resaca Blues – «Ey Ey Mama»
  • Nadea Levinscaia – «Mírame»
  • Alberto Pérez Tapia – «Me Escueces»
  • Orca – «Bizarre»
  • Noches Blancas – «Frío Azul»
  • Oceandelis – «Out There»
  • Old Virginia – «California»
  • Diazepam Rock Band – «Te quieres venir»
  • Sevillano – «Sé que vas a volver»
  • Ruido de Fondo – «El Gildo»

El Origen de la Información en ChatGPT con la Herramienta RAGE


«El Origen de la Información en ChatGPT con la Herramienta RAGE», 6 de junio de 2024. https://wwwhatsnew.com/2024/06/06/el-origen-de-la-informacion-en-chatgpt-con-la-herramienta-rage/.

La inteligencia artificial sigue avanzando a pasos agigantados, pero con estos avances surgen nuevos desafíos. Uno de los problemas más preocupantes es entender de dónde proviene la información que nos proporcionan los modelos de lenguaje como ChatGPT. Aquí entra en juego una innovadora herramienta desarrollada por un equipo de la Universidad de Waterloo: RAGE.

La Importancia de Saber de Dónde Proviene la Información

En la era digital, los modelos de lenguaje grande (LLMs), como ChatGPT, se han convertido en herramientas fundamentales en diversas áreas, desde la medicina hasta el derecho. Sin embargo, estos modelos no están exentos de problemas. Al funcionar mediante el «aprendizaje profundo no supervisado», recopilan información de toda la web de maneras que pueden ser complicadas de rastrear.

Problemas de Confiabilidad

Un problema común con los LLMs es la alucinación. Es decir, estos modelos pueden generar respuestas que parecen coherentes y precisas, pero que en realidad están basadas en información incorrecta o inexistente. Esto plantea un gran desafío, especialmente cuando las respuestas se utilizan en contextos críticos.

La Necesidad de Transparencia

Como bien señala Joel Rorseth, estudiante de doctorado en ciencias de la computación en la Universidad de Waterloo y autor principal del estudio, «no puedes necesariamente confiar en que un LLM se explique a sí mismo». Es vital que podamos verificar las fuentes de información que utilizan estos modelos para asegurarnos de su fiabilidad.

La Solución: La Herramienta RAGE

¿Qué es RAGE?

RAGE es una herramienta que utiliza una estrategia llamada «generación aumentada por recuperación» (RAG) para entender el contexto de las respuestas proporcionadas por los LLMs. En lugar de confiar ciegamente en las respuestas generadas, RAGE permite a los usuarios proporcionar sus propias fuentes de información para contextualizar las respuestas.

¿Cómo Funciona?

La herramienta ilustra cómo diferentes fuentes pueden llevar a distintas respuestas. Esto es crucial para evaluar la confiabilidad de la información. Al utilizar RAGE, los usuarios pueden ver de manera clara cómo la información de diferentes fuentes afecta las respuestas de los modelos.

Aplicaciones Prácticas

En la Medicina y el Derecho

El uso de LLMs en sectores sensibles como la medicina y el derecho está en aumento. Sin embargo, la falta de transparencia en la fuente de información puede ser peligrosa. RAGE permite asegurar que las respuestas de estos modelos estén basadas en información precisa y confiable, algo esencial en estos campos.

En la Educación

En el ámbito educativo, los estudiantes y profesores pueden beneficiarse enormemente. Pueden verificar y validar la información proporcionada por los modelos de lenguaje, asegurándose de que las fuentes sean fiables.

El Futuro de la Regulación y la Innovación

Estamos en una época donde la innovación tecnológica ha superado la regulación. Es vital que entendamos los riesgos potenciales de usar estas tecnologías sin un marco regulatorio adecuado. Herramientas como RAGE son esenciales para garantizar que los productos de inteligencia artificial sean seguros y confiables.

Referencias
Joel Rorseth et al, RAGE Against the Machine: Retrieval-Augmented LLM Explanations, arXiv (2024). DOI: 10.48550/arxiv.2405.13000