Archivo de la etiqueta: Bases de datos

Una base de datos pública para conocer qué herramientas de IA se usan en los procesos de selección de personal

The talent acquisition & recruiting ai index (TARAI)

https://www.tarai.org/

La University of Virginia School of Data Science ha lanzado una base de datos pública e interactiva que permite conocer de forma clara qué herramientas de inteligencia artificial se utilizan actualmente en los procesos de selección de personal.

El proyecto surge ante la creciente preocupación por el uso opaco de sistemas automatizados que filtran, clasifican o evalúan a los candidatos sin que estos —ni muchas veces los propios reclutadores— comprendan realmente cómo funcionan.

La base de datos recoge más de un centenar de tecnologías de recursos humanos que incorporan IA y ofrece descripciones detalladas sobre su propósito, el tipo de tareas que automatizan y el grado de transparencia que presentan. Para ello, combina la información proporcionada por las propias empresas con datos obtenidos en entrevistas a profesionales del sector, lo que permite identificar diferencias significativas entre lo que los proveedores prometen y lo que realmente realiza cada sistema.

Además, la plataforma está diseñada para dos tipos de públicos: por un lado, los profesionales de recursos humanos que necesitan comparar herramientas antes de adquirirlas o utilizarlas; por otro, los investigadores y responsables de políticas públicas interesados en entender el impacto de la IA en la contratación laboral. La iniciativa también revela que, a pesar de que la regulación en muchos países considera estas tecnologías de “alto riesgo”, aún existe una supervisión limitada sobre su funcionamiento real, lo que hace especialmente valioso un recurso que facilite su análisis crítico y su escrutinio social.

PAPR: un registro colaborativo para preservar colecciones impresas de revistas y otras publicaciones seriadas en bibliotecas

PAPR (Print Archives Preservation Registry) 

https://papr.crl.edu/

PAPR  es un registro que reúne información sobre qué bibliotecas conservan colecciones impresas de revistas y otras publicaciones seriadas. Su función principal es ayudar a que estas instituciones coordinen la preservación del papel, evitando duplicidades innecesarias y garantizando que siempre exista un número suficiente de copias para proteger el patrimonio documental.

Gracias a este sistema, las bibliotecas pueden saber qué títulos conserva cada institución, qué años o volúmenes exactos poseen y qué compromisos de preservación han asumido a largo plazo.

Este registro actúa como un repositorio colectivo de datos, permitiendo que las bibliotecas compartan sus datos de tenencia y compromisos de preservación. Gracias a esto, los miembros pueden analizar solapamientos entre colecciones, planear políticas de retención o descarte, y tomar decisiones informadas para gestionar sus colecciones impresas.

El sistema se ha renovado recientemente con la plataforma TIND ILS, que permite gestionar grandes volúmenes de datos de forma más rápida, clara y eficiente. Con esta actualización, PAPR ofrece mejores herramientas de búsqueda, análisis y comparación entre colecciones, lo que facilita la toma de decisiones sobre qué conservar, qué retirar y cómo colaborar entre bibliotecas. En conjunto, PAPR se convierte en una herramienta esencial para investigadores, profesionales de la información y gestores de preservación que necesitan localizar material impreso o planificar su conservación futura.

Base de datos de Prompts de Rebiun

base de datos de Prompts

La página «Prompts» del Observatorio de Inteligencia Artificial de REBIUN (Red de Bibliotecas Universitarias) ofrece una recopilación estructurada de ejemplos de Prompts —instrucciones o preguntas— que permiten interactuar eficazmente con herramientas de inteligencia artificial generativa, como ChatGPT o Copilot. Estos recursos están pensados especialmente para su aplicación en el ámbito bibliotecario y educativo, con el fin de fomentar el uso ético, eficiente y estratégico de la IA en el entorno universitario.

El contenido se organiza en distintas categorías temáticas: desde tareas de apoyo a la docencia e investigación, pasando por la creación de contenidos, la búsqueda y análisis de información, hasta la automatización de procesos administrativos. Cada prompt incluye una descripción breve de su finalidad y una sugerencia de redacción para que el usuario pueda adaptarla a sus propias necesidades.

Además, se destacan recomendaciones para formular prompts de manera efectiva, como ser claro, proporcionar contexto y definir el formato de la respuesta esperada. En conjunto, esta herramienta busca empoderar a los profesionales de las bibliotecas universitarias para que aprovechen el potencial de la IA generativa como un aliado en sus funciones clave. La iniciativa se enmarca dentro del compromiso de REBIUN con la innovación responsable en el ámbito académico.

Búsqueda de información asistida por IA (RAG) en bibliotecas universitarias

Bevara, R. V. K., Lund, B. D., Mannuru, N. R., Karedla, S. P., Mohammed, Y., Kolapudi, S. T., & Mannuru, A. (2025). Prospects of Retrieval Augmented Generation (RAG) for Academic Library Search and Retrieval. Information Technology and Libraries44(2). https://doi.org/10.5860/ital.v44i2.17361

Retrieval Augmented Generation (RAG) es una tecnología que combina dos cosas: por un lado, sistemas que saben buscar información en bases de datos o documentos (esto es el “retrieval” o recuperación), y por otro lado, modelos de inteligencia artificial que pueden entender y generar texto en lenguaje natural (como los chatbots o asistentes virtuales). De manera que cuando Entonces, cuando se hace una pregunta, RAG primero busca la información relevante en fuentes confiables y después usa esa información para crear una respuesta clara y completa, como si estuvieras hablando con un experto que tiene acceso a mucha información precisa.

Se examina el potencial de los sistemas basados en RAG para transformar los métodos tradicionales de búsqueda y recuperación de información en bibliotecas universitarias. RAG combina las capacidades de comprensión del lenguaje natural de los grandes modelos de lenguaje (LLM) con sistemas estructurados de recuperación de información basados en bases de datos verificadas, creando así un enfoque innovador para la búsqueda académica que mejora la precisión y relevancia de los resultados.

El estudio detalla los requerimientos técnicos necesarios para integrar RAG en los sistemas bibliotecarios actuales, destacando la importancia de las arquitecturas middleware que conectan las bases de datos académicas con los procesos de generación y recuperación. Se profundiza en elementos como las canalizaciones de embedding (representaciones vectoriales de datos), las bases de datos vectoriales y la arquitectura técnica que permite que RAG procese consultas en tiempo real, utilizando el contexto y el significado semántico para refinar los resultados de búsqueda.

Además, el artículo resalta cómo los sistemas RAG pueden mejorar significativamente la experiencia del usuario en las bibliotecas académicas, gracias a funcionalidades como la asistencia personalizada en la investigación, interfaces conversacionales para interactuar de forma más natural y la integración multimodal de contenido (texto, imágenes, datos). Sin embargo, también enfatiza la necesidad de cumplir con regulaciones de privacidad de datos y derechos de autor para asegurar un uso responsable y ético de estas tecnologías.

Entre las consideraciones críticas, el estudio aborda aspectos éticos, la transparencia del sistema y la confianza del usuario, indicando que, aunque RAG ofrece grandes oportunidades para modernizar los servicios bibliotecarios, su implementación exitosa depende de un equilibrio cuidadoso entre innovación técnica y responsabilidad social. Finalmente, los autores concluyen que la integración de RAG en bibliotecas académicas tiene un gran potencial para revolucionar la forma en que se accede y se gestiona el conocimiento, pero que aún se requiere investigación continua en áreas como la escalabilidad del sistema, el cumplimiento ético y la optimización de costos para su adopción masiva.

Clarivate lanza un nuevo índice gratuito de investigación educativa y refuerza su compromiso con ERIC

ProQuest Education Research Index

El 13 de junio de 2025, Clarivate, una de las principales compañías globales de análisis e información académica, anunció oficialmente el lanzamiento del ProQuest Education Research Index, un recurso gratuito destinado a facilitar el acceso a literatura científica en el campo de la educación. Este nuevo índice es parte de su estrategia para fortalecer su compromiso con ERIC (Education Resources Information Center), el índice de literatura educativa más consultado a nivel mundial, gestionado por el Departamento de Educación de los Estados Unidos.

ProQuest Education Research Index servirá como una herramienta abierta y de fácil acceso para investigadores, docentes, estudiantes y formuladores de políticas, al integrar miles de registros bibliográficos vinculados con publicaciones académicas, actas de congresos, informes técnicos y otros documentos relacionados con la investigación educativa. Esta base de datos está diseñada para mejorar la visibilidad y el descubrimiento de la literatura educativa más relevante, aprovechando las capacidades de búsqueda avanzadas y las tecnologías de indexación de Clarivate.

Clarivate destaca que este nuevo índice no solo apoya la misión de ERIC, sino que también democratiza el acceso al conocimiento, al permitir que cualquier persona —sin importar su afiliación institucional— pueda acceder a una fuente curada y estructurada de literatura científica en educación. La compañía también subraya la importancia de apoyar la educación basada en evidencias y el valor que tiene la investigación abierta en la mejora de sistemas educativos en todo el mundo.

Esta iniciativa se enmarca dentro de los esfuerzos más amplios de Clarivate y ProQuest por ofrecer soluciones basadas en datos para impulsar el conocimiento académico, reforzar la equidad en el acceso a la información y fomentar una educación de calidad para todos, en línea con los Objetivos de Desarrollo Sostenible (ODS) de la ONU.

Base de datos de alucinaciones de la Inteligencia Artificial generativa

AI Hallucination Cases

https://www.damiencharlotin.com/hallucinations/

Esta base de datos recopila decisiones judiciales relacionadas con casos en los que una inteligencia artificial generativa produjo contenido alucinado —es decir, contenido falso o erróneo generado por el sistema. El ejemplo más común son las citas legales falsas (fake citations), aunque también se incluyen otros tipos de errores, como argumentos jurídicos inventados o distorsionados.

Es importante destacar que esta base no abarca todos los casos en que se han utilizado citas falsas o IA en procedimientos judiciales, sino que se centra únicamente en los casos en los que ha habido una decisión legal vinculada a la utilización de contenido alucinado por IA.

El fenómeno de las alucinaciones en IA se refiere a la generación de información falsa pero con apariencia convincente. En el ámbito jurídico, esto representa un riesgo serio para la integridad del proceso judicial, ya que puede conducir a decisiones basadas en datos erróneos o incluso a la desinformación intencionada. Por ello, esta base de datos funciona también como una advertencia práctica sobre los límites actuales de la tecnología y la necesidad de usarla con criterio, supervisión humana y sentido ético.

Hasta el momento, la base de datos ha identificado 121 casos, y sigue en expansión conforme surgen nuevos ejemplos. Su objetivo es ofrecer un registro sistemático y riguroso que permita entender el impacto real del uso de estas herramientas tecnológicas en entornos legales, donde la precisión y la veracidad son esenciales. Es un recurso de gran valor tanto para juristas como para investigadores, medios de comunicación y responsables de políticas públicas.

El uso de contenido generado por IA en documentos judiciales ha provocado en algunos casos consecuencias graves, como sanciones disciplinarias a abogados que incluyeron citas falsas producidas por sistemas como ChatGPT sin verificarlas. Estos incidentes han sido objeto de cobertura mediática y han despertado un amplio debate sobre la responsabilidad profesional y la fiabilidad de las herramientas de IA en contextos de alta exigencia ética.

Un caso destacado es el de Mata v. Avianca, Inc., donde los abogados del demandante utilizaron ChatGPT para generar una moción legal que contenía múltiples casos jurídicos ficticios. El tribunal descubrió que las citas eran inexistentes y sancionó a los abogados con una multa de 5.000$, subrayando la responsabilidad profesional de verificar la exactitud de las referencias legales, independientemente de las herramientas utilizadas.

Otro ejemplo relevante es el caso en Israel de Mahala Association v. Clalit Health Services, donde se presentaron múltiples citas falsas generadas por una herramienta de IA llamada Takdin.AI. El tribunal no solo desestimó la petición de certificación de acción colectiva, sino que también impuso sanciones monetarias y determinó que el abogado no era apto para actuar en el caso.

En definitiva, este archivo documental se ha convertido en un instrumento de seguimiento y análisis de un fenómeno emergente que afecta a la práctica del derecho y que requiere atención tanto desde el ámbito jurídico como desde la innovación tecnológica y la regulación.

ERIC en peligro: la mas importante base de datos de investigación educativa podría dejar de actualizarse esta semana

​Barshay, Jill. «Proof Points: A Treasure Trove of Education Reports and Studies Is Under Threat.» The Hechinger Report, April 21, 2025. https://hechingerreport.org/proof-points-eric-under-threat/

El centro de recursos educativos ERIC (Education Resources Information Center), una biblioteca pública digital con 2,1 millones de documentos educativos, podría dejar de actualizarse esta semana por falta de financiación. A pesar de tener un contrato vigente hasta 2028 y fondos ya autorizados por el Congreso, el Departamento de Eficiencia Gubernamental (DOGE) se ha negado a liberar el dinero necesario para su operación. ERIC, gestionado por el Departamento de Educación de EE.UU., es una herramienta esencial para investigadores, docentes y responsables de políticas educativas, comparable a PubMed en el campo de la salud.

Erin Pollard Young, la única empleada del Departamento de Educación dedicada a ERIC, fue despedida en marzo junto con otros 1.300 trabajadores. Antes de su salida, intentó recortar el presupuesto de ERIC a la mitad, como exigía DOGE, pero incluso esa propuesta fue rechazada. El contrato podría expirar el 23 de abril, lo que significaría que ya no se añadirían nuevos documentos al repositorio.

ERIC contiene artículos de revistas académicas, libros, informes gubernamentales y tesis doctorales, incluyendo una gran cantidad de «literatura gris» (estudios no publicados ni catalogados en bases privadas como EBSCO), lo que lo hace insustituible por herramientas como Google o IA.

Desde el Departamento de Educación han justificado los recortes con la necesidad de reestructurar el Instituto de Ciencias de la Educación (IES), del cual depende ERIC, acusándolo de ineficacia en la mejora de resultados educativos.

Pollard Young ha decidido hablar públicamente sobre la situación, a pesar del riesgo de represalias, para intentar salvar un recurso que ha sido clave para la investigación educativa durante más de 60 años.

RetractBase: base de datos de las publicaciones que han sido retractadas o retiradas

https://retractbase.csic.es

RetractBase es una base de datos abierta que tiene como objetivo recopilar el listado más completo posible de publicaciones científicas que han sido retractadas o retiradas desde el año 2000.

En el contexto de la ciencia y las publicaciones, una «retractación» (o «retractación de artículo científico») se refiere a la retirada oficial de un artículo científico publicado debido a errores graves, mala conducta científica o violaciones éticas.

Esta herramienta está dirigida a la comunidad académica y científica, con la intención de promover la investigación sobre la integridad científica y la detección de posibles casos de mala conducta. Con más de 60.000 registros disponibles, RetractBase se alinea con los principios de la Ciencia Abierta al ofrecer un recurso transparente que permite advertir sobre el uso y la citación inapropiada de trabajos científicos que ya no son válidos.

La base de datos se apoya en fuentes bibliográficas abiertas, como Crossref y OpenAlex, utilizando las interfaces públicas (APIs) de estas plataformas para obtener los registros de publicaciones retractadas, así como sus correspondientes avisos de retractación o retirada. Una de las principales innovaciones de RetractBase es que conecta directamente las publicaciones con los documentos que explican su retractación, permitiendo así conocer las razones que motivaron dicha acción.

Cada registro dentro de RetractBase proporciona enlaces web tanto a la publicación original como al aviso de retractación, además de incluir identificadores provenientes de otras fuentes externas como PubMed, OpenAlex y Crossref. Esto facilita el acceso a información adicional y contrastada sobre cada publicación. Asimismo, RetractBase enlaza las publicaciones con los comentarios que han recibido en PubPeer, una plataforma donde otros investigadores pueden señalar posibles fallos o irregularidades. Estos comentarios han sido clasificados en función del tipo de problema que presentan las publicaciones.

Finalmente, se han diseñado varios indicadores que permiten medir el impacto de las retractaciones desde diferentes perspectivas, como el autor, la revista científica, la institución u organización de afiliación y el país. De este modo, RetractBase no solo permite identificar qué trabajos han sido retractados, sino también analizar patrones y tendencias relacionadas con la producción científica y su control de calidad. Puedes consultar la base de datos en el siguiente enlace: https://retractbase.csic.es/intro.

Neo-censura en bibliotecas de EE. UU.: un nuevo informe sobre la supresión de contenidos digitales

Reed, Michelle, y Tova Gaster. “Neo-Censorship in U.S. Libraries: An Investigation Into Digital Content Suppression.” Library Futures, febrero 13, 2025

Texto completo

El informe analiza cómo una minoría activista utiliza el término «pornografía» como una excusa para restringir el acceso a la información en bibliotecas y escuelas de EE. UU. A través del estudio de leyes, audiencias públicas y entrevistas con bibliotecarios, el informe revela una tendencia creciente hacia la censura digital en bases de datos y recursos electrónicos, afectando el derecho a la información de estudiantes y comunidades.

Uno de los casos más destacados ocurrió en Utah en 2018, cuando más de 650.000 estudiantes quedaron bloqueados del acceso a bases de datos educativas de la noche a la mañana. Aunque el acceso fue restaurado un mes después, el estado implementó restricciones de búsqueda y monitoreo de términos clave. Este caso se convirtió en un precedente de nuevas formas de censura digital que afectan no solo libros específicos, sino colecciones enteras, limitando el acceso a información sobre temas como cáncer de mama o abuso sexual.

Si bien las prohibiciones de libros físicos han sido ampliamente debatidas, la censura digital sigue siendo menos visible pero potencialmente más dañina. Bibliotecas y bases de datos han enfrentado crecientes restricciones debido a presiones políticas y grupos organizados. De acuerdo con el informe de PEN America, en 2023 hubo más de 3,300 intentos de censura en bibliotecas y escuelas, lo que representa un incremento significativo respecto a años anteriores.

Otro informe, publicado por la American Library Association (ALA) en su State of America’s Libraries Report 2024, señala que la mayoría de estos intentos de censura provienen de grupos organizados con objetivos políticos. En particular, la eliminación de bases de datos enteras constituye una nueva estrategia que va más allá de la censura de títulos individuales y busca restringir el acceso masivo a la información.

A pesar de que muchas de estas iniciativas no logran convertirse en ley, su existencia ya genera un impacto significativo, promoviendo el miedo y la autocensura en bibliotecas y editoriales. El informe de Library Futures destaca que estas acciones violan el Primer Enmienda de la Constitución de EE. UU., que protege la libertad de expresión y el derecho a la información. Sin embargo, la estrategia de censura persiste, con tácticas como la eliminación de presupuestos bibliotecarios y campañas mediáticas para desacreditar a bibliotecarios y educadores.

Las bibliotecas han comenzado a responder a esta ofensiva mediante alianzas estratégicas y litigios. Organizaciones como la ALA y la Freedom to Read Foundation han tomado acciones legales contra las prohibiciones de libros y bases de datos, mientras que iniciativas como #UniteAgainstBookBans buscan movilizar a la ciudadanía en defensa de la libertad de lectura.

En conclusión, la censura digital en bibliotecas representa una amenaza creciente a la libertad de acceso a la información. Mientras algunos grupos intentan restringir el conocimiento a través de leyes y presiones políticas, bibliotecarios y defensores de los derechos civiles trabajan para garantizar que las generaciones futuras sigan teniendo acceso a recursos educativos esenciales.

Clarivate obligará a las instituciones a alquilar contenido en lugar de adquirirlo permanentemente

Beeck, Nathalie. “Library Database Providers Clash Over Subscription Models.” Publishers Weekly, February 24, 2025. https://www.publishersweekly.com/pw/by-topic/industry-news/libraries/article/97170-library-database-providers-clash-over-subscription-models.html.

Clarivate, proveedor global de servicios de información, anunció que a partir de 2025 adoptará un modelo de suscripción para el acceso académico, eliminando la compra perpetua de libros y colecciones digitales para bibliotecas. Esto obligará a las instituciones a alquilar contenido en lugar de adquirirlo permanentemente, lo que ha generado preocupación en la comunidad académica y editorial.

EBSCO, competidor de Clarivate, reafirmó su compromiso con la compra perpetua, ofreciendo modelos flexibles como la Adquisición Basada en la Evidencia (EBA) y la Adquisición Basada en la Demanda (DDA). Su vicepresidente, Jon Elwell, criticó el enfoque de Clarivate, argumentando que afectará la biodiversidad bibliográfica y la preservación del registro académico.

Leo Lo, presidente de la Asociación de Bibliotecas Académicas y de Investigación (ACRL), destacó que el modelo de suscripción puede ser útil para ciertas instituciones, pero la falta de opciones de compra perpetua pone en riesgo la estabilidad de las colecciones. Doug Way, de la Asociación de Bibliotecas de Investigación (ARL), consideró que Clarivate subestima la preferencia de las bibliotecas por adquisiciones únicas, que resultan más rentables a largo plazo.

Andrew Pace, director ejecutivo de la ARL, advirtió que la medida afectará a las editoriales universitarias sin fines de lucro, que ya operan con presupuestos ajustados. Además, la comunidad académica ha defendido desde hace tiempo el acceso perpetuo como una necesidad para preservar el conocimiento. Iniciativas como TOME buscan alternativas de acceso abierto para mitigar estos impactos.

Wendy Queen, de la AUPresses, recordó que desde 2012 se estableció el acceso ilimitado, sin DRM y perpetuo como estándar en colecciones digitales. Según ella, el cambio propuesto por Clarivate podría ser financieramente beneficioso para la empresa, pero plantea incertidumbre para editores y bibliotecas en un contexto de crisis en la financiación de la educación superior.