Archivo de la etiqueta: Libros electronicos

Meta utilizó libros pirateados de Library Genesis (LibGen) para entrenar su modelo de inteligencia artificial Llama 3 sin autorización de los autores

Reisner, Alex. “Meta Used Pirated Books to Train Its AI.” The Atlantic, March 20, 2025. https://www.theatlantic.com/technology/archive/2025/03/libgen-meta-openai/682093/?gift=iWa_iB9lkw4UuiWbIbrWGYDRoX8kfg3ZQZL6J-W0kQE.

La decisión de emplear estos materiales surge de la necesidad de contar con grandes volúmenes de texto de alta calidad para mejorar sus productos de IA y competir con modelos como ChatGPT. Sin embargo, en lugar de optar por acuerdos de licencia con editoriales y autores, lo cual implicaba costos elevados y plazos largos, la empresa decidió recurrir a LibGen, una de las mayores bibliotecas piratas de Internet, que alberga más de 7.5 millones de libros y 81 millones de artículos académicos.

Las revelaciones provienen de documentos judiciales recientemente desclasificados en el marco de una demanda por infracción de derechos de autor presentada por autores como Sarah Silverman y Junot Díaz. Entre los hallazgos más significativos se encuentra la confirmación de que Meta obtuvo permiso explícito de su CEO, Mark Zuckerberg, para descargar y utilizar la base de datos de LibGen en el entrenamiento de su modelo de IA. Este hecho subraya que la empresa no solo era consciente de la ilegalidad de sus acciones, sino que las respaldó desde los niveles más altos de la compañía.

Meta, al igual que OpenAI, ha defendido su uso de contenido protegido argumentando que los modelos de IA generan obras «transformadoras» a partir del material entrenado y, por lo tanto, están amparados bajo el principio de «fair use» (uso justo). No obstante, este argumento es altamente controvertido y todavía está lejos de una resolución definitiva en los tribunales. Más allá de la cuestión de si entrenar IA con libros pirateados constituye un uso legítimo de los materiales protegidos por derechos de autor, el artículo plantea un problema adicional: la forma en que Meta accedió a estos contenidos. Según los registros internos, la empresa utilizó BitTorrent para descargar los archivos, un método que generalmente implica no solo la descarga, sino también la distribución de los mismos, lo que agravaría aún más su situación legal.

Los documentos internos de Meta también revelan que sus empleados eran plenamente conscientes del riesgo legal que implicaba usar LibGen, calificándolo de «riesgo medio-alto». Para mitigar posibles repercusiones, sugirieron estrategias para ocultar la procedencia de los datos, como eliminar metadatos que indicaran que los textos estaban protegidos por derechos de autor y evitar cualquier mención pública del uso de LibGen. Además, se discutió la posibilidad de ajustar Llama 3 para que se negara a responder solicitudes que pudieran revelar la reproducción de contenido protegido, como pedirle que generara las primeras páginas de un libro específico.

El artículo también aborda el papel de LibGen en el acceso al conocimiento. Esta biblioteca pirata surgió en Rusia en 2008 con el propósito de ofrecer acceso gratuito a libros y artículos académicos, particularmente para estudiantes y profesionales de países con dificultades para costear estos materiales, como India, Pakistán e Irán. Sin embargo, su crecimiento exponencial ha facilitado su uso más allá de estos contextos, permitiendo que grandes corporaciones tecnológicas como Meta se beneficien del contenido sin retribuir a los autores originales.

Finalmente, Reisner plantea una reflexión sobre el impacto de esta práctica en el ecosistema del conocimiento y la creación intelectual. Si bien bibliotecas piratas como LibGen han democratizado el acceso a la información, el uso que hacen las empresas de IA de estos materiales plantea preocupaciones éticas y económicas. Al desarrollar chatbots y modelos generativos que sintetizan el conocimiento sin citar sus fuentes, estas compañías descontextualizan la información, limitan la colaboración intelectual y dificultan que escritores e investigadores reciban reconocimiento por su trabajo. La cuestión de fondo es si este tipo de apropiación tecnológica realmente beneficia a la sociedad en su conjunto o simplemente maximiza los beneficios de las grandes corporaciones, desplazando a los creadores originales en el proceso.

Libros de texto inteligentes: Pasado, presente y futuro

Brusilovsky, Peter, y Sergey Sosnovsky. 2024. «Intelligent Textbooks: Past, Present, and Future.» International Journal of Artificial Intelligence in Education. https://link.springer.com/article/10.1007/s40593-024-00451-9.

Los libros de texto siguen siendo una herramienta clave en la educación, pero han evolucionado significativamente en las últimas décadas en términos de creación, publicación, formato, acceso y mantenimiento. Actualmente, la mayoría tiene versiones digitales y se pueden consultar en línea, con un número creciente de recursos educativos abiertos. Además, muchos incluyen bibliotecas de materiales complementarios e incluso se integran en plataformas educativas digitales.

El paso de los libros impresos a los digitales ha impulsado la incorporación de funciones interactivas como búsquedas avanzadas, anotaciones, contenido interactivo, evaluaciones automatizadas y chatbots. Estas mejoras han generado nuevos desafíos y oportunidades para aplicar inteligencia artificial (IA) en el desarrollo y uso de los libros de texto digitales.

Algunas cuestiones clave en este ámbito incluyen cómo mejorar el acceso y la lectura, extraer conocimiento implícito en los textos para optimizar el aprendizaje, analizar los registros de interacción de los estudiantes, enriquecer el contenido con información externa y utilizar tecnologías de lenguaje avanzado para personalizar la experiencia educativa.

En este contexto, el campo de los Libros de Texto Inteligentes ha pasado por distintas generaciones de desarrollo. La primera generación, basada en sistemas de tutoría inteligente e hipertexto educativo, ofrecía personalización a través de estructuras predefinidas por expertos en el dominio. Con el avance de la web, estos libros adoptaron formatos tradicionales con tablas de contenido y glosarios, incorporando técnicas como navegación adaptativa, recomendación de contenido y personalización del aprendizaje. Sin embargo, operaban en entornos cerrados con materiales cuidadosamente seleccionados y estructurados.

Este desarrollo ha generado diversas generaciones de «libros de texto inteligentes»:

Primera Generación: Inteligencia Diseñada

Esta fase inicial surgió de la intersección entre los sistemas de tutoría inteligentes y los hipermedios educativos adaptativos. Los primeros prototipos no presentaban el formato tradicional de los libros de texto; en su lugar, proporcionaban a los estudiantes acceso adaptativo a elementos de información o «hiper-tarjetas» en respuesta al rendimiento en ejercicios asociados. Con la popularización de la web, estos libros adoptaron una estructura más convencional, incorporando técnicas de personalización como soporte de navegación, manipulación adaptativa de páginas, recomendación de contenido y secuenciación de contenidos. Estos sistemas eran entornos de corpus cerrado, ofreciendo colecciones limitadas de textos y ejercicios diseñados meticulosamente.

Segunda Generación: Inteligencia Integrada

En esta etapa, la atención se centró en aspectos prácticos como arquitecturas abiertas, integración con recursos educativos externos y estandarización de modelos semánticos. El desarrollo de tecnologías de la Web Semántica permitió la representación de conocimientos compartibles y soluciones arquitectónicas para software inteligente. Esto facilitó la implementación de modelos de conocimiento como ontologías y la integración de materiales educativos interconectados, permitiendo a los libros de texto «comprender» su contenido y participar en interacciones más significativas con los estudiantes, como responder preguntas y crear mapas conceptuales.

Tercera Generación: Inteligencia Extraída

Con el avance de técnicas de Procesamiento de Lenguaje Natural (PLN) y Aprendizaje Automático (AA), los investigadores comenzaron a ver los libros de texto no solo como herramientas educativas, sino también como fuentes ricas de contenido de alta calidad. Se aplicaron métodos para extraer automáticamente temas, conceptos, relaciones e incluso modelos completos de conocimiento de los textos digitales. Esta capacidad permitió transformar automáticamente libros de texto en versiones inteligentes, enlazándolos con contenido interactivo externo y conectándolos entre sí.

Cuarta Generación: Inteligencia Minada de Datos

La adopción creciente de libros de texto digitales generó una abundancia de datos sobre la interacción de los estudiantes. Se emplearon métodos de minería de datos para analizar estos registros, permitiendo comprender mejor los comportamientos de lectura y su relación con el progreso académico. Los patrones de navegación y las actividades de anotación se utilizaron para predecir el éxito o fracaso de los estudiantes, facilitando intervenciones oportunas. Además, estos datos ayudaron a modelar el conocimiento de los estudiantes sobre conceptos específicos y mejorar la organización y presentación de los contenidos.

Quinta Generación: Inteligencia Generada

Recientemente, la incorporación de modelos de lenguaje de gran escala (LLMs) ha revolucionado los libros de texto inteligentes. Estos modelos, entrenados con vastas cantidades de datos textuales, pueden extraer y sintetizar información de los libros de texto, ofreciendo respuestas automáticas a preguntas y reduciendo problemas como las «alucinaciones» en las respuestas generadas. Además, se han utilizado para crear experiencias interactivas, como chatbots que simulan conversaciones tutor-estudiante, mejorando la interacción y personalización del aprendizaje.

Conclusiones

A pesar de su larga historia, los libros de texto inteligentes siguen siendo un campo de innovaciones en el que se introducen y exploran nuevos enfoques en diversos estudios. Los investigadores de libros de texto inteligentes adoptan con entusiasmo tecnologías desarrolladas fuera de este campo y plantean casos de uso y escenarios de aplicación que amplían las capacidades y la eficacia potencial de los prototipos de libros de texto. Los libros de texto siguen siendo una de las principales fuentes de conocimiento para los estudiantes, a pesar de que los contenidos más interactivos y no textuales están ganando popularidad en muchas otras tareas y contextos.

Ha llegado el momento de que los libros de texto aumenten su funcionalidad con características interactivas que mejoren la eficacia general de los libros de texto como herramientas de aprendizaje. Las interfaces adaptables de los libros de texto, los contenidos inteligentes, los servicios inteligentes y las herramientas centradas en la comunidad para interactuar con otros usuarios transformarán el estudio de los alumnos con libros de texto en una experiencia de aprendizaje más interactiva y social. La nueva ola de IA generativa que ya alimenta la actual generación de libros de texto inteligentes abre un amplio abanico de posibilidades para hacer que el aprendizaje con libros de texto sea aún más interactivo y atractivo. Los LLM son muy capaces de transferir eficazmente lo que aprenden del preentrenamiento en textos a escala web a diferentes contextos, lo que se traduce en altos niveles de fluidez y coherencia del texto generado. Actualmente, la dirección más popular de estos trabajos es utilizar los LLM para producir automáticamente preguntas de evaluación para libros de texto inteligentes, con resultados iniciales prometedores. Además, se están construyendo nuevos prototipos de libros de texto inteligentes que emplean IA generativa para apoyar nuevas formas significativas de interacción. Esperamos más trabajos interesantes que utilicen el potencial de estos modelos en diversas formas de apoyo al alumno en torno a los libros de texto inteligentes, especialmente si se basan en el éxito de la investigación anterior.

TOME arroja luz sobre la publicación sostenible de libros en acceso abierto y impacto del OA en las ventas de libros impresos.

Potter, Peter (2023, febrero 16). TOME sheds light on sustainable open access book publishing. Digital Science. https://www.digital-science.com/blog/2023/02/tome-sheds-light-on-sustainable-open-access-book-publishing/

Un proyecto piloto de publicación en acceso abierto de cinco años de duración ha llegado a su fin, ofreciendo información clave sobre el futuro de la publicación sostenible en acceso abierto de monografías. En este artículo analizaré brevemente un aspecto concreto de la evaluación: Qué hemos aprendido del proyecto piloto sobre el uso del libro electrónico y el impacto de la edición de OA en las ventas de libros impresos.

TOME se lanzó en 2017 como un proyecto piloto de cinco años de la Association of American Universities (AAU), Association of Research Libraries (ARL), and Association of University Presses (AUPresses).. El objetivo del proyecto piloto era explorar un nuevo modelo para la publicación sostenible de monografías, en el que las universidades participantes se comprometieran a proporcionar subvenciones de referencia de 15.000 dólares para apoyar la publicación de monografías por parte de su profesorado, mientras que las editoriales universitarias participantes se comprometieran a producir ediciones digitales de acceso abierto de los volúmenes de TOME, licenciándolos abiertamente bajo licencia Creative Commons y depositando los archivos en repositorios abiertos seleccionados..

A lo largo del proyecto piloto, se han publicado más de 130 monografías académicas en ediciones de OA con financiación de las 20 instituciones TOME participantes. Las ediciones de OA han sido muy consultadas en línea. En julio de 2022, los primeros 25 libros de TOME sumaban casi 195.000 descargas y visualizaciones. La media por libro fue de 7.754. Las estadísticas de uso de TOME destacan aún más cuando se ven junto a las cifras de ventas de las ediciones impresas de los mismos títulos.

Estos resultados coinciden con los de otras iniciativas de libros de OA. En noviembre de 2022, MIT Press informó de que los 50 libros publicados en OA en 2022 a través de su programa Direct to Open se descargaron más de 176.000 veces . Del mismo modo, University of Michigan Press informó en enero de 2023 de que los 40 libros de Fund to Mission publicados en OA en 2022 se habían descargado más de 149.000 veces hasta finales de diciembre, alcanzando una media de 3.826 por libro. Aunque las cifras por libro tanto de D2O como de Michigan son inferiores a las de TOME, los libros de TOME acumularon sus estadísticas durante un periodo de tiempo más largo.

Las estadísticas de uso de TOME destacan aún más si se comparan con las cifras de ventas de las ediciones impresas de los mismos títulos. La media de descargas/visiones por libro (7.754) es significativamente superior a la media de ventas unitarias por libro (590).

También nos planteamos una de las grandes preguntas que los editores siguen haciéndose sobre los libros de OA: ¿Cómo afecta la edición en OA a las ventas de la edición impresa? Con esta pregunta en mente, los editores proporcionaron no sólo las cifras de ventas de los libros TOME, sino también las cifras de ventas de títulos comparables de su lista. Las ediciones impresas de los libros de TOME superaron en ventas a sus libros equivalentes.

Estos resultados deben tomarse con cautela. Como han señalado varios editores, identificar las comparaciones de un título concreto es, en gran medida, una conjetura. Además, el tamaño de la muestra (25 títulos) es demasiado pequeño para sacar conclusiones firmes. Por ejemplo, la mayoría de los 25 títulos de TOME vendieron entre 300 y 500 ejemplares. Sólo en cuatro casos las ventas superaron los 1.000 ejemplares, y si se excluyen estos cuatro títulos de la muestra, la media desciende a una cifra más coherente con las comparaciones. Por lo tanto, es comprensible que la mayoría de las editoriales se muestren reacias a sacar conclusiones sobre el impacto del OA en las ventas.

Monografías digitales multimodales: contenido, colaboración, comunidad

Multimodal Digital Monographs: Content, Collaboration, Community” Brown Library, Together with Emory University, 2022

Ver

En la primavera de 2021, la Biblioteca de la Universidad Brown y el Centro Fox para la Investigación Humanística de la Universidad de Emory organizaron conjuntamente una cumbre sobre monografías digitales multimodales – publicaciones digitales nacidas que ofrecen capacidades únicas más allá de los formatos convencionales, desde mejoras multimedia y navegación interactiva hasta participación comunitaria y alcance global. El objetivo era estudiar la experimentación del profesorado con nuevas formas académicas en varias bibliotecas y centros de humanidades. Los estudios de caso de ocho obras recientemente publicadas o en desarrollo ejemplificaron el espectro y la hibridez de la innovación en este ámbito y proporcionaron una lente a través de la cual considerar algunas de las cuestiones más apremiantes en torno a las formas reimaginadas de la erudición en humanidades.

Las Bibliotecas de la Universidad Estatal de Florida están lanzando el primer programa de publicación de acceso abierto de FSU.

Libros OA de FSOP

Florida State Open Publishing (FSOP) proporciona a la facultad, los estudiantes y el personal de la universidad las herramientas de publicación digital y el apoyo necesarios para producir publicaciones académicas abiertas revisadas por pares, recursos educativos y otros resultados de investigación digital.

Creado para abordar las brechas en la publicación académica tradicional, FSOP tiene como objetivo hacer que la producción académica de FSU sea más accesible, diversa e innovadora.

FSOP da la bienvenida a proyectos de todas las disciplinas, idiomas y autores afiliados a FSU independientemente del alcance de su trabajo. Fundado en principios de inclusión y diversidad, el programa está particularmente interesado en promover la erudición por o sobre grupos subrepresentados. Las publicaciones de FSOP se publican bajo licencias de derechos de autor flexibles que permiten a los autores conservar sus derechos de autor, lo que les permite compartir su trabajo con colegas y comunidades de investigación para reutilizar su trabajo de formas innovadoras

¿Cómo Integrar los recursos digitales en las colecciones?

Géraldine, B. and G.-J. Pauline Le [e-Book] Intégrer des ressources numériques dans les collections, Presses de l’enssib.

Texto completo

Este libro es la continuación de varios otros volúmenes de la colección con el fin de proporcionar a los bibliotecarios y documentalistas las claves para abordar y gestionar eficazmente la documentación desmaterializada: una docena de autores presentan los métodos de selección, adquisición, informe, evaluación y conservación específicos de estos recursos mediante la elaboración de una filigrana que cuestiona la función de la biblioteca. Basándose tanto en las bibliotecas de lectura pública como en las universidades, el plan se organiza en torno a cuatro partes pragmáticas y operativas: conocer el contexto; seleccionar y adquirir; integrar y seleccionar; y, por último, evaluar y conservar.