Archivo de la etiqueta: Derechos de autor

¿De quién es realmente una respuesta generada por inteligencia artificial? Propiedad intelectual, autoría y dilemas emergentes en la era de la IA

The AI School Librarian. “Who Owns an AI Answer?”. Publicado en Substack, 2026. Disponible en: The AI School Librarian (Substack)

Se aborda una de las cuestiones más complejas surgidas con la expansión de la inteligencia artificial generativa: la propiedad intelectual de los contenidos creados con ayuda de sistemas como ChatGPT, Gemini o Claude. A medida que estas herramientas producen textos, imágenes, código o ideas cada vez más sofisticadas, surge una pregunta central tanto en el ámbito educativo como en el legal: ¿quién puede reclamar la autoría o propiedad de una respuesta producida por una máquina entrenada con datos ajenos?

Durante años, una de las explicaciones más repetidas por las grandes empresas de inteligencia artificial ha sido relativamente sencilla: los sistemas de IA pueden cometer errores. Desde el comienzo, compañías tecnológicas han advertido a sus usuarios que deben contrastar la información generada, verificar las fuentes y mantener una actitud crítica frente a cualquier respuesta producida por estos sistemas. Estas advertencias aparecen de forma habitual en manuales, políticas de uso y declaraciones públicas de prácticamente todas las empresas que desarrollan herramientas de inteligencia artificial.

Sin embargo, una reciente decisión judicial en Alemania parece indicar que esa explicación podría dejar de ser suficiente.

Un tribunal alemán ha dictaminado que Google puede ser considerado legalmente responsable por información falsa generada por su sistema AI Overviews, la función que ofrece resúmenes automáticos en los resultados de búsqueda. El caso se originó cuando el sistema vinculó erróneamente a dos editores con actividades fraudulentas y estafas. La defensa de Google siguió el argumento habitual: la inteligencia artificial puede equivocarse y los usuarios no deberían asumir que todas las respuestas generadas son completamente precisas. El tribunal, sin embargo, rechazó esta justificación.

La relevancia de esta resolución judicial radica en que desplaza el foco del debate. Hasta ahora, gran parte de la discusión sobre inteligencia artificial se había centrado en cómo se entrenan los modelos, qué datos utilizan o si vulneran derechos de autor durante ese proceso. La sentencia introduce otra perspectiva: no importa únicamente cómo funciona la IA internamente, sino también qué tipo de información entrega directamente al usuario y quién asume la responsabilidad cuando esa información resulta falsa o perjudicial.

La cuestión trasciende ampliamente a Google. Durante los últimos años, buena parte del debate sobre inteligencia artificial en educación se ha centrado casi exclusivamente en el comportamiento de los estudiantes: el posible plagio, la integridad académica, el uso adecuado de herramientas generativas o el papel que debe ocupar la IA dentro del aprendizaje. Mucho menos se ha discutido sobre las obligaciones de las empresas tecnológicas cuando sus sistemas generan información errónea y esa información termina afectando a personas reales o condicionando decisiones importantes.

El texto analiza cómo los sistemas de IA generativa funcionan a partir de modelos entrenados sobre enormes cantidades de información extraída de internet, libros, artículos académicos, obras creativas y otros materiales protegidos por derechos de autor. Cuando un usuario introduce una instrucción o prompt, la IA no “crea” en un sentido humano tradicional, sino que genera una respuesta basada en patrones estadísticos aprendidos durante el entrenamiento. Esto complica enormemente la atribución de propiedad, porque la respuesta final puede contener ecos, estructuras o influencias derivadas de miles de obras previas, cuyos autores originales raramente han dado consentimiento explícito para ese uso.

Desde el punto de vista jurídico, el artículo subraya que en muchas legislaciones actuales —especialmente en Estados Unidos y Europa— la protección del copyright exige un grado de creatividad humana identificable. Esto significa que un contenido generado enteramente por inteligencia artificial podría no ser susceptible de protección legal como obra original, o al menos no bajo los marcos tradicionales del derecho de autor. La intervención humana, por tanto, se vuelve decisiva: cuanto mayor sea el nivel de edición, selección, reformulación o dirección creativa del usuario, más sólida resulta su posible reclamación de autoría sobre el resultado final.

El artículo dedica especial atención al ámbito educativo, donde docentes, investigadores y bibliotecarios deben enfrentarse a nuevos escenarios éticos relacionados con el uso de herramientas generativas. Si un estudiante presenta como propio un trabajo elaborado en gran parte por inteligencia artificial, surge un debate no solo sobre plagio, sino sobre autenticidad intelectual y aprendizaje real. Del mismo modo, en la producción académica y editorial aparece la necesidad de establecer criterios transparentes para declarar cuándo un texto ha sido asistido por IA y en qué medida esa asistencia altera la noción tradicional de autor.

La reflexión final plantea que la inteligencia artificial está obligando a redefinir conceptos fundamentales como creación, originalidad, propiedad intelectual y responsabilidad autoral. Más que una simple cuestión tecnológica, el problema revela una transformación profunda en la relación entre conocimiento, producción cultural y derechos de propiedad. En este nuevo escenario, bibliotecas, universidades, editoriales y legisladores deberán desempeñar un papel central en la construcción de marcos éticos y jurídicos capaces de responder a una pregunta cada vez más urgente: cuando una máquina produce conocimiento, ¿a quién pertenece realmente esa creación?

Suno y Udio: la inteligencia artificial musical busca legitimarse tras enfrentar a la industria discográfica

Rock band playing instruments energetically with AI music generator and soundwave visuals
A rock band passionately performing powered by an AI music generator in a high-tech studio.

O’Brien, Matt, y Rodrique Ngowi. “AI Song Generator Startups Suno and Udio Angered the Music Industry. Now They’re Hoping to Join It.” Associated Press, 25 de febrero de 2026. Associated Press

Las plataformas de generación musical por inteligencia artificial Suno y Udio se han convertido en dos de los actores más controvertidos del ecosistema tecnológico y cultural contemporáneo. Ambas empresas irrumpieron con herramientas capaces de crear canciones completas —incluyendo voz, instrumentación, arreglos y estilos específicos— a partir de simples instrucciones de texto, democratizando aparentemente la producción musical pero abriendo simultáneamente un profundo conflicto legal y ético con la industria discográfica tradicional.

El principal problema surgió cuando grandes sellos como Universal Music Group, Warner Music Group y Sony Music Entertainment demandaron a ambas compañías alegando que habían entrenado sus modelos utilizando grabaciones protegidas por derechos de autor sin autorización previa. La acusación sostiene que millones de canciones pertenecientes a catálogos comerciales fueron incorporadas a los sistemas de entrenamiento algorítmico, permitiendo a estas herramientas reproducir patrones estilísticos extremadamente similares a artistas reales, sin compensar a compositores, intérpretes o productores originales.

A partir de estas demandas, ambas compañías tomaron caminos parcialmente distintos. Udio optó por una estrategia de conciliación y alcanzó acuerdos de licencia con varios grandes sellos, transformándose progresivamente en una plataforma más integrada dentro del negocio musical tradicional. Suno, por el contrario, mantuvo durante más tiempo una estrategia jurídica basada en defender que el entrenamiento algorítmico constituye un caso de fair use (uso legítimo), una posición que podría tener consecuencias judiciales decisivas para toda la industria de inteligencia artificial generativa.

Sin embargo, la controversia no terminó con los acuerdos entre empresas tecnológicas y discográficas. En junio de 2026, la American Federation of Musicians presentó una nueva demanda contra Universal y Warner alegando que los acuerdos alcanzados con Suno y Udio beneficiaron económicamente a las grandes compañías discográficas, pero excluyeron a miles de músicos de sesión cuyas interpretaciones originales fueron utilizadas para entrenar los sistemas. El sindicato sostiene que los artistas no recibieron compensación ni reconocimiento por un uso comercial completamente nuevo de sus grabaciones.

GEMA, la entidad alemana encargada de gestionar y recaudar derechos de autor musicales, también demandó a Suno, acusándola de generar composiciones demasiado similares a canciones conocidas como Mambo No. 5 de Lou Bega y Forever Young del grupo Alphaville.

Más de mil músicos, entre ellos Kate Bush, Annie Lennox y Damon Albarn, publicaron un álbum en silencio como forma de protesta contra los cambios propuestos en la legislación del United Kingdom sobre inteligencia artificial, al considerar que estas modificaciones podrían debilitar su control creativo sobre sus propias obras.

Al mismo tiempo, otros artistas como will.i.am, Timbaland e Imogen Heap han mostrado una postura favorable y han adoptado esta tecnología como una nueva herramienta de creación musical.

El caso ilustra una transformación estructural en la industria musical. La inteligencia artificial ya no aparece solamente como una herramienta experimental, sino como un agente capaz de alterar profundamente la creación artística, los modelos de negocio y la propia definición de autoría. Mientras algunos músicos consideran estas plataformas una amenaza directa al trabajo creativo humano, otros defienden que pueden convertirse en instrumentos complementarios de producción musical, del mismo modo que en el pasado lo fueron los sintetizadores, las cajas de ritmos o los programas de edición digital.

En un plano más amplio, el conflicto Suno-Udio representa uno de los primeros grandes laboratorios jurídicos donde se está definiendo el futuro de la relación entre creatividad humana e inteligencia artificial. Lo que decidan los tribunales sobre estas compañías probablemente sentará precedentes para otros sectores culturales como la literatura, el cine, el periodismo o la ilustración digital, donde el debate sobre entrenamiento algorítmico, copyright y compensación a los creadores se encuentra igualmente abierto. La música, una vez más, está funcionando como campo de prueba de las tensiones culturales que acompañan la revolución algorítmica contemporánea.

Bibliotecas piratas y plataformas de acceso ilegal a contenidos en la era de la Inteligencia Artificial

Swartz, Mark. 2026. “What’s an Author to Do? Shadow Libraries in the Age of AI.” Slaw (blog), May 8, 2026. https://www.slaw.ca/2026/05/08/whats-an-author-to-do-shadow-libraries-in-the-age-of-ai/

La emergencia de la inteligencia artificial generativa está reconfigurando de forma profunda el ecosistema del acceso al conocimiento, especialmente en relación con las llamadas shadow libraries (bibliotecas sombra) como Anna’s Archive, LibGen o Sci-Hub. El autor parte del contexto de una nueva oleada de litigios impulsados por grandes editoriales internacionales contra estas plataformas, que históricamente han sido vistas como espacios de acceso no autorizado a libros y artículos académicos. Sin embargo, el debate actual no se limita a la infracción de derechos de autor, sino que incorpora un elemento decisivo: su uso como fuentes de entrenamiento para modelos de lenguaje de gran escala (LLM).

El 6 de marzo, un importante grupo de editoriales, incluidas las cinco más grandes del mundo (Hachette, Penguin Random House, HarperCollins, Macmillan y Simon & Schuster), presentó una demanda ante un tribunal federal de Nueva York para intentar cerrar la biblioteca clandestina «Anna’s Archive». Décadas atrás, John Willinsky describió la publicación académica como su «momento Napster» con la aparición de sitios piratas como LibGen y Sci-Hub. La carrera por entrenar grandes modelos de lenguaje utilizando sitios como Anna’s Archive (sucesor de LibGen/Sci-Hub) se asemeja a una segunda etapa, donde estos sitios no solo sirven como canales para libros y artículos pirateados, sino también como fuentes de datos de entrenamiento para grandes modelos de lenguaje (LLM). Esto también se limita a las editoriales comerciales; HathiTrust informó recientemente que una gran parte de su colección fue obtenida y redistribuida en Anna’s Archive.

Las demandas contra bibliotecas clandestinas no son nuevas: editores y creadores llevan intentando eliminar obras creativas pirateadas de internet desde sus inicios, como lo demuestra la interminable lista de demandas publicadas en el blog Torrentfreak. En los últimos años, estas demandas han puesto de relieve el papel que desempeñan sitios como Anna’s Archive en el entrenamiento de grandes modelos de lenguaje (LLM), ya que «la actuación de los editores es ahora especialmente crucial a la luz de los informes que indican que Anna’s Archive anuncia activamente que proporcionará acceso de alta velocidad —y de hecho ya ha proporcionado— obras de autores robadas a desarrolladores de grandes sistemas de IA de modelos de lenguaje (LLM) y a intermediarios de datos»

El rápido ritmo del progreso tecnológico, sumado a la feroz competencia entre las empresas que desarrollan modelos de IA, ha generado un vacío ético, y países de todo el mundo se apresuran a desarrollar políticas para ponerse al día. Una de las muchas víctimas de este vacío son los autores y creadores, cuyas obras publicadas se han convertido en el principal material de entrenamiento para modelos de IA, frecuentemente sin recibir compensación alguna. Y dado que las grandes empresas tecnológicas detrás del desarrollo de la IA han adoptado un enfoque de entrenamiento similar al de Trump, han recurrido al pirateo de sitios web y bibliotecas clandestinas como Anna’s Archive para obtener datos de entrenamiento.

Esto, naturalmente, ha dado lugar a un sinfín de demandas y acusaciones. Por ejemplo, en el caso Kadrey contra Meta, se alegó que Meta entrenó su modelo de aprendizaje automático (LLM) con Books3, un conjunto de datos que incluía el texto completo de casi 200.000 libros pirateados. En esta decisión, Meta obtuvo una ajustada victoria, al determinarse que el uso de este conjunto de datos constituía un uso legítimo. Por otro lado, el caso Bartz et al. contra Anthropic PBC culminó en el mayor acuerdo de demanda colectiva por derechos de autor en la historia de Estados Unidos (1.500 millones de dólares). Los documentos judiciales de este caso ofrecen el ejemplo más claro del insaciable apetito de la IA por los datos de entrenamiento: además de contenido de bibliotecas clandestinas, Anthropic contrató a Tom Turvey, exdirector de alianzas del proyecto de digitalización de libros de Google, y le encargó obtener «todos los libros del mundo». Anthropic compró, digitalizó y destruyó millones de los libros impresos más utilizados y creó un gigantesco corpus electrónico que se planeaba que continuara indefinidamente. La liquidación de Anthropic se debió en gran medida al uso de una «biblioteca central» de obras pirateadas, a pesar de la sentencia del juez Alsup que dictaminó que el entrenamiento con libros adquiridos legalmente constituía un uso legítimo. Además, muchas otras empresas tecnológicas líderes, como Nvidia, Salesforce y Apple, han estado utilizando una estrategia similar para la formación de másteres en derecho (LLM).

Por supuesto, no son solo las grandes tecnológicas las que se benefician de esta situación. Grandes editoriales, incluidas algunas de las editoriales académicas más destacadas como Taylor & Francis y Wiley, han firmado importantes acuerdos de licencia para que grandes empresas tecnológicas utilicen sus publicaciones en el entrenamiento de IA. Los autores solo se enteran de estos acuerdos a través de artículos o comunicados de prensa. Cambridge University Press adoptó un modelo más progresista que permite a los autores optar por no permitir que su trabajo se utilice para entrenamiento, pagando además regalías. Estos son solo algunos ejemplos; para una lista más extensa, consulte el rastreador de acuerdos de licencia de IA generativa de Ithaka S+R. Esto refleja un cambio de perspectiva: las grandes editoriales se están convirtiendo menos en proveedoras de información y más en intermediarias de datos, al tiempo que investigan el desarrollo de sus propias herramientas y plataformas de IA que utilizan el contenido que poseen y licencian.

¿Qué implica esto para los autores y creadores? En este punto, es probable que muchas publicaciones en inglés, entradas de blog o publicaciones en internet se hayan utilizado como datos de entrenamiento para múltiples másteres en Derecho (LLM). Los autores que no desean que su contenido se utilice para entrenamiento tienen pocas opciones. Pueden publicar en plataformas que permiten a los autores optar por no participar, aunque esta opción no tiene mucho sentido si los datos de entrenamiento se obtienen de bibliotecas no oficiales. También pueden analizar los modelos de licenciamiento emergentes.

En este escenario, el artículo subraya que las bibliotecas piratas han pasado de ser únicamente mecanismos de distribución paralela de contenidos a convertirse en infraestructuras invisibles dentro de la economía de datos de la IA. Esta transformación intensifica el conflicto entre acceso abierto y propiedad intelectual, ya que las obras de autores y académicos no solo se consumen por lectores humanos, sino que también son absorbidas masivamente por sistemas automatizados sin compensación ni control efectivo. El texto destaca cómo esta dinámica ha generado una “zona gris ética y legal”, donde las fronteras entre uso legítimo, reutilización y explotación se vuelven cada vez más difusas.

Finalmente, el artículo plantea un problema de fondo para los autores contemporáneos: la pérdida de capacidad de control sobre sus obras en un entorno donde prácticamente todo contenido publicado puede haber sido ya incorporado a múltiples sistemas de IA. Frente a ello, se mencionan respuestas emergentes como nuevos modelos de licencia, mecanismos de “opt-out” y proyectos como Creative Commons Signals, aunque el autor se muestra escéptico respecto a su efectividad real frente a la escala y opacidad del entrenamiento de modelos de IA por parte de grandes empresas tecnológicas.

CNN demanda a Perplexity por reproducir artículos de forma casi literal

«CNN sues Perplexity AI over ‘verbatim‘ copies of articles». Boing Boing, 29 de mayo de 2026. Disponible en: https://boingboing.net/2026/05/29/cnn-sues-perplexity-ai-over-verbatim-copies-of-articles.html.

La cadena de noticias CNN ha presentado una demanda judicial contra la empresa de inteligencia artificial Perplexity AI, acusándola de infringir sistemáticamente los derechos de autor mediante la copia y redistribución de contenidos periodísticos. La demanda sostiene que Perplexity habría rastreado, extraído y reutilizado miles de artículos, vídeos e imágenes de CNN para alimentar sus sistemas de búsqueda y generación de respuestas basadas en inteligencia artificial.

Según la documentación judicial, CNN afirma haber identificado más de 17.000 ejemplos de contenido supuestamente utilizado sin autorización. La acusación no se limita al empleo de esos materiales para entrenar modelos de IA, sino que sostiene que las respuestas ofrecidas a los usuarios contienen fragmentos idénticos o sustancialmente similares a los artículos originales. En algunos casos, bastaría con introducir el título de una noticia para que el sistema devolviera extensos pasajes muy próximos al texto publicado por CNN, incluyendo contenidos protegidos por suscripción.

CNN argumenta que esta práctica socava el modelo económico del periodismo profesional. La cadena señala que sus noticias son fruto del trabajo de periodistas, investigadores, editores y productores que invierten recursos significativos en la creación de información original. Desde esta perspectiva, permitir que una plataforma de IA reproduzca esos contenidos sin licencia ni compensación económica equivaldría a apropiarse del valor generado por los medios de comunicación tradicionales.

Otro aspecto relevante del caso es que CNN asegura haber intentado previamente negociar con Perplexity un acuerdo de licencia para regular el uso de sus contenidos. Sin embargo, las conversaciones habrían terminado sin acuerdo a finales de 2025. Tras la ruptura de las negociaciones, CNN sostiene que la empresa continuó utilizando sus materiales y que incluso ignoró requerimientos formales para cesar dichas actividades.

Por su parte, Perplexity rechaza las acusaciones. La compañía mantiene que los hechos y la información en sí mismos no están protegidos por derechos de autor y que su tecnología se limita a recopilar, sintetizar y presentar información procedente de múltiples fuentes. Esta línea de defensa coincide con la utilizada por diversas empresas de inteligencia artificial que sostienen que existe una diferencia jurídica entre copiar una obra protegida y extraer hechos o conocimientos contenidos en ella.

La demanda de CNN se inscribe en un contexto más amplio de conflictos legales entre medios de comunicación y empresas de IA. En los últimos años, organizaciones como The New York Times, Reddit, Dow Jones, Merriam-Webster y Encyclopaedia Britannica han emprendido acciones similares, denunciando el uso no autorizado de sus contenidos para entrenar o alimentar sistemas de inteligencia artificial.

Más allá del caso concreto, el litigio plantea una cuestión fundamental para el futuro de la inteligencia artificial generativa: dónde se encuentra el límite entre el uso legítimo de información pública y la reproducción indebida de obras protegidas. El resultado de este y otros procedimientos judiciales podría definir las reglas de juego para la relación entre las empresas tecnológicas y los productores de contenido durante los próximos años, afectando tanto a la sostenibilidad económica del periodismo como al desarrollo de los sistemas avanzados de IA.

El desafío del copyright en la música generada por IA: el caso Suno y las “covers” no autorizadas

Merritt, Chris. “Suno Is a Music Copyright Nightmare.The Verge, 5 de abril de 2026. https://www.theverge.com/ai-artificial-intelligence/906896/sunos-copyright-ai-music-covers

La tecnología de generación musical con IA ha superado las capacidades actuales de protección de derechos autorales, y herramientas como Suno, aun con políticas de bloqueo, pueden convertirse en un verdadero “nightmare” (pesadilla) de copyright si no se adoptan controles técnicos y legales mucho más estrictos.

La plataforma de generación musical con inteligencia artificial Suno enfrenta un serio problema con el respeto al copyright y la protección de obras musicales preexistentes. Aunque la compañía afirma en sus políticas que no permite el uso de material con derechos de autor y que bloquea estas entradas, investigaciones prácticas han demostrado que los controles automáticos son sumamente fáciles de burlar. Mediante técnicas sencillas —como alterar la velocidad de reproducción de una pista o añadir ruido blanco— cualquier usuario puede engañar a los filtros de copyright y generar covers con la IA que conservan elementos reconocibles de la obra original, lo que plantea alarmantes implicaciones tanto legales como éticas.

El texto detalla cómo estos controles no son exhaustivos y solo se aplican al momento de la subida de archivos, pero no se revisan de nuevo durante la generación ni antes de la exportación del resultado final. Esto permite que versiones generadas, a veces apenas ligeramente transformadas, se descarguen y se suban a servicios de streaming como Spotify, donde pueden confundirse con versiones legítimas y monetizarse sin compensar a los creadores originales. Esta situación es especialmente preocupante para artistas independientes o de menor notoriedad, cuyos trabajos a menudo no son detectados por los sistemas automáticos y terminan expuestos a usos no autorizados o incluso monetizaciones indebidas.

El artículo también señala que los resultados de estas “covers” generadas por IA suelen situarse en lo que se denomina situación legal compleja (uncanny valley): suenan extrañamente cercanos a las originales —reconocibles para el oyente— pero carecen de la energía, matices y creatividad propios de una interpretación humana. Pese a ello, estos productos artificiales son suficientes para confundir o distraer al público y representar un riesgo tangible para los ingresos de los artistas, ya que incluso un pequeño desvío de reproducciones en plataformas de streaming puede afectar significativamente las comisiones, especialmente cuando los pagos por reproducción suelen ser bajos.

En el centro de la controversia está la incapacidad de Suno y de sistemas técnicos similares para ofrecer protecciones eficaces frente a la reproducción no autorizada de obras protegidas por derechos de autor. A pesar de que plataformas como Spotify, Deezer o Qobuz han implementado algunas medidas para detectar contenido duplicado o sospechoso, estos mecanismos no son infalibles y requieren de supervisión humana para mejorar la precisión. Algunos casos reales, como el de la cantante folk Murphy Campbell, ilustran cómo incluso grabaciones aparentemente inocuas pueden acabar siendo usadas sin permiso y vinculadas a perfiles oficiales de artistas en servicios de streaming, provocando procesos de reclamación y complicaciones legales para quienes son afectados.

La situación del uso de IA para producir música plantea preguntas profundas sobre la viabilidad de los sistemas de autoregulación tecnológica y la necesidad de marcos legales más robustos. Si los filtros que supuestamente protegen los derechos de autor pueden ser engañados con herramientas gratuitas y conocimientos básicos, ello indica que la industria —tanto los desarrolladores de IA como las entidades de protección de derechos— se enfrenta a un desafío estructural. Según el artículo, esto no solo amenaza a los creadores, sino que también podría acelerar la intervención regulatoria en el sector, puesto que la incapacidad de los sistemas técnicos para asegurar el respeto al copyright demuestra que las soluciones puramente automatizadas no bastan para abordar la complejidad de los derechos de propiedad intelectual en la era de la inteligencia artificial.

El trabajo creado íntegramente por IA no tiene derechos de autor

The AI School Librarian, «AI Work Has No Owner. Now What Do We Teach? A Supreme Court decision forces educators to rethink originality in the age of AI«, The AI School Librarians Newsletter (blog), 24 de marzo de 2026, https://aischoollibrarian.substack.com/p/the-supreme-court-drew-a-line-on.

La reciente negativa de la Corte Suprema de los Estados Unidos a escuchar el caso del científico informático Stephen Thaler, quien intentó registrar los derechos de autor de una obra de arte generada por un sistema de inteligencia artificial, ha establecido una realidad legal ineludible: el trabajo creado íntegramente por IA no tiene derechos de autor.

Los tribunales inferiores han dictaminado consistentemente que la ley de derechos de autor protege exclusivamente la autoría humana, y que una máquina no puede ser considerada autora sin un aporte creativo humano significativo. Esto significa que las obras generadas por IA carecen actualmente de un autor legal, una realidad que choca directamente con las prácticas educativas contemporáneas.

Existe una profunda desalineación entre este estándar legal y lo que ocurre en las escuelas. Actualmente, los educadores están calificando trabajos que, bajo la ley, no tienen un autor legítimo. Si un estudiante envía una tarea generada completamente por IA, no es el autor legal de la misma. Además, la habilidad de escribir indicaciones (hacer «promptis») no equivale a la autoría creativa. Muchas de las tareas escolares tradicionales están desactualizadas frente a esta realidad, ya que pueden ser completadas fácilmente por herramientas de IA, dando como resultado trabajos pulidos pero con una autoría humana nula o muy dudosa.

Este escenario no implica que la IA deba ser prohibida en las escuelas, sino que debe usarse como una herramienta donde la aportación del estudiante siga siendo el núcleo del trabajo. Para evaluar esto, los educadores deben implementar una «nueva prueba de autoría» haciendo preguntas clave: quién realizó el pensamiento crítico, quién tomó las decisiones principales y si el estudiante es capaz de explicar el proceso de creación. Sin embargo, la mayoría de las políticas de los distritos escolares se centran erróneamente en hacer frente a las trampas o en el uso de software de detección, ignorando el problema fundamental de la autoría. Las políticas que no abordan qué constituye el trabajo original de un estudiante están destinadas a volverse obsoletas.

Para adaptarse a esta nueva era, la educación debe redefinir lo que cuenta como aprendizaje. El artículo propone cuatro cambios fundamentales: primero, cambiar el enfoque del producto final al proceso, exigiendo a los estudiantes que demuestren cómo llegaron a sus resultados; segundo, definir claramente qué se espera de la contribución humana en cada tarea; tercero, normalizar y enseñar la divulgación ética del uso de la IA, donde los alumnos declaren qué herramientas usaron y qué pensamiento es propio; y cuarto, rediseñar intencionalmente las tareas para que requieran interpretación, razonamiento y revisión. En conclusión, aunque la inteligencia artificial llegó para quedarse y generar contenido de forma instantánea, no puede reemplazar la necesidad fundamental de la autoría y el pensamiento humano en el aprendizaje.

¿Quién posee el conocimiento? Copyright, IA Generativa y el futuro de la publicación académica

Kochetkov, Dmitry. 2025. “Who Owns the Knowledge? Copyright, GenAI, and the Future of Academic Publishing.” arXiv, noviembre 24, 2025. https://doi.org/10.48550/arXiv.2511.21755

El documento aborda el impacto profundo y multifacético de la inteligencia artificial generativa (GenAI) y los grandes modelos de lenguaje (LLMs) en la investigación científica y el sistema de publicación académica. Las capacidades de estas tecnologías, señala el autor, representan un cambio de paradigma que ofrece oportunidades revolucionarias para acelerar descubrimiento, análisis y difusión del conocimiento, pero al mismo tiempo plantea desafíos éticos, legales y regulatorios significativos que no han sido adecuadamente resueltos por los marcos jurídicos existentes en las principales jurisdicciones del mundo.

Un foco central del análisis es el reto que GenAI plantea para las leyes de copyright tradicionales y para los principios de la ciencia abierta. Kochetkov argumenta que las normativas actuales en países como Estados Unidos, China, la Unión Europea y el Reino Unido, aunque pretenden fomentar la innovación, dejan vacíos importantes específicamente en relación con el uso de obras protegidas por derechos de autor y de resultados de ciencia abierta para entrenar modelos de IA. Es decir, las normas pensadas para regular la reutilización humana de contenidos no cubren adecuadamente la ingestión masiva de textos científicos por parte de algoritmos de aprendizaje automático.

El autor también discute las limitaciones de los mecanismos de licencia existentes, incluyendo las licencias de acceso abierto como las de Creative Commons. Aunque estas licencias han sido útiles para permitir la reutilización y difusión entre personas, no están diseñadas para regular el entrenamiento de GenAI, que implica procesamiento de datos a gran escala y sin intervención humana directa. Esto se traduce, según el artículo, en una falta de atribución y reconocimiento de la autoría real de los contenidos, lo cual socava nociones académicas fundamentales de originalidad, crédito y responsabilidad intelectual.

Frente a esto, Kochetkov propone una crítica al uso automático de figuras legales como la “excepción de uso justo” (“fair use”) en Estados Unidos para justificar el entrenamiento de modelos de IA con textos académicos. En su análisis, depender de este enfoque es problemático porque no respeta suficientemente los derechos de los creadores originales —especialmente cuando los modelos son desarrollados o explotados comercialmente o cuando producen derivados opacos sin atribución clara— y podría favorecer la consolidación de mercados oligopólicos donde prevalecen intereses comerciales sobre la integridad científica y la equidad en la producción de conocimiento.

Como alternativa, el autor aboga por que los autores mantengan derechos explícitos para rechazar el uso de sus obras en procesos de entrenamiento de IA, independientemente de la doctrina de uso justo, y que las universidades jueguen un papel más activo en la gobernanza responsable de IA. Las instituciones académicas, sostiene, están en una posición única para desarrollar políticas internas que reflejen los valores de integridad científica, transparencia y justicia epistémica, negociando derechos que incluyan cláusulas específicas sobre IA.

Finalmente, Kochetkov llama a un esfuerzo legislativo internacional armonizado que pueda integrar coherentemente derechos de autor, ciencia abierta y el uso de GenAI en la investigación académica. Una regulación coordinada a nivel global ayudaría a proteger la propiedad intelectual, garantizar transparencia en los datos de entrenamiento, y evitar que la infraestructura de conocimiento científico quede dominada por intereses comerciales en detrimento del acceso equitativo y la integridad de la producción académica.

En conjunto, el artículo plantea que la revolución de la IA en la ciencia requiere no solo innovación tecnológica, sino también reformas profundas en las políticas de derechos de autor, licencias abiertas y gobernanza institucional, para asegurar que la transformación digital refuerce —y no erosione— los principios fundamentales de la investigación científica y la difusión del saber.

Silicon Valley construyó la IA comprando, escaneando y descartando millones de libros

Schaffer, Aaron; Oremus, Will y Tiku, Nitasha. “How Silicon Valley Built AI: Buying, Scanning & Discarding Millions of Books”, MSN (basado en Washington Post), 27 de enero de 2026. https://www.msn.com/en-us/technology/artificial-intelligence/how-silicon-valley-built-ai-buying-scanning-and-discarding-millions-of-books/ar-AA1V4aZv

En los últimos años, las grandes empresas de tecnología y startups de Silicon Valley han librado una competencia frenética por adquirir conjuntos masivos de datos textuales, especialmente libros, como materia prima para entrenar sus modelos de inteligencia artificial (IA).

Según documentos judiciales revelados en demandas por derechos de autor, compañías como Anthropic, Meta, Google y OpenAI emprendieron acciones a gran escala para obtener millones de títulos físicos y digitales con el objetivo de mejorar la capacidad de sus modelos de lenguaje para “entender” y “escribir bien”.

Un caso emblemático es el llamado Project Panama de Anthropic, descrito en documentos internos como un esfuerzo por comprar y escanear “todos los libros del mundo”. La compañía gastó decenas de millones de dólares comprando grandes lotes de libros, a menudo en lotes de decenas de miles, y contrató servicios profesionales para desencuadernar y escanear las páginas a gran velocidad. Después del escaneo, muchas de estas copias físicas fueron recicladas o descartadas, lo que ha generado preocupación entre autores y defensores del patrimonio cultural por la eliminación física de obras impresas.

Los detalles de Project Panama, inéditos hasta ahora, salieron a la luz en más de 4.000 páginas de documentos incluidos en una demanda por derechos de autor interpuesta por escritores contra Anthropic. La empresa, valorada por sus inversores en unos 183.000 millones de dólares, aceptó pagar 1.500 millones de dólares para cerrar el litigio en agosto. Sin embargo, la decisión de un juez federal de hacer públicos numerosos documentos del caso permitió conocer con mayor profundidad la intensidad con la que Anthropic persiguió la obtención de libros.

Estos nuevos archivos, junto con otros presentados en demandas similares contra empresas de inteligencia artificial, revelan hasta qué punto compañías tecnológicas como Anthropic, Meta, Google u OpenAI llegaron a extremos notables para reunir enormes volúmenes de datos con los que “entrenar” sus sistemas. En esa carrera acelerada, los libros fueron considerados un botín esencial. Así lo reflejan los registros judiciales: en enero de 2023, uno de los cofundadores de Anthropic sostenía que entrenar modelos con libros permitiría enseñarles “a escribir bien”, en lugar de limitarse a reproducir un “lenguaje de baja calidad propio de internet”. En un correo interno de Meta fechado en 2024, el acceso a grandes bibliotecas digitales se calificaba directamente como “imprescindible” para competir con otros actores del sector.

Sin embargo, los documentos sugieren que las empresas no consideraron viable solicitar autorización directa a autores y editoriales. En su lugar, según las acusaciones recogidas en los autos, Anthropic, Meta y otras compañías recurrieron a métodos de adquisición masiva sin conocimiento de los creadores, incluida la descarga de copias pirateadas.

Estos esfuerzos reflejan las tensiones legales y éticas detrás del entrenamiento de IA con datos culturales. Muchos autores y editoriales han emprendido demandas alegando que la adquisición y uso masivo de sus obras para entrenar modelos de IA se hizo sin permiso y constituye una violación de derechos de autor. A su vez, las empresas tecnológicas han argumentado que el uso es “transformador” y, en algunos fallos judiciales, se ha considerado legal bajo la doctrina de fair use (“uso justo”). No obstante, los documentos judiciales también han expuesto que algunas empresas, incluyendo Meta, consideraron o incluso utilizaron descargas masivas desde bibliotecas pirata en línea como LibGen para obtener copias digitales de libros sin pagar por ellos, lo que ha intensificado las críticas sobre prácticas poco transparentes.

En el caso de Meta, varios empleados expresaron internamente su inquietud ante la posibilidad de infringir la ley de derechos de autor al descargar millones de libros sin permiso. Aun así, un correo electrónico de diciembre de 2023 indicaba que la práctica había sido aprobada tras una “escalada a MZ”, en aparente referencia al consejero delegado Mark Zuckerberg. Meta declinó hacer comentarios al respecto.

Además de las cuestiones legales, expertos y críticos han señalado preocupaciones más amplias sobre el impacto cultural y social de estas prácticas. La destrucción física de libros tras su digitalización plantea preguntas sobre la preservación del patrimonio literario y el valor intrínseco de las obras impresas como registros culturales. Del mismo modo, la dependencia de datos extraídos de fuentes no autorizadas subraya la necesidad de un marco ético y regulador más robusto en torno al uso de contenidos creativos para construir inteligencias artificiales avanzadas.

Reino Unido busca abrir un nuevo debate por los derechos de autor entre la IA y los creadores

Britain seeks ‘reset’ in copyright battle between AI and creators Reuters, 13 de enero de 2026 https://www.reuters.com/business/media-telecom/britain-seeks-reset-copyright-battle-between-ai-creators-2026-01-13/

El gobierno del Reino Unido ha anunciado su intención de replantear profundamente su enfoque sobre las normas de derechos de autor en relación con la inteligencia artificial (IA), en respuesta a tensiones crecientes entre los desarrolladores de IA y los creadores de contenido tradicional.

La secretaria de Tecnología, Liz Kendall, explicó que se busca un “reinicio” de las propuestas legislativas que hasta ahora habían intentado modernizar la legislación de derechos de autor para facilitar el entrenamiento de sistemas de IA con obras existentes. Esta revisión se presentará oficialmente en un informe programado para marzo de 2026.

Hasta el momento, el planteamiento inicial del gobierno —respaldado por el primer ministro Keir Starmer como parte de su objetivo de posicionar al país como una potencia en IA— pretendía relajar las leyes para permitir el uso de cualquier material al que los desarrolladores tuvieran acceso legal, dejando a los creadores la opción de excluir sus obras si así lo deseaban. Sin embargo, esta propuesta de sistema de exclusión (opt-out) fue ampliamente criticada por los sectores creativos, que consideraron insuficiente la protección de sus derechos y la compensación por el uso de sus trabajos en el entrenamiento de modelos de IA.

Tanto Kendall como la ministra de Cultura, Lisa Nandy, reconocieron ante una comisión parlamentaria que el enfoque inicial fue un error y que los principales temores de la industria —garantizar una retribución justa por su trabajo y mantener el control sobre sus creaciones— deben ser el centro de cualquier reforma futura. La intención es adoptar una estrategia más matizada y colaborativa con diversos segmentos del sector creativo para afrontar los desafíos legales y existenciales que plantea la actual interacción entre los sistemas de IA y la propiedad intelectual tradicional.

los derechos de autor en la era de la Inteligencia Artificial generativa

Chaudhry, Uzma; Borda, Ann; Forbes, Stephanie; Jones, Joe; Perini, Antonella Maia; Rättzén, Mattias; Stewart-David, Mary. Creative Grey Zones: Copyright in the Age of Hybridity. The Alan Turing Institute, 2025. https://www.turing.ac.uk/news/publications/creative-grey-zones-copyright-age-hybridity

El informe analiza cómo la IA generativa tensiona las leyes de derechos de autor al usar obras protegidas para entrenar modelos sin consentimiento claro. Identifica “zonas grises” donde se mezclan autoría humana, producción automatizada y vacíos legales. Propone comprender estos dilemas éticos, técnicos y jurídicos para guiar futuras reformas del copyright.

El informe Creative Grey Zones: Copyright in the Age of Hybridity del The Alan Turing Institute examina cómo el auge de la inteligencia artificial generativa está forzando una reevaluación global de las leyes de derecho de autor. Parte del problema radica en que los modelos de IA se entrenan utilizando enormes cantidades de material protegido por derechos de autor —sin autorización explícita de los titulares—, y luego generan nuevos contenidos derivados de ese entrenamiento. Este uso masivo pone en tensión la eficacia de los marcos legales tradicionales que regulan la autoría

El informe identifica cuatro “zonas grises” donde convergen ética, derecho, estándares técnicos y actores híbridos (usuarios, desarrolladores, titulares de derechos, reguladores), y en las que la frontera entre creación humana y producción automatizada se vuelve difusa.

Su propósito es mapear este panorama complejo —no dictar soluciones definitivas—, aportando un análisis multidisciplinar que permita un diálogo informado para futuras reformas normativas.

Entre las tensiones destacadas, están: la dificultad de definir cuándo una obra generada o asistida por IA sigue siendo fruto de creatividad humana; los dilemas sobre consentimiento o remuneración a los autores originales cuyos trabajos alimentan los modelos; y la necesidad de adaptar las leyes de copyright para incluir nuevos tipos de “stakeholders híbridos”. El informe subraya que estos retos no son puramente técnicos sino profundamente sociales y legales, lo que exige repensar las bases mismas de la autoría y la protección intelectual en la era de la IA.