Dos autores afirman que OpenAI «ingirió» sus libros para entrenar a ChatGPT, y es posible que se produzca una «oleada» de casos judiciales similares.

Rivera, Gabriel. «2 Authors Say OpenAI “ingested” Their Books to Train ChatGPT. Now They’re Suing, and a “Wave” of Similar Court Cases May Follow.» Business Insider. Accedido 19 de julio de 2023. https://www.businessinsider.com/openai-copyright-lawsuit-authors-chatgpt-trained-on-books-2023-7.

OpenAI se enfrenta a una demanda interpuesta por dos autores de renombre, Mona Awad y Paul Tremblay. Los autores acusan a OpenAI de violar la ley de propiedad intelectual al utilizar sus libros publicados para entrenar ChatGPT, el modelo de lenguaje de OpenAI, sin obtener su consentimiento.

La demanda, presentada a finales de junio, sostiene que el extenso modelo de lenguaje de ChatGPT «ingirió» el contenido protegido por derechos de autor de Mona Awad y Paul Tremblay. Los autores sostienen que la capacidad de ChatGPT para generar resúmenes detallados de sus obras sugiere que sus libros se incluyeron en los conjuntos de datos utilizados para entrenar la tecnología de IA.

Esta acción legal ejemplifica la tensión existente entre los creadores y las herramientas de IA generativa, que tienen la capacidad de producir texto e imágenes en cuestión de segundos. Muchos profesionales que trabajan en campos creativos expresan su preocupación por el impacto potencial del rápido avance de la tecnología en sus carreras y medios de vida. En consecuencia, estas preocupaciones están dando lugar cada vez más a desafíos legales.

Daniel Gervais, profesor de Derecho de la Universidad de Vanderbilt, señaló a Insider que la demanda presentada por los autores es uno de los varios casos de derechos de autor que han surgido en todo el país relacionados con herramientas de IA generativa. Sugiere que pueden surgir disputas legales similares en el futuro.

Gervais espera que muchos más autores demanden a las empresas que desarrollan grandes modelos de lenguaje y generative AI a medida que estos programas avancen y mejoren en la replicación del estilo de escritores y artistas. Él cree que es inminente una avalancha de desafíos legales que apuntan a la producción de herramientas como ChatGPT en todo el país.

Demostrar que los autores en el caso sufrieron daños económicos debido a las prácticas de recolección de datos de OpenAI, como alega la demanda, puede ser un desafío. Gervais dijo a Insider que ChatGPT podría haber obtenido el trabajo de Awad y Tremblay de fuentes alternativas distintas al material original de los autores, pero que era posible que el bot «ingiriera» sus libros como afirma la demanda.

Andres Guadamuz, experto en IA y derechos de autor en la Universidad de Sussex, expresó la misma preocupación, al decir a Insider que incluso si los libros están en los conjuntos de datos de entrenamiento de OpenAI, la compañía podría haber obtenido el trabajo a través de la recopilación legal de otro conjunto de datos.

Y demostrar que ChatGPT se habría comportado de manera diferente si nunca hubiera recopilado el trabajo de los autores es poco probable debido a la gran cantidad de datos que obtiene de la web, según afirmó Guadamuz a The Guardian.

The Authors Guild, un grupo de defensa con sede en Estados Unidos que apoya los derechos laborales de los escritores, publicó una carta abierta la semana pasada instando a los directores ejecutivos de las grandes empresas de tecnología y de IA a «obtener permiso» de los escritores para utilizar su trabajo con derechos de autor en la formación de programas de generative AI y «compensar justamente a los escritores». La organización informó a Insider que su carta ha recibido más de 2,000 firmas.

La demanda de Awad y Tremblay se presentó el mismo día en que OpenAI recibió otra denuncia legal, alegando que la compañía se apropió de «enormes cantidades de datos personales» que luego alimentó a ChatGPT. La denuncia de 157 páginas, que excluye los nombres completos de los 16 demandantes, critica a la compañía por absorber «prácticamente cada pieza de datos intercambiada en Internet que pudo obtener».

En cuanto a la demanda de Awad y Tremblay, presentada en un tribunal de distrito en el norte de California, los autores buscan daños y la restitución de lo que consideran ganancias perdidas.

El archivo de la demanda también presentó documentos que contenían resúmenes producidos por ChatGPT de las novelas de Awad «13 Ways of Looking at a Fat Girl» y «Bunny», así como de la novela de Tremblay «The Cabin at the End of the World». La novela de Tremblay fue adaptada a la película «Knock at the Cabin» dirigida por M. Night Shyamalan.

OpenAI y Awad no respondieron a las solicitudes de comentarios por parte de Insider. Un representante de Tremblay se negó a hacer comentarios.