Tres autores demandan a Anthropic por infracción de derechos de autor en el entrenamiento de IA

Roth, E. (2024, agosto 20). Authors sue Anthropic for training AI using pirated books. The Verge. https://www.theverge.com/2024/8/20/24224450/anthropic-copyright-lawsuit-pirated-books-ai

La compañía de inteligencia artificial Anthropic enfrenta una demanda colectiva en un tribunal federal de California, interpuesta por tres autores que afirman que la empresa utilizó sus libros y cientos de miles de obras más para entrenar su chatbot Claude, impulsado por IA.

Un grupo de autores ha demandado a la compañía de inteligencia artificial Anthropic, acusándola de entrenar sus modelos de IA con libros pirateados, según informó Reuters. La demanda colectiva, presentada en un tribunal de California, alega que Anthropic «construyó un negocio multimillonario robando cientos de miles de libros con derechos de autor.»

La demanda sostiene que Anthropic utilizó un conjunto de datos de código abierto conocido como «The Pile» para entrenar su familia de chatbots Claude. Dentro de este conjunto de datos se encuentra «Books3», una vasta biblioteca de ebooks pirateados que incluye obras de Stephen King, Michael Pollan y miles de otros autores. A principios de agosto, Anthropic confirmó a Vox que utilizó «The Pile» para entrenar a Claude.

La demanda afirma que Anthropic descargó y reprodujo copias de «The Pile» y «Books3», sabiendo que estos conjuntos de datos contenían contenido con derechos de autor extraído de sitios pirata como Bibiliotik. Los autores buscan que el tribunal certifique la demanda colectiva, exija a Anthropic el pago de daños y perjuicios propuestos, y prohíba a la compañía utilizar material protegido por derechos de autor en el futuro.

Los escritores que demandan a Anthropic incluyen a Andrea Bartz, autora de We Were Never Here; Charles Graeber, autor de The Good Nurse; y Kirk Wallace Johnson, autor de The Feather Thief. Aunque se reconoce que «Books3» ha sido eliminado de la versión «más oficial» de «The Pile», la versión original supuestamente sigue disponible en línea. Una investigación reciente también descubrió que compañías como Anthropic y Apple entrenaron sus modelos de IA con miles de subtítulos de videos de YouTube extraídos de «The Pile».

El año pasado, el exgobernador de Arkansas Mike Huckabee y otros autores presentaron una demanda similar contra Meta, Microsoft y EleutherAI, la organización sin fines de lucro detrás de «The Pile», por acusaciones de uso indebido de sus obras para entrenar modelos de IA. Otros autores, como George R.R. Martin, Jodi Picoult y Michael Chabon, también han demandado a OpenAI por el supuesto uso de su contenido protegido por derechos de autor.

Explorando las capacidades de ChatGPT como bibliotecario investigador, ético de la investigación, generador de datos y predictor de datos.

Lehr, Steven A., Aylin Caliskan, Suneragiri Liyanage, y Mahzarin R. Banajii. «ChatGPT as Research Scientist: Probing GPT’s Capabilities as a Research Librarian, Research Ethicist, Data Generator, and Data Predictor.» Proceedings of the National Academy of Sciences 121, no. 35 (2024): e2404328121. https://doi.org/10.1073/pnas.2404328121

¿Hasta qué punto es ChatGPT un buen investigador científico? Se probó sistemáticamente las capacidades de GPT-3.5 y GPT-4 en cuatro componentes centrales del proceso científico: como bibliotecario de investigación, ético de investigación, generador de datos y predictor de datos novedosos, utilizando la ciencia psicológica como campo de pruebas.

En el Estudio 1 (Bibliotecario de Investigación), a diferencia de los investigadores humanos, GPT-3.5 y GPT-4 alucinaron, generando autoritariamente referencias ficticias el 36,0% y el 5,4% de las veces, respectivamente, aunque GPT-4 mostró una capacidad evolutiva para reconocer sus ficciones.

En el Estudio 2 (Ética de la investigación), GPT-4 (aunque no GPT-3.5) demostró ser capaz de detectar infracciones como el p-hacking en protocolos de investigación ficticios, corrigiendo el 88,6% de los problemas presentados de forma flagrante y el 72,6% de los presentados de forma sutil.

En el Estudio 3 (Generador de datos), ambos modelos reprodujeron sistemáticamente patrones de sesgo cultural descubiertos previamente en grandes corpus lingüísticos, lo que indica que ChatGPT puede simular resultados conocidos, un antecedente de utilidad tanto para la generación de datos como para habilidades como la generación de hipótesis.

Por el contrario, en el Estudio 4 (Predictor de datos novedosos), ninguno de los modelos logró predecir resultados nuevos ausentes en sus datos de entrenamiento, y ninguno pareció aprovechar información sustancialmente nueva a la hora de predecir resultados más o menos novedosos.

En conjunto, estos resultados sugieren que GPT es un bibliotecario defectuoso pero en rápida mejora, un ético de la investigación ya decente, capaz de generar datos en dominios simples con características conocidas, pero deficiente en la predicción de nuevos patrones de datos empíricos para ayudar en futuras experimentaciones.

Manifiesto por las métricas socioterritoriales de la ciencia la tecnología y la innovación

Cancino, Ronald and Albis Salas, Nadia and Villarroel Valenzuela, Jacqueline and Robles Belmont, Eduardo and Oliveira [et al.] Manifiesto por las métricas socioterritoriales de la ciencia la tecnología y la innovación 2024

Ver

La ciencia, la tecnología y la innovación han devenido en un verdadero motor de transformaciones de toda índole en escalas locales y globales. Sin embargo, las capacidades desigualmente distribuidas a nivel mundial han generado desarrollos desproporcionales en estas distribuciones. No es tan solo un problema de la ciencia en sí, sino del modo en cómo se han desarrollado las sociedades, las relaciones entre ellas, y el rol que han jugado la ciencia y la tecnología en la dinámica y el desarrollo de las sociedades. Hoy, a los problemas de asimetrías, desigualdad, exclusión y marginalidad, se suman pandemias, migraciones forzadas, extractivismo y los efectos visibles de la autonomización del cambio climático como generador de transformaciones y desastres locales y globales en los que la ciencia y la tecnología juegan un rol central en su comprensión, mitigación, prevención y solución. De este modo, el desarrollo de capacidades y el conocimiento sobre su distribución local y global son fundamentales para una actuación en el mundo contemporáneo. En este contexto, una verdadera transformación en la ciencia parece experimentarse. La conformación de redes, la demanda por impactos, la investigación mediante y en mundos virtuales y simulados, junto al creciente movimiento por el acceso y la ciencia abierta y ciudadana, son acompañados por permanentes ajustes y rediseños institucionales, actualizaciones de políticas, nuevas prioridades, instrumentos y una tendencia creciente a alinearse, por ejemplo, a los Objetivos de Desarrollo Sostenible. En este contexto, los esfuerzos para conocer, comprender y gestionar las capacidades de ciencia, tecnología e innovación, mediante métricas y formas de evaluación científica, continúan centrados en formas tradicionales y en métricas de impacto de citaciones articuladas a formas de evaluación, financiación y gasto en sistemas de publicaciones transnacionales. Los movimientos locales, nacionales y globales por la apertura de la ciencia y su evaluación son cada vez más activos, y permean de manera muy incipiente las políticas de ciencia, tecnología e innovación. Proponemos que, en estos esfuerzos, debemos incorporar un conjunto de principios que permitan construir métricas para la medición de capacidades y formas de evaluación que consideren las características, requerimientos y demandas socioterritoriales respecto de las cuales actúan y se desarrollan capacidades científicas y tecnológicas.

El valor de los terceros espacios

The Power of Third Places in Effective Leadership | Psychology Today. (2024). Recuperado 19 de agosto de 2024, de https://www.psychologytoday.com/intl/blog/radical-sabbatical/202407/the-power-of-third-places-in-effective-leadership

El concepto de «tercer lugar» se refiere a un espacio fuera del trabajo y del hogar donde uno puede relajarse y conectar con otros. Encontrar un tercer lugar, como una cafetería, un parque o una biblioteca, puede mejorar la creatividad, el bienestar y, en última instancia, la efectividad en el liderazgo. Estos lugares proporcionan un ambiente acogedor que permite recargar energías y equilibrar la vida personal con la profesional. Invertir tiempo en un tercer lugar es una estrategia que fortalece tanto el liderazgo como la satisfacción personal, promoviendo un enfoque más saludable y equilibrado en la vida y el trabajo.

La rutina de «trabajar, comer, dormir, repetir» puede ser agotadora, llevando a muchos a sentirse insatisfechos. La verdadera satisfacción implica prosperar, no solo sobrevivir. Si te identificas con esto, podría ser el momento de explorar el concepto de «tercer lugar», un término popularizado por el sociólogo Ray Oldenburg. Este concepto se refiere a espacios fuera de la oficina (el segundo lugar) y el hogar (el primer lugar), donde puedes relajarte, conectar y rejuvenecer. El objetivo de un tercer lugar es ser casual y acogedor, un lugar donde los miembros de una comunidad puedan interactuar, sin que el costo sea una barrera para asistir.

Equilibrar las responsabilidades de liderazgo con el tiempo personal es difícil, especialmente con la difusa línea entre el trabajo y la vida personal debido a la conectividad digital. Encontrar un tercer lugar es vital: sirve como un refugio para fomentar la creatividad, mantener el equilibrio y mejorar el bienestar, lo que en última instancia aumenta tu efectividad como líder.

Para comenzar, comienza reflexionando sobre tus preferencias y necesidades. Considera las actividades que te traen alegría y relajación. Ya sea leer, socializar, estar en la naturaleza o explorar nuevas cocinas, identificar lo que resuena contigo guiará tu búsqueda. Piensa en el ambiente que te calma: ¿Te sientes mejor en entornos bulliciosos con ruido de fondo o prefieres lugares tranquilos para la introspección? También evalúa cuán lejos estás dispuesto a viajar y cómo puedes integrar tu tercer lugar en tu rutina diaria.

¿Qué espacios pueden ser terceros lugares?

  • Bibliotecas y Librerías: Ambientes tranquilos y acogedores ideales para leer, estudiar o asistir a eventos comunitarios como clubes de lectura o charlas de autores.
  • Parques y Espacios al Aire Libre: Entornos naturales donde puedes disfrutar del aire fresco, hacer ejercicio y contemplar paisajes.
  • Centros Comunitarios: Lugares que albergan diversas actividades, como clases de fitness, talleres de arte y reuniones sociales, fomentando el compromiso comunitario.
  • Refugios de Animales: Si amas a los animales, este es un maravilloso modo de llenarte de energía y retribuir a la comunidad cuidando a los animales y dándoles amor.
  • Cafeterías: Populares por su ambiente relajado, ofrecen un espacio para disfrutar de café y aperitivos, y a veces incluso para trabajar o socializar de manera casual.

Estos ejemplos resaltan la diversidad de los terceros lugares, cada uno atendiendo a necesidades únicas. La clave es encontrar un lugar que se alinee con tus intereses, proporcione comodidad y te permita recargar energías fuera de las presiones del trabajo y el hogar.

¿Qué beneficios proporcionan los terceros lugares?

  • Recargar y Rejuvenecer: Estos santuarios proporcionan una oportunidad vital para alejarse del ajetreo diario, aliviar el estrés, ganar una nueva perspectiva y regresar a tu rol con energía y claridad renovadas.
  • Estimular la Creatividad e Innovación: La exposición a nuevas experiencias y perspectivas en terceros lugares puede estimular ideas frescas, fomentando la creatividad esencial para mantenerse a la vanguardia en industrias competitivas.
  • Promover el Equilibrio entre la Vida Personal y Profesional: Priorizar intereses personales y bienestar en un tercer lugar mejora la resiliencia general y la salud mental, lo que mejora la toma de decisiones y la productividad.

Un tercer lugar es una inversión estratégica en efectividad como líder y en satisfacción personal. Empodera para liderar con autenticidad, creatividad y resiliencia, promoviendo un enfoque equilibrado que beneficia tanto eñ desempeño profesional como el bienestar personal. Esto puede allanar el camino para una cultura organizacional más saludable y un éxito sostenible en tu trayectoria de liderazgo.

ChatGPT es realmente pésimo diagnosticando afecciones médicas

published, B. T. (2024, agosto 16). ChatGPT is truly awful at diagnosing medical conditions. Livescience.Com. https://www.livescience.com/technology/artificial-intelligence/chatgpt-less-accurate-than-a-coin-toss-at-medical-diagnosis-new-study-finds

Un estudio reciente reveló que ChatGPT tiene una precisión de menos del 50% al realizar diagnósticos médicos. Los investigadores pidieron al chatbot que evaluara 150 estudios de casos de la web médica Medscape y encontraron que GPT 3.5, la versión del modelo utilizada, solo acertó en el 49% de los casos. Aunque estudios previos demostraron que el chatbot podría aprobar el Examen de Licencia Médica de los Estados Unidos, los autores del nuevo estudio, publicado el 31 de julio en la revista PLOS ONE, advirtieron sobre los peligros de depender de la IA para casos médicos complejos. Según el Dr. Amrit Kirpalani, es crucial que la comunidad médica eduque al público sobre las limitaciones de estas herramientas, que aún no deben reemplazar a los médicos.

El futuro de la edición y la comunicación académica: Informe del Grupo de Expertos a la Comisión Europea

Guédon, Jean-Claude, ed. El futuro de la edición y la comunicación académica: Informe del Grupo de Expertos a la Comisión Europea. Books2bits, 2024. https://doi.org/10.51438/B2Binfoce2024.

PDF

El informe propone una visión del futuro de la comunicación académica; examina el sistema actual -con sus puntos fuertes y débiles- y sus principales actores. Considera el papel de los investigadores, las instituciones de investigación, las financiadoras y responsables políticos, los editores y otros proveedores de servicios, así como los ciudadanos, y formula recomendaciones dirigidas a cada uno de ellos. El informe sitúa a los investigadores y sus necesidades en el centro de la comunicación académica del futuro y considera que el conocimiento y la comprensión creados por los investigadores son bienes públicos. Los desarrollos actuales, propiciados principalmente por la tecnología, han dado lugar a una ampliación de los tipos de actores que intervienen en la comunicación académica y, en algunos casos, a la desagregación de las funciones tradicionales en el sistema.

El informe considera que la evaluación de la investigación es una piedra angular de la comunicación científica que afecta a todos los actores. Los investigadores, las comunidades y todas las organizaciones, en particular las financiadoras, tienen la posibilidad de mejorar el actual sistema de comunicación y edición académicas: deberían empezar por introducir cambios en el sistema de evaluación de la investigación. La colaboración entre los actores es esencial para lograr un cambio positivo y permitir la innovación en el sistema de comunicación y publicación académicas en el futuro.

Las ventas de audiolibros en Harper Collins han superado por primera vez a las de libros electrónicos

Limbong, Andrew. «Audiobooks Are Doing Better than Ever. Just Ask Harper Collins.» NPR, August 16, 2024. https://www.npr.org/2024/08/16/nx-s1-5072546/audiobooks-are-doing-better-than-ever-just-ask-harper-collins.

Las ventas de audiolibros en Harper Collins han superado por primera vez a las de libros electrónicos, según un reciente informe de ganancias. Este crecimiento no es un auge repentino, sino el resultado de varios factores, como el lanzamiento de la plataforma ACX de Amazon en 2011, que permitió a autores independientes publicar audiolibros, y el aumento del consumo de contenido de audio debido al auge del podcasting y la pandemia de COVID-19. Michele Cobb, de la Audio Publishers Association, señala que la industria ha evitado el ciclo de auge y caída del podcasting, ya que se basa en un modelo de ventas unitarias en lugar de publicidad. Sin embargo, hay preocupaciones sobre el impacto futuro de la inteligencia artificial y la entrada de Spotify en el mercado de audiolibros.

La audiencia de audiolibros también ha cambiado considerablemente. Si bien en el pasado los oyentes de audiolibros eran predominantemente personas mayores que escuchaban cintas de cassette, hoy en día, la mayoría de los oyentes son menores de 45 años. Además, estos adultos jóvenes están introduciendo a sus hijos en el mundo de los audiolibros, ampliando aún más el alcance del mercado.

A diferencia del podcasting, que ha experimentado altibajos debido a su dependencia de modelos de negocio basados en la publicidad, la industria de los audiolibros ha disfrutado de un crecimiento más estable. Esto se debe a que los audiolibros se venden como unidades individuales, al igual que los libros impresos, lo que proporciona una fuente de ingresos más constante y predecible.

A pesar del éxito reciente, la industria de los audiolibros enfrenta desafíos. Uno de los principales es el impacto potencial de la inteligencia artificial, que podría afectar la producción y el empleo en la narración de audiolibros. Además, la entrada de Spotify en el mercado de audiolibros a fines de 2023 genera tanto expectativas como preocupaciones. Aunque algunos editoriales reportan que esta incursión ha atraído a nuevos oyentes, también hay inquietudes sobre cómo este modelo de negocio podría afectar los ingresos de los autores.

Retiran más de 16.000 artículos científicos generados con Inteligencia Artificial

Agencia AFP. «Alerta en la ciencia: se han retirado más de 16 mil artículos científicos hechos con la ayuda de la Inteligencia ArtificialEl Colombiano, 12 de agosto de 2024. https://www.elcolombiano.com/tecnologia/retiran-miles-de-articulos-cientificos-hechos-con-inteligencia-artificial-HP25195741

La ciencia enfrenta una alerta preocupante debido al retiro de más de 16.000 artículos científicos que fueron elaborados con la ayuda de inteligencia artificial (IA). Se espera que esta cifra aumente en los próximos meses. Estos artículos, que presentan errores graves y absurdos, como una imagen de una rata con genitales sobredimensionados o una pierna humana con un número incorrecto de huesos, han sido publicados en revistas científicas importantes.

Aunque la IA, como ChatGPT, se reconoce por su utilidad en tareas como la traducción, su uso en la redacción de artículos científicos ha generado preocupaciones por prácticas deshonestas. Un ejemplo de esto ocurrió en marzo de 2024, cuando un artículo comenzó con una frase típica de ChatGPT, lo que llevó a su retiro.

El empleo de IA en la literatura científica es cada vez más difícil de detectar y está en aumento. Según estudios, al menos 60.000 artículos en 2023 fueron realizados con ayuda de la IA, lo que representa un 1% de la producción científica anual. Esta tendencia está contribuyendo a un aumento significativo en el número de artículos retirados, que alcanzó un récord de 13.000 en 2023.

La IA ha facilitado la creación masiva de artículos científicos de baja calidad, plagiados o falsos, a menudo producidos por «fábricas» de artículos financiadas por investigadores. Se estima que estas «fábricas» son responsables de un 2% de los estudios publicados, cifra que podría estar aumentando considerablemente debido a la IA.

Metadatos de alta calidad: Una responsabilidad y una oportunidad colectivas.

Buttrick, Adam. «High-Quality Metadata: A Collective Responsibility and OpportunityUpstream, August 13, 2024. https://upstream.force11.org/high-quality-metadata/

La comunidad y las herramientas relacionadas con los Identificadores de Objetos Digitales (DOI, por sus siglas en inglés) dependen de metadatos de alta calidad para establecer conexiones y mejorar la eficiencia. Sin embargo, el modelo actual, donde las mejoras en estos metadatos se limitan a sus creadores o se realizan dentro de silos a nivel de servicio, perpetúa un sistema con importantes lagunas, ineficiencias y desconexiones. Pero este no tiene por qué ser el caso. Al construir de manera colaborativa sistemas abiertos, robustos y escalables para enriquecer los metadatos DOI, la comunidad puede aprovechar su trabajo colectivo para superar estas barreras y mejorar el estado e interconexión de la información de investigación.

La construcción del corpus de metadatos DOI a lo largo de los años ha enseñado a la comunidad una lección importante: cuando se trabaja en conjunto para definir cómo debería existir la infraestructura y cómo se desea mejorarla, se logran mejores resultados que cuando este trabajo se realiza de manera aislada. La administración colectiva de las fuentes compartidas de verdad permite tomar decisiones correctas para el mayor número posible de personas.

El enriquecimiento comunitario de los metadatos DOI presenta desafíos significativos, aunque no insuperables. La reunión inicial en Los Ángeles reafirmó el interés de la comunidad en abordar este desafío de manera conjunta, tal como se ha hecho con otras iniciativas de infraestructura exitosas. A través de la colaboración y el uso de la experiencia compartida, es posible construir un sistema de información de investigación mejor y más conectado. UC3 continuará con estas discusiones críticas e invita a la comunidad a mantenerse involucrada.

Internet Archive se ve obligado a retirar 500.000 libros tras la victoria judicial de los editores

Belanger, A. (2024, junio 21). Internet Archive forced to remove 500,000 books after publishers’ court win. Ars Technica. https://arstechnica.com/tech-policy/2024/06/internet-archive-forced-to-remove-500000-books-after-publishers-court-win/

Internet Archive, una biblioteca en línea que proporciona acceso gratuito a una vasta colección de libros, ha tenido que retirar aproximadamente 500.000 títulos después de una victoria legal obtenida por los editores. Esta decisión judicial, tomada el año pasado, obligó a Internet Archive a reducir drásticamente su oferta, lo que ha causado una «pérdida devastadora» para los lectores que dependen de esta plataforma para acceder a libros difíciles de conseguir o inexistentes en sus bibliotecas locales.

Internet Archive está apelando la decisión ante el Tribunal de Apelaciones del Segundo Circuito de EE. UU., argumentando que su modelo de préstamo digital controlado debería considerarse un uso justo bajo la ley de derechos de autor. La organización sostiene que los editores no han presentado pruebas de que su mercado de libros electrónicos haya sufrido daños a causa del préstamo de Internet Archive. Además, afirma que sus prácticas están alineadas con la tecnología estándar de la industria para evitar la descarga y redistribución no autorizada de los libros.

Chris Freeland, director de servicios de biblioteca de Internet Archive, ha expresado que los editores que han demandado a Internet Archive han impuesto restricciones que limitan gravemente el acceso a los libros, afectando a académicos, estudiantes y lectores en comunidades desfavorecidas. En respuesta, muchos usuarios de Internet Archive han firmado una carta abierta pidiendo a los editores que reconsideren y restauren los libros eliminados, subrayando el impacto negativo en la educación y el acceso a la información.

Los editores, representados por la Asociación de Editores Americanos (AAP), defienden las retiradas alegando que IA violó los derechos de autor al ofrecer acceso global a obras sin licencias adecuadas. La AAP no ha respondido a las preocupaciones sociales expresadas por los usuarios de IA.

En el caso de que la apelación no tenga éxito, Internet Archive planea seguir luchando en los tribunales para restablecer el acceso a los títulos afectados. Mientras tanto, la biblioteca sigue creciendo en otros aspectos, como la digitalización de libros para preservación y la oferta de libros fuera de circulación y de dominio público.

El resultado del caso podría tardar meses en resolverse, y los usuarios del Internet Archive, incluidos aquellos en comunidades rurales o con discapacidades, temen perder uno de los pocos recursos confiables para acceder a libros raros o difíciles de encontrar.