The Public Interest Corpus es un proyecto para desarrollar un corpus de entrenamiento de IA de alto nivel basado en libros y otros materiales de bibliotecas y archivos

 The Public Interest Corpus

El proyecto The Public Interest Corpus se enmarca en una tendencia global donde instituciones culturales y académicas buscan desarrollar infraestructuras de inteligencia artificial (IA) que prioricen el interés público. Estas iniciativas buscan democratizar el acceso a la IA y garantizar que su desarrollo beneficie a toda la sociedad.

En Europa, por ejemplo, se ha lanzado ALIA, la primera infraestructura pública, abierta y multilingüe de IA en el continente. Financiada completamente con fondos públicos, ALIA tiene como objetivo servir a la ciudadanía, administraciones públicas, universidades y empresas, asegurando un acceso universal a tecnologías avanzadas de IA. Este esfuerzo representa un paso significativo hacia la soberanía digital europea y la creación de modelos de lenguaje que reflejen la diversidad lingüística y cultural de la región.

Además, la Authors Alliance, con el apoyo de la Fundación Mellon, ha iniciado un proyecto para planificar un archivo de libros orientado al interés público en el desarrollo de la IA. En colaboración con la Biblioteca de la Universidad de Northeastern, esta iniciativa busca crear un corpus de entrenamiento de IA de alta calidad, basado en colecciones de bibliotecas y archivos, para promover el aprendizaje y el acceso al conocimiento.

Estas iniciativas reflejan un esfuerzo concertado por parte de diversas organizaciones para garantizar que el desarrollo de la IA se alinee con valores éticos y beneficie al público en general, evitando la concentración de poder en manos de unos pocos actores corporativos.