
Leppert, Greg. «Harvard’s Library Innovation Lab Launches Institutional Data Initiative.» Harvard Law School Today, December 12, 2024. https://hls.harvard.edu/today/harvards-library-innovation-lab-launches-initiative-to-use-public-domain-data-to-train-artificial-intelligence/.
La Iniciativa de Datos Institucionales (IDI, por sus siglas en inglés) es un nuevo programa lanzado por el Harvard Library Innovation Lab con el objetivo de mejorar la accesibilidad de los datos de dominio público para el entrenamiento de la inteligencia artificial (IA). Este programa tiene como foco hacer disponibles grandes cantidades de datos de instituciones de conocimiento, incluyendo casi un millón de libros digitalizados en la Biblioteca de la Facultad de Derecho de Harvard, para alimentar modelos
Institutional Data Initiative (IDI), de la Biblioteca de la Facultad de Derecho de Harvard, lanzada el 12 de diciembre de 2024, tiene como objetivo ampliar y mejorar los recursos de datos disponibles para entrenar modelos de inteligencia artificial (IA). Este programa se centra en hacer accesibles los materiales de dominio público almacenados en instituciones como la Biblioteca de la Facultad de Derecho de Harvard, incluida una base de datos de casi un millón de libros digitalizados, para entrenar IA.
La iniciativa busca resolver la falta de diversidad y la subrepresentación de ciertos grupos en los conjuntos de datos utilizados actualmente para entrenar IA. Estos datos, proveniente de colecciones de instituciones académicas y bibliotecas públicas, son clave para desarrollar sistemas de IA más inclusivos y representativos. Según Greg Leppert, director ejecutivo de IDI, estos conjuntos de datos deben ser parte de la «dieta saludable» de datos para entrenar IA, ya que las IA solo son tan diversas como los datos con los que se entrenan.
Además, el proyecto busca garantizar que los datos de dominio público, como los obtenidos a través del Caselaw Access Project, no sean alterados ni omitidos, preservando la integridad de las colecciones institucionales. IDI también trabaja en colaboración con otras instituciones de conocimiento, como la Biblioteca Pública de Boston, y planea realizar un simposio para fomentar la cooperación y la liberación de datos entre diversas instituciones.
En general esta Iniciativa de Datos Institucionales de Harvard tiene como objetivo mejorar el acceso a los datos públicos y promover el uso ético de estos recursos para el entrenamiento de IA, con el fin de asegurar que las tecnologías futuras beneficien a la humanidad de manera más equitativa.