
The open source ai definition 1.0. Open Source Initiative, 2024
Se presenta la primera definición oficial de inteligencia artificial de código abierto, conocida como Open Source AI Definition (OSAID), elaborada por la Open Source Initiative (OSI). Esta definición surge de años de colaboración con académicos e industriales y tiene como objetivo establecer un estándar claro que permita identificar si un modelo de IA es realmente de código abierto.
Una de las principales motivaciones para esta definición es alinear a los legisladores y desarrolladores de IA, especialmente en un contexto donde organismos como la Comisión Europea están considerando un reconocimiento especial para el código abierto. Según Stefano Maffulli, vicepresidente de la OSI, el objetivo es que, al haber consenso, se reduzcan las confusiones sobre lo que se considera realmente «código abierto».
Para que un modelo de IA se considere de código abierto bajo la OSAID, debe proporcionar suficiente información sobre su diseño, de manera que cualquier persona pueda recrearlo sustancialmente. Esto incluye detalles sobre los datos de entrenamiento, su origen y cómo se pueden obtener o licenciar. Maffulli enfatiza que un modelo de IA de código abierto debe permitir a los usuarios entender completamente su construcción y modificarlo libremente.
Sin embargo, la OSI no cuenta con mecanismos de cumplimiento para obligar a los desarrolladores a seguir la OSAID. Su intención es señalar aquellos modelos que se etiquetan como “código abierto” pero que no cumplen con la definición. La OSI espera que la comunidad de IA no reconozca modelos mal etiquetados, lo que podría llevar a correcciones en el uso del término.
A pesar de la participación de grandes empresas tecnológicas, como Meta, en la elaboración de la OSAID, muchas de estas han sido criticadas por no cumplir con sus criterios. Por ejemplo, Meta requiere licencias especiales para usar sus modelos Llama, lo que contradice la esencia de ser “código abierto”. La situación es similar con otras empresas, donde los modelos se presentan como abiertos, pero con restricciones significativas.
El artículo también destaca que un estudio reciente encontró que muchos modelos de “código abierto” son en realidad solo nominalmente abiertos, ya que mantienen en secreto datos de entrenamiento y requieren recursos computacionales que son inaccesibles para muchos desarrolladores. Esto sugiere que, en lugar de democratizar la IA, estos proyectos pueden consolidar el poder centralizado.
Además, hay voces críticas, como la de Meta, que argumentan que la OSAID no aborda adecuadamente las complejidades de los modelos de IA modernos. Meta defiende su enfoque cauteloso en cuanto a la divulgación de datos de entrenamiento, alegando que esto es necesario para evitar implementaciones dañinas.
El artículo también menciona que la OSAID no aborda cuestiones de derechos de autor y licencias de datos de entrenamiento, lo que podría limitar su efectividad. Maffulli reconoce que la definición necesitará revisiones y actualizaciones, y la OSI ha creado un comité para supervisar su aplicación y proponer enmiendas en el futuro.
En resumen, la OSAID representa un avance significativo en la clarificación de lo que constituye la inteligencia artificial de código abierto, pero aún enfrenta desafíos y críticas que deberán abordarse para que sea realmente efectiva y útil en la práctica.

