Home Tecnología De todos modos, ¿qué significa “IA de código abierto”?

De todos modos, ¿qué significa “IA de código abierto”?

by internauta
0 comment


La lucha entre el software de código abierto y el software propietario es bien conocida. Pero las tensiones que impregnan los círculos del software durante décadas se han trasladado al espacio de la inteligencia artificial, en parte porque nadie puede ponerse de acuerdo sobre lo que realmente significa “fuente abierta” en el contexto de la IA.

El New York Times publicó recientemente una evaluación efusiva del CEO de Meta, Mark Zuckerberg, señalando cómo su adopción de la “IA de código abierto” lo había hecho popular una vez más en Silicon Valley. Sin embargo, según la mayoría de las estimaciones, los grandes modelos de lenguaje de marca Llama de Meta no son realmente de código abierto, lo que resalta el meollo del debate.

Es este desafío el que la Iniciativa de Código Abierto (OSI) está tratando de abordar, dirigida por el director ejecutivo Stefano Maffulli (en la foto de arriba), a través de conferencias, talleres, paneles, seminarios web, informes y más.

La IA no es código de software

<strong>Créditos de imagen<strong> Westend61 vía Getty

La OSI ha sido guardiana de la Definición de Código Abierto (OSD) durante más de un cuarto de siglo, estableciendo cómo el término “código abierto” puede o debe aplicarse al software. Una licencia que cumple con esta definición puede considerarse legítimamente “código abierto”, aunque reconoce un espectro de licencias que van desde extremadamente permisivas hasta no tan permisivas.

Pero trasladar las convenciones de denominación y licencias heredadas del software a la IA es problemático. Joseph Jacks, evangelista del código abierto y fundador de la firma de capital riesgo OSS Capital, llega incluso a decir que “no existe la IA de código abierto”, señalando que “el código abierto se inventó explícitamente para el código fuente del software”. Además, los “pesos de la red neuronal” (NNW, por sus siglas en inglés), un término utilizado en el mundo de la inteligencia artificial para describir los parámetros o coeficientes a través de los cuales la red aprende durante el proceso de entrenamiento, no son de ninguna manera comparables con el software.

“Los pesos netos neuronales no son código fuente de software; son ilegibles para los humanos, [and they are not] depurable”, señala Jacks. “Además, los derechos fundamentales del código abierto tampoco se trasladan a los NNW de manera congruente”.

Estas inconsistencias llevaron el año pasado a Jacks y a su colega de OSS Capital, Heather Meeker, a idear su propia definición en torno al concepto de “pesos abiertos”. Y Maffulli, si sirve de algo, está de acuerdo con ellos. “El punto es correcto”, dijo a TechCrunch. “Uno de los debates iniciales que tuvimos fue si llamarlo IA de código abierto, pero todo el mundo ya estaba usando el término”.

Ilustración de llamas
<strong>Créditos de imagen<strong> Larysa Amosova vía Getty

Fundada en 1998, la OSI es una corporación de beneficio público sin fines de lucro que trabaja en una gran variedad de actividades relacionadas con el código abierto en torno a la promoción, la educación y su principal razón de ser: la definición de código abierto. Hoy en día, la organización depende de patrocinios para su financiación, con miembros tan estimados como Amazon, Google, Microsoft, Cisco, Intel, Salesforce y Meta.

La participación de Meta con OSI es particularmente notable en este momento en lo que respecta a la noción de “IA de código abierto”. A pesar de que Meta cuelga su sombrero de IA en la clavija del código abierto, la compañía tiene restricciones notables con respecto a cómo se pueden usar sus modelos Llama: claro, se pueden usar de forma gratuita para casos de uso comercial y de investigación, pero los desarrolladores de aplicaciones con más de 700 millones de usuarios mensuales deben solicitar una licencia especial a Meta, que ésta otorgará a su entera discreción.

El lenguaje de Meta en torno a sus LLM es algo maleable. Si bien la compañía llamó a su modelo Llama 2 de código abierto, con la llegada de Llama 3 en abril, se apartó un poco de la terminología y utilizó en su lugar frases como “abiertamente disponible” y “abiertamente accesible”. Pero en algunos lugares todavía se refiere al modelo como “código abierto”.

“Todos los que participan en la conversación están perfectamente de acuerdo en que Llama en sí no puede considerarse de código abierto”, dijo Maffulli. “Las personas con las que he hablado que trabajan en Meta saben que es un poco exagerado”.

Además de eso, algunos podrían argumentar que aquí hay un conflicto de intereses: ¿una empresa que ha mostrado un deseo de aprovechar la marca de código abierto también proporciona financiación a los administradores de “la definición”?

Esta es una de las razones por las que la OSI está tratando de diversificar su financiación y recientemente obtuvo una subvención de la Fundación Sloan, que está ayudando a financiar su impulso global de múltiples partes interesadas para alcanzar la definición de IA de código abierto. TechCrunch puede revelar que esta subvención asciende a alrededor de 250.000 dólares, y Maffulli tiene la esperanza de que esto pueda alterar la óptica en torno a su dependencia de la financiación corporativa.

“Esa es una de las cosas que la subvención Sloan deja aún más clara: podríamos despedirnos del dinero de Meta en cualquier momento”, dijo Maffulli. “Podríamos hacerlo incluso antes de esta Subvención Sloan, porque sé que recibiremos donaciones de otros. Y Meta lo sabe muy bien. No están interfiriendo con nada de esto. [process]tampoco lo es Microsoft, ni GitHub, ni Amazon, ni Google; saben absolutamente que no pueden interferir, porque la estructura de la organización no lo permite”.

Definición práctica de IA de código abierto

Ilustración conceptual que representa encontrar una definición
<strong>Créditos de imagen<strong> Aleksei MorozovGetty Images

El borrador actual de la definición de IA de código abierto se encuentra en la versión 0.0.8 y constituye tres partes principales: el “preámbulo”, que establece el mandato del documento; la propia definición de IA de código abierto; y una lista de verificación que recorre los componentes necesarios para un sistema de IA compatible con código abierto.

Según el borrador actual, un sistema de IA de código abierto debería otorgar libertad para utilizar el sistema para cualquier propósito sin solicitar permiso; permitir que otros estudien cómo funciona el sistema e inspeccionen sus componentes; y modificar y compartir el sistema para cualquier propósito.

Pero uno de los mayores desafíos ha estado relacionado con los datos: es decir, ¿puede un sistema de IA clasificarse como “código abierto” si la empresa no ha puesto el conjunto de datos de entrenamiento a disposición de otros para que puedan revisarlo? Según Maffulli, es más importante saber de dónde provienen los datos y cómo un desarrollador los etiquetó, deduplicó y filtró. Y también, tener acceso al código que se utilizó para ensamblar el conjunto de datos a partir de sus diversas fuentes.

“Es mucho mejor conocer esa información que tener el conjunto de datos sin el resto”, dijo Maffulli.

Si bien sería bueno tener acceso al conjunto de datos completo (el OSI lo convierte en un componente “opcional”), Maffulli dice que en muchos casos no es posible ni práctico. Esto podría deberse a que el conjunto de datos contiene información confidencial o protegida por derechos de autor que el desarrollador no tiene permiso para redistribuir. Además, existen técnicas para entrenar modelos de aprendizaje automático mediante las cuales los datos en sí no se comparten con el sistema, utilizando técnicas como el aprendizaje federado, la privacidad diferencial y el cifrado homomórfico.

Y esto resalta perfectamente las diferencias fundamentales entre “software de código abierto” e “IA de código abierto”: las intenciones pueden ser similares, pero no son comparables, y esta disparidad es lo que la OSI está tratando de capturar en su definición.

En software, el código fuente y el código binario son dos vistas del mismo artefacto: reflejan el mismo programa en diferentes formas. Pero los conjuntos de datos de entrenamiento y los modelos entrenados posteriores son cosas distintas: puede tomar ese mismo conjunto de datos y no necesariamente podrá recrear el mismo modelo de manera consistente.

“Existe una variedad de lógica estadística y aleatoria que ocurre durante el entrenamiento, lo que significa que no puede hacerlo replicable de la misma manera que el software”, agregó Maffulli.

Por lo tanto, un sistema de IA de código abierto debería ser fácil de replicar y con instrucciones claras. Y aquí es donde entra en juego la faceta de la lista de verificación de la definición de IA de código abierto, que se basa en un artículo académico publicado recientemente llamado “The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency, and Usability in Artificial Intelligence”.

Este artículo propone el Model Openness Framework (MOF), un sistema de clasificación que califica los modelos de aprendizaje automático “en función de su integridad y apertura”. El Ministerio de Hacienda exige que los componentes específicos del desarrollo del modelo de IA se “incluyan y publiquen bajo licencias abiertas apropiadas”, incluidas metodologías de capacitación y detalles sobre los parámetros del modelo.

Condición estable

Stefano Maffulli presentando en la cumbre de miembros de la Alianza de Bienes Públicos Digitales DPGA en Addis Abeba
Stefano Maffulli presentando en la cumbre de miembros de la Alianza de Bienes Públicos Digitales DPGA en Addis Abeba
Créditos de imagen: OSI

La OSI llama al lanzamiento oficial de la definición la “versión estable”, de manera muy similar a lo que haría una empresa con una aplicación que ha sido sometida a pruebas y depuraciones exhaustivas antes del horario de máxima audiencia. La OSI no lo llama a propósito “versión final” porque es probable que algunas partes evolucionen.

“Realmente no podemos esperar que esta definición dure 26 años como la definición de código abierto”, dijo Maffulli. “No espero la parte superior de la definición, como ‘¿qué es un sistema de IA?’ — cambiar mucho. Pero, ¿las piezas a las que nos referimos en la lista de verificación, esas listas de componentes dependen de la tecnología? Mañana, quién sabe cómo será la tecnología”.

Se espera que la Junta apruebe la definición estable de IA de código abierto en la conferencia All Things Open a finales de octubre, y en los meses intermedios la OSI se embarcará en una gira global que abarcará cinco continentes, buscando más “aportaciones diversas”. sobre cómo se definirá la “IA de código abierto” en el futuro. Pero es probable que cualquier cambio final sea poco más que “pequeños ajustes” aquí y allá.

“Esta es la recta final”, dijo Maffulli. “Hemos llegado a una versión completa de la definición; tenemos todos los elementos que necesitamos. Ahora tenemos una lista de verificación, así que estamos comprobando que no haya sorpresas allí; no hay sistemas que deban incluirse o excluirse”.

You may also like

Exploramos la red para colectar la información más importante que pueda ser compartida para los intereses de los internautas.

El Blog del Internauta 2022

-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00