Esta semana, Google lanzó una familia de modelos de IA abiertos, Gemma 3, que rápidamente obtuvo elogios por su impresionante eficiencia. Pero como varios desarrolladores se lamentaron en X, la licencia de Gemma 3 hace que el uso comercial de los modelos sea una propuesta arriesgada.
No es un problema exclusivo de Gemma 3. Las empresas como Meta también aplican términos de licencia personalizados y no estándar a sus modelos abiertamente disponibles, y los términos presentan desafíos legales para las empresas. Algunas empresas, especialmente operaciones más pequeñas, se preocupan de que Google y otras puedan “tirar de la alfombra” a su negocio al afirmar las cláusulas más onerosas.
“La licencia restrictiva e inconsistente de los llamados modelos de IA ‘abiertos’ está creando una incertidumbre significativa, particularmente para la adopción comercial”, dijo Nick Vidal, Jefe de Comunidad de la Iniciativa de código abierto, una institución de larga duración con el objetivo de definir y “administrar” todas las cosas de código abierto, a TechCrunch. “Si bien estos modelos se comercializan como abiertos, los términos reales imponen varios obstáculos legales y prácticos que disuaden a las empresas de integrarlos en sus productos o servicios”.
Los desarrolladores de modelos abiertos tienen sus razones para liberar modelos bajo licencias patentadas en lugar de opciones estándar de la industria como Apache y MIT. La startup de IA Cohere, por ejemplo, ha sido clara sobre su intención de apoyar el trabajo científico, pero no comercial, además de sus modelos.
Pero las licencias de la llama de Gemma y Meta en particular tienen restricciones que limitan las formas en que las empresas pueden usar los modelos sin temor a la represalia legal.
Meta, por ejemplo, prohíbe a los desarrolladores usar la “salida o resultados” de los modelos LLAMA 3 para mejorar cualquier modelo además de LLAMA 3 o “trabajos derivados”. También evita que las empresas con más de 700 millones de usuarios activos mensuales implementen modelos de LLAMA sin obtener primero una licencia especial y adicional.
La licencia de Gemma es generalmente menos onerosa. Pero le otorga a Google el derecho de “restringir (de forma remota o de otro tipo) el uso” de Gemma que Google cree que está violando la política de uso prohibida de la compañía o “leyes y regulaciones aplicables”.
Estos términos no solo se aplican a los modelos originales de Llama y Gemma. Los modelos basados en Llama o Gemma también deben adherirse a las licencias de Llama y Gemma, respectivamente. En el caso de Gemma, eso incluye modelos entrenados en datos sintéticos generados por Gemma.
Florian Brand, asistente de investigación del Centro de Investigación Alemán de Inteligencia Artificial, cree que, a pesar de lo que los ejecutivos gigantes de tecnología le harían creer, licencias como Gemma y Llama “no se puede llamar razonablemente ‘código abierto”.
“La mayoría de las empresas tienen un conjunto de licencias aprobadas, como Apache 2.0, por lo que cualquier licencia personalizada es muchos problemas y dinero”, dijo Brand a TechCrunch. “Las pequeñas empresas sin equipos legales o dinero para abogados se mantendrán en modelos con licencias estándar”.
Brand señaló que los desarrolladores de modelos de IA con licencias personalizadas, como Google, aún no han aplicado agresivamente sus términos. Sin embargo, la amenaza es suficiente para disuadir la adopción, agregó.
“Estas restricciones tienen un impacto en el ecosistema de IA, incluso en investigadores de IA como yo”, dijo Brand.
Han-Chung Lee, director de aprendizaje automático en Moody’s, está de acuerdo en que las licencias personalizadas como las adjuntas a Gemma y Llama hacen que las modelos no sean “no se pueden usar” en muchos escenarios comerciales. También lo hace Eric Tramel, un científico del personal en la startup de IA Gretel.
“Las licencias específicas del modelo realizan tallas específicas para derivados del modelo y destilación, lo que causa preocupación por los naufla”, dijo Tramel. “Imagine un negocio que está produciendo específicamente un modelo de ajuste para sus clientes. ¿Qué licencia debe tener un ajuste de Llama de Gemma-Data? ¿Cuál sería el impacto para todos sus clientes aguas abajo?
El escenario que los despliegadores más temen, dijo Tramel, es que los modelos son una especie de caballo troyano.
“Un modelo de fundición puede publicar [open] Modelos, espere para ver qué casos de negocios desarrollan utilizando esos modelos, y luego un brazo fuerte en verticales exitosos por extorsión o ley “, dijo. “Por ejemplo, Gemma 3, por todas las apariencias, parece una liberación sólida, y una que podría tener un amplio impacto. Pero el mercado no puede adoptarlo debido a su estructura de licencia. Por lo tanto, las empresas probablemente se mantendrán con modelos Apache 2.0 quizás más débiles y menos confiables “.
Para ser claros, ciertos modelos han logrado una distribución generalizada a pesar de sus licencias restrictivas. Llama, por ejemplo, ha sido descargado cientos de millones de veces y integrado en productos de las principales corporaciones, incluida Spotify.
Pero podrían tener aún más exitosos si tuvieran licencias permisivamente, según Yacine Jernite, Jefe de Aprendizaje Machine y Sociedad de AI Startup Hugging Face. Jernite pidió a los proveedores como Google que se muevan para abrir marcos de licencias y “colaborar más directamente” con los usuarios en términos ampliamente aceptados.
“Dada la falta de consenso sobre estos términos y el hecho de que muchos de los supuestos subyacentes aún no se han probado en los tribunales, todo sirve principalmente como una declaración de intención de esos actores”, dijo Jernite. “[But if certain clauses] se interpretan de manera demasiado amplia, muchos buenos trabajos se encontrarán en un terreno legal incierto, lo cual es particularmente aterrador para las organizaciones que construyen productos comerciales exitosos “.
Vidal dijo que existe una necesidad urgente de empresas de modelos de IA que puedan integrarse, modificarse y compartir libremente sin temer cambios repentinos en la licencia o ambigüedad legal.
“El panorama actual de la licencia modelo de IA está plagado de confusión, términos restrictivos y reclamos engañosos de apertura”, dijo Vidal. “En lugar de redefinir ‘abierto’ para adaptarse a los intereses corporativos, la industria de la IA debería alinearse con los principios establecidos de código abierto para crear un ecosistema verdaderamente abierto”.