Hacer accesibles los modelos básicos: la batalla entre la IA de código abierto y cerrado

Jae Lee es el director ejecutivo y cofundador de Twelve Labs, una plataforma que brinda a las empresas y desarrolladores acceso a la comprensión de videos multimodales.

La explosión masiva de modelos generativos de IA para texto e imagen ha sido inevitable últimamente. A medida que estos modelos se vuelven cada vez más capaces, el “modelo de base” es un término relativamente nuevo que se está utilizando. Entonces, ¿qué es un modelo de base?

El término sigue siendo algo vago. Algunos lo definen por la cantidad de parámetros y, por lo tanto, qué tan grande es una red neuronal, y otros por la cantidad de tareas únicas y difíciles que puede realizar el modelo. ¿Es realmente tan emocionante hacer modelos de IA cada vez más grandes y la capacidad del modelo para abordar múltiples tareas? Si se quita todo el bombo publicitario y el lenguaje de marketing, lo que es realmente emocionante acerca de estas nuevas generaciones de modelos de IA es esto: cambiaron fundamentalmente la forma en que interactuamos con las computadoras y los datos. Piense en empresas como Cohere, Covariant, Hebbia y You.com.

Ahora hemos entrado en una fase crítica de la IA en la que quién puede construir y servir estos modelos poderosos se ha convertido en un punto de discusión importante, particularmente a medida que comienzan a surgir cuestiones éticas, como quién tiene derecho a qué datos, si los modelos violan suposiciones razonables de privacidad, si el consentimiento para el uso de datos es un factor, qué constituye un “comportamiento inapropiado” y mucho más. Con preguntas como estas sobre la mesa, es razonable suponer que aquellos que controlan los modelos de IA serán quizás los más importantes en la toma de decisiones de nuestro tiempo.

¿Hay un juego para los modelos de base de código abierto?

Debido a los problemas éticos asociados con la IA, el llamado a los modelos básicos de código abierto está cobrando impulso. Pero construir modelos básicos no es barato. Requieren decenas de miles de GPU de última generación y muchos ingenieros y científicos de aprendizaje automático. El ámbito de la construcción de modelos básicos hasta la fecha solo ha sido accesible para los gigantes de la nube y las nuevas empresas extremadamente bien financiadas que se encuentran en un cofre de guerra de cientos de millones de dólares.

Casi todos los modelos y servicios creados por estas pocas empresas elegidas por ellos mismos han sido de código cerrado. Aún así, el código cerrado confía una gran cantidad de poder y decisiones a un número limitado de empresas que definirán nuestro futuro, lo que puede ser bastante inquietante.

Hemos entrado en una fase crítica de la IA en la que quién puede construir y servir estos modelos poderosos se ha convertido en un punto de discusión importante.

Sin embargo, el código abierto de Stable Diffusion por Stability AI planteó una seria amenaza para los constructores del modelo de base decididos a guardar todo el secreto para ellos. Se han escuchado aplausos de comunidades de desarrolladores de todo el mundo con respecto al código abierto de Stability porque libera sistemas, poniendo el control en manos de las masas frente a compañías selectas que podrían estar más interesadas en las ganancias que en lo que es bueno para la humanidad. Esto ahora afecta la forma en que los expertos piensan sobre el paradigma actual de los sistemas de IA de código cerrado.

Obstáculos potenciales

El mayor obstáculo para los modelos básicos de código abierto sigue siendo el dinero. Para que los sistemas de IA de código abierto sean rentables y sostenibles, aún requieren decenas de millones de dólares para funcionar y administrarse adecuadamente. Aunque esto es una fracción de lo que las grandes empresas están invirtiendo en sus esfuerzos, sigue siendo bastante significativo para una startup.

Podemos ver que el intento de Stability AI de abrir Neo-GPT y convertirlo en un negocio real fracasó, ya que fue superado por compañías como Open AI y Cohere. La empresa ahora tiene que enfrentarse a la demanda de Getty Images, que amenaza con distraer a la empresa y agotar aún más los recursos, tanto financieros como humanos. La oposición de Meta a los sistemas de código cerrado a través de LLaMA ha echado gasolina al movimiento de código abierto, pero aún es demasiado pronto para saber si seguirán cumpliendo con su compromiso.

Hacer accesibles los modelos básicos: la batalla entre la IA de código abierto y cerrado

¿Hay un juego para los modelos de base de código abierto?

Obstáculos potenciales

Elección del Editor

Queue

Hacer accesibles los modelos básicos: la batalla entre la IA de código abierto y cerrado

¿Hay un juego para los modelos de base de código abierto?

Obstáculos potenciales

Pride Hotels Group firma Pride Resort Ambaji, Gujarat – Today’s Traveler

WelcomHeritage amplía su presencia en el sur de la India con Ayatana, Ooty – Today’s Traveler

You may also like

Elección del Editor

Queue