Home Tecnología El futuro de la IA generativa en la empresa podría ser modelos de lenguaje más pequeños y enfocados

El futuro de la IA generativa en la empresa podría ser modelos de lenguaje más pequeños y enfocados

by internauta
0 comment


Las asombrosas habilidades de ChatGPT de OpenAI no sería posible sin grandes modelos de lenguaje. Estos modelos se entrenan en miles de millones, a veces billones de ejemplos de texto. La idea detrás de ChatGPT es entender el lenguaje tan bien que pueda anticipar qué palabra viene a continuación en una fracción de segundo. Eso requiere mucho entrenamiento, recursos de cómputo y conocimiento de los desarrolladores para que suceda.

Pero tal vez el futuro de estos modelos esté más enfocado que el enfoque de hervir el océano que hemos visto de OpenAI y otros, que quieren poder responder todas las preguntas bajo el sol. ¿Qué pasaría si cada industria o incluso cada empresa tuviera su propio modelo capacitado para comprender la jerga, el lenguaje y el enfoque de la entidad individual? Quizás entonces obtendremos menos respuestas completamente inventadas porque las respuestas provendrán de un universo más limitado de palabras y frases.

En el futuro impulsado por la IA, los propios datos de cada empresa podrían ser su activo más valioso. Si es una compañía de seguros, tiene un léxico completamente diferente al de un hospital, una compañía automotriz o una firma de abogados, y cuando combina eso con los datos de sus clientes y el cuerpo completo de contenido en toda la organización, tiene un modelo de lenguaje. Si bien quizás no sea grande, como en el sentido de modelo de lenguaje verdaderamente grande, sería justo el modelo que necesita, un modelo creado para uno y no para las masas.

Esto también requerirá un conjunto de herramientas para recopilar, agregar y actualizar constantemente el conjunto de datos corporativos de una manera que lo haga ingerible para estos modelos de lenguaje grande más pequeños (sLLM).

Construir estos modelos podría representar un desafío. Probablemente aprovecharán algo como el código abierto o los LLM existentes de una empresa privada y luego lo ajustarán en la industria o los datos de la empresa para enfocarlo más, todo en un entorno más seguro que la variedad genérica de LLM.

Esto representa una gran oportunidad para la comunidad de startups, y estamos viendo muchas empresas con una ventaja inicial en esta idea.

You may also like

Exploramos la red para colectar la información más importante que pueda ser compartida para los intereses de los internautas.

El Blog del Internauta 2022

-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00