La siguiente frontera para modelos de idiomas grandes (LLM), una de las tecnologías clave que sustentan el auge en las herramientas generativas de IA, podría ser geográfica. El lunes, la startup de IA con sede en París, Mistral, que compite por rivalizar con los gustos de Anthrope y OpenAI con sede en Estados Unidos, está lanzando un modelo que es un poco diferente de su LLM habitual.
Llamado Mistral Saba, el nuevo modelo personalizado está diseñado para abordar una geografía específica: países de habla árabe. El objetivo de Mistral Saba es sobresalir en las interacciones árabes.
Mistral Saba es un modelo relativamente pequeño con 24 mil millones de parámetros. Como recordatorio, menos parámetros generalmente conducen a un mejor rendimiento con una menor latencia. Pero más parámetros generalmente significan respuestas más inteligentes, aunque no es una correlación lineal.
Mistral Saba es comparable en tamaño a Mistral Small 3, su modelo pequeño de propósito general. Pero, según las propias pruebas de Mistral, Mistral Saba funciona mucho mejor que Mistral Small 3 al manejar el contenido árabe.
Como un efecto secundario interesante, debido a la polinización cruzada cultural entre el Medio Oriente y el sur de Asia, Saba también funciona bien con los idiomas de origen indio, por distrao, especialmente los idiomas de origen del sur de la India, como tamil y malayalam.

El nuevo modelo representa un movimiento estratégico interesante para el gigante de la IA francés, que muestra un mayor enfoque en el Medio Oriente. Mistral dijo que espera que el modelo ayude a ganar tracción entre los clientes en la región.
Como modelo estándar, Mistral SABA podría usarse para el apoyo conversacional o la generación de contenido en árabe que suena más natural y relevante. También se puede utilizar como base para algunos modelos ajustados para casos de uso internos, dijo la compañía.
La semana pasada, Mistral utilizó la Cumbre de Acción de AI para demostrar que se está tomando en serio los negocios. Si bien la compañía ya ha recaudado grandes cantidades de dinero de los inversores internacionales, muchos de sus patrocinadores extranjeros tienen su sede en los Estados Unidos, inversores como Lightspeed Venture Partners, Andreessen Horowitz y Salesforce Ventures.
Debido al cambio geopolítico cambiante, Mistral podría dar la bienvenida a los inversores del Medio Oriente en su próxima ronda de financiación. Sería una forma de recaudar más dinero para seguir siendo relevante en la carrera de IA a nivel técnico, al tiempo que se posiciona como la alternativa internacional a las empresas de IA y la IA china. Por lo tanto, el modelo más nuevo de Mistral, Saba, podría contribuir a ese posible esfuerzo de recaudación de fondos.
Mistral Saba es accesible a través de la API de Mistral. También se puede implementar en las instalaciones, lo que podría ser un punto de venta fuerte para las empresas que trabajan en industrias delicadas, como energía, finanzas o atención médica.
Debido a las raíces europeas de la compañía, desde el lanzamiento del modelo original Mistral 7B de peso abierto, a menudo ha reiterado que se toma en serio el soporte de varios idiomas. El lanzamiento de Saba es una continuación de ese posicionamiento. Y Mistral dijo que centrará su atención en otros idiomas regionales en el futuro.