Operai lanza nuevas herramientas para ayudar a las empresas a construir agentes de IA

El martes, Openai lanzó nuevas herramientas diseñadas para ayudar a los desarrolladores y empresas a construir agentes de IA, sistemas automatizados que pueden lograr de forma independiente tareas, utilizando los propios modelos de IA de la compañía y marcos.

Las herramientas son parte de la nueva API de respuestas de OpenAI, que permite a las empresas desarrollar agentes de IA personalizados que pueden realizar búsquedas web, escanear a través de archivos de la compañía y navegar sitios web, al igual que el producto de operador de OpenAI. La API de respuestas reemplaza efectivamente la API de asistentes de OpenAI, que la compañía planea al atardecer en la primera mitad de 2026.

La exageración sobre los agentes de IA ha crecido dramáticamente en los últimos años a pesar de que la industria tecnológica ha luchado por mostrar a las personas, o incluso definir, cuáles son realmente los “agentes de IA”. En el ejemplo más reciente de la exageración del agente que se adelanta a la utilidad, la startup de la startup china Butterfly Effect a principios de esta semana se volvió viral para una nueva plataforma de agente de IA llamada Manus que los usuarios descubrieron rápidamente que no cumplió muchas de las promesas de la compañía.

En otras palabras, las apuestas son altas para que OpenAi obtenga los agentes correctos.

“Es bastante fácil demostrar a su agente”, dijo Olivier Godemont, jefe de productos API de OpenAi, a TechCrunch en una entrevista. “Escalar un agente es bastante difícil, y lograr que la gente lo use a menudo es muy difícil”.

A principios de este año, Operai presentó dos agentes de IA en ChatGPT: Operator, que navega por los sitios web en su nombre, y las investigaciones profundas, que compila informes de investigación para usted. Ambas herramientas ofrecieron una idea de lo que la tecnología de agente puede lograr, pero se dejaron bastante que desear en el departamento de “autonomía”.

Ahora, con la API de respuestas, OpenAI quiere vender acceso a los componentes que impulsan a los agentes de IA, permitiendo a los desarrolladores construir sus propias aplicaciones de agente de operador y profundas investigaciones. Operai espera que los desarrolladores puedan crear algunas aplicaciones con su tecnología de agente que se sientan más autónomos de lo que está disponible hoy en día.

Usando la API de respuestas, los desarrolladores pueden tocar los mismos modelos AI (en vista previa) bajo el capó de la herramienta de búsqueda web de búsqueda de chatgpt de OpenAI: GPT-4O Search y GPT-4O Mini Search. Los modelos pueden buscar respuestas en la web a las preguntas, citando fuentes mientras generan respuestas.

Operai afirma que GPT-4O Search y GPT-4O Mini Search son muy precisos. En el SimpleQA Benchmark de la compañía, que mide la capacidad de los modelos para responder preguntas cortas y de búsqueda de hechos, los puntajes de búsqueda GPT-4O 90%, mientras que los puntajes de búsqueda GPT-4O Mini 88% (más alto es mejor). A modo de comparación, GPT-4.5, el modelo mucho más grande y lanzado recientemente de Openai, obtiene solo el 63%.

El hecho de que las herramientas de búsqueda con IA sean más precisas que los modelos de IA tradicionales no es necesariamente sorprendente; en teoría, la búsqueda GPT-4O puede buscar la respuesta correcta. Sin embargo, la búsqueda web no hace que las alucinaciones sean un problema resuelto. Más allá de su precisión objetiva, las herramientas de búsqueda de IA también tienden a luchar con consultas de navegación cortas (como “LACERS LAKERS HOY”), y los informes recientes sugieren que las citas de ChatGPT no siempre son confiables.

La API de respuestas también incluye una utilidad de búsqueda de archivos que puede escanear rápidamente los archivos en las bases de datos de una empresa para recuperar información. (OpenAI afirma que no capacitará modelos en estos archivos). Además, los desarrolladores que usan la API de respuestas pueden tocar el modelo de agente de uso informático (CUA) de Openai, que impulsa el operador. El modelo genera acciones de mouse y teclado, lo que permite a los desarrolladores automatizar tareas de uso de la computadora como entrada de datos y flujos de trabajo de aplicaciones.

Las empresas pueden ejecutar opcionalmente el modelo CUA, que se lanza en la vista previa de la investigación, localmente en sus propios sistemas, dijo OpenAI. La versión de consumo del CUA disponible en el operador solo puede tomar medidas en la web.

Para ser claros, las respuestas API no resolverán todos los problemas técnicos que afectan a los agentes de IA hoy.

Si bien las herramientas de búsqueda con AI son más precisas que los modelos de IA tradicionales, un hecho que no es sorprendente dado que solo pueden buscar la respuesta correcta, la búsqueda web no hace que las alucinaciones de IA se resuelvan un problema resuelto. La búsqueda GPT-4O todavía obtiene el 10% de las preguntas fácticas incorrectas. Más allá de su precisión, las herramientas de búsqueda de IA también tienden a luchar con consultas de navegación cortas (como “Lakers Score hoy”), y los informes recientes sugieren que las citas de ChatGPT no siempre son confiables.

En una publicación de blog proporcionada a TechCrunch, Openai dijo que el modelo CUA “aún no es muy confiable para automatizar tareas en los sistemas operativos”, y que es susceptible a cometer errores “inadvertidos”.

Sin embargo, Openai dijo que estas son iteraciones tempranas de sus herramientas de agentes, y que constantemente funciona para mejorarlas.

Junto con la API de respuestas, OpenAI está lanzando un kit de herramientas de código abierto llamado Agents SDK, que ofrece a los desarrolladores herramientas gratuitas para integrar modelos con sus sistemas internos, establecer salvaguardas y monitorear actividades de agentes de IA para fines de depuración y optimización. El agente SDK es una especie de seguimiento para el enjambre de OpenAi, un marco para la orquestación de múltiples agentes que la compañía lanzó a fines del año pasado.

Godemont dijo que espera que Operai pueda cerrar la brecha entre las demostraciones y los productos del agente de IA este año, y que, en su opinión, “los agentes son la aplicación más impactante de IA que sucederá”. Eso se hace eco de un CEO de Proclamation Openai que Sam Altman hizo en enero: que 2025 es el año en que los agentes de IA ingresan a la fuerza laboral.

Si 2025 realmente se convierte o no en el “año del agente de IA”, los últimos lanzamientos de OpenAI muestran que la compañía quiere pasar de demostraciones llamativas de agente a herramientas impactantes.

Operai lanza nuevas herramientas para ayudar a las empresas a construir agentes de IA

Elección del Editor

Queue

Operai lanza nuevas herramientas para ayudar a las empresas a construir agentes de IA

Aprenda lo que los VC quieren ver de los fundadores en Sessions: AI

Y Combinator Founders recaudando menos dinero señalan un ‘cambio de vibra’, dice VC

You may also like

Elección del Editor

Queue