Operai está actualizando el operador de alimentación del modelo AI, su agente de IA que puede navegar de forma autónoma la web y usar cierto software dentro de una máquina virtual alojada en la nube para satisfacer las solicitudes de los usuarios.
Pronto, el operador utilizará un modelo basado en O3, uno de los últimos en la serie O de “razonamiento” de OpenAI. Anteriormente, el operador se basaba en una versión personalizada de GPT-4O.
Según muchos puntos de referencia, O3 es un modelo mucho más avanzado, particularmente en tareas que involucran matemáticas y razonamiento.
“Estamos reemplazando el modelo existente basado en GPT-4O para el operador con una versión basada en OpenAI O3”, escribió OpenAI en una publicación de blog. “La versión API [of Operator] permanecerá basado en 4O “.
El operador es uno de las muchas herramientas de agente publicadas por las compañías de IA en los últimos meses. Las empresas están corriendo para hacer agentes altamente sofisticados que puedan llevar a cabo las tareas más o menos sin supervisión.
Google ofrece un agente de “uso de computadora” a través de su API Gemini que puede navegar de manera similar la web y tomar medidas en nombre de los usuarios, así como una oferta más centrada en el consumidor llamada Mariner. Los modelos de Anthrope también pueden realizar tareas informáticas, incluida la apertura de archivos y navegación de páginas web.
Según OpenAI, el nuevo modelo de operador, llamado operador O3, fue “ajustado con datos de seguridad adicionales para el uso de la computadora”, incluidos los conjuntos de datos diseñados para “enseñar el modelo [OpenAI’s] Límites de decisión en confirmaciones y rechazos “.
Operai ha publicado un informe técnico que muestra el rendimiento del operador de O3 en evaluaciones de seguridad específicas. En comparación con el modelo de operador GPT-4O, es menos probable que el operador O3 se niegue a realizar actividades “ilícitas” y buscar datos personales confidenciales, y menos susceptible a una forma de ataque de IA conocido como inyección rápida, según el informe técnico.
“El operador de O3 utiliza el mismo enfoque de seguridad múltiple que utilizamos para la versión 4O del operador”, escribió Openii en su publicación de blog. “Aunque el operador de O3 hereda las capacidades de codificación de O3, no tiene acceso nativo a un entorno de codificación o terminal”.