Para limitar un día de lanzamientos de productos, los investigadores, ingenieros y ejecutivos de Operai, incluido el CEO de OpenAI, Sam Altman, respondieron preguntas en un amplio Reddit AMA el viernes.
Operai se encuentra en una posición precaria. Está luchando contra la percepción de que está cediendo terreno en la carrera de IA hacia compañías chinas como Deepseek, que OpenAi alega que podría haber robado su IP. El fabricante de chatgpt ha estado tratando de apuntalar su relación con Washington y simultáneamente busca un ambicioso proyecto de centro de datos, mientras que, según se informa, estableciendo bases para una de las rondas de financiación más grandes de la historia.
Altman admitió que Deepseek ha disminuido el liderazgo de OpenAi en la IA, y dijo que cree que OpenAi ha estado “en el lado equivocado de la historia” cuando se trata de abre sus tecnologías. Si bien OpenAI tiene modelos de origen abierto en el pasado, la compañía generalmente ha favorecido un enfoque de desarrollo de código cerrado patentado.
“[I personally think we need to] Calcule una estrategia de código abierto diferente ”, dijo Altman. “No todos en OpenAi comparte esta opinión, y tampoco es nuestra más alta prioridad actual … produciremos mejores modelos [going forward]pero mantendremos menos liderazgo que en años anteriores ”.
En una respuesta de seguimiento, Kevin Weil, director de productos de OpenAi, dijo que Operai está considerando obtener modelos más antiguos que ya no son de última generación. “Definitivamente pensaremos en hacer más de esto”, dijo, sin entrar en más detalles.
Más allá de haber llevado a Openai a reconsiderar su filosofía de lanzamiento, Altman dijo que Deepseek ha empujado a la compañía a revelar más sobre cómo sus llamados modelos de razonamiento, como el modelo O3-Mini lanzado hoy, muestran su “proceso de pensamiento”. Actualmente, los modelos de OpenAI ocultan su razonamiento, una estrategia destinada a evitar que los competidores raspen los datos de capacitación para sus propios modelos. En contraste, el modelo de razonamiento de Deepseek, R1, muestra su cadena de pensamiento completa.
“Estamos trabajando para mostrar mucho más de lo que mostramos hoy – [showing the model thought process] Será muy pronto ”, agregó Weil. “TBD en todos: mostrar toda la cadena de pensamiento conduce a la destilación competitiva, pero también sabemos que las personas (al menos los usuarios avanzados) lo quieren, por lo que encontraremos la forma correcta de equilibrarlo”.
Altman y Weil intentaron disipar rumores de que ChatGPT, la plataforma Chatbot a través de la cual OpenAi lanza muchos de sus modelos, aumentaría en el precio en el futuro. Altman dijo que le gustaría hacer que Chatgpt sea “más barato” con el tiempo, si es factible.
Altman dijo anteriormente que Operai estaba perdiendo dinero en su plan ChatGPT más caro, ChatGPT Pro, que cuesta $ 200 por mes.
En un hilo algo relacionado, Weil dijo que OpenAi continúa viendo evidencia de que más poder de cálculo conduce a modelos “mejores” y más actuantes. Eso es en gran parte lo que requiere proyectos como Stargate, el proyecto de centro de datos masivo recientemente anunciado de Operai, dijo Weil. Servir una base de usuarios en crecimiento también está alimentando la demanda de cálculo dentro de OpenAi, continuó.
Cuando se le preguntó sobre la superación personal recursiva que podría estar habilitada por estos poderosos modelos, Altman dijo que cree que un “despegue rápido” es más plausible de lo que alguna vez creyó. La superación automática recursiva es un proceso en el que un sistema de IA podría mejorar su propia inteligencia y capacidades sin aportes humanos.
Por supuesto, vale la pena señalar que Altman es conocido por su sobreprueba. No fue hace mucho tiempo que bajó el bar de Openai para AGI.
Un usuario de Reddit preguntó si los modelos de OpenAi, que aumentan o no, se utilizarían para desarrollar armas destructivas, específicamente armas nucleares. Esta semana, Openai anunció una asociación con el gobierno de los Estados Unidos para dar sus modelos a los Laboratorios Nacionales de los Estados Unidos en parte para la investigación de defensa nuclear.
Weil dijo que confiaba en el gobierno.
“He llegado a conocer a estos científicos y son expertos en IA además de investigadores de clase mundial”, dijo. “Entienden el poder y los límites de los modelos, y no creo que haya ninguna posibilidad de que solo yolo sean alguna salida del modelo en un cálculo nuclear. Son inteligentes y basados en la evidencia y realizan mucha experimentación y trabajo de datos para validar todo su trabajo ”.
Se le hizo al equipo de Operai varias preguntas sobre una naturaleza más técnica, como cuando se lanzará el próximo modelo de razonamiento de OpenAI, O3, (“más de unas pocas semanas, menos de unos pocos meses”, dijo Altman); Cuando el próximo modelo “no razonable” de la compañía, GPT-5, podría aterrizar (“aún no tiene una línea de tiempo”, dijo Altman); Y cuando OpenAi podría presentar un sucesor de Dall-E 3, el modelo de generación de imágenes de la compañía. Dall-E 3, que se lanzó hace unos dos años, se ha vuelto bastante largo en el diente. La tecnología de generación de imágenes ha mejorado a saltos y límites desde el debut de Dall-E 3, y el modelo ya no es competitivo en una serie de pruebas de referencia.
“¡Sí! Estamos trabajando en ello ”, dijo Weil sobre un seguimiento de Dall-E 3. “Y creo que valdrá la pena la espera”.