Home Tecnología Géminis de Google ha vencido a Pokémon Blue (con un poco de ayuda)

Géminis de Google ha vencido a Pokémon Blue (con un poco de ayuda)

by internauta
0 comment


El modelo de IA más caro de Google parece haber cruzado un hito importante: superar un videojuego de 29 años.

Anoche, el CEO de Google, Sundar Pichai, publicó triunfante en X, “¡Qué acabado! ¡Géminis 2.5 Pro acaba de completar Pokémon Blue!”

Para ser claros, el Géminis Plays Pokemon Livestress se creó (en sus propias palabras) “un ingeniero de software de 30 años que no está afiliado con Google” que pasa por Joel Z. Pero los ejecutivos de Google han estado animando el esfuerzo.

Por ejemplo, Logan Kilpatrick, el líder del producto para Google AI Studio, publicado el mes pasado que Gemini estaba “haciendo un gran progreso al completar Pokémon” y había “ganado su quinta insignia (el siguiente mejor modelo solo tiene 3 hasta ahora, aunque con un arnés de agente diferente)”, llevando a Pichai a bromear, “estamos trabajando en API, inteligencia artificial de Pokémon :)” “”.

¿Por qué Pokémon? En febrero, Anthrope destacó el progreso que sus modelos Claude AI estaban haciendo en “Pokémon Red”, escribiendo que el “pensamiento extendido y el entrenamiento de agentes” de Claude le da “un impulso importante” en tareas “más inesperadas”, como jugar un juego clásico. (“Pokémon Red” y “Blue” son diferentes versiones de un título de Gameboy lanzado por primera vez en 1996 y vinculados a la larga franquicia Pokémon). Incluso hay un canal Pokemon Twitch de Claude que Joel Z citó como una inspiración.

A pesar de su progreso, Claude no parece haber vencido a “Pokémon Red” todavía. ¿Eso significa que Géminis es objetivamente mejor en el juego? En su página de Twitch, Joel Z instó a los espectadores: “Por favor, no considere esto un punto de referencia de qué tan bien un LLM puede jugar Pokemon. Realmente no se puede hacer comparaciones directas: Gemini y Claude tienen herramientas diferentes y reciben información diferente”.

Y ambos modelos de IA necesitan ayuda para jugar el juego, ahí es donde entran los arneses de agentes antes mencionados, proporcionando a los modelos capturas de pantalla de juego superpuestas con información adicional, permitiendo que el modelo decida cómo responder (lo que puede involucrar a los agentes especializados) y luego presionar el botón que corresponde con la instrucción de la IA.

Evento de TechCrunch

Berkeley, CA
|
5 de junio

Reservar ahora

Joel Z reconoció que había otras “intervenciones de desarrollo” para ayudar a Gemini a completar el juego, pero insistió en que no es trampa.

“Mis intervenciones mejoran las habilidades generales de toma de decisiones y razonamiento de Géminis”, dice. “No doy sugerencias específicas: no hay tutoriales o instrucciones directas para desafíos particulares como el monte Moon. Lo único que incluso se acerca es hacer que Gemini sepa que necesita hablar con un cohete gruñido dos veces para obtener la llave de elevación, que fue un error que luego se fijó en Pokemon Yellow”.

Además, dijo: “Géminis juega a Pokémon todavía se está desarrollando activamente, y el marco continúa evolucionando”.

You may also like

Exploramos la red para colectar la información más importante que pueda ser compartida para los intereses de los internautas.

El Blog del Internauta 2022

-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00