Home Tecnología Los modelos de IA más populares, lo que hacen y cómo usarlos

Los modelos de IA más populares, lo que hacen y cómo usarlos

by internauta
0 comment


Los modelos de IA están siendo arrancados a un ritmo vertiginoso, desde grandes compañías tecnológicas como Google hasta nuevas empresas como OpenAi y Anthrope. Hacer un seguimiento de los últimos puede ser abrumador.

Además de la confusión es que los modelos de IA a menudo se promueven en función de los puntos de referencia de la industria. Pero estas métricas técnicas a menudo revelan poco sobre cómo las personas y empresas reales realmente los usan.

Para reducir el ruido, TechCrunch ha compilado una visión general de los modelos AI más avanzados lanzados desde 2024, con detalles sobre cómo usarlos y para qué son mejor. También mantendremos esta lista actualizada con los últimos lanzamientos.

Hay literalmente más de un millón de modelos de IA: abrazar la cara, por ejemplo, alberga más de 1.4 millones. Por lo tanto, esta lista puede perder algunos modelos que funcionan mejor, de una forma u otra.

Modelos AI lanzados en 2025

Google Géminis 2.5

Gemini 2.5 Pro Experimental, un modelo de razonamiento, sobresale en la creación de aplicaciones web y agentes de código según Google. Sin embargo, tiene un rendimiento inferior en un punto de referencia de codificación popular en comparación con Claude Sonnet 3.7. El modelo requiere una suscripción avanzada mensual de Gemini de $ 20.

Chatgpt-4o Generador de imágenes

Operai ha actualizado su modelo GPT-4O existente para generar imágenes, no solo texto. El modelo de Soped-Up pronto se volvió viral por transformar imágenes en anime al estilo Studio Gibli, a pesar de las obvias preocupaciones de derechos de autor. Acceder a GPT-4O requiere, como mínimo, una suscripción ChatGPT Plus de $ 20 por mes.

Cámara virtual estable de estabilidad AI

La estabilidad de inicio de la generación de imágenes AI ha lanzado un modelo que la compañía dice que puede generar escenas 3D y ángulos de cámara desde una sola imagen 2D. Sin embargo, todavía lucha con escenas con elementos más complejos como humanos y agua en movimiento. El modelo está disponible para uso de investigación no comercial en Huggingface.

La visión de Aya de Cohere

Cohere lanzó un modelo multimodal llamado AYA Vision que afirma que es mejor en clase para hacer cosas como subtítulos y responder preguntas sobre fotos. También se destaca en idiomas distintos del inglés, a diferencia de otros modelos, cohere reclamos. Está disponible de forma gratuita en WhatsApp.

GPT 4.5 “Orión” de Openai

Operai llama a Orion su modelo más grande hasta la fecha, promocionando su fuerte “conocimiento mundial” e “inteligencia emocional”. Sin embargo, tiene un rendimiento inferior en ciertos puntos de referencia en comparación con los modelos de razonamiento más nuevos. Orion está disponible para los suscriptores del plan de $ 200 por mes de Openai.

Claude soneto 3.7

Anthrope dice que este es el primer modelo de razonamiento “híbrido” de la industria, porque puede disparar respuestas rápidas y realmente pensar en las cosas cuando sea necesario. También brinda a los usuarios control sobre cuánto tiempo puede pensar el modelo, según antrópico. Sonnet 3.7 está disponible para todos los usuarios de Claude, pero los usuarios más pesados ​​necesitarán un plan Pro de $ 20 por mes.

Xai’s Grok 3

Grok 3 es el último modelo insignia de la startup con fundada de Elon Musk Xai. Se afirma que supera a otros modelos líderes sobre matemáticas, ciencias y codificación. El modelo requiere X premium (que es de $ 50 por mes). Después de que un estudio encontró que Grok 2 se inclinó a la izquierda, Musk se comprometió a cambiar a Grok más “políticamente neutral”, pero aún no está claro si eso se ha logrado.

OPERAI O3-MINI

Este es el último modelo de razonamiento de OpenAI y está optimizado para tareas relacionadas con STEM como codificación, matemáticas y ciencias. No es el modelo más poderoso de OpenAI, pero debido a que es más pequeño, la compañía dice que es un costo significativamente menor. Está disponible de forma gratuita, pero requiere una suscripción para usuarios pesados.

Investigación profunda de Openai

La investigación profunda de Openai está diseñada para hacer una investigación en profundidad sobre un tema con citas claras. Este servicio solo está disponible con la suscripción Pro de $ 200 por mes de ChatGPT. Operai lo recomienda para todo, desde la ciencia hasta la investigación de compras, pero tenga cuidado con que las alucinaciones sigan siendo un problema para la IA.

Chat mistral le

Mistral ha lanzado versiones de aplicaciones de Le Chat, un asistente personal de IA multimodal. Mistral afirma que LE Chat responde más rápido que cualquier otro chatbot. También tiene una versión paga con periodismo actualizado de la AFP. Las pruebas de Le Monde encontraron el rendimiento de Le Chat impresionante, aunque cometió más errores que ChatGPT.

Operador de Openai

El operador de Operai está destinado a ser un pasante personal que pueda hacer las cosas de forma independiente, como ayudarlo a comprar comestibles. Requiere una suscripción CHATGPT Pro de $ 200 por mes. Los agentes de IA son muy prometedores, pero aún son experimentales: un revisor del Washington Post dice que el operador decidió por sí solo ordenar una docena de huevos por $ 31, pagados con la tarjeta de crédito del revisor.

Google Gemini 2.0 Pro Experimental

El tan esperado modelo insignia de Google Gemini dice que se destaca por codificar y comprender el conocimiento general. También tiene una ventana de contexto súper larga de 2 millones de tokens, ayudando a los usuarios que necesitan procesar rápidamente fragmentos de texto masivos. El servicio requiere (como mínimo) una suscripción premium de Google One Ai de $ 19.99 al mes.

Modelos AI lanzados en 2024

Deepseek r1

Este modelo de IA chino tomó por asalto Silicon Valley. El R1 de Deepseek funciona bien en la codificación y las matemáticas, mientras que su naturaleza de código abierto significa que cualquiera puede ejecutarlo localmente. Además, es gratis. Sin embargo, R1 integra la censura del gobierno chino y los enfrenta prohibiciones crecientes para enviar datos de usuarios de regreso a China.

Investigación de Gemini Deep

Deep Research resume los resultados de búsqueda de Google en un documento simple y bien citado. El servicio es útil para los estudiantes y cualquier otra persona que necesite un resumen de investigación rápido. Sin embargo, su calidad no es tan buena como un papel real revisado por pares. La investigación profunda requiere una suscripción premium de Google One AI de $ 19.99.

Meta Llama 3.3 70B

Esta es la versión más nueva y más avanzada de los modelos de IA de código abierto de Meta’s Open Source. Meta ha promocionado esta versión como la más barata y eficiente hasta el momento, especialmente para las matemáticas, el conocimiento general y el seguimiento de la instrucción. Es gratuito y de código abierto.

Operai Sora

Sora es un modelo que crea videos realistas basados ​​en el texto. Si bien puede generar escenas enteras en lugar de solo clips, Operai admite que a menudo genera “física poco realista”. Actualmente solo está disponible en versiones pagas de ChatGPT, comenzando con Plus, que cuesta $ 20 al mes.

Alibaba Qwen QWQ-32B-Preview

Este modelo es uno de los pocos que rivaliza con Oprai’s O1 en ciertos puntos de referencia de la industria, sobresaliendo en matemáticas y codificación. Irónicamente, para un “modelo de razonamiento”, tiene “margen de mejora en el razonamiento de sentido común”, dice Alibaba. También incorpora la censura del gobierno chino, según muestra las pruebas de TechCrunch. Es gratis y de código abierto.

Uso de la computadora de Anthrope

El uso de la computadora de Claude está destinado a tomar el control de su computadora para completar tareas como codificar o reservar un boleto de avión, lo que lo convierte en un predecesor del operador de OpenAI. El uso de la computadora, sin embargo, permanece en beta. El precio es a través de API: $ 0.80 por millón de tokens de entrada y $ 4 por millón de tokens de producción.

Xai’s Grok 2

La compañía AI de Elon Musk, Xai, ha lanzado una versión mejorada de su chat de Grok 2 insignia que afirma que es “tres veces más rápido”. Los usuarios gratuitos se limitan a 10 preguntas cada dos horas en Grok, mientras que los suscriptores de los planes Premium y Premium+ de X disfrutan de mayores límites de uso. XAI también lanzó un generador de imágenes, Aurora, que produce imágenes altamente fotorrealistas, incluidos contenido gráfico o violento.

OpenAi O1

La familia O1 de OpenAI está destinada a producir mejores respuestas “pensando” a través de respuestas a través de una función de razonamiento oculto. El modelo se destaca en la codificación, las matemáticas y la seguridad, los reclamos de Operai, pero también tiene problemas para tratar de engañar a los humanos. El uso de O1 requiere suscribirse a ChatGPT Plus, que es de $ 20 al mes.

Anthrope’s Claude Sonnet 3.5

Claude Sonnet 3.5 es un modelo antrópico como los mejores en clase. Se conoce por sus capacidades de codificación y se considera el chatbot de elección de un interior de tecnología. Se puede acceder al modelo de forma gratuita en Claude, aunque los usuarios pesados ​​necesitarán una suscripción a Pro Monthly de $ 20. Si bien puede entender las imágenes, no puede generarlas.

Operai GPT 4O-Mini

Operai ha promocionado GPT 4O-Mini como su modelo más asequible y más rápido hasta ahora, gracias a su pequeño tamaño. Está destinado a habilitar una amplia gama de tareas como impulsar chatbots de servicio al cliente. El modelo está disponible en el nivel gratuito de Chatgpt. Es más adecuado para tareas simples de alto volumen en comparación con las más complejas.

Cohere Command R+

El modelo de comando R+ de Cohere se destaca en aplicaciones de generación (o trapo) de recuperación compleja para empresas. Eso significa que puede encontrar y citar muy bien las piezas específicas. (El inventor de RAG en realidad funciona en Cohere.) Aún así, Rag no resuelve completamente el problema de alucinación de AI.

You may also like

Exploramos la red para colectar la información más importante que pueda ser compartida para los intereses de los internautas.

El Blog del Internauta 2022

-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00