Home Tecnología Deep Cogito emerge del sigilo con modelos híbridos de ‘razonamiento’ de IA

Deep Cogito emerge del sigilo con modelos híbridos de ‘razonamiento’ de IA

by internauta
0 comment


Una nueva compañía, Deep Cogito, ha surgido de sigilo con una familia de modelos de inteligencia artificial abiertamente disponibles que se puede cambiar entre los modos de “razonamiento” y no de condición.

Los modelos de razonamiento como Openi’s O1 han mostrado una gran promesa en dominios como las matemáticas y la física, gracias a su capacidad de verificar de manera efectiva a sí mismos trabajando a través de problemas complejos paso a paso. Sin embargo, este razonamiento tiene un costo: mayor informática y latencia. Es por eso que los laboratorios como Anthrope están buscando arquitecturas de modelos “híbridas” que combinan componentes de razonamiento con elementos estándar y no razonables. Los modelos híbridos pueden responder rápidamente preguntas simples mientras pasan un tiempo adicional considerando consultas más desafiantes.

Todos los modelos de Deep Cogito, llamados Cogito 1, son modelos híbridos. Cogito afirma que superan a los mejores modelos abiertos del mismo tamaño, incluidos los modelos de la startup de IA Meta y china Deepseek.

“Cada modelo puede responder directamente […] o autorreflexión antes de responder (como modelos de razonamiento) “, explicó la compañía en una publicación de blog”.[All] fueron desarrollados por un pequeño equipo en aproximadamente 75 días “.

Los modelos Cogito 1 varían de 3 mil millones de parámetros a 70 mil millones de parámetros, y Cogito dice que los modelos que varían hasta 671 mil millones de parámetros se unirán a ellos en las próximas semanas y meses. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, con más parámetros que generalmente son mejores.

Cogito 1 no se desarrolló desde cero, para ser claro. Deep Cogito construyó sobre Meta’s Open Llama y los modelos Qwen de Alibaba para crear los suyos. La compañía dice que aplicó nuevos enfoques de capacitación para aumentar el rendimiento de los modelos base y permitir un razonamiento alternable.

Según los resultados de la evaluación comparativa interna de Cogito, el modelo de Cogito 1 más grande, Cogito 70B, con el razonamiento supera el modelo de razonamiento R1 de Deepseek en algunas evaluaciones de matemáticas y idiomas. Cogito 70B con el razonamiento desactivado también Eclipses Meta Llama 4 Scouts lanzado recientemente en LiveBench, una prueba de IA de uso general.

Cada modelo Cogito 1 está disponible para descargar o usar a través de API en los proveedores de nubes, AI y AI juntos.

Cogito profundo
<span class=wp element caption text>El rendimiento de Cogito 1 en comparación con otros modelos de IA abiertos populares disponibles<span><span class=wp block image credits><strong>Créditos de imagen<strong>Cogito profundo<span>

“Actualmente, todavía estamos en las primeras etapas de [our] Curva de escala, habiendo usado solo una fracción de cómputo típicamente reservada para el modelo de lenguaje grande tradicional después de la capacitación/entrenamiento continuo “, escribió Cogito en su publicación de blog.” En el futuro, estamos investigando enfoques complementarios posteriores a la capacitación para la superación personal “.

Según las presentaciones del estado de California, Deep Cogito, con sede en San Francisco, se fundó en junio de 2024. La página de LinkedIn de la compañía enumera a dos cofundadores, Drishan Arora y Dhruv Malhotra. Malhotra fue anteriormente gerente de productos en Google AI Lab Deepmind, donde trabajó en tecnología de búsqueda generativa. Arora era ingeniera de software senior en Google.

Deep Cogito, cuyos patrocinadores incluyen South Park Commons, según Pitchbook, tiene como objetivo construir ambiciosamente “Superinteligencia general”. Los fundadores de la compañía entienden la frase que significa AI que puede realizar tareas mejor que la mayoría de los humanos y “descubrir capacidades completamente nuevas que aún no hemos imaginado”.

You may also like

Exploramos la red para colectar la información más importante que pueda ser compartida para los intereses de los internautas.

El Blog del Internauta 2022

-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00