Se está volviendo un poco más fácil construir proyectos de robóticos sofisticados en casa.
A principios de esta semana, la plataforma AI Dev Hugging Face lanzó un modelo de IA abierto para robótica llamado Smolvla. Entrenado en conjuntos de datos “con licencia compatiblemente” compartidos de la comunidad, Smolvla supera a modelos mucho más grandes para robótica en entornos virtuales y de mundo real, abrazando reclamos faciales.
“Smolvla tiene como objetivo democratizar el acceso a la acción-idioma de la visión [VLA] Modelos y aceleran la investigación hacia agentes robóticos generalistas “, escribe la cara abrazada en una publicación de blog.” Smolvla no solo es un modelo liviano pero capaz, sino también un método para entrenar y evaluar la robótica generalista [technologies]. “
Smolvla es parte de Hugging Face el esfuerzo en rápida expansión para establecer un ecosistema de hardware y software de robótica de bajo costo. El año pasado, la compañía lanzó Lerobot, una colección de modelos, conjuntos de datos y herramientas centrados en la robótica. Más recientemente, abrazando a Pollen Robotics, una startup de robótica con sede en Francia, y dio a conocer varios sistemas de robótica económicos, incluidos los humanoides, para la compra.
Smolvla, que tiene 450 millones de parámetros de tamaño, fue capacitado en datos de conjuntos de datos de la comunidad de Lerobot, conjuntos de datos de robóticos especialmente marcados compartidos en Hugging Face’s AI Development Platform. Los parámetros, a veces denominados “pesos”, son los componentes internos de un modelo que guían su comportamiento.
Abrazando a Face afirma que Smolvla es lo suficientemente pequeño como para ejecutarse con una sola GPU de consumo, o incluso en una MacBook, y puede probarse e implementarse en hardware “asequible”, incluidos los sistemas de robótica propios de la compañía.
En un giro interesante, Smolvla también admite una “pila de inferencias asíncronas”, que dice que abraza la cara dice que el modelo separe el procesamiento de las acciones de un robot del procesamiento de lo que ve y escucha. Como explica la compañía en su publicación de blog, “[b]Porcúa de esta separación, los robots pueden responder más rápidamente en entornos de cambio rápido “.
Smolvla está disponible para descargar desde Hugging Face. Ya, un usuario en X afirma haber utilizado el modelo para controlar un brazo robótico de terceros:
Vale la pena señalar que abrazar la cara está lejos de ser el único jugador en la naciente carrera de robótica abierta.
Nvidia tiene una colección de herramientas para robótica abierta, y la startup K-Scale Labs está construyendo los componentes para lo que llama “humanoides de código abierto”. Otras empresas formidables en el segmento incluyen Dyna Robotics, inteligencia física respaldada por Jeff Bezos y RLWRLD.