NVIDIA ha lanzado una serie de innovadoras herramientas de inteligencia artificial y simulación, pensadas para acelerar el desarrollo de robots con capacidades avanzadas, incluidos los humanoides. En el marco de la Conferencia de Aprendizaje en Robótica (CoRL) en Múnich, Alemania, la compañía presentó avances significativos en su plataforma NVIDIA Isaac Lab y en su iniciativa Project GR00T, junto con nuevos sistemas para la creación de modelos de mundo.
NVIDIA Isaac Lab: un nuevo marco de aprendizaje para robots
Isaac Lab es una plataforma de aprendizaje para robots basada en NVIDIA Omniverse, que permite entrenar políticas de robot a gran escala. Esta herramienta open-source es aplicable a todo tipo de robots, desde humanoides hasta cuadrúpedos, y está siendo adoptada por líderes en la industria robótica, como Boston Dynamics, Agility Robotics, y XPENG Robotics.
La plataforma permite a los desarrolladores entrenar modelos de aprendizaje para que los robots manejen movimientos e interacciones complejas. “La evolución de los robots humanoides representa la siguiente ola de la inteligencia artificial encarnada”, comenta Jim Fan, gerente de investigación de IA en NVIDIA. Isaac Lab facilita un entorno para simular y perfeccionar los movimientos y habilidades de estos robots, ampliando sus capacidades y acercándolos a un nivel de operación más funcional y adaptable.
Project GR00T: una guía para la creación de robots humanoides
Desarrollar un robot humanoide requiere un enfoque técnico y multidisciplinar que aborde las habilidades de percepción, movimiento y aprendizaje. Project GR00T, impulsado por NVIDIA, es una iniciativa diseñada para acelerar el desarrollo de humanoides mediante flujos de trabajo avanzados y modelos fundacionales.
Este proyecto ofrece seis nuevos flujos de trabajo especializados para humanoides:
- GR00T-Gen: para la creación de entornos 3D basados en IA generativa.
- GR00T-Mimic: generación de movimiento y trayectorias.
- GR00T-Dexterity: manipulación precisa y habilidades manuales.
- GR00T-Control: control del cuerpo completo.
- GR00T-Mobility: locomoción y navegación.
- GR00T-Perception: percepción multimodal para interpretación del entorno.
Estos flujos de trabajo proporcionan una base para la construcción de robots humanoides que puedan interactuar tanto con personas como con el ambiente, promoviendo la colaboración entre equipos de investigación y desarrollo.
Herramientas para construir modelos de mundo de alta calidad
Para los desarrolladores de robots que requieren modelos precisos del mundo, NVIDIA ha presentado el Cosmos tokenizer y el NeMo Curator, ambos diseñados para simplificar el procesamiento de datos visuales y de video. Estas herramientas facilitan la creación de representaciones digitales de alta calidad del entorno, que son esenciales para que los robots anticipen y respondan a interacciones en tiempo real.
El Cosmos tokenizer, disponible como open-source, permite una tokenización visual hasta 12 veces más rápida que los métodos actuales, con alta compresión y mínima distorsión. Eric Jang, vicepresidente de IA en 1X Technologies, destacó que “el Cosmos tokenizer permite entrenar modelos de mundo con generación de video de largo horizonte de manera más eficiente en términos de recursos computacionales”.
Por otro lado, NeMo Curator optimiza la curación de video en grandes escalas, permitiendo una orquestación eficiente de datos a través de sistemas de múltiples GPU. Esta herramienta soporta el escalado lineal y puede manejar más de 100 petabytes de datos, simplificando el desarrollo de la IA y reduciendo costos operativos.
Una comunidad en crecimiento: avances en investigación y colaboración
En la CoRL, el equipo de robótica de NVIDIA presentó 23 artículos de investigación y organizó nueve talleres. Las investigaciones incluyeron innovaciones en integración de modelos de lenguaje-visual para mejorar la comprensión del entorno y la navegación, así como el control y manipulación de robots humanoides. Estos estudios demuestran el compromiso de NVIDIA con el avance de la robótica y la colaboración en el desarrollo de soluciones efectivas y accesibles.
Disponibilidad de las nuevas herramientas de NVIDIA
La versión 1.2 de NVIDIA Isaac Lab ya está disponible en GitHub, junto con el Cosmos tokenizer y otros recursos de código abierto en colaboración con Hugging Face. El NeMo Curator para procesamiento de video estará disponible a finales de este mes.
Project GR00T, que representa un enfoque integral para la creación de robots humanoides de propósito general, lanzará próximamente sus flujos de trabajo para los desarrolladores. NVIDIA también invita a los investigadores a unirse al programa de desarrolladores de robots humanoides, que ofrece acceso a guías y tutoriales específicos, así como oportunidades de mentoría en sus horas de oficina.
Conclusión
La apuesta de NVIDIA por el desarrollo de robots humanoides y de IA no solo avanza las capacidades tecnológicas, sino que también apoya la creación de una robusta comunidad de desarrolladores y empresas en el ámbito de la robótica. Estas innovaciones, que incluyen herramientas de simulación, aprendizaje y procesamiento de datos visuales, ofrecen un camino accesible y eficiente para que los robots sean capaces de interactuar con el mundo físico con mayor precisión y adaptabilidad.
vía: Nvidia