Meta ha dado un paso significativo hacia la inteligencia artificial avanzada con la presentación de V-JEPA 2, su modelo de IA entrenado sobre vídeo capaz de entender y predecir el comportamiento del mundo físico. Este avance refuerza la carrera de los grandes laboratorios por dotar a los sistemas de IA y robots de una “intuición física” similar a la humana, crucial para la próxima generación de agentes inteligentes.
Pensar antes de actuar: el reto de la IA física
La mayoría de los modelos actuales de inteligencia artificial se centran en el procesamiento de texto, imágenes o audio, pero aún les falta algo que los humanos hacen de manera instintiva: anticipar cómo cambiará el entorno como consecuencia de sus acciones. Así, tareas cotidianas como esquivar obstáculos en una calle concurrida o anticipar la trayectoria de un objeto en movimiento —tan naturales para las personas— siguen siendo un desafío para las máquinas.
V-JEPA 2 aborda precisamente este reto. Según explica Meta, se trata de un “modelo del mundo” (world model), es decir, una IA capaz de observar, comprender y predecir el comportamiento de objetos, personas y espacios, para planificar acciones de manera inteligente. En la práctica, esto significa que los robots equipados con este modelo pueden aprender a manipular objetos desconocidos, moverse en entornos no vistos previamente o resolver tareas prácticas sin instrucciones precisas.
Entrenamiento con vídeo: la clave del salto cualitativo
La principal innovación de V-JEPA 2 reside en su entrenamiento: el modelo ha sido expuesto a grandes volúmenes de vídeo, permitiéndole identificar patrones sobre cómo se mueven los objetos, cómo interactúan entre sí o cómo los humanos los manipulan. Gracias a este enfoque, la IA no solo reconoce imágenes, sino que entiende las dinámicas y consecuencias que se derivan de las acciones en el mundo físico.
Durante las pruebas en los laboratorios de Meta, robots alimentados por V-JEPA 2 han demostrado capacidad para realizar tareas como alcanzar y recoger objetos, manipularlos y colocarlos en nuevas ubicaciones, todo ello en entornos desconocidos.
Benchmark abierto y colaboración científica
Junto al lanzamiento del modelo, Meta ha publicado tres nuevos benchmarks específicamente diseñados para evaluar la capacidad de las IAs en la comprensión y el razonamiento sobre el mundo físico usando vídeo. El objetivo es facilitar la comparación objetiva de los avances y acelerar la investigación global en este campo. La compañía ha abierto tanto el modelo como estos recursos a la comunidad investigadora, reforzando su apuesta por la ciencia abierta.
Camino hacia la inteligencia artificial avanzada
La visión de Meta con V-JEPA 2 es clara: avanzar hacia lo que la propia compañía denomina AMI (Advanced Machine Intelligence), donde los agentes artificiales puedan pensar antes de actuar, anticipando resultados y adaptándose a entornos complejos de forma autónoma.
El desarrollo de “modelos del mundo” como V-JEPA 2 supone un avance fundamental para robots domésticos, vehículos autónomos, asistentes inteligentes y sistemas capaces de interactuar de forma segura y eficiente con el entorno físico.
En palabras de los responsables del proyecto, “dotar a la IA de intuición física y capacidad predictiva marcará la diferencia en la vida real de las personas, permitiendo agentes más útiles, fiables y proactivos en multitud de aplicaciones cotidianas y profesionales”.
Meta refuerza así su liderazgo en la carrera global por la inteligencia artificial física, abriendo la puerta a una nueva generación de sistemas que, por primera vez, serán capaces de pensar y anticipar antes de actuar.
Fuente: Meta