
NVIDIA quiere resolver el gran cuello de botella de la IA agéntica: la latencia
La IA agéntica ha cambiado el problema técnico de la inferencia. Ya no se trata solo de responder a una petición aislada con el mayor número posible de tokens por segundo. Un agente puede consultar herramientas, dividir una tarea en subtareas, invocar otros agentes, mantener contexto durante cientos de pasos y generar decisiones encadenadas. Cada una de esas acciones añade














