NVIDIA y Amazon Web Services (AWS) se han unido para abordar los desafíos que supone la construcción de sistemas de inteligencia artificial (IA) a gran escala, proporcionando un camino más práctico para implementar IA a nivel de producción. Ambas compañías están resolviendo problemas fundamentales como la baja latencia, búsqueda rápida de vectores, rendimiento óptimo de GPUs y una infraestructura escalable sin complejidad operativa adicional.
AWS ha presentado las nuevas instancias EC2 G7, potenciadas por GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition, diseñadas para cargas de trabajo de IA, gráficos y análisis de datos. Estas instancias ofrecen mejoras significativas en el rendimiento de inferencia de IA, rendimiento gráfico y análisis de datos acelerados por GPU en comparación con sus predecesoras, las instancias G6. Las nuevas características incluyen soporte para hasta ocho GPUs, 256 GB de memoria total de GPU, y una amplia capacidad de almacenamiento local NVMe SSD, permitiendo a los clientes ajustar la infraestructura según sus necesidades específicas.
La integración de la biblioteca NVIDIA cuVS en Amazon OpenSearch Serverless marca un hito en la aceleración de búsqueda de vectores por GPU, estableciendo un nuevo estándar para las aplicaciones de generación aumentada por recuperación, búsqueda semántica y sistemas de recomendación. Esta tecnología permite realizar indexaciones vectoriales hasta diez veces más rápido y a una cuarta parte del costo comparado con configuraciones estándar de CPU, revolucionando la construcción de bases de datos de vectores a gran escala.
AWS también ha alcanzado el estatus NVIDIA Exemplar Cloud, lo que certifica que la infraestructura cloud de AWS cumple con exigentes parámetros de rendimiento en cargas de trabajo de entrenamiento, asegurando a los desarrolladores y líderes de IA que emplean recursos de alta calidad para proyectos a gran escala.
Estos avances, fruto de una intensa colaboración entre NVIDIA y AWS, consolidan una infraestructura de IA robusta en AWS, diseñada para operar a escala sin aumentar la carga operacional. Con ello, ambas empresas buscan facilitar el camino de los proyectos de IA desde la planificación hasta la producción, mejorando el coste total de propiedad y la eficiencia en las implementaciones cloud.
Fuente: Zona de blogs y prensa de Nvidia












