Nuevas Capacidades De Amazon SageMaker Inference Con Soporte Para Instancias G6e

Elena Digital López

En el dinámico campo de la inteligencia artificial generativa, la búsqueda de soluciones cada vez más eficientes y potentes es constante. En este contexto, Amazon ha dado un paso significativo al anunciar la disponibilidad de sus nuevas instancias G6e en la plataforma Amazon SageMaker. Equipadas con las GPUs NVIDIA L40S Tensor Core, estas instancias prometen transformar la manera en que las organizaciones abordan sus necesidades de procesamiento de datos, ofreciendo opciones flexibles, potentes y rentables.

Una de las características más destacadas de las instancias G6e es su capacidad de memoria. Con un total de 48 GB de memoria de alta capacidad de datos (HBM) por instancia, superan considerablemente a las anteriores instancias G5 y G6, permitiendo el despliegue de modelos de lenguaje grande en formato FP16. Esto significa que los usuarios pueden manejar modelos extensos en configuraciones de hasta 90 mil millones de parámetros en un único nodo con 8 GPUs. Además, con un rendimiento de red de hasta 400 Gbps y hasta 384 GB de memoria GPU, estas instancias ofrecen un incremento notable en velocidad y capacidad.

Estas mejoras tienen un impacto directo en la eficiencia y el costo, posicionando a las G6e como una opción preferida para aplicaciones que requieren baja latencia y operaciones en tiempo real, como los chatbots y modelos de inteligencia artificial conversacional. En comparaciones de pruebas de rendimiento, las instancias G6e demostraron un 37% mejor en latencia y un 60% más de rendimiento en comparación con las G5.2xlarge, destacando su superioridad en el manejo de modelos complejos como Llama 3.1 y Llama 3.2 Vision.

La economía también se ve favorecida con estas nuevas instancias. Al analizar los costos de despliegue por 1000 tokens en un modelo Llama 3.1 70b, las instancias G6e ofrecen claras ventajas, revelando ahorros sustanciales que pueden ser críticos para muchas organizaciones que gestionan grandes volúmenes de datos.

En resumen, las instancias G6e de Amazon SageMaker suponen un avance significativo para las organizaciones que buscan maximizar el rendimiento de sus aplicaciones de inteligencia artificial sin comprometer el presupuesto. Con capacidades mejoradas y un enfoque económico, estas instancias no solo fortalecen la infraestructura tecnológica existente, sino que también permiten la innovación continua en el desarrollo de aplicaciones de IA modernas.

Scroll al inicio