En la carrera constante por empujar los límites de la inteligencia artificial, seleccionar la solución de cómputo correcta se ha convertido en una pieza clave para el desarrollo exitoso de modelos de IA de vanguardia. En este contexto, la eficiencia y la habilidad para manejar tareas complejas y variadas son aspectos críticos que definen el éxito de proyectos ambiciosos, como es el caso de Stable Diffusion 3, el modelo más avanzado de texto a imagen de Stability AI, que se encuentra en fase de desarrollo.
Comprometidos con el avance de modelos abiertos en diversas modalidades, los expertos de Stability AI han llevado a cabo un análisis exhaustivo de las soluciones de cómputo disponibles, poniendo a prueba dos de sus modelos, incluido el muy anticipado Stable Diffusion 3, contra los aceleradores Intel Gaudi 2 y las soluciones Nvidia A100 y H100. Estas últimas son las opciones predominantes entre startups y desarrolladores en el entrenamiento de Modelos de Lenguaje Grande (LLM).
El análisis realizado con la versión de 2 mil millones de parámetros de Stable Diffusion 3 reveló resultados sorprendentes. En pruebas de entrenamiento con una configuración de 2 nodos, un total de 16 aceleradores (Gaudi/GPU), el clúster de Gaudi 2 procesó más de 3 veces más imágenes por segundo en comparación con las GPU A100-80GB. Este logro es notable, considerando la optimización del software de Nvidia.
Durante las pruebas de inferencia con el modelo de 8 mil millones de parámetros de Stable Diffusion 3, los chips Gaudi 2 ofrecieron una velocidad de inferencia comparable a los chips Nvidia A100 usando PyTorch base. Con la optimización de TensorRT, los chips A100 procesan imágenes un 40% más rápido que Gaudi 2, aunque se espera que con futuras optimizaciones, Gaudi 2 pueda superar a los A100 en este modelo.
El segundo modelo analizado, Stable Beluga 2.5 70B, una versión afinada de LLaMA 2 70B, destacó por su impresionante rendimiento en pruebas de entrenamiento utilizando 256 aceleradores Gaudi 2. Este modelo ha superado a ChatGPT 3.5 en ciertos benchmarks, demostrando un rendimiento excepcional en términos de eficiencia y capacidad.
La demanda de soluciones de cómputo más potentes y eficientes continúa creciendo. Los hallazgos de Stability AI subrayan la importancia de explorar alternativas como Gaudi 2, que no solo ofrece un rendimiento superior a otros chips de 7nm, sino que también satisface necesidades críticas del mercado como la asequibilidad, los tiempos de entrega reducidos y una relación precio-rendimiento superior.
La disponibilidad de opciones de cómputo diversificadas, como Gaudi 2, amplía las oportunidades para la participación y la innovación, haciendo que las tecnologías avanzadas de IA sean más accesibles para todos. Este análisis de rendimiento promete transformar radicalmente el desarrollo y la implementación de modelos de IA generativa, abriendo nuevas posibilidades para la exploración y la creatividad en el campo de la inteligencia artificial.
vía: Stability AI