
Amazon Escala Rufus: Construyendo Inferencia Multi-Nodo Con Chips AWS Trainium y vLLM
En un avance significativo en el ámbito de la inteligencia artificial, Amazon ha presentado Rufus, un asistente de compras impulsado por IA generativa que ya está disponible para millones de usuarios. Aunque su implementación a gran escala conlleva desafíos considerables, la empresa ha logrado mantener interacciones de alta calidad, eficiencia en costos y baja latencia. Para lograrlo, Amazon ha desarrollado