En el competitivo mundo de la inteligencia artificial, un nuevo jugador ha llegado para revolucionar la industria: Sohu, el chip de IA más rápido jamás creado. Desarrollado por Etched, este innovador chip especializado ha sido diseñado exclusivamente para modelos de transformadores, dejando muy atrás a sus competidores en términos de velocidad y eficiencia.
Rendimiento sin precedentes
Con una capacidad para procesar más de 500.000 tokens por segundo en el modelo Llama 70B, Sohu promete hacer posible la creación de productos que antes eran impensables con las GPU tradicionales. Un servidor 8xSohu puede reemplazar hasta 160 GPUs H100 de NVIDIA, lo que lo convierte en una solución extremadamente eficiente y rentable.
Primer chip especializado para transformadores
Sohu es el primer chip ASIC (circuito integrado específico de aplicación) desarrollado específicamente para modelos de transformadores. Este enfoque especializado permite un rendimiento mucho mayor, ya que el chip no puede ejecutar otros modelos de IA como CNNs, LSTMs o SSMs. Sin embargo, esta limitación es precisamente lo que le permite alcanzar velocidades y eficiencias superiores a cualquier otro chip en el mercado.
Comparación con GPUs de próxima generación
Sohu no solo supera a las actuales GPUs H100 de NVIDIA, sino que también es más rápido y económico que las GPUs de próxima generación, como la B200. Un servidor Sohu puede manejar más de 500.000 tokens por segundo, en comparación con los 23.000 tokens por segundo de un servidor H100 y los 45.000 tokens por segundo de un servidor B200.
La inevitable especialización de chips
Con la ralentización de la ley de Moore, la única manera de mejorar el rendimiento es a través de la especialización. Los ASICs como Sohu son 10-100 veces más rápidos que las GPUs para tareas específicas. Esta especialización es similar a lo que ocurrió en 2014 con los mineros de Bitcoin, donde se volvió más económico desechar las GPUs en favor de los ASICs especializados.
Impacto en la economía de escala
En la actualidad, entrenar modelos de IA cuesta más de 1.000 millones de dólares, y se espera que el uso en inferencias alcance los 10.000 millones de dólares. En este contexto, incluso una mejora del 1% justificaría una inversión de 50-100 millones de dólares en un proyecto de chip personalizado. Los ASICs, como Sohu, ofrecen un rendimiento mucho mayor, lo que los convierte en una opción inevitable para las grandes compañías de IA.
Una apuesta segura en la lotería del hardware
Los modelos de transformadores han demostrado ser extremadamente eficientes y rentables, lo que ha llevado a una inversión masiva en su optimización. Los modelos de última generación, como ChatGPT, Sora, Gemini y Stable Diffusion 3, son todos transformadores, y Sohu ha sido diseñado para maximizar su rendimiento. La arquitectura de transformadores ha ganado la «lotería del hardware», dominando todos los mercados importantes de computación de IA.
El futuro de Sohu y los ASICs
A medida que los modelos de IA escalan desde entrenamientos de 1.000 millones de dólares a 100.000 millones de dólares, el riesgo de probar nuevas arquitecturas se dispara. La inversión en mejorar la eficiencia de los transformadores en lugar de probar nuevas leyes de escalabilidad es una apuesta más segura. Con la llegada de ASICs como Sohu, la optimización para transformadores marcará el punto de no retorno en la evolución del hardware de IA.
Conclusión
Sohu representa un salto cuántico en el rendimiento de la IA, estableciendo un nuevo estándar para la industria. Su especialización en modelos de transformadores le permite ofrecer un rendimiento sin precedentes, haciendo que los productos de IA sean más rápidos y accesibles. Con el respaldo de las mejores mentes en investigación de IA y hardware, y en asociación con TSMC para su producción, Sohu está listo para transformar el futuro de la inteligencia artificial.
Para más información sobre cómo obtener acceso anticipado al Sohu Developer Cloud y formar parte de esta revolución tecnológica, visita el sitio web de Etched.