AMD lidera el procesamiento local de modelos GPT-OSS con sus procesadores Ryzen AI Max+ y gráficas Radeon

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Los chips Ryzen AI Max+ 395 de AMD son los primeros procesadores de consumo capaces de ejecutar el modelo GPT-OSS 120B de OpenAI de forma local, abriendo una nueva etapa para la inteligencia artificial en ordenadores personales.

Con el reciente lanzamiento de los modelos de lenguaje GPT-OSS 20B y 120B por parte de OpenAI, AMD ha anunciado soporte completo desde el primer día en sus plataformas Ryzen AI y tarjetas gráficas Radeon, posicionándose como el primer proveedor en ofrecer soluciones de inteligencia artificial de vanguardia que abarcan desde el cliente hasta la nube.

Los modelos GPT-OSS, sucesores open-weight del GPT-2 lanzado en 2019, destacan por su capacidad de razonamiento avanzado y su arquitectura mixture-of-experts, lo que les permite responder con rapidez y precisión en aplicaciones locales. La versión de 120.000 millones de parámetros, conocida como GPT-OSS 120B, requiere una infraestructura considerable, hasta ahora reservada a centros de datos. Sin embargo, el nuevo procesador AMD Ryzen AI Max+ 395 con 128 GB de memoria ha demostrado ser capaz de ejecutar este modelo directamente desde un portátil.

Ryzen AI Max+ 395: el primer procesador doméstico que ejecuta el GPT-OSS 120B

El chip AMD Ryzen AI Max+ 395 incorpora una GPU integrada con 96 GB de memoria gráfica dedicada, lo que permite cargar el modelo GPT-OSS 120B, cuyos pesos en formato GGML MXFP4 requieren aproximadamente 61 GB de VRAM. Con un rendimiento sostenido de hasta 30 tokens por segundo, este procesador transforma el paradigma de la IA local, proporcionando velocidades que anteriormente sólo eran posibles con hardware de servidores.

Además, gracias a su gran capacidad de memoria, el procesador es compatible con Model Context Protocol (MCP), una tecnología que permite mantener contextos de conversación más amplios y detallados. Esta compatibilidad convierte al Ryzen AI Max+ 395 en la mejor opción actual para desarrolladores y entusiastas que buscan experimentar con modelos LLM avanzados de forma nativa en Windows.

Radeon RX 9070 XT y la IA local con el modelo GPT-OSS 20B

Para quienes deseen trabajar con el modelo más liviano GPT-OSS 20B, AMD ofrece una alternativa potente con su tarjeta gráfica Radeon RX 9070 XT de 16 GB. En pruebas realizadas con un procesador Intel Core i9-13900K, esta GPU ha demostrado un rendimiento excepcional, especialmente en términos de velocidad de generación de tokens y tiempo de respuesta inicial (TTFT), aspectos críticos en escenarios donde la latencia es un factor determinante.

Este modelo también es compatible con MCP y es ideal para PCs de escritorio destinados al desarrollo de agentes conversacionales, interfaces inteligentes o sistemas de asistencia personal local.

Soporte inmediato y acceso a los modelos desde LM Studio

Los usuarios interesados en probar los modelos GPT-OSS 20B y 120B pueden hacerlo mediante LM Studio, el entorno de inferencia recomendado por AMD. Tras instalar los drivers AMD Software: Adrenalin Edition 25.8.1 WHQL o superiores, y ajustar la memoria gráfica variable (VGM) en caso de usar un chip Ryzen AI, los modelos pueden descargarse y ejecutarse directamente desde la aplicación.

El procedimiento, detallado en la documentación de AMD, permite configurar la carga manual de parámetros y optimizar la inferencia local con solo unos clics. Para modelos grandes como el 120B, se recomienda paciencia durante la carga, ya que la transferencia de datos puede ser extensa.

Implicaciones del avance

Este hito marca un paso crucial hacia la democratización de la inteligencia artificial generativa. AMD no solo se posiciona como líder en la carrera por la IA local, sino que también habilita un nuevo paradigma en el que tareas que antes requerían infraestructura cloud ahora pueden ejecutarse de forma autónoma desde equipos portátiles o de sobremesa.

La empresa también ha publicado una tabla de compatibilidad, destacando que su Ryzen AI Max+ 395 es el único chip de consumo capaz de ejecutar el modelo de 120B, mientras que GPUs Radeon RX 9000, RX 7000 y Radeon AI PRO R9000 con al menos 16 GB de VRAM pueden ejecutar el modelo de 20B con fluidez.

Preguntas frecuentes (FAQ)

¿Qué es el modelo GPT-OSS 120B de OpenAI?
Es un modelo de lenguaje de 116.800 millones de parámetros con pesos abiertos, diseñado para tareas de razonamiento avanzado y agente conversacional. Su arquitectura mixture-of-experts permite mayor rendimiento y eficiencia.

¿Qué hardware necesito para ejecutar GPT-OSS 120B localmente?
El único procesador de consumo capaz de ejecutarlo actualmente es el AMD Ryzen AI Max+ 395 con 128 GB de memoria. También se necesita al menos 61 GB de VRAM dedicada y drivers AMD Adrenalin 25.8.1 WHQL o superiores.

¿Qué modelo de AMD es recomendable para GPT-OSS 20B?
GPUs como la Radeon RX 9070 XT de 16 GB ofrecen un excelente rendimiento con el modelo GPT-OSS 20B, incluyendo soporte para MCP y bajas latencias de respuesta.

¿Dónde se pueden descargar y ejecutar estos modelos?
Los modelos GPT-OSS pueden descargarse y ejecutarse a través de LM Studio, una herramienta gratuita compatible con hardware AMD Ryzen AI y Radeon.

vía: amd

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Alan Sonny

Escribo sobre inteligencia artificial, robótica y tecnología y sigo la actualidad y notas del sector.

AMD lidera el procesamiento local de modelos GPT-OSS con sus procesadores Ryzen AI Max+ y gráficas Radeon

Ryzen AI Max+ 395: el primer procesador doméstico que ejecuta el GPT-OSS 120B

Radeon RX 9070 XT y la IA local con el modelo GPT-OSS 20B