MTIA v1: el acelerador de inferencia IA propio que Meta diseñó para sus centros de datos

Meta presentó en mayo de 2023 el MTIA v1 (Many Tensor Inference Accelerator), su primer chip propio diseñado específicamente para cargas de trabajo de inferencia de inteligencia artificial en centros de datos. El anuncio se hizo en un evento en línea para ingenieros y supone la primera incursión pública de la compañía en hardware de IA de diseño propio orientado a producción.

Arquitectura y formato físico

MTIA v1 es una matriz de procesadores tensoriales con múltiples elementos de procesamiento (PE). Cada PE cuenta con dos núcleos de procesador y varias unidades de función fija. El diseño prioriza el paralelismo y la reutilización de datos para maximizar la eficiencia en tareas de inferencia.

En cuanto al formato físico, el chip se monta en tarjetas M.2 duales que se conectan al procesador anfitrión del servidor mediante enlaces PCIe Gen4 x8. Los servidores que integran MTIA siguen la especificación Yosemite V3 del Open Compute Project, lo que facilita el despliegue a escala en infraestructura de centro de datos compatible con este estándar abierto. En el debate más amplio sobre quién controla la próxima generación de chips de IA, revistacloud analiza la situación de TSMC frente a Intel.

Pila de software: PyTorch y KNYFE

La pila de software de MTIA se integra directamente con PyTorch. El sistema aprovecha PyTorch FX IR para transformaciones y optimizaciones a nivel de modelo, y LLVM IR para optimizaciones de bajo nivel. El tiempo de ejecución de PyTorch para MTIA gestiona la ejecución en el dispositivo, incluyendo la gestión de memoria y las APIs para programar operadores en el acelerador.

Para el desarrollo de núcleos de cálculo, los ingenieros pueden usar PyTorch, C/C++ o KNYFE, un lenguaje de dominio específico nuevo que Meta diseñó para este acelerador. La elección de PyTorch como capa principal reduce la curva de aprendizaje para equipos de investigación que ya trabajan con este framework.

Rendimiento y contexto competitivo

Meta publicó resultados comparativos internos que muestran ventajas de MTIA frente a otros aceleradores en cargas de inferencia seleccionadas, con énfasis en la eficiencia energética por operación. Meta no detalló en el anuncio los benchmarks concretos ni los competidores contra los que comparó, por lo que los datos publicados deben tomarse como cifras propias pendientes de validación externa.

El movimiento de Meta sigue la tendencia de las grandes plataformas tecnológicas de diseñar chips propios para reducir la dependencia de NVIDIA y controlar el coste de inferencia a escala. Google lleva años con sus TPUs, Amazon con Trainium e Inferentia, y Apple con sus chips de la serie M y Neural Engine. MTIA v1 es la primera incursión de Meta en este espacio con un chip anunciado públicamente y orientado a centros de datos propios.

Más detalles técnicos en el blog oficial: Meta AI.

Preguntas frecuentes sobre MTIA v1

¿Qué significa MTIA?
Many Tensor Inference Accelerator. Es el nombre del primer chip de inferencia de IA de diseño propio que Meta ha anunciado públicamente.

¿Para qué tipo de tareas está diseñado MTIA?
Específicamente para inferencia de IA en centros de datos, no para entrenamiento. El chip optimiza la eficiencia energética en la ejecución de modelos ya entrenados.

¿Qué lenguajes de programación soporta MTIA?
PyTorch, C/C++ y KNYFE, un DSL (lenguaje de dominio específico) diseñado por Meta para este acelerador. La integración nativa con PyTorch facilita la adopción por parte de equipos de investigación.

¿Está disponible MTIA para terceros?
No. MTIA v1 es un chip interno de Meta para sus propios centros de datos. No se anunció ningún programa de acceso externo en el momento del lanzamiento.

Scroll al inicio