Hoy se ha anunciado el lanzamiento del altamente avanzado modelo de lenguaje visual (VLM) Pixtral 12B, desarrollado por Mistral AI, que ahora está accesible para los clientes a través de Amazon SageMaker JumpStart. Este modelo destaca por su capacidad para abordar tanto tareas de texto como multimodales, prometiendo un rendimiento excepcional en aplicaciones del mundo real, como el entendimiento de gráficos y figuras, respuesta a preguntas sobre documentos, razonamiento multimodal y seguimiento de instrucciones.
La singularidad de Pixtral 12B radica en su habilidad para procesar imágenes en su resolución y relación de aspecto naturales, manteniendo un elevado rendimiento en tareas textuales. Su innovadora arquitectura se compone de un codificador de visión con 400 millones de parámetros y un decodificador transformador multimodal con 12 mil millones de parámetros, lo que le permite realizar inferencias rápidas y precisas.
Disponible bajo la licencia comercial Apache 2.0, Pixtral 12B ofrece una potente opción para empresas y startups que buscan desarrollar aplicaciones multimodales complejas. Su integración con SageMaker JumpStart simplifica el acceso y despliegue de modelos de aprendizaje automático en un entorno seguro, permitiendo una personalización profunda para satisfacer necesidades específicas de uso.
SageMaker JumpStart, parte del portfolio de AWS, permite a los desarrolladores acceder a modelos preentrenados de alto rendimiento y desplegarlos en instancias dedicadas de inferencia, incluidas aquellas potenciadas por AWS Trainium e Inferentia. A pesar de que el ajuste fino del Pixtral 12B aún no está disponible, los usuarios pueden aprovechar sus capacidades para realizar tareas como reconocimiento óptico de caracteres (OCR), análisis de gráficos y conversión de imágenes a código, ya sea mediante interfaces de usuario intuitivas o el SDK de Python de SageMaker.
Con este lanzamiento, Mistral AI refuerza su posición en el ámbito del desarrollo de modelos de lenguaje visual. Al mismo tiempo, Amazon SageMaker JumpStart continúa facilitando el acceso a las arquitecturas de modelos más avanzadas, optimizando así el despliegue de modelos de aprendizaje automático para expertos en datos e ingenieros de aprendizaje automático. Este anuncio representa un significativo avance hacia la integración de modelos multimodales en procesos empresariales, allanando el camino para futuras innovaciones en el campo de la inteligencia artificial.