La startup francesa de Inteligencia Artificial, Mistral, ha dado un paso significativo en el campo de la IA con el lanzamiento de Pixtral 12B, su primer modelo multimodal capaz de procesar tanto imágenes como texto. Este innovador modelo está disponible para su descarga gratuita bajo la licencia Apache 2.0.
Pixtral 12B es un modelo de 12 mil millones de parámetros y tiene un tamaño de aproximadamente 24GB. Se basa en el modelo de texto de Mistral, Nemo 12B, y representa un avance importante para la startup al introducir la capacidad de procesar y responder preguntas sobre imágenes, además de texto.
El modelo está accesible para la comunidad a través de plataformas como GitHub y Hugging Face, permitiendo su uso y ajuste sin restricciones. Mistral también planea integrar Pixtral 12B en sus plataformas de chatbot y API, Le Chat y Le Plateforme, en un futuro cercano.
A pesar de su corta existencia, poco más de un año, Mistral está emergiendo rápidamente como la “respuesta” europea a OpenAI. Con un equipo reducido de investigadores de alto nivel y una reciente ronda de financiación de 645 millones de dólares, la empresa está impulsando con fuerza los límites de la IA con modelos abiertos y potentes.