Modelos Mistral-NeMo Ahora Disponibles en SageMaker JumpStart

Elena Digital López

Hoy se ha anunciado oficialmente la disponibilidad de los modelos de lenguaje Mistral-NeMo-Base-2407 y Mistral-NeMo-Instruct-2407 a través de Amazon SageMaker JumpStart. Desarrollados por Mistral AI en colaboración con NVIDIA, estos modelos cuentan con la impresionante cifra de doce mil millones de parámetros y son capaces de generar textos de alta calidad en varios idiomas. Los usuarios interesados pueden acceder a estos modelos mediante SageMaker JumpStart, una plataforma de aprendizaje automático que ofrece un acceso directo a algoritmos y modelos preentrenados que pueden implementarse fácilmente con un simple clic para realizar inferencias.

Los modelos Mistral NeMo son especialmente notables por su capacidad para manejar contenido extenso gracias a su ventana de contexto de 128k tokens. Destacan por su eficacia en tareas de razonamiento, conocimiento mundial y precisión en codificación, además de su compatibilidad con idiomas como inglés, francés, alemán, español, italiano, portugués, chino, japonés, coreano, árabe e hindi, lo que sin duda potencia su accesibilidad global. Una característica sobresaliente de estos modelos es su tokenizador Tekken, que permite una compresión más eficiente del texto y el código fuente, mejorando significativamente la eficiencia en más de cien idiomas.

SageMaker JumpStart es un servicio gestionado que proporciona modelos preentrenados para diversos usos, como la generación de contenido, respuestas a preguntas, y redacción de copias publicitarias, entre otros. La incorporación de los modelos Mistral-NeMo-Base-2407 y Mistral-NeMo-Instruct-2407 en su catálogo facilitará a las empresas y a los investigadores el desarrollo de aplicaciones de aprendizaje automático de manera más rápida y sencilla, aprovechando las avanzadas capacidades de estos modelos.

La implementación de estos modelos puede realizarse con facilidad mediante Amazon SageMaker Studio, utilizando el SDK de Python de SageMaker. Este enfoque permite a los usuarios optimizar el rendimiento del modelo y gestionar las operaciones de aprendizaje automático de manera segura, gracias al entorno protegido de AWS. Además, los usuarios disponen de la opción de modificar configuraciones predeterminadas para personalizar la implementación conforme a sus necesidades específicas.

Para quienes deseen explorar las capacidades instruccionales del modelo NeMo, este ofrece herramientas efectivas para la generación de código y la comprensión de tareas matemáticas avanzadas, entre otras aplicaciones. Gracias a la eficiencia de procesamiento del tokenizador Tekken, es posible lograr mejoras significativas en la reducción del uso de tokens, siendo especialmente ventajoso en aplicaciones demandantes como la traducción de idiomas y la generación de contenido extenso.

Este desarrollo refuerza el compromiso de Mistral AI y Amazon de democratizar el acceso a tecnologías avanzadas de inteligencia artificial y aprendizaje automático, proporcionando herramientas poderosas y versátiles que pueden adaptarse a diversas necesidades empresariales e investigativas en todo el mundo.

Scroll al inicio