Modelos Mistral-NeMo Ahora Disponibles en SageMaker JumpStart

Por Ángel Carrero

X (Twitter) Facebook Pinterest Email WhatsApp

Hoy se ha dado a conocer de manera oficial que los innovadores modelos de lenguaje Mistral-NeMo-Base-2407 y Mistral-NeMo-Instruct-2407 ya están disponibles para su uso a través de Amazon SageMaker JumpStart. Diseñados por Mistral AI en colaboración con NVIDIA, estos modelos cuentan con la impresionante cifra de doce mil millones de parámetros, lo que les permite generar textos de alta calidad en múltiples idiomas.

Estos modelos destacan particularmente por su capacidad para gestionar contenido extenso, gracias a su ventana de contexto de 128k tokens, y por su eficacia en tareas complejas como el razonamiento, conocimiento mundial y codificación precisa. Entre los idiomas compatibles se encuentran el inglés, francés, alemán, español, italiano, portugués, chino, japonés, coreano, árabe e hindi, ampliando así su accesibilidad a una audiencia global. Una característica destacada es el tokenizador Tekken que incorporan, el cual facilita una compresión más eficiente del texto en lenguaje natural y código fuente, mejorando la eficiencia en más de cien idiomas.

SageMaker JumpStart, el servicio que facilita este acceso, es una plataforma gestionada que ofrece una vasta colección de modelos preentrenados para diversos usos, tales como la generación de contenido, respuestas a preguntas, redacción de textos, entre otros. La integración de los modelos Mistral-NeMo en su catálogo supone un avance significativo, ya que permitirá a empresas e investigadores desarrollar aplicaciones de aprendizaje automático de manera más rápida y sencilla, utilizando las capacidades avanzadas de estos modelos.

La implementación de estos modelos en aplicaciones prácticas se puede llevar a cabo mediante Amazon SageMaker Studio, haciendo uso del SDK de Python de SageMaker. Este sistema proporciona a los usuarios la capacidad de maximizar el rendimiento del modelo y controlar las operaciones de aprendizaje automático en un entorno seguro, protegido por las medidas de seguridad de AWS. Además, ofrece la opción de personalizar configuraciones predeterminadas para adaptarse a necesidades específicas.

Para aquellos interesados en las capacidades instruccionales del modelo NeMo, este ofrece herramientas robustas para la generación de código y el manejo de tareas matemáticas avanzadas. La eficiencia de procesamiento que aporta el tokenizador Tekken permite lograr mejoras significativas en la reducción del uso de tokens, beneficiando aplicaciones exigentes como la traducción de idiomas y la generación de textos extensos.

Este avance subraya el compromiso de Mistral AI y Amazon por democratizar el acceso a tecnologías avanzadas de inteligencia artificial y aprendizaje automático, ofreciendo herramientas versátiles y poderosas que se ajustan a diversas necesidades empresariales y de investigación en todo el mundo.