Hermes 3: El modelo de IA de código abierto que supera a Llama-3.1

Nous Research ha presentado Hermes 3, la última versión de su serie de modelos de lenguaje de código abierto, destacando mejoras significativas en áreas clave como el rol en juegos de rol, tareas agenticas, llamadas a funciones, chats de múltiples turnos y coherencia en contextos extensos.

Hermes 3 está disponible en tres tamaños: 8 mil millones, 70 mil millones y 405 mil millones de parámetros. El modelo más grande, con 405 mil millones de parámetros, ha alcanzado un rendimiento de vanguardia en comparación con otros modelos abiertos, superando en muchos aspectos al modelo Llama-3.1 405B de Meta.

Según Nous Research, Hermes 3 está ajustado para instrucción, lo que significa que está entrenado para responder de manera fiel a las solicitudes de los usuarios y seguir de cerca los avisos del sistema proporcionados. Esto contrasta con los modelos base o fundamentales que a menudo requieren ajustes adicionales para cumplir con tareas específicas.

El nuevo modelo ha demostrado tener un rendimiento comparable o incluso superior en áreas como modelado de juicio, modelado de recompensas, resolución de problemas interpretables, generación de código y uso de herramientas. Estas mejoras se reflejan en la capacidad de Hermes 3 para gestionar chats extensos con mayor coherencia y realizar llamadas a funciones de manera más confiable.

Hermes 3 está disponible de forma gratuita a través de Lambda Chat y en el servidor de Discord de Nous Research, proporcionando a la comunidad de investigación y desarrollo acceso a un modelo avanzado sin costo.

El lanzamiento de Hermes 3 subraya el creciente desafío a la dominancia de Meta en el campo de la inteligencia artificial de código abierto. Empresas como Nous Research y Mistral, con sus últimos modelos Hermes 3 y Large 2, están avanzando rápidamente y ofreciendo alternativas robustas que promueven una mayor transparencia y accesibilidad en el desarrollo de la IA.

Para obtener más detalles sobre Hermes 3, los interesados pueden consultar el informe técnico publicado por Nous Research, y explorar el modelo en el sitio web oficial.

Scroll al inicio