Creación De Flujo De Trabajo Agente Con OpenAI GPT OSS En Amazon SageMaker AI Y Amazon Bedrock AgentCore

Elena Digital López

OpenAI ha hecho una incursión significativa en el ámbito de la inteligencia artificial al presentar dos nuevos modelos de pesos abiertos: gpt-oss-120b y gpt-oss-20b. Estos modelos, con 117 mil millones y 21 mil millones de parámetros respectivamente, son destacados por su capacidad de ejecutar tareas de razonamiento y manejar flujos de trabajo dinámicos, consolidándose como líderes en el ámbito de modelos de código abierto según los benchmarks de Artificial Analysis.

Mediante Amazon SageMaker AI, los usuarios pueden personalizar y ajustar estos modelos a sus necesidades específicas, contando con la ventaja de un servicio completamente gestionado que facilita los procesos sin requerir la construcción y mantenimiento de clústeres propios. Esto se logra gracias a la flexibilidad de SageMaker Inference, que permite la incorporación de código de inferencia personalizado.

A pesar de las capacidades avanzadas de los grandes modelos de lenguaje en términos de comprensión y generación de contenido, la transformación de estos modelos en aplicaciones autónomas del mundo real presenta desafíos considerables. Aquí es donde las arquitecturas de múltiples agentes, capaces de descomponer sistemas complejos en componentes especializados, juegan un papel crucial aunque también implican nuevas complejidades en la coordinación de agentes.

Un reciente artículo detalla el proceso para desplegar el modelo gpt-oss-20b en los endpoints gestionados de SageMaker. También se presenta un ejemplo práctico de un asistente analizador de acciones que emplea LangGraph, un marco potente que facilita la gestión de estado y flujos de trabajo coordinados. Los agentes se despliegan posteriormente en Amazon Bedrock AgentCore, permitiendo operaciones seguras a gran escala mediante una infraestructura abstracta.

La solución resultante permite un análisis eficiente de acciones mediante componentes clave: la utilización del modelo GPT OSS 20B, el marco de orquestación LangGraph y la infraestructura proporcionada por Amazon Bedrock AgentCore. Esta arquitectura facilita la gestión observacional, permitiendo consultas de los usuarios que son abordadas por agentes especializados.

Los usuarios son orientados sobre la configuración de sus entornos y la gestión de permisos, destacando herramientas como vLLM y Amazon Elastic Container Registry para asegurar un despliegue eficiente. Todo esto contribuye a optimizar el tiempo dedicado al análisis de acciones y a maximizar la productividad de los analistas, permitiéndoles concentrarse en tareas más complejas y estratégicas.

Se anima a la comunidad a explorar ejemplos de código y experimentar con flujos de trabajo de agentes para atender diversos casos de uso, destacando el potencial transformador de los modelos de código abierto en la mejora de procesos empresariales.

Scroll al inicio