Escalando Rufus: El Asistente de Compras de Amazon para el Prime Day Impulsado por IA Generativa

Elena Digital López

Amazon ha dado un paso audaz hacia la transformación de la experiencia de compra en línea con el lanzamiento de Rufus, su nuevo asistente de compras impulsado por inteligencia artificial generativa. Esta herramienta avanzada está diseñada para proporcionar respuestas precisas y detalladas a las consultas de los clientes, usando no solo la vasta base de datos de Amazon, sino también información relevante extraída de la web. Con Rufus, los usuarios pueden tomar decisiones de compra más informadas y ajustadas a sus necesidades.

Para soportar el funcionamiento de Rufus a nivel global y asegurar una baja latencia, Amazon ha utilizado la infraestructura de Amazon Web Services (AWS), implementando sus chips de inteligencia artificial Trainium e Inferentia. Estos chips están optimizados para manejar cargas de trabajo de aprendizaje profundo, permitiendo a Rufus operar de manera más eficiente y económica en comparación con otras soluciones.

El diseño de Rufus incluye un sistema de inferencia distribuido que se extiende por múltiples Regiones de AWS, lo que le permite adaptarse a picos de demanda, como ocurre durante el Prime Day. Esta distribución no solo mejora la capacidad de respuesta en momentos críticos, sino que también incrementa la resiliencia del sistema, garantizando un servicio ininterrumpido y de calidad.

El asistente utiliza un enfoque conocido como Generación Aumentada por Recuperación, donde busca información adicional para enriquecer sus respuestas, particularmente los detalles de productos solicitados por los clientes. Además, la eficiencia energética es un aspecto clave del diseño de Rufus, gracias al uso de chips Trainium e Inferentia, que le permiten operar con un 54% más de eficiencia en comparación con otras opciones, en línea con los objetivos de sostenibilidad de Amazon.

En situaciones de alta demanda, Rufus puede escalar dinámicamente su operación utilizando hasta más de 80,000 chips, asegurando una latencia media de menos de un segundo para generar la respuesta inicial. Esta rapidez en el procesamiento se logra a través de una arquitectura de streaming de inferencia, que ofrece respuestas en tiempo real a los usuarios, mejorando así la experiencia de interacción.

El desarrollo de Rufus no se detendrá aquí. Amazon planea continuar mejorando sus capacidades a medida que avanzan las tecnologías de inteligencia artificial generativa y se recibe feedback de los clientes. Rufus es un claro ejemplo del compromiso de la compañía con la innovación tecnológica, con el objetivo de elevar la satisfacción y el servicio al cliente mediante herramientas tecnológicas de última generación.

Scroll al inicio