Mejorando la Relleno de Slots en Amazon Lex mediante Puntuaciones de Confianza en la Transcripción

Por Ángel Carrero

X (Twitter) Facebook Pinterest Email WhatsApp

El desarrollo de chatbots habilitados para voz ha alcanzado un nuevo hito con el uso de Amazon Lex, una herramienta diseñada para optimizar la interacción con los usuarios al captar sus entradas de voz de manera precisa. Uno de los desafíos más importantes en este campo es la captura exacta de datos críticos, como números de cuenta o códigos de confirmación, donde la precisión del reconocimiento del habla juega un papel esencial. Para abordar este tema, Amazon Lex ha introducido las puntuaciones de confianza de transcripción, un mecanismo que promete mejorar la fiabilidad en la recopilación de datos.

Las puntuaciones de confianza de transcripción son indicadores que muestran el nivel de certeza de Amazon Lex en la conversión de voz a texto con respecto a los valores del slot. Estas puntuaciones, que oscilan entre niveles bajos y altos, son distintas de las puntuaciones de reconocimiento de intención o entidad, y permiten a los desarrolladores validar la comprensión correcta de la entrada. Esto facilita la decisión sobre si es necesario pedir una confirmación, volver a formular la pregunta o modificar los flujos de conversación según el grado de confianza alcanzado.

Existen varias estrategias para usar estas puntuaciones de manera efectiva en la gestión de slots. Una de ellas es la confirmación progresiva, que indica el curso de acción a seguir según el nivel de confianza: si la puntuación es alta (superior a 0.9), se aconseja aceptar el valor, mientras que puntuaciones medias o bajas sugieren confirmar la entrada o solicitar al usuario que repita la información. También se sugiere una re-pregunta adaptativa, que ajusta los mensajes según el nivel de confianza, y una lógica de ramificación que permite redirigir a un agente humano tras varios intentos de baja confianza.

Estos enfoques se reflejan en las interacciones habituales que los usuarios tienen al comunicarse con agentes virtuales. Implementar estas directrices no solo disminuye errores en la captura de información importante, sino que además mejora las tasas de auto-servicio y gestiona mejor condiciones de audio desafiantes. Esto da lugar a flujos de conversación más inteligentes, optimizando la experiencia del cliente.

La solución se complementa con una arquitectura que integra un bot de Amazon Lex con Amazon Connect, estableciendo un flujo conversacional robusto. Esta integración permite a Amazon Lex evaluar la confianza en las transcripciones durante las interacciones, adaptando el proceso de confirmación en consecuencia. Ejemplos prácticos muestran cómo la confianza en la transcripción influye en las respuestas del agente virtual, mejorando la experiencia del usuario mediante una interacción más fluida.

Para implementar esta solución, se necesita una cuenta de AWS y ciertos permisos para gestionar los recursos necesarios. Desde este punto, se pueden seguir una serie de pasos para crear y configurar el bot de Amazon Lex y el flujo de Amazon Connect. La lógica de puntuación de confianza se puede configurar fácilmente a través del Visual Conversation Builder, un diseño que facilita la personalización del flujo conversacional.

No obstante, se deben considerar algunas limitaciones. Actualmente, las puntuaciones de confianza de transcripción están disponibles únicamente en inglés y para entradas de audio de 8 kHz. Además, no se generan puntuaciones de confianza para las entradas de audio hechas en la ventana de prueba de Amazon Lex V2.

Finalmente, optimizar la experiencia del usuario se convierte en una prioridad fundamental para los diseñadores de conversaciones en Amazon Lex. Al implementar estas características, se logra un diálogo más natural y se mantiene la precisión en la captura de información vital, traduciéndose en una experiencia más satisfactoria a lo largo de toda la interacción.