Volkswagen ha dado un paso significativo en la gestión del conocimiento mediante la implementación de una solución innovadora basada en inteligencia artificial generativa. En colaboración con el equipo de Prototipado e Ingeniería de Clientes de AWS (AWSI-PACE), la compañía automovilística ha desarrollado un prototipo que aprovecha los avanzados modelos Claude 3 de Anthropic presentes en Amazon Bedrock. Este sistema permite extraer y analizar datos complejos de documentos privados en formato PDF, que incluyen tanto texto como imágenes.
El principal reto técnico al que se enfrentó Volkswagen fue crear un sistema eficaz para manejar y procesar datos en un entorno multimodal, garantizando precisión y accesibilidad. La solución adoptada, basada en la arquitectura de Recuperación de Generación Aumentada (RAG), facilita a Volkswagen el acceso eficiente a la información interna, optimizando la precisión y eficiencia en sus operaciones productivas.
El diseño arquitectónico integra un sistema backend nativo sin servidor de AWS, priorizando la eficiencia, escalabilidad y fiabilidad. Entre los servicios de AWS empleados se encuentran Amazon S3 para el almacenamiento de datos, Amazon Kendra para la búsqueda semántica y Amazon Bedrock para el análisis de datos. Los modelos de visión Claude 3 son esenciales para interpretar imágenes y textos, siendo fundamentales para extraer información de documentos complejos.
El funcionamiento comienza cuando un usuario carga un documento PDF a través de la interfaz web habilitada por Amazon CloudFront. Tras ser cargado, el documento se almacena en Amazon S3, permitiendo a Amazon Kendra indexar el texto. Concurrentemente, una función Lambda extrae imágenes, procesadas por Amazon Bedrock para extraer texto contextual relevante, que se almacena nuevamente en S3 y es indexado por Kendra, mejorando su capacidad de búsqueda.
El sistema no solo gestiona documentos en alemán, sino que también ofrece una capacidad multilingüe avanzada, manejando consultas y respuestas en alemán e inglés. Este avance es clave para los usuarios que interactúan con documentos en varios idiomas, mejorando su experiencia al permitirles consultar en el idioma de su preferencia.
El rendimiento del prototipo ha sido destacable, logrando un proceso de búsqueda semántica más preciso y relevante contextualmente, además de mejorar la experiencia del usuario con la integración de capacidades multilingües. Estas características han ampliado considerablemente el alcance y accesibilidad del sistema para los usuarios de Volkswagen.
Stefan Krawinkel, representante de Volkswagen, mostró su satisfacción con los resultados, destacando el espíritu innovador del equipo de AWS y el potencial de la inteligencia artificial generativa para superar desafíos complejos y redefinir los límites tecnológicos. Esta colaboración no solo ha permitido superar barreras actuales, sino que también ha abierto nuevas posibilidades para futuras innovaciones en el sector automotriz.