Implementación Multi-tenant RAG con Bases de Conocimiento en Amazon Bedrock

Elena Digital López

En el mundo empresarial actual, donde la personalización se ha convertido en un elemento esencial para el éxito, las organizaciones buscan continuamente modos de maximizar el uso de su conocimiento interno y experiencia sectorial para obtener una ventaja competitiva. Con la llegada de los modelos de base (FMs) y sus impresionantes capacidades de procesamiento del lenguaje natural, se ha abierto una vía novedosa para aprovechar de forma más efectiva los activos de datos de las empresas.

La integración de la inteligencia artificial generativa en el tejido empresarial es una tendencia en aumento, permitiendo a las empresas brindar experiencias personalizadas a sus clientes. Especializar el comportamiento de los FMs utilizando sus propios datos y los de sus clientes se ha convertido en una prioridad. Es aquí donde la Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) juega un papel crucial, presentándose como un método simple pero poderoso para alcanzar la especialización deseada.

Amazon Bedrock Knowledge Bases se posiciona como una solución integral que simplifica la gestión del flujo de trabajo RAG, permitiendo a las organizaciones ofrecer información contextual y relevante a los FMs y agentes. Esto se logra a través de fuentes de datos privadas, proporcionando respuestas más precisas y adaptadas a necesidades específicas.

Para los desarrolladores de productos multiarrendatarios, como los proveedores de software independiente (ISVs) que ofrecen software como servicio (SaaS), la capacidad de personalizar la experiencia para cada cliente es sumamente significativa. La implementación de RAG permite utilizar de manera selectiva los datos específicos de cada arrendatario, abordando de manera efectiva desafíos como el aislamiento de datos, la seguridad, la gestión de los múltiples arrendatarios y los costos.

La arquitectura RAG, cuando se integra en aplicaciones de los ISVs, ofrece ejemplos concretos de cómo lograr esta personalización. Un elemento central en este esfuerzo es el almacenamiento de datos en bases de vectores, utilizando actualmente Amazon OpenSearch Service, aunque la arquitectura puede adaptarse para otras implementaciones.

Al diseñar un sistema RAG multiarrendatario, las organizaciones deben evaluar el aislamiento necesario para los arrendatarios, la facilidad de gestión y la eficiencia en costos. Lograr un equilibrio entre estos factores es crucial para la efectividad de la solución. Los patrones de silo, pool y puente ofrecen diferentes grados de aislamiento y personalización, respondiendo a diversas necesidades.

El patrón de silo destaca por su elevado nivel de aislamiento, ofreciendo una infraestructura independiente para cada arrendatario, lo cual, aunque costoso, asegura mayor seguridad y control de datos. En contraste, el patrón de pool, que comparte la infraestructura RAG entre arrendatarios, resulta más económico pero menos personalizado. El patrón de puente busca un equilibrio entre ambos, facilitando la personalización y optimizando costos comparado con el patrón de silo.

Estos enfoques flexibles permiten que las organizaciones actualicen y adapten su arquitectura tecnológica a fin de ofrecer un servicio altamente personalizado, garantizando simultáneamente la satisfacción del cliente y el aprovechamiento óptimo de recursos y datos disponibles.

Scroll al inicio