Exploración de Activos de Datos Empresariales con LLMs y Grafos de Conocimiento

Elena Digital López

Empresas de todo el mundo enfrentan hoy importantes desafíos al gestionar y acceder a sus activos de datos, que están dispersos a través de innumerables fuentes debido a la creciente complejidad del manejo de grandes volúmenes de información. Los métodos de búsqueda tradicionales a menudo resultan insuficientes para proporcionar resultados comprensivos y contextuales, especialmente cuando se trata de datos no estructurados o consultas complejas.

En el contexto actual, donde el manejo eficiente de grandes datos es crucial, surge la necesidad de soluciones de búsqueda que sean tanto eficientes como precisas, adaptándose al ingreso continuo de nuevos datos. Los usuarios buscan poder consultar todos los datos y aplicaciones de su organización, accediendo también a información de procedencia y metadatos de todos los documentos y activos de datos relevantes que encuentren.

Para responder a estas necesidades, se ha desarrollado recientemente una solución de búsqueda semántica avanzada, potenciada por Inteligencia Artificial generativa. Esta herramienta permite a los usuarios de negocios localizar rápida y precisamente los activos de datos relevantes a través de múltiples fuentes dentro de una empresa. Está integrada con modelos de lenguaje de gran escala alojados en Amazon Bedrock y respaldados por un grafo de conocimiento construido en Amazon Neptune, creando un paradigma de búsqueda innovador que admite consultas en lenguaje natural.

Esta solución permite realizar búsquedas integradas a través de documentos almacenados en Amazon S3, tablas de data lake en el catálogo de datos de AWS Glue, así como activos empresariales en Amazon DataZone. Al combinar modelos base en Amazon Bedrock para generación de texto y tareas lingüísticas con grafos de conocimiento, este enfoque híbrido ofrece razonamiento estructurado e inferencia, conjuntando la comprensión del lenguaje con conocimientos de dominio y razonamiento lógico.

El sistema se integra con los catálogos y repositorios de datos existentes dentro de las organizaciones, creando una capa semántica unificada y escalable en todo el ecosistema de datos. Esto mejora significativamente la disponibilidad y el acceso a los datos a nivel empresarial, ofreciendo una experiencia de búsqueda tan sencilla como un motor de búsqueda común, pero con la profundidad y especificidad que requieren los negocios.

La implementación de esta solución facilita el acceso a una plataforma donde los usuarios pueden ingresar consultas en lenguaje natural, permitiéndoles descubrir activos de datos con una comprensión semántica precisa que potencia la toma de decisiones, la eficiencia y la innovación. Esta herramienta promete habilitar el uso continuo y eficaz de los datos empresariales, abriendo nuevas posibilidades de descubrimiento e insights que pueden llevar a innovaciones notables dentro de las organizaciones.

Scroll al inicio