Construcción De Aplicaciones Rag Rentables Con Binarios Embeddings Usando Amazon Titan Text Embeddings V2, OpensSearch Serverless Y Bedrock Knowledge Bases

Elena Digital López

Hoy se ha anunciado un avance significativo en la tecnología de inteligencia artificial con la introducción de las incrustaciones binarias para las Amazon Titan Text Embeddings V2, ahora disponibles en las Amazon Bedrock Knowledge Bases y en Amazon OpenSearch Serverless. Esta innovación promete transformar el desarrollo de aplicaciones de Recuperación y Generación Aumentada (RAG) al permitir un uso más eficiente de la memoria y reducir los costos relacionados.

La actualización de Amazon Titan Text Embeddings V2 ofrece la capacidad de generar incrustaciones semánticas más avanzadas para documentos, párrafos y oraciones. Lo notable de esta mejora es la posibilidad de configurar las dimensiones de incrustación a 1,024, 512 o 256 bits, con la nueva opción de incrustaciones binarias. Esto implica un almacenamiento y procesamiento de datos más eficiente, ya que los datos se guardan en forma de vectores binarios.

En paralelo, Amazon OpenSearch Serverless ha mejorado su servicio al integrar soporte para algoritmos de vecino más cercano, tanto exactos como aproximados. Esta mejora se traduce en una búsqueda más rápida y almacenamiento de vectores más económico, gracias a la utilización de índices binarios.

Los beneficios de estas nuevas capacidades han sido validados mediante el uso del conjunto de datos Massive Text Embedding Benchmark (MTEB), que demostró una mejora de 25 veces en la latencia. Además, mantuvo una precisión de recuperación del 98.5% con reordenamiento y del 97% sin él, cifras casi comparables a las obtenidas con incrustaciones de precisión completa.

Asimismo, las pruebas con el algoritmo HNSW han mostrado una reducción del 50% en las Unidades Computacionales de OpenSearch, lo que resulta en un ahorro de costos significativo. Este nuevo enfoque utiliza distancias de Hamming para maximizar la eficiencia, superando así los métodos tradicionales que requieren mayores recursos computacionales.

Esta funcionalidad ya se encuentra disponible en todas las regiones de AWS donde se ofrecen servicios como Amazon Bedrock y Amazon OpenSearch Serverless. Los usuarios interesados pueden explorar las ventajas de esta tecnología a través de la consola de Amazon Bedrock y unirse a la comunidad de AWS para dar su retroalimentación y discutir sobre el futuro de la inteligencia artificial generativa.

Para obtener más información sobre estas soluciones y sobre cómo implementarlas, se recomienda consultar la documentación oficial y las páginas de productos correspondientes en el sitio web de AWS.

Scroll al inicio