En la actualidad, la revolución digital sigue transformando el panorama de diversas industrias, y el ámbito financiero no es la excepción. Un innovador método conocido como Aprendizaje Generativo Tabular (GTL) ha emergido recientemente como una solución prometedora para el análisis de datos tabulares con la asistencia de modelos de lenguaje grandes (LLMs). Este enfoque pretende revolucionar la forma en la que se generan análisis precisos de datos estructurados, empleando terminología específica de la industria.
GTL destaca por simplificar procesos complejos al ofrecer resultados comparables al ajuste fino de modelos de lenguaje sin la habitual dificultad de implementación. Utilizando modelos de lenguaje preentrenados, esta técnica analiza datos tabulares a través de ejemplos de contexto integrados en las indicaciones. Esto facilita una mejora tanto en la comprensión como en la relevancia del análisis generado.
Basado en un documento técnico titulado «From Supervised to Generative: A Novel Paradigm for Tabular Deep Learning with Large Language Models», el método GTL ha sido implementado usando JupyterLabs gestionados en Amazon SageMaker. Los modelos de lenguaje, como los Meta Llama activos en Amazon SageMaker y Amazon Bedrock, son cruciales en este proceso. Adicionalmente, cuadernos de referencia disponibles en GitHub brindan soporte para usuarios que buscan implementar estos modelos.
Para adoptar esta estratégica solución, es imperativo acceder a modelos LLM como los de Meta, configurar adecuadamente Amazon SageMaker y poseer conocimientos sólidos en ingeniería de indicaciones generativas, así como en evaluación precisa de resultados.
El sector financiero se presenta como uno de los mayores beneficiarios de GTL, debido a la estructura tabular de muchos de sus datos, presentes en archivos PDF o en bases de datos estructuradas. Un ejemplo concreto es el uso de datasets con detalles sobre fondos cotizados en bolsa (ETFs) para experimentar con esta solución.
Un elemento resaltante de GTL es la capacidad de formular preguntas sectoriales, proporcionando respuestas adecuadas a través del uso de lenguajes específicos. Por ejemplo, brindar información sobre los ETFs más seguros con altos rendimientos de dividendos y baja volatilidad, basándose en los datos de rendimiento y volatilidad de cinco, tres y un año.
Propone GTL un camino intermedio antes de efectuar el costoso procedimiento de adecuación de modelos, ofreciendo así una solución más simple y económica. Esto permite a las organizaciones producir resultados específicos para su industria mediante la creación de instrucciones GTL que detallan características y etiquetas pertinentes.
Estas características son especialmente valiosas para desarrollar aplicaciones interactivas que faciliten a los usuarios del negocio, sin experiencia técnica, obtener análisis significativos mediante preguntas en lenguaje natural.
En síntesis, a pesar del avance continuo de los modelos de lenguaje grandes, el uso de técnicas como GTL asegura un valioso espacio para la optimización del análisis de datos estructurados. Esto permite a las organizaciones satisfacer sus necesidades de análisis sin la necesidad inmediata de un complejo ajuste fino de modelos.