La transformación digital a través de la inteligencia artificial (IA) está redefiniendo el futuro de varios sectores, y las telecomunicaciones no son una excepción. Fastweb, un importante operador de telecomunicaciones en Italia, ha apostado por la IA desde 2019, invirtiendo en tecnología para desarrollar un modelo de lenguaje extenso entrenado con datos en italiano, con el objetivo de ofrecer esta capacidad a otros.
El proceso de entrenamiento de un modelo de lenguaje extenso (LLM) requiere enormes recursos computacionales, por lo que Fastweb decidió utilizar los servicios de IA generativa y aprendizaje automático de Amazon Web Services (AWS), como Amazon SageMaker HyperPod. Esta herramienta permite gestionar clusters de computación a gran escala, utilizando tecnologías avanzadas como AWS Trainium y GPU de NVIDIA, asegurando flexibilidad en la implantación de clusters ágiles que optimizan recursos y costos.
Uno de los mayores desafíos fue la falta de conjuntos de datos de alta calidad en italiano. Para superarlo, Fastweb creó una base de datos extensa a partir de fuentes públicas y datos licenciados de editoriales y medios, logrando adaptar el modelo Mistral 7B mediante un ajuste fino. Este modelo, reconocido en el mercado, ahora puede realizar tareas como resumir, responder preguntas y generar contenido creativo en italiano, reflejando un profundo entendimiento de la cultura del país.
El ajuste fino se realizó en AWS, donde la eficiencia en la preparación de datos permitió obtener resultados tempranos cruciales para el desarrollo de modelos en italiano. Mediante la traducción de datasets y la generación de datos sintéticos, Fastweb enriqueció su recurso de datos, asegurando calidad y diversidad, a pesar de las restricciones.
El entrenamiento del modelo Mistral 7B requirió más de 156 GB de memoria, lo que llevó a Fastweb a emplear técnicas de entrenamiento distribuido para optimizar el uso de múltiples GPUs y reducir el tiempo de procesamiento. Como resultado, el modelo de Fastweb mostró una mejora del 20% en precisión en tareas en italiano, destacando en respuesta a preguntas y razonamiento básico.
Mirando hacia el futuro, Fastweb planea desplegar nuevos modelos en Amazon Bedrock para construir y escalar soluciones de IA generativa. Este enfoque refuerza su compromiso con la tecnología y la transformación digital, posicionando a la empresa como líder en la adopción de soluciones innovadoras basadas en IA. La estrategia no solo mejorará su oferta de servicios, sino que también impulsará la adopción de estas tecnologías en múltiples industrias, fomentando un entorno empresarial más avanzado y digitalizado.