DPG Media, un prominente grupo mediático del Benelux, ha dado un paso crucial hacia la modernización de sus procesos de gestión de datos mediante la incorporación de inteligencia artificial. Frente al desafío de gestionar un vasto y creciente catálogo de contenido audiovisual a través de su plataforma VTM GO, que ofrece más de 500 días de contenido ininterrumpido, la compañía ha optado por integrar tecnologías de Amazon como Bedrock y Transcribe en sus flujos de publicación de video. Esta transformación busca optimizar la generación y administración de metadatos de los contenidos.
Con el aumento en su biblioteca de videos, DPG Media identificó la necesidad de gestionar eficientemente los metadatos que describen su contenido, como la información sobre actores, géneros, resúmenes de episodios y el estado anímico de los programas. La precisión en estos datos no solo mejora las descripciones en guías de televisión, sino que también refina las recomendaciones de contenido y facilita la exploración por parte de los consumidores.
Entre los principales retos del proceso de automatización se encuentran la diversidad de idiomas, la variabilidad en el volumen de contenido y la frecuencia de lanzamientos, factores que complican la estandarización de metadatos. Adicionalmente, la agregación de datos a lo largo de diferentes temporadas de un show presenta un desafío significativo al requerir una consolidación confiable.
Para superar estos desafíos, DPG Media ha adoptado un enfoque centrado en el procesamiento de audio, evitando el análisis de datos de video por su alto costo y tiempo de procesamiento. El sistema diseñado consta de dos pasos: primero, la generación de transcripciones de pistas de audio mediante modelos de reconocimiento de voz; segundo, la extracción y generación de metadatos detallados utilizando modelos de lenguaje extensivo (LLMs).
Inicialmente, DPG Media evaluó diversas estrategias de transcripción, eligiendo eventualmente Amazon Transcribe, una solución gerenciada que proporciona transcripciones de audio precisas, con soporte para actualizaciones automáticas de modelos y funciones de diarización de locutores. La generación de metadatos se ha delegado a Amazon Bedrock, utilizando el modelo Anthropic Claude 3 Sonnet, seleccionado por su rendimiento en lengua holandesa y su capacidad de razonamiento.
La implementación de esta solución ha permitido a DPG Media ahorrar tiempo considerable en la generación de metadatos, optimizando tareas de producción de subtítulos y creación de resúmenes detallados de series completas. Aunque el sistema genera automáticamente los metadatos, se ha decidido mantener una validación humana para garantizar la calidad del resultado final antes de su presentación a los clientes. Este enfoque no solo mejora la experiencia del usuario al proporcionar recomendaciones de contenido más precisas, sino que también refuerza el compromiso de DPG Media de integrar capacidades humanas con tecnologías avanzadas.
Esta iniciativa representa un paso hacia la modernización continua y la mejora de la experiencia del consumidor en una industria en constante evolución. DPG Media sigue explorando nuevas oportunidades para experimentar con modelos adicionales y mejorar sus sistemas a medida que la tecnología avanza, buscando siempre alinear la oferta de contenido con los hábitos de consumo moderno y las innovaciones tecnológicas.