En el panorama actual de la industria del contenido digital, la capacidad de ofrecer accesibilidad multilingüe se ha convertido en un elemento clave para alcanzar un éxito global y mantener un alto nivel de compromiso del usuario. 123RF, un destacado proveedor de activos digitales libres de regalías, ha hecho un avance significativo en esta dirección. En 2023, la empresa adoptó el servicio Amazon OpenSearch para mejorar la detección de imágenes mediante un sistema de búsqueda semántica basado en vectores. Este movimiento estratégico allanó el camino para la incorporación de Amazon Bedrock y del modelo Claude 3 Haiku de Anthropic, aumentando considerablemente la eficiencia en la moderación de contenido y acelerando el proceso de traducción de su vasto acervo digital.
A pesar de estos avances, 123RF se enfrentó a desafíos significativos relacionados con la traducción y el descubrimiento de contenido en 15 nuevos idiomas. La prevalencia de títulos y palabras clave solo en inglés limitaba el acceso completo a su extensa colección de activos, que incluye millones de imágenes, archivos de audio y gráficos en movimiento. Aunque el uso de Google Translate para traducciones continuas resultaba demasiado costoso, otros modelos como Claude Sonnet de Anthropic o GPT-4 de OpenAI tampoco eran económicamente viables. Por otro lado, aunque GPT-3.5 cumplía con las limitaciones presupuestarias, carecía de la consistencia necesaria en la calidad de sus traducciones. Esto impulsó a 123RF a explorar alternativas más sostenibles y fiables.
La solución surgió a través de las innovaciones tecnológicas ofrecidas por Amazon Bedrock y Claude 3 Haiku, apoyadas por un almacenamiento vectorial. Estos avances permitieron una traducción eficiente de metadatos, minimizando significativamente los costos y potenciando la capacidad de descubrimiento global de contenido de la empresa.
El principal desafío de 123RF era encontrar un equilibrio entre calidad y costo en el contexto de traducciones masivas. Dado el peso de los títulos y descripciones aportados por usuarios en sus productos digitales, era imprescindible traducir estos metadatos a varios idiomas para maximizar el potencial de la biblioteca. Sin embargo, este proceso implicaba superar obstáculos técnicos y financieros considerables.
Uno de los mayores retos técnicos fue la resolución de entidades nombradas (NER), que implicaba el correcto manejo de nombres propios, marcas y referencias culturales específicas a través de distintos idiomas. Por ejemplo, una foto de la Torre Eiffel debe mantener su denominación original en todos los idiomas, evitando una traducción literal.
Tras explorar varias opciones de modelos de lenguaje, 123RF constató que los modelos más sofisticados, como GPT-4 de OpenAI y Claude Sonnet de Anthropic, ofrecían alta calidad pero eran económicamente insostenibles. Alternativamente, modelos más modestos como GPT-3.5 eran asequibles pero presentaban traducciones inconsistentes. Amazon Bedrock proporcionó la solución ideal, equilibrando calidad y costo.
El equipo también invirtió en técnicas avanzadas de ingeniería de prompts para optimizar el rendimiento del modelo de lenguaje, integrándolas con almacenamiento vectorial para mejorar aún más los resultados. Gracias a estos esfuerzos, 123RF logró reducir sus costos de traducción en un 95%, mejorando simultáneamente la calidad de las traducciones y facilitando la expansión a nuevos mercados lingüísticos.
De cara al futuro, 123RF planea ampliar su cobertura idiomática más allá de los 15 idiomas iniciales y buscar mayores integraciones de IA generativa en sus procesos, fortaleciendo la moderación de contenidos y personalizando las recomendaciones para sus usuarios. Con estas iniciativas, 123RF se posiciona como un referente de cómo las empresas pueden usar la inteligencia artificial para superar barreras lingüísticas y globalizar su contenido digital de manera exitosa.