Optimización Del Entrenamiento De Redes Neuronales En Grafos Usando GraphStorm v0.4

Por Ángel Carrero

X (Twitter) Facebook Pinterest Email WhatsApp

AWS ha lanzado GraphStorm v0.4, una actualización importante de su marco de aprendizaje automático basado en gráficos, diseñada para mejorar la eficiencia en el manejo de grandes volúmenes de datos en entornos empresariales. La nueva versión, ahora disponible, incluye la integración con DGL-GraphBolt, un marco innovador que busca optimizar tanto el entrenamiento como la inferencia de redes neuronales gráficas (GNN). Con estas mejoras, GraphStorm promete acelerar la inferencia de datos en un 360% y reducir el tiempo de entrenamiento por época en un 140%.

GraphStorm, conocida por su enfoque de bajo código, permite a los profesionales del aprendizaje automático construir, entrenar y desplegar modelos sobre gran cantidad de datos en formato gráfico. La actualización v0.4 aborda problemas comunes en los modelos de aprendizaje de gráficos, como limitaciones de memoria y la necesidad de un muestreo eficiente y veloz. Esta versión ofrece un sistema de almacenamiento distribuido y compacto que puede manejar gráficos de varios terabytes, facilitando así el trabajo con conjuntos de datos masivos.

GraphBolt, una de las principales incorporaciones a GraphStorm, proporciona una representación de gráficos más compacta y realiza un muestreo mediante tuberías, lo cual disminuye los requerimientos de memoria y acelera significativamente los procesos de entrenamiento e inferencia. En pruebas con conjuntos de datos a gran escala, se ha demostrado una reducción notable en el tiempo de entrenamiento, permitiendo a investigadores y desarrolladores obtener resultados de manera más rápida y eficiente.

Además, GraphStorm v0.4 se integra perfectamente con Amazon SageMaker, permitiendo a los usuarios transferir de manera sencilla sus pruebas locales a entrenamientos a gran escala. Este proceso gestionado optimiza los flujos de trabajo y puede traducirse en una reducción de los gastos operativos. Gracias a SageMaker, los usuarios pueden desarrollar y probar modelos en instancias de EC2 y luego escalar sus operaciones en el entorno distribuido de SageMaker.

AWS hace un llamado a los profesionales del campo del aprendizaje automático para que exploren las nuevas funcionalidades de GraphStorm, enfatizando que la plataforma simplifica los procesos de modelado. Esto permite a los usuarios concentrarse más en la investigación y menos en las complejidades de la infraestructura tecnológica.