Implementación de recuperación ante desastres entre regiones para Amazon SageMaker usando instancias personalizadas de Amazon EFS

Elena Digital López

Amazon SageMaker, la plataforma líder en aprendizaje automático de Amazon Web Services (AWS), ha anunciado una serie de innovaciones clave para el año 2023. Estas mejoras están orientadas a optimizar tanto las funciones colaborativas como las capacidades de recuperación ante desastres, con el objetivo de mejorar el manejo y respaldo de datos críticos en proyectos de machine learning.

Entre las actualizaciones más destacadas se encuentra el lanzamiento de SageMaker Studio, que ahora incluye aplicaciones como JupyterLab y Code Editor. A diferencia de versiones anteriores, cada aplicación cuenta con su propio volumen de almacenamiento en Amazon Elastic Block Store (EBS), lo que permite una gestión más eficiente y flexible de los recursos. Asimismo, se ha integrado la posibilidad de utilizar instancias personalizadas del Amazon Elastic File System (EFS), lo que facilita la manipulación de archivos en entornos personalizados.

SageMaker ha reforzado sus estrategias de recuperación ante desastres para usuarios que ejecutan tareas críticas. La capacidad de replicación entre regiones de Amazon EFS ahora permite asegurar una operatividad continua incluso en el caso de fallos regionales. Este enfoque garantiza que los datos y perfiles de usuario de los dominios SageMaker se mantengan seguros y disponibles sin interrumpir el trabajo de ingenieros y científicos de datos.

El nuevo sistema redundante de recuperación opera en dos modos: activo-pasivo y activo-activo. En el modo activo-pasivo, la infraestructura se establece en una región principal y los datos se replican casi en tiempo real a una región secundaria que solo se activa si la primera presenta fallos. En el modo activo-activo, el sistema opera en múltiples regiones a la vez, con sincronización de datos gracias a AWS Step Functions, que pueden ser invocadas bajo demanda, programadas o activadas por eventos.

Para implementar esta solución, SageMaker utiliza un conjunto de herramientas de AWS, incluyendo Amazon EFS para copias de seguridad, AWS Step Functions para automatizar procesos de recuperación, y el AWS Cloud Development Kit (CDK) para configurar la infraestructura necesaria. Este enfoque garantiza que todas las instancias y perfiles de usuario se repliquen y restauren con precisión en caso de interrupciones.

La mejora en la experiencia de SageMaker promete incrementar la seguridad y accesibilidad de los datos, facilitando una recuperación rápida y fluida. Este avance resulta crucial para empresas que dependen de la disponibilidad constante de sus aplicaciones de inteligencia artificial y machine learning, ofreciendo una solución robusta frente a desastres naturales y fallos técnicos. La inversión de Amazon en estrategias de continuidad de negocio refuerza su compromiso con proporcionar un entorno confiable y seguro para la innovación tecnológica basada en datos.

Scroll al inicio