Acelera Tu Ciclo de Vida de ML con el Nuevo y Mejorado SDK de Python de Amazon SageMaker – Parte 2: ModelBuilder

Elena Digital López

En noviembre de 2023, Amazon SageMaker introdujo una serie de mejoras en su clase ModelBuilder dentro del SDK Python, cuyo propósito es optimizar el proceso de implementación de modelos de aprendizaje automático (ML) en los endpoints de SageMaker. Estas innovaciones están diseñadas para facilitar la transición del entrenamiento de modelos a la inferencia, mediante la oferta de una interfaz unificada y el soporte para diversas configuraciones de despliegue.

Una de las características más destacadas es la capacidad de integrar ModelBuilder directamente con las interfaces de entrenamiento de SageMaker. Esto asegura que el sistema identifica automáticamente la ruta hacia el artefacto del modelo más reciente, lo que simplifica significativamente el flujo de trabajo desde el entrenamiento hasta el despliegue del modelo. Además, se ha mejorado la interfaz de inferencia unificada, eliminando la necesidad de diferentes flujos de trabajo para las inferencias en tiempo real, por lotes, sin servidor y asincrónicas.

Otra mejora relevante es el soporte para pruebas en modo local, que permite a los usuarios depurar y probar sus scripts de procesamiento e inferencia a mayor velocidad. Además, SageMaker ha añadido una función que ofrece la última imagen de contenedor para un determinado marco, evitando así la necesidad de actualizar el código con cada nueva versión.

La clase ModelBuilder también permite la personalización de los pasos de preprocesamiento y postprocesamiento de inferencias. Esto es especialmente útil para flujos de trabajo complejos que requieren ajustes antes y después de que los datos sean enviados al modelo para predicciones. Además, facilita la integración de scripts para filtrar contenido y eliminar información personal identificable (PII), encapsulando todos estos pasos esenciales dentro de la configuración del modelo para una gestión y despliegue más efectivos.

Un aspecto crucial incluido es el soporte para la evaluación del rendimiento a través de una nueva API de benchmarking. Esta funcionalidad permite a los usuarios evaluar diferentes opciones de despliegue mediante métricas clave como la latencia y el coste, optimizando así los modelos para un desempeño óptimo antes de su implementación en producción.

Con estas mejoras, Amazon SageMaker se propone reducir la complejidad y la carga operativa para los científicos de datos, proporcionando una interfaz sencilla e intuitiva para entrenar y desplegar modelos de manera efectiva. Al mismo tiempo, estas innovaciones posicionan la plataforma para abordar una amplia gama de casos de uso en el floreciente ámbito de la inteligencia artificial generativa.

Las mejoras en ModelBuilder, sumadas a las capacidades del ModelTrainer presentadas previamente, representan un avance significativo para facilitar el trabajo de los científicos de datos, permitiéndoles concentrarse en crear modelos más sofisticados y eficientes. SageMaker invita a sus usuarios a explorar estas características del SDK, aprovechando la documentación y los ejemplos prácticos disponibles en la plataforma.

Scroll al inicio