Amazon ha anunciado una importante actualización de su plataforma Amazon SageMaker, diseñada para facilitar la creación, entrenamiento y despliegue de modelos de aprendizaje automático (ML) de manera escalable y personalizada. Este avance es especialmente relevante para sectores que demandan soluciones a medida, como el análisis geoespacial, investigaciones en bioinformática o el emergente campo de modelos de aprendizaje automático cuántico.
Con la nueva funcionalidad, SageMaker ahora permite a los desarrolladores ampliar sus capacidades mediante el uso de contenedores personalizados. Esta mejora posibilita la inclusión de sus propios modelos y dependencias de software que no están disponibles en las imágenes de contenedor administradas por SageMaker. En una reciente guía se ilustra este proceso adoptando el modelo Prithvi de la NASA, desarrollado en cooperación con IBM. Este modelo emplea arquitectura de transformadores de visión temporal y ha sido entrenado con datos de los satélites Landsat y Sentinel 2.
El modelo Prithvi está diseñado para ser ajustable a múltiples tareas, incluyendo la detección de cicatrices por incendios, la clasificación de cultivos y la cartografía de inundaciones, utilizando la biblioteca mmsegmentation. Implementar tales modelos personalizados en SageMaker involucra un proceso que requiere la creación de definiciones de modelo personalizadas, la preparación de artefactos y archivos de inferencia estructurados correctamente, y su posterior carga en Amazon S3.
Una característica destacada de estas novedades es la capacidad de integrar librerías y paquetes adicionales que no están presentes en las imágenes de contenedor estándar. Esto ofrece a investigadores y desarrolladores un control completo sobre el entorno y las dependencias del modelo, ampliando significativamente su capacidad de personalización.
Para desplegar un modelo en SageMaker, los usuarios deben construir una imagen de contenedor que incluya el modelo y sus dependencias, además de crear un archivo de especificación de compilación. A continuación, deben seguir una serie de pasos a través de la interfaz de Amazon SageMaker Studio. Una vez establecida la infraestructura, es posible probar el endpoint de inferencia mediante la creación de casos de prueba que envíen imágenes para procesamiento y reciban predicciones en tiempo real.
Este avance reafirma el compromiso de Amazon con la innovación en el ámbito del aprendizaje automático, brindando a desarrolladores e investigadores herramientas poderosas y personalizables que facilitan la implementación de soluciones complejas. Con el continuo crecimiento del uso de la inteligencia artificial y el análisis de datos, SageMaker se perfila como una plataforma esencial para el desarrollo y despliegue de modelos de machine learning adaptados a necesidades específicas.