Desbloquea la Escalabilidad Global de la Inferencia de IA con la Nueva Inferencia Cruzada Regional en Amazon Bedrock con Claude Sonnet 4.5 de Anthropic

Elena Digital López

Las organizaciones están cada vez más integrando capacidades de inteligencia artificial generativa en sus aplicaciones, con el objetivo de mejorar la experiencia del cliente, optimizar operaciones y fomentar la innovación. No obstante, el crecimiento constante de las cargas de trabajo de IA genera nuevos desafíos en cuanto a rendimiento, fiabilidad y disponibilidad de estas aplicaciones impulsadas por inteligencia artificial. Para mantener la coherencia, los clientes buscan ampliar sus cargas de trabajo de inferencia de IA a través de múltiples regiones de AWS.

En respuesta a esta demanda, Amazon Bedrock ha introducido la inferencia cruzada entre regiones (CRIS, por sus siglas en inglés). Esta nueva función redirige automáticamente las solicitudes de inferencia a través de múltiples regiones, permitiendo que las aplicaciones manejen picos de tráfico con facilidad. La CRIS funciona mediante la creación de «perfiles de inferencia» que establecen un modelo base y las regiones destinatarias para las solicitudes.

Recientemente, se ha lanzado la inferencia cruzada global con Claude Sonnet 4.5 de Anthropic en Amazon Bedrock. Esta funcionalidad permite a los usuarios elegir entre un perfil de inferencia específico de una geografía o un perfil global, otorgando una mayor flexibilidad. Amazon Bedrock selecciona automáticamente la región más adecuada para procesar la solicitud de inferencia, optimizando el uso de recursos y permitiendo un mejor rendimiento del modelo, particularmente durante picos de uso no previstos.

La inferencia cruzada global ayuda a las empresas a gestionar imprevistos en el tráfico utilizando recursos computacionales de diferentes regiones. Emplea un mecanismo inteligente que evalúa la disponibilidad, capacidad y latencia para redirigir las solicitudes adecuadamente. Además, Amazon CloudWatch y AWS CloudTrail continúan registrando actividades únicamente en la región de origen, lo que simplifica la gestión y monitoreo, asegurando que la seguridad de los datos quede intacta gracias al cifrado en la red segura de AWS.

Para empezar a utilizar esta nueva funcionalidad con Claude Sonnet 4.5, los desarrolladores deben especificar el ID del perfil de inferencia global y configurar los permisos necesarios mediante AWS Identity and Access Management. La implementación de CRIS no solo mejora el rendimiento y la fiabilidad, sino que también ofrece ahorros de costos, con una reducción aproximada del 10% en precios de tokens de entrada y salida comparado con la inferencia geográfica tradicional.

La evolución de la inferencia cruzada global permite a las empresas optimizar sus aplicaciones de IA, gestionando cargas de trabajo intensas y mejorando la recuperación ante desastres de manera innovadora y eficiente.

Scroll al inicio