De Terabytes a Soluciones Llave en Mano: Modelos Climáticos con IA Se Popularizan

En la carrera por entender el cambio climático de nuestro planeta, la velocidad y la precisión son fundamentales. Sin embargo, los simuladores climáticos más utilizados hoy en día enfrentan dificultades: a menudo no logran capturar procesos críticos a pequeña escala, como tormentas eléctricas o nubes tropicales imponentes, debido a limitaciones computacionales.

Para abordar estas características, los científicos emplean simulaciones de ultra alta resolución conocidas como modelos de resolución de nubes (CRM, por sus siglas en inglés). Estas simulaciones rastrean cómo se forman y evolucionan las nubes, pero son tan costosas que ejecutarlas durante una década para pronósticos climáticos globales es prácticamente inviable.

Surge aquí una propuesta innovadora: ¿y si pudiéramos destilar la sabiduría de estas simulaciones detalladas en un modelo de aprendizaje automático que funcione entre diez y cien veces más rápido sin perder fidelidad?

Esa es la promesa de ClimSim-Online, un marco reproducible para desarrollar y desplegar modelos climáticos híbridos que integran física y aprendizaje automático a gran escala. Este marco fue producido por NVIDIA Earth 2 y un consorcio de modeladores climáticos internacionales del gobierno y la academia. Fue iniciado y apoyado por un centro de ciencia y tecnología de la Universidad de Columbia, financiado por la Fundación Nacional de Ciencia, que explora el futuro de la tecnología de simulación climática potenciada por la IA.

ClimSim-Online se basa en el galardonado conjunto de datos ClimSim, presentado en NeurIPS 2023. Este conjunto de datos fue creado utilizando el Modelo del Sistema Terrestre Exaescala de Energía, un simulador climático de próxima generación que incrusta miles de CRMs localizados dentro de cada columna atmosférica de un modelo climático de malla gruesa. Aunque reduce la cantidad de suposiciones que deben hacerse sobre la física a pequeña escala, su gran costo computacional ha impedido su uso en proyecciones internacionales. Sin embargo, externalizar la física anidada al aprendizaje automático podría cambiar eso.

El modelo climático opera a una resolución horizontal de aproximadamente 1.5 grados, mientras que cada CRM incrustado funciona a 2 km de resolución, simulando explícitamente nubes y convección en escalas mucho más finas. E3SM-MMF, en un lapso simulado de 10 años, produjo 5.7 mil millones de muestras que describen cómo los procesos físicos a pequeña escala alteran el estado atmosférico a gran escala.

Este conjunto de datos masivo es la base para entrenar modelos de aprendizaje automático que imitan la física subestima y pueden reemplazar el caro CRM incrustado. Ya ha dado pie a una competencia global en Kaggle, atrayendo a más de 460 equipos desarrolladores de soluciones de aprendizaje automático en este conjunto de datos climático de alta fidelidad.

El reto: estos modelos no solo deben ser precisos fuera de línea, sino también estables cuando se integran en un simulador climático en tiempo real. Controlar el comportamiento de las simulaciones híbridas es un desafío destacado, especialmente cuando no se puede hacer diferenciable el modelo físico anfitrión.

ClimSim-Online, desarrollado por NVIDIA, facilita el modelado climático híbrido para la comunidad de aprendizaje automático. Se ha construido un flujo de trabajo reproducible y encapsulado para sortear obstáculos típicos de ejecución, permitiendo a los usuarios integrar su modelo entrenado en el simulador climático E3SM basado en Fortran y lanzar simulaciones híbridas, ya sea en estaciones de trabajo locales, clústeres de computación de alto rendimiento o VMs en la nube.

Con ClimSim-Online, la emulación climática se convierte en un proceso listo para usar. Todo el sistema se ejecuta en un contenedor precargado con las bibliotecas necesarias, permitiendo simular fácilmente. Se proporcionan instrucciones para la configuración en el repositorio de ClimSim-Online en GitHub.

En estudios recientes, se han logrado simulaciones híbridas estables de varios años utilizando una red neuronal U-Net entrenada en el conjunto de datos ClimSim. Estos resultados establecen un nuevo punto de referencia para la habilidad en línea dentro de ClimSim-Online, demostrando el potencial del aprendizaje automático informado por la física.

Con esta herramienta, ClimSim-Online hace más accesible la colaboración en IA-clima, facilitando la capacitación, prueba y evaluación de modelos de aprendizaje automático en el contexto de un simulador climático a escala completa, el verdadero examen de preparación para el mundo real. La frontera de la simulación climática híbrida de física-ML aguarda nuevos descubrimientos.
Fuente: Zona de blogs y prensa de Nvidia

Scroll al inicio