Impulsando los Idiomas del Reino Unido con NVIDIA Nemotron

En un esfuerzo por revitalizar y empoderar a las lenguas celtas del Reino Unido, un nuevo proyecto de inteligencia artificial (IA) está marcando un hito al proporcionar servicios públicos accesibles en galés. Esta iniciativa, respaldada por la AI soberana del Reino Unido y basada en la tecnología NVIDIA Nemotron, busca ofrecer capacidades de razonamiento en inglés y galés, beneficiando a aproximadamente 850,000 hablantes en Gales hoy en día.

La aplicación de la IA en galés permitirá mejorar la calidad de servicios en sectores clave como la sanidad, la educación y los recursos legales. «Quiero que cada rincón del Reino Unido aproveche los beneficios de la inteligencia artificial. Al permitir que la IA razone en galés, aseguramos que los servicios públicos sean accesibles para todos en su lengua materna», comentó el Primer Ministro del Reino Unido, Keir Starmer. Destacó la importancia de esta tecnología avanzada, entrenada en el superordenador de inteligencia artificial más potente del país en Bristol, para preservar el patrimonio cultural y abrir oportunidades a nivel nacional.

El proyecto, conocido como UK-LLM y anteriormente llamado BritLLM, ha sido impulsado desde 2023 por el University College London en colaboración con la Universidad de Bangor y NVIDIA. Este avance está alineado con los esfuerzos del gobierno galés para aumentar el uso del idioma, aspirando a alcanzar un millón de hablantes para 2050, bajo la iniciativa Cymraeg 2050.

El proveedor de nube de IA Nscale facilitará el acceso al modelo a través de su interfaz API, permitiendo que desarrolladores puedan integrar la tecnología. «El objetivo es asegurar que el galés siga siendo un idioma vivo y dinámico que evoluciona con los tiempos», expresó Gruffudd Prys, responsable de la Unidad de Tecnologías del Lenguaje en Canolfan Bedwyr de la Universidad de Bangor. Además, destacó el potencial de la IA para facilitar el aprendizaje del galés como segunda lengua y apoyar a hablantes nativos a mejorar sus habilidades.

Este nuevo modelo no solo tiene el potencial de aumentar la accesibilidad de recursos en galés, sino que también podría permitir a instituciones públicas y empresas en Gales ofrecer servicios y contenidos bilingües. Esto incluye traductores de contenido y chatbots, beneficiando a sectores como la salud, la educación, los medios de comunicación, el comercio minorista y la restauración.

El equipo detrás de UK-LLM planea extender la metodología empleada en el modelo galés para desarrollar modelos de IA para otras lenguas del Reino Unido, como el córnico, el irlandés, el escocés y el gaélico escocés. Incluso colaborarán internacionalmente para implementar modelos semejantes en idiomas de África y el sureste asiático.

Pontus Stenetorp, profesor de procesamiento de lenguaje natural en el University College London, explicó que este proyecto con NVIDIA y la Universidad de Bangor ha permitido la creación de nuevos datos de entrenamiento y el desarrollo del mejor modelo de lenguaje para galés hasta la fecha, con la intención de aplicar estos conocimientos a otras lenguas minoritarias.

Utilizando la infraestructura AI soberana y tecnologías como NVIDIA NIM y Nemotron, el equipo ha construido un modelo de galés basado en datos traducidos conjuntamente con las herramientas avanzadas y supercomputadoras como Isambard-AI. El esfuerzo ha estado respaldado por una inversión gubernamental significativa, buscando acelerar los procesos de traducción y entrenamiento de modelos.

Este modelo estará disponible para su uso en sectores públicos y privados, apoyando el desarrollo de nuevas aplicaciones y el entrenamiento de futuros modelos. Gruffudd Prys subrayó la importancia de hacer que estas capacidades de IA sean accesibles para todos, resaltando la diferencia entre simplemente tener disponible esta tecnología y que realmente se utilice ampliamente en la comunidad.
Fuente: Zona de blogs y prensa de Nvidia

Scroll al inicio