El equipo de Investigación Fundamental en Inteligencia Artificial (FAIR) de Meta está centrado en el desarrollo de una inteligencia de máquina avanzada que imite el razonamiento humano para llevar a cabo tareas cognitivamente exigentes, como la traducción. La iniciativa no solo busca mejorar sus productos, sino también generar innovaciones al servicio de todos. Un pilar fundamental de este esfuerzo es la colaboración con la UNESCO para ampliar el soporte de idiomas desatendidos en los modelos de inteligencia artificial, promoviendo así la diversidad lingüística y la inclusividad en el ámbito digital.
Meta ha anunciado recientemente una serie de programas y modelos que apoyan este objetivo, brindando oportunidades para que colaboradores contribuyan a tecnologías de traducción que incorporen una amplia gama de idiomas y dialectos globales. En este contexto, han lanzado el Programa de Asociaciones en Tecnología del Lenguaje, el cual busca socios para mejorar y ampliar las tecnologías de lenguaje de código abierto de Meta, con un énfasis especial en idiomas poco atendidos. Esta iniciativa apoya el trabajo de la UNESCO como parte del Decenio Internacional de las Lenguas Indígenas.
El programa busca colaboradores que puedan aportar más de 10 horas de grabaciones de voz con transcripciones, grandes cantidades de texto escrito y conjuntos de oraciones traducidas. Los socios trabajarán con los equipos de Meta para integrar estos idiomas en modelos de reconocimiento de voz y traducción automática, que al ser publicados estarán disponibles libremente para la comunidad. Las asociaciones también brindarán acceso a talleres técnicos dirigidos por equipos de investigación, con la finalidad de enseñar cómo aprovechar los modelos de código abierto de Meta. Una de las primeras organizaciones en unirse a esta iniciativa es el Gobierno de Nunavut, Canadá, que colaborará compartiendo datos en las lenguas inuit Inuktitut e Inuinnaqtun.
Además del programa de asociación, Meta está lanzando un punto de referencia de traducción automática de código abierto. Compuesto por oraciones elaboradas cuidadosamente por expertos lingüísticos, este punto de referencia tiene como objetivo mostrar la diversidad del lenguaje humano. Se invita a la comunidad a acceder y contribuir a este benchmark, para así construir un estándar de traducción automática multilingüe sin precedentes.
Estos anuncios forman parte del compromiso a largo plazo de Meta de apoyar los idiomas desatendidos. En 2022, lanzaron el proyecto No Language Left Behind (NLLB), un revolucionario motor de traducción automática de código abierto que sirvió como el primer modelo de traducción automática neuronal para muchos idiomas. Esta herramienta sentó las bases para futuras investigaciones y desarrollos. En colaboración con UNESCO y Hugging Face, Meta lanzó un traductor basado en NLLB durante la semana de la Asamblea General de las Naciones Unidas.
Para fomentar el empoderamiento digital, Meta introdujo el proyecto Massively Multilingual Speech (MMS), que escala la transcripción de audio a más de 1,100 idiomas. Desde entonces, han mejorado sus capacidades, incluyendo el reconocimiento de voz sin entrenamiento previo en 2024, lo que permite transcribir audio en idiomas nunca antes vistos por el modelo. Con todo esto, Meta reafirma su objetivo de crear sistemas inteligentes capaces de comprender y responder a las complejas necesidades humanas, independientemente del idioma o la cultura.
Fuente: Zona de prensa de Meta.