Root Signals y el superordenador LUMI: liderazgo europeo en evaluación fiable de modelos de lenguaje

La startup finlandesa desarrolla Root Judge, una innovadora IA de evaluación de LLMs entrenada con 400 GPUs del superordenador LUMI.

La inteligencia artificial basada en modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) avanza a pasos agigantados, pero con ella también crecen las preocupaciones sobre su fiabilidad y control de calidad. Frente a este reto, la empresa Root Signals, con sede en Helsinki y en Palo Alto (EE. UU.), se ha posicionado como pionera en Europa gracias a una herramienta única: Root Judge, un modelo de evaluación de LLMs entrenado en el superordenador LUMI.

Fundada en 2023, Root Signals se especializa en control automatizado de calidad para aplicaciones de inteligencia artificial, chatbots y agentes conversacionales. Gracias al apoyo de Business Finland y al acceso al poder computacional de LUMI, la joven empresa ha logrado desarrollar una solución de código abierto capaz de detectar errores de alucinación en modelos de lenguaje, mejorar su eficiencia y aportar transparencia a los procesos de evaluación.

Root Judge: un “juez” para otros modelos de IA

El desarrollo de Root Judge representa un hito técnico en el ámbito de la IA. Se trata de un modelo específicamente entrenado para evaluar la fiabilidad de otros LLMs, ofreciendo puntuaciones con justificaciones claras. Para ello, Root Signals utilizó casi 400 unidades GPU de LUMI, procesando millones de tareas de evaluación con datos tanto de código abierto como sintéticos.

«Benchmarkeamos Root Judge frente a modelos líderes como los de OpenAI y Anthropic, y obtuvimos mejores resultados en las tareas de evaluación«, explicó Oguzhan Gencoglu, supervisor del equipo de desarrollo.

Para facilitar el uso de esta potente herramienta, la empresa ha realizado una versión cuantificada del modelo, reduciendo la necesidad de hardware especializado. Así, Root Judge puede ejecutarse en GPUs de consumo común, lo que amplía su accesibilidad y refuerza la posición comercial de Root Signals.

La clave: acceso a LUMI y apoyo institucional

La participación en el programa de computación de Business Finland fue fundamental para que Root Signals pudiera entrenar su modelo en LUMI. “Sabíamos que necesitábamos una capacidad de cómputo enorme, y LUMI era la elección perfecta”, señaló Gencoglu, quien ya había trabajado con otros superordenadores de CSC (Centro de Ciencia de Finlandia).

No obstante, el equipo experimentó ciertos desafíos relacionados con la sincronización entre el calendario de financiación y el tiempo real necesario para los entrenamientos masivos. “Una mayor flexibilidad temporal habría permitido concluir el proyecto con más tranquilidad”, añadió el investigador.

Código abierto como estrategia empresarial

Tras el lanzamiento público de Root Judge, la empresa ha ganado visibilidad y nuevos clientes en sectores variados. El hecho de ofrecer su tecnología como código abierto y de uso comercial gratuito se ha convertido en un pilar estratégico.

«Era esencial mostrar que los clientes pueden confiar en nosotros para externalizar la evaluación de sus LLMs«, explicó Gencoglu. «Además, contribuir a la comunidad de desarrolladores ha reforzado nuestra reputación como empresa tecnológica de referencia».

Nuevos horizontes: modelos de razonamiento

El trabajo de Root Signals con LUMI no se detiene aquí. La empresa ya mira hacia el futuro con un nuevo objetivo: desarrollar un modelo de razonamiento, un paso más allá de la simple evaluación. Esta nueva generación de LLMs no solo deberá puntuar respuestas, sino explicar y razonar como lo haría un ser humano.

“Nadie ha entrenado aún un juez con capacidad de razonamiento. Son modelos más lentos, pero también mucho más sofisticados. Su uso será distinto”, concluye Gencoglu.


La historia de Root Signals es un ejemplo de cómo la colaboración entre tecnología puntera, talento emprendedor y recursos europeos, como LUMI y EuroHPC, puede posicionar a Europa como un actor central en el desarrollo de inteligencias artificiales más fiables y transparentes. Un paso crucial para construir confianza en los sistemas que, cada vez más, forman parte de nuestras vidas.

Fuente: Lumi

Scroll al inicio