JetBrains libera Mellum como código abierto: un modelo de IA especializado en programación ya disponible en Hugging Face

El nuevo modelo de lenguaje de JetBrains se enfoca en la completación de código, con soporte multilenguaje y una apuesta clara por la especialización y la eficiencia

JetBrains, la reconocida compañía detrás de populares entornos de desarrollo como IntelliJ IDEA, PyCharm o WebStorm, ha dado un paso relevante en el mundo de la inteligencia artificial con la liberación de Mellum, su modelo de lenguaje (LLM, por sus siglas en inglés) diseñado específicamente para tareas de programación. A partir del 30 de abril, Mellum está disponible en la plataforma Hugging Face bajo una licencia de código abierto.

Especialización en lugar de generalidad: el modelo focal

A diferencia de los modelos de propósito general como GPT o Gemini, Mellum no pretende saberlo todo. Su objetivo es claro: destacar en tareas relacionadas con el código. Este enfoque se define como el de un modelo focal, una tipología que prioriza la profundidad en una única área de aplicación en lugar de la amplitud.

JetBrains explica que esta estrategia responde a una filosofía conocida en el ámbito de las habilidades profesionales como el perfil en “T”: un conocimiento general básico en múltiples áreas, pero una gran especialización en un solo dominio. Mellum encarna ese modelo, centrándose por completo en tareas como la autocompletación, predicción de cambios (diff prediction) y análisis de código.

¿Por qué abrir el modelo?

Según el comunicado oficial de la compañía, la decisión de liberar Mellum como proyecto de código abierto responde a tres pilares: transparencia, colaboración e impulso al progreso colectivo. JetBrains considera que el software libre ha sido motor de innovación durante décadas —con ejemplos como Linux, Git o Docker— y que los modelos de IA no deberían ser la excepción.

Además, Mellum no es un simple ajuste de un modelo ya existente. Se ha entrenado desde cero con el objetivo de potenciar la completación de código en los IDEs de la compañía, lo que lo convierte en una herramienta ideal para investigadores, educadores y equipos técnicos que quieran entender cómo funciona un modelo construido específicamente para programación.

Rendimiento y eficiencia técnica

Mellum es un modelo de 4.000 millones de parámetros, multilingüe, y orientado a tareas de código en lenguajes como Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust y Ruby. JetBrains ha comparado su rendimiento con modelos más grandes como CodeLlama y DeepSeek-Coder.

Según los datos ofrecidos:

ModeloHumanEval (single-line)RepoBench (multi-line)SAFIM (avg)
Mellum-4B66,2 %38,1 %28,2 %
InCoder-6B69,0 %33,8 %
CodeLlama-7B83,0 %45,0 %34,1 %
CodeLlama-13B85,6 %52,8 %36,2 %
DeepSeek-Coder-6.7B80,7 %63,4 %

Aunque los modelos más grandes superan a Mellum en precisión, la compañía insiste en que su modelo ofrece un equilibrio ideal entre rendimiento, eficiencia energética y accesibilidad.

Ventajas del enfoque focal

JetBrains destaca varias ventajas de optar por modelos focales como Mellum:

  • Precisión en tareas específicas de programación.
  • Costes reducidos de entrenamiento y despliegue.
  • Menor huella de carbono.
  • Mayor accesibilidad para investigadores y pequeñas organizaciones.

Este enfoque es también una respuesta a las limitaciones prácticas de los modelos generalistas, que requieren enormes recursos computacionales y no siempre resultan óptimos para tareas especializadas.

¿A quién está dirigido Mellum?

JetBrains reconoce que Mellum no está pensado para el usuario promedio, sino para investigadores, desarrolladores de IA y educadores. Su publicación en Hugging Face ofrece una base para experimentar, afinar o estudiar la arquitectura de modelos centrados en código, y no como una solución lista para usar por cualquier programador.

Una familia en construcción

Mellum no será un modelo único. JetBrains ha confirmado que este es solo el primero de una futura familia de modelos focales que abordarán tareas específicas del desarrollo de software, como la predicción de cambios o la explicación de código.

Ya disponible en Hugging Face

El modelo Mellum-4B-base está ya accesible en huggingface.co/JetBrains. JetBrains invita a la comunidad de IA y desarrollo a contribuir, experimentar y colaborar en este proyecto, con la esperanza de que sirva como catalizador para nuevas investigaciones o herramientas.

Scroll al inicio