La compañía de tecnología profunda iGenius, fundada en 2016, ha anunciado el lanzamiento de «Italia», su modelo de lenguaje grande (LLM) totalmente de código abierto, desarrollado en colaboración con Cineca. Este avance se ha logrado gracias al uso de miles de GPUs en el supercomputador Leonardo, una de las infraestructuras de computación más avanzadas del mundo.
El primer modelo de la serie es Italia 9B, un LLM con una arquitectura Transformer de 9 mil millones de parámetros, una ventana de contexto de 4.096 tokens y un vocabulario de 50.000 tokens. Italia 9B fue entrenado desde cero en italiano, utilizando una mezcla heterogénea de datos: fuentes públicas, datos sintéticos y contenido específico de dominio proporcionado por socios comerciales. Este enfoque permite al modelo comprender todas las sutilezas lingüísticas y culturales del italiano con una precisión sin precedentes.
Además, iGenius ha establecido una colaboración con Editoriale Nazionale, parte del grupo Monrif, para utilizar su archivo histórico de artículos de prensa como una fuente adicional para mejorar el modelo. Este valioso contenido permitirá ampliar aún más el conocimiento de Italia, cubriendo décadas de historia nacional e internacional.
Para construir el conjunto de datos de entrenamiento y garantizar la integridad ética del contenido generado, se han desarrollado filtros de seguridad específicos para el idioma italiano. Estos filtros eliminan contenido sensible, explícito y altamente sesgado, mitigando así la aparición de sesgos y limitando las alucinaciones y la generación de contenido inconsistente.
La seguridad de los datos y la fiabilidad de la información siempre han sido prioridades para iGenius. La empresa ha invertido en la construcción de un conjunto de datos italiano de alta calidad para desarrollar un modelo de lenguaje verdaderamente abierto, transparente y seguro, cumpliendo con las regulaciones europeas de IA, como el AI Act.
Desde 2016, la misión de iGenius ha sido humanizar los datos y democratizar el conocimiento empresarial, revolucionando el paradigma histórico de IA de centrado en los datos a centrado en las personas. El desarrollo de un modelo de lenguaje de código abierto se alinea perfectamente con este objetivo, aumentando los niveles de transparencia, confianza y seguridad para las personas y empresas que deciden adoptarlo.
Italia: Un Modelo Diseñado para Empresas
Italia fue diseñado para empresas que operan en sectores altamente regulados, como servicios financieros o administración pública. Incluso en su primera versión, se presenta como un LLM único: especializado en un solo idioma, el alto número de parámetros combinado con la calidad del proceso de entrenamiento lo convierten en la elección ideal para los casos de uso más críticos en el mundo empresarial, donde la fiabilidad del contenido generado es de suma importancia.
Italia no solo domina el vocabulario y la estructura de las oraciones, sino también el conocimiento cultural e histórico del país, lo cual es esencial para aplicaciones que requieren una competencia avanzada en el idioma italiano. Además, gracias a un tokenizador propietario desarrollado específicamente por el equipo de iGenius, Italia puede procesar y generar tokens en italiano con una eficiencia de rendimiento equivalente a un aumento del 60% en su ventana de contexto.
Casos de Uso: Italia y el Futuro de la IA en los Negocios
iGenius cree que Italia es el primer paso hacia un Renacimiento Digital, introduciendo una nueva era de desarrollo de IA centrada en las personas. Italia ha sido desarrollado y entrenado con una atención particular a las necesidades de las empresas y profesionales, asegurando una integración efectiva de la IA en sus actividades.
Para iGenius, cada organización debería adoptar la IA con soluciones adaptadas a sus necesidades específicas, manteniendo el control sobre sus datos privados. Desde 2016, la compañía ha trabajado con empresas para adaptar la IA a sus necesidades, partiendo siempre de los requisitos reales de las personas, más que de sus datos.
Con Crystal, su producto de inteligencia de decisiones para empresas, iGenius ha comprendido completamente los desafíos que impiden a las organizaciones adoptar la IA en contextos operativos críticos y de alta prioridad. Por ello, han creado Unicorn, una nueva línea de negocio destinada a apoyar a organizaciones públicas y privadas en la adopción de la IA y los LLM, desarrollando soluciones personalizadas adaptadas a sus necesidades específicas.
Italia es el resultado de una extensa investigación y desarrollo, representando solo el comienzo del viaje de iGenius en la innovación en IA. Ya están trabajando en nuevas versiones del modelo, incluyendo una versión multilingüe que estará disponible próximamente.
Mientras tanto, se puede descargar Italia 9B completando el formulario en la parte inferior de la página. Para mantenerse al día con las últimas noticias sobre Italia y iGenius, suscríbase a su boletín informativo.
El Renacimiento Digital ya está aquí.
Fuente: iGenius