La Infraestructura Pública de IA en Castellano y Lenguas Cooficiales: ALIA, un Proyecto Pionero en Europa
En un mundo donde la inteligencia artificial (IA) está dominada por modelos en inglés, España ha dado un paso histórico con el lanzamiento de ALIA, la primera infraestructura pública, abierta y multilingüe de IA en Europa. Anunciada por el presidente del Gobierno español, Pedro Sánchez, en enero de 2025, ALIA busca fomentar el uso del castellano y las lenguas cooficiales —catalán y valenciano, euskera y gallego— en el desarrollo y despliegue global de la IA. Coordinada por el Barcelona Supercomputing Center (BSC-CNS) y respaldada por la Secretaría de Estado para la Digitalización e Inteligencia Artificial (SEDIA), esta iniciativa 100% financiada con fondos públicos refuerza la soberanía tecnológica de España y Europa, promoviendo una IA transparente, responsable y al servicio de las personas.
Orígenes y Objetivos de ALIA
ALIA nace como parte del Plan de Tecnologías del Lenguaje iniciado en 2019, evolucionando a través de proyectos como AINA (impulsado por el Gobierno de Cataluña) e ILENIA (liderado por SEDIA). En 2024, se convirtió en un pilar clave de la Estrategia Nacional de Inteligencia Artificial de España, alineándose con el programa Década Digital de la Unión Europea. Su objetivo principal es democratizar el acceso a recursos de IA, asegurando que el castellano y las lenguas cooficiales, que representan a más de 600 millones de hispanohablantes, tengan un lugar destacado en el desarrollo tecnológico.
El proyecto aborda una brecha crítica: los modelos de lenguaje predominantes, como los entrenados con datos de CommonCrawl, contienen menos del 5% de contenido en castellano y cantidades aún menores en lenguas como el catalán, euskera o gallego. ALIA garantiza que el 20% de sus datos sean en lenguas de España, lo que la convierte en el sistema de IA que mejor refleja la diversidad lingüística y cultural del país, según Mateo Valero, director del BSC.
Características y Recursos de ALIA
ALIA ofrece una familia de modelos de lenguaje, destacando el ALIA-40B, el modelo fundacional multilingüe público más avanzado de Europa, entrenado en el supercomputador MareNostrum 5 del BSC, capaz de realizar 314,000 trillones de cálculos por segundo. Este modelo trabaja con textos en más de 35 lenguas europeas, priorizando el castellano y las lenguas cooficiales. Además, incluye modelos de texto, voz y traducción automática, algunos entrenados desde cero, como los de traducción entre gallego y catalán o entre euskera y catalán, e incluso en lenguas minoritarias como el aranés, aragonés y asturiano.
A través del ALIA Kit, los usuarios pueden acceder a cinco modelos de lenguaje masivos (LLM) de propósito general, dos de ellos entrenados con instrucciones de corpora abiertos, junto con nueve modelos de traducción multilingüe. También se proporciona el corpus textual CATalog, con 17.45 mil millones de palabras distribuidas en 34.8 millones de documentos, revisados en su mayoría manualmente. Esta transparencia y accesibilidad fomentan la innovación, permitiendo a desarrolladores, empresas y administraciones públicas construir aplicaciones adaptadas a las lenguas y culturas locales.
Ventajas de ALIA
ALIA ofrece múltiples beneficios que la distinguen de otros modelos de IA:
- Transparencia y acceso abierto: Como proyecto de código abierto, cualquier entidad puede acceder, modificar y adaptar sus modelos, promoviendo la colaboración y la innovación.
- Riqueza cultural: Los modelos están diseñados para entender y procesar con precisión las lenguas y particularidades culturales de España, asegurando una representación adecuada.
- Soberanía tecnológica: ALIA reduce la dependencia de tecnologías extranjeras, fortaleciendo la posición de España y Europa en el panorama global de la IA.
- Democratización del acceso: Al ser 100% pública, ALIA beneficia a ciudadanos, administraciones, universidades y empresas, especialmente pymes y autónomos, que pueden usarla para mejorar procesos sin incurrir en altos costos.
Un ejemplo práctico de su impacto es su uso en proyectos piloto anunciados en abril de 2025: ALIA se está aplicando en el Ministerio de Hacienda para optimizar procesos administrativos y en el diagnóstico de cardiopatías, demostrando su versatilidad en sectores clave.
Impacto en el Sector Público y Privado
ALIA tiene un potencial transformador tanto para el sector público como privado. En la administración pública, permite desarrollar servicios más eficientes e inclusivos, como asistentes de voz, traducción automática y procesamiento de documentos multilingües. En el sector privado, pymes y startups pueden integrarla para crear aplicaciones innovadoras, desde chatbots hasta herramientas de automatización, sin depender de modelos propietarios de grandes tecnológicas. Además, al estar alineada con el Reglamento de IA de la UE y supervisada por la Agencia Española de Supervisión de IA (AESIA), ALIA garantiza un desarrollo ético y responsable.
Futuro y Proyecciones
ALIA no solo beneficia a España, sino que tiene un alcance global al dirigirse a toda la comunidad hispanohablante, incluyendo América Latina. Su naturaleza abierta fomenta un ecosistema de startups que pueden desarrollar soluciones adaptadas localmente, cumpliendo con las normativas europeas. A futuro, se espera que ALIA se expanda con más modelos especializados y se integre en sectores como la educación, la salud y la sostenibilidad, contribuyendo a la visión de Europa como líder en IA centrada en el ser humano.
Conclusión
ALIA marca un hito en la IA europea al priorizar la diversidad lingüística y la accesibilidad. Al proporcionar una infraestructura pública que promueve el castellano y las lenguas cooficiales, este proyecto no solo impulsa la innovación, sino que también refuerza la identidad cultural de España en el ámbito digital. Con el respaldo del MareNostrum 5 y un enfoque ético, ALIA está posicionando a España como un referente en el desarrollo de una IA inclusiva y soberana, demostrando que la tecnología puede ser un puente para unir culturas y lenguas en un mundo cada vez más conectado.