CSUC

AINA, el proyecto para que la tecnología entienda y hable el catalán

El 16 de febrero se ha celebrado en el Petit Palau, el acto de presentación de la campaña "La nostra llengua és la teva veu", en el marco del proyecto AINA, para hacer posible que las máquinas entiendan y hablen el catalán. La campaña hace así una llamada para recoger millones de voces de personas hablando en catalán a través de la iniciativa de Common Voice de Mozilla, una plataforma donde todo el que quiera pueda leer y registrar frases, agrupadas de cinco en cinco, para ayudar a las máquinas a aprender cómo hablamos las personas.

El acto ha estado encabezado por el Vicepresidente del Govern y conseller de Políticas Digitales y Territorio, Jordi Puigneró, y ha contado con la intervención del Presidente de la Generalitat, Pere Aragonès.

Durante su intervención en el acto, Pere Aragonès ha remarcado que "el progreso de la lengua catalana es uno de los principales compromisos de este Govern", que destinará 13,5 millones de euros en el período 2020-2024. "No escatimaremos recursos para asegurar la presencia de nuestra lengua en todos los ámbitos", ha asegurado, y ha puesto como ejemplo las aportaciones a la Corporació Catalana de Medios Audiovisuales con todo su repositorio documental.

Por su parte, el vicepresidente Puigneró ha reivindicado "el impulso del catalán en la época digital" y ha añadido que "la AINA llega para conquistar nuevos territorios". Jordi Puigneró ha defendido que "tenemos derecho a poder relacionarnos en catalán con las máquinas y que esto que hacemos muy a menudo de cambiar de idioma no nos pase también con las máquinas". "Si nosotros no cuidamos el catalán, si no hacemos un sobreesfuerçzo para el sector digital, nadie más lo hará", ha sentenciado.

El proyecto AINA y la colaboración del CSUC

El proyecto AINA, impulsado por el Govern en colaboración con el Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS), generará los recursos digitales y lingüísticos necesarios para facilitar el desarrollo de aplicaciones basadas en la inteligencia artificial y las tecnologías de la lengua, como los asistentes de voz, los traductores automáticos o los agentes conversacionales en catalán.

El objetivo último es que la ciudadanía pueda participar en catalán en el mundo digital al mismo nivel que los angloparlantes o castellanoparlantes, y evitar así la extinción digital de la lengua catalana.

El primer recurso generado es el corpus del catalán para entrenar los algoritmos de inteligencia artificial (IA), el más grande creado hasta al momento, con 1.770 millones de metadatos asociados a palabras.

Para la creación de este corpus, el proyecto AINA necesita acceder a materiales de diferente naturaleza y procedencia escritos o hablados en catalán. Y esto es lo que hace con los repositorios que mantiene el CSUC como el de Tesis Doctorals en Xarxa (TDX) y el de Revistes Catalanes amb Accés Obert (RACO). Los contenidos en abierto y en lengua catalana presentes en TDX y RACO interesan a AINA, ya que a pesar de no ser de naturaleza cuotidiana, el proyecto necesita también material técnico y de diversa tipología para ir creando y enriqueciendo el corpus textual (diccionario de la lengua) con que nos podremos comunicar con las diferentes aplicaciones en catalán.

El próximo paso será generar los modelos de la lengua, modelos del habla y modelos de traducción utilizando redes neuronales multicapa, para que las empresas que crean aplicaciones basadas en inteligencia artificial (IA) puedan hacerlo fácilmente en catalán.

A continuación encontraréis el vídeo de la presentación y lanzamiento de la campaña:

Para más información podéis acceder a: projecteaina.cat

  • Compartir:
  • #
  • #
  • #