CSUC

AINA, el projecte perquè la tecnologia entengui i parli el català

El 16 de febrer ha tingut lloc al Petit Palau, l'acte de presentació de la campanya "La nostra llengua és la teva veu", en el marc del projecte AINA, per fer possible que les màquines entenguin i parlin el català. La campanya fa així una crida per recollir milions de veus de persones parlant en català a través de la iniciativa de Common Voice de Mozilla, una plataforma on tothom qui vulgui pot llegir i enregistrar frases, agrupades de cinc en cinc, per ajudar les màquines a aprendre com parlem les persones.

L'acte ha estat encapçalat pel vicepresident del Govern i conseller de Polítiques Digitals i Territori, Jordi Puigneró, i ha comptat amb la intervenció del president de la Generalitat, Pere Aragonès.

Durant la seva intervenció en l'acte, Pere Aragonès ha remarcat que “el progrés de la llengua catalana és un dels principals compromisos d'aquest Govern”, que hi destinarà 13,5 milions d'euros en el període 2020-2024. “No escatimarem recursos per assegurar la presència de la nostra llengua en tots els àmbits”, ha assegurat, i n'ha posat com a exemple les aportacions a la Corporació Catalana de Mitjans Audiovisuals amb tot el seu repositori documental.

Per la seva part, el vicepresident Puigneró ha reivindicat "l'impuls del català en l'època digital" i ha afegit que "l'AINA arriba per conquerir nous territoris". Jordi Puigneró ha defensat que “tenim dret a poder relacionar-nos en català amb les màquines i que això que fem massa sovint de canviar d'idioma no ens passi també amb les màquines”. "Si nosaltres no cuidem el català, si no fem un sobreesforç per al sector digital, ningú més ho farà", ha sentenciat.

El projecte AINA i la col·laboració del CSUC

El projecte AINA, impulsat pel Govern en col·laboració amb el Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS),  generarà els recursos digitals i lingüístics necessaris per facilitar el desenvolupament d'aplicacions basades en la intel·ligència artificial i les tecnologies de la llengua, com ara els assistents de veu, els traductors automàtics o els agents conversacionals en català.

L'objectiu últim és que la ciutadania pugui participar en català en el món digital al mateix nivell que els angloparlants o castellanoparlants, i evitar així l'extinció digital de la llengua catalana.

El primer recurs generat és el corpus del català per entrenar els algoritmes d'intel·ligència artificial (IA), el més gran creat fins al moment, amb 1.770 milions de metadades associades a paraules.

Per a la creació d'aquest corpus, el projecte AINA necessita accedir a materials de diferent natura i procedència escrits o parlats en català. I això és el que fa amb els repositoris que manté el CSUC com el de Tesis Doctorals en Xarxa (TDX) i el de Revistes Catalanes amb Accés Obert (RACO). Els continguts en obert i en llengua catalana presents a TDX i RACO interessen a AINA, ja que tot i no ser de naturalesa quotidiana, el projecte necessita també material tècnic i de diversa tipologia per anar creant i enriquint el corpus textual (diccionari de la llengua) amb què ens podrem comunicar amb les diferents aplicacions en català.

El proper pas serà generar els models de la llengua, models de la parla i models de traducció utilitzant xarxes neuronals multicapa, perquè les empreses que creen aplicacions basades en intel·ligència artificial (IA) puguin fer-ho fàcilment en català.

A continuació trobareu el vídeo de la presentació i llançament de la campanya:

Per a més informació podeu accedir a: projecteaina.cat

  • Compartir:
  • #
  • #
  • #