Una campanya per recollir milions de veus de persones parlant en català permetrà crear el primer corpus de veu del català. L’objectiu és elaborar recursos digitals perquè qualsevol empresa o entitat pugui desenvolupar productes o serveis tecnològics en la nostra llengua.

La campanya s’inscriu en el projecte Aina, impulsat pel Departament de la Vicepresidència i de Polítiques Digitals i Territori en col·laboració amb el Barcelona Supercomputing Center (BSC).
El llançament va tenir lloc dies enrere i la captació de veus, segons el govern català, ha estat un “èxit espectacular”. En concret, ha recollit 225.000 veus en menys d’una setmana, el 76% corresponents al català central.
L’objectiu és generar els recursos digitals i lingüístics necessaris per facilitar el desenvolupament d’aplicacions basades en la intel·ligència artificial i les tecnologies de la llengua, com ara els assistents de veu, els traductors automàtics o els agents conversacionals en català.
La campanya, que porta el lema “La nostra llengua és la teva veu”, es fa a través de la iniciativa de Common Voice de Mozilla per al català. Es tracta d’una plataforma on tothom que vulgui pot llegir i enregistrar un nombre il·limitat de frases, agrupades de cinc en cinc, per ajudar les màquines a aprendre com parlem les persones.
L’enregistrament es pot fer de manera totalment anònima, però els promotors expliquen que registrar-se prèviament i proporcionar les dades de gènere, edat i variant dialectal facilita molt la feina de classificar les dades.
A més, permetrà saber si es cobreixen tots els registres. Actualment, el perfil de veu majoritari d’aquesta plataforma és el d’homes d’entre 30 i 50 anys parlants de català central.