Avui he llegit l’última de Meta (anteriorment Facebook). Espatarrant! Han desbancat Whisper d’OpenAI (el millor transcriptor d’àudio a text) i han creat una IA capaç de transcriure veu a text amb una precisió flipant en més de 1.100 idiomes! Com? Ho creieu o no, han donat a menjar a la seva intel·ligència artificial (IA) amb… la Bíblia!!!
I per què la Bíblia? Doncs, bé, resulta que és una de les obres més traduïdes de la història, així que han construït un dataset amb unes 32 hores d’àudio per cada un dels 1.100 idiomes. Més que espavilats, no?
Aquesta IA, batejada com Massively Multilingual Speech (MMS), és més precisa que el seu rival Whisper, tot i treballar amb un nombre d’idiomes que fa que el Whisper semblin un principiant. I el més increïble de tot? L’ús de la Bíblia pot ajudar a preservar llengües que estan en perill d’extinció. Salvant els idiomes amb imaginació, oi?
Però, com en qualsevol avanç, hi ha sempre un però. I és que la IA de Meta té alguns esbiaixaments precisament per tractar-se d’una obra tan antiga.
La festa no s’acaba aquí. Meta planeja incloure més idiomes (fins a 4.000!) i treballar en el reconeixement de dialectes. També es plantegen el potencial d’aquesta tecnologia en realitat virtual i augmentada. Imagina’t parlar amb el teu avatar en qualsevol idioma per rar que sigui!
Per si tot això no fos prou sorprenent, Meta ha decidit compartir la seva joguina amb tothom, posant el codi font disponible en GitHub. Així que, en qüestió de mesos (o pocs anys) hi haurà una implosió d’aplicacions de veu que al·lucinaran als filòlegs.
Senzillament brillant.. i divi!