Cash News Logo

Pierdut în traducere - Cum încearcă Africa să reducă decalajul lingvistic în AI

Tech & AI4 septembrie 2025, 03:28
Pierdut în traducere - Cum încearcă Africa să reducă decalajul lingvistic în AI

Pierdut în traducere - Cum încearcă Africa să reducă decalajul lingvistic în AI

De Pumza Fihlani - BBC News în Johannesburg Joi, 4 Septembrie 2025

Deși Africa găzduiește o proporție uriașă din limbile lumii - cu mult peste un sfert, conform unor estimări - multe lipsesc atunci când vine vorba de dezvoltarea AI. Aceasta este atât o problemă de lipsă de investiții, cât și de date ușor disponibile.

Majoritatea instrumentelor AI, cum ar fi Chat GPT, utilizate astăzi sunt antrenate în engleză, precum și în alte limbi europene și chineze. Acestea au cantități mari de text online din care să se inspire.

Dar, deoarece multe limbi africane sunt mai ales vorbite decât scrise, există o lipsă de text pentru a antrena AI pentru a-l face util pentru vorbitorii acestor limbi. Pentru milioane de oameni de pe continent, acest lucru înseamnă a fi lăsați pe dinafară.

"Gândim în propriile limbi, visăm în ele și interpretăm lumea prin ele. Dacă tehnologia nu reflectă acest lucru, un întreg grup riscă să fie lăsat în urmă", a declarat pentru BBC profesorul Vukosi Marivathe de la Universitatea din Pretoria, care a lucrat la proiect.

"Trecem prin această revoluție AI, imaginându-ne tot ce se poate face cu ea. Acum imaginați-vă că există o parte a populației care pur și simplu nu are acces la asta, deoarece toate informațiile sunt în engleză."

Proiectul Africa Next Voices a reunit lingviști și informaticieni pentru a crea seturi de date pregătite pentru AI în 18 limbi africane. Aceasta poate fi doar o mică parte din cele peste 2.000 de limbi despre care se estimează că sunt vorbite pe continent, dar cei implicați în proiect spun că speră să se extindă în viitor.

În doi ani, echipa a înregistrat 9.000 de ore de vorbire în Kenya, Nigeria și Africa de Sud, surprinzând scenarii de zi cu zi în agricultură, sănătate și educație.

Limbile înregistrate au inclus Kikuyu și Dholuo în Kenya, Hausa și Yoruba în Nigeria și isiZulu și Tshivenda în Africa de Sud, dintre care unele sunt vorbite de milioane de oameni.

"Aveți nevoie de o bază de pornire și asta este Africa Next Voices și apoi oamenii vor construi pe deasupra ei și vor adăuga propriile lor inovații", spune profesorul Marivathe, care a condus cercetarea în Africa de Sud.

Omologul său kenyan, lingvistul computațional Lilian Wanzare, spune că înregistrarea vorbirii pe continent a însemnat crearea de date menite să reflecte modul în care oamenii trăiesc și vorbesc cu adevărat.

"Am adunat voci din diferite regiuni, vârste și medii, astfel încât să fie cât mai incluzive posibil. Big tech nu poate vedea întotdeauna acele nuanțe", spune ea.

Proiectul a fost posibil printr-un grant de 2,2 milioane de dolari (1,6 milioane de lire sterline) de la Fundația Gates. Datele vor fi open access, permițând dezvoltatorilor să construiască instrumente care traduc, transcriu și răspund în limbi africane.

Există deja mici exemple despre modul în care limbile indigene utilizate în AI pot fi folosite pentru a rezolva provocări din viața reală în Africa, potrivit profesorului Marivathe.

Fermiera Kelebogile Mosime gestionează un teren de 21 de hectare în Rustenburg, inima regiunii de platină din Africa de Sud. Femeia de 45 de ani lucrează cu o echipă mică pentru a cultiva rânduri de legume - inclusiv fasole, spanac, conopidă și roșii.

A început abia acum trei ani, cu o cultură de varză, și pentru a ajuta, ea folosește o aplicație numită AI-Farmer, care recunoaște mai multe limbi sud-africane, inclusiv Sesotho, isiZulu și Afrikaans, pentru a ajuta la rezolvarea diferitelor probleme.

"Ca persoană care încă învață să cultive, te confrunți cu o mulțime de provocări", spune doamna Mosime. "Zilnic, văd beneficiile de a putea folosi limba mea maternă Setswana în aplicație atunci când întâmpin probleme la fermă, întreb orice și primesc un răspuns util.

"Pentru cineva din zonele rurale ca mine, care nu este expus tehnologiei, este util. Pot întreba despre diferite opțiuni pentru controlul insectelor, a fost, de asemenea, util în diagnosticarea plantelor bolnave", zâmbește ea sub o pălărie de soare cu boruri largi.

Pentru CEO-ul său, Pelonomi Moiloa, ceea ce este disponibil în prezent este foarte restrictiv. "Engleza este limba oportunităților. Pentru mulți sud-africani care nu o vorbesc, nu este doar incomod - poate însemna pierderea serviciilor esențiale, cum ar fi asistența medicală, serviciile bancare sau chiar sprijinul guvernamental", a declarat ea pentru BBC.

"Limba poate fi o barieră uriașă. Spunem că nu ar trebui să fie."

Dar asta înseamnă mai mult decât afaceri și confort. Pentru profesorul Marivathe există, de asemenea, un pericol ca, fără inițiative lingvistice africane, altceva să se piardă

"Limba este accesul la imaginație", spune el.

"Nu sunt doar cuvinte - este istorie, cultură, cunoștințe. Dacă limbile indigene nu sunt incluse, pierdem mai mult decât date; pierdem moduri de a vedea și de a înțelege lumea."