Cash News Logo

De ce Inteligențele Artificiale Se Încurcă la Anumite Jocuri?

Tech & AI13 martie 2026, 23:47
De ce Inteligențele Artificiale Se Încurcă la Anumite Jocuri?

De ce Inteligențele Artificiale Se Încurcă la Anumite Jocuri

Când câștigarea depinde de intuitirea unei funcții matematice, Inteligențele Artificiale se dovedesc a fi deficitare.

John Timmer – 13 Martie 2026 17:47 | 18

În mod ciudat, metodele de antrenament care funcționează excelent pentru șah eșuează în cazul jocurilor mult mai simple. Credit: SimpleImages

Cu seria sa Alpha de IA-uri care joacă jocuri, grupul DeepMind de la Google părea să fi găsit o modalitate ca IA-urile sale să abordeze orice joc, stăpânind jocuri precum șahul și Go jucându-se în mod repetat în timpul antrenamentului. Dar apoi s-au întâmplat lucruri ciudate, deoarece oamenii au început să identifice poziții de Go care ar pierde în fața unor nou-veniți relativi în joc, dar ar învinge cu ușurință o IA similară care juca Go.

În timp ce înfrângerea unei IA la un joc de masă poate părea relativ trivială, ne poate ajuta să identificăm modurile de eșec ale IA-ului sau modalități prin care putem îmbunătăți antrenamentul lor pentru a evita dezvoltarea acestor puncte oarbe de la bun început – lucruri care pot deveni critice pe măsură ce oamenii se bazează pe contribuția IA pentru o gamă tot mai mare de probleme.

Un articol recent publicat în Machine Learning descrie o întreagă categorie de jocuri în care metoda folosită pentru a antrena AlphaGo și AlphaChess eșuează. Jocurile în cauză pot fi remarcabil de simple, după cum exemplifică cel cu care au lucrat cercetătorii: Nim, care implică doi jucători care își dau pe rând eliminând bețe de chibrituri dintr-o tablă în formă de piramidă până când unul rămâne fără o mutare legală.

Imparțialitate

Nim implică configurarea unui set de rânduri de bețe de chibrituri, cu rândul de sus având un singur băț și fiecare rând de dedesubt având cu două mai multe decât cel de deasupra. Aceasta creează o tablă în formă de piramidă. Apoi, doi jucători își dau pe rând eliminând bețe de chibrituri de pe tablă, alegând un rând și apoi eliminând de la un element la întregul conținut al rândului. Jocul continuă până când nu mai există mutări legale.

Este un joc simplu care poate fi predat cu ușurință copiilor. De asemenea, se dovedește a fi un exemplu critic al unei întregi categorii de seturi de reguli care definesc „jocuri imparțiale”. Acestea diferă de ceva de genul șahului, unde fiecare jucător are propriul set de piese; în jocurile imparțiale, cei doi jucători împărtășesc aceleași piese și sunt legați de același set de reguli. Importanța jocului Nim provine dintr-o teoremă care arată că orice poziție într-un joc imparțial poate fi reprezentată printr-o configurație a unei piramide Nim. Ceea ce înseamnă că, dacă ceva se aplică jocului Nim, se aplică tuturor jocurilor imparțiale.

Una dintre trăsăturile distinctive ale jocului Nim și ale altor jocuri imparțiale este că, în orice moment al jocului, este ușor să evaluezi tabla și să determini ce jucător are potențialul de a câștiga. Altfel spus, poți evalua tabla și poți ști că, dacă faci mișcările optime de acum înainte, vei câștiga probabil. Pentru a face acest lucru, este suficient să introduci configurația tablei într-o funcție de paritate, care face calculele pentru a-ți spune dacă câștigi. (Evident, persoana care câștigă în prezent ar putea face o mutare suboptimă și ar ajunge să piardă. Iar seria exactă de mișcări optime nu este determinată până la sfârșit, deoarece va depinde exact de ceea ce face adversarul tău.)

Noua lucrare, realizată de Bei Zhou și Soren Riis, pune o întrebare simplă: Ce se întâmplă dacă iei abordarea AlphaGo pentru a antrena o IA să joace jocuri și încerci să dezvolți o IA care să joace Nim? Altfel spus: Au întrebat dacă o IA ar putea dezvolta o reprezentare a unei funcții de paritate pur și simplu jucându-se în Nim.

Când auto-învățarea eșuează

AlphaZero, versiunea care joacă șah, a fost antrenată doar din regulile șahului. Jucându-se pe sine, poate asocia diferite configurații ale tablei cu o probabilitate de câștig. Pentru a o împiedica să se blocheze în rutine, există, de asemenea, un element de eșantionare aleatorie care îi permite să continue explorarea unui teritoriu nou. Și, odată ce poate identifica un număr limitat de mutări cu valoare ridicată, este capabilă să exploreze mai adânc posibilitățile viitoare care apar din aceste mutări. Cu cât joacă mai multe jocuri, cu atât este mai mare probabilitatea ca aceasta să poată atribui valori configurațiilor potențiale ale tablei care ar putea apărea dintr-o anumită poziție (deși beneficiile a mai multor jocuri tind să scadă după ce se joacă un număr suficient).

În Nim, există un număr limitat de mutări optime pentru o anumită configurație a tablei. Dacă nu faci una dintre ele, atunci practic cedezi controlul adversarului tău, care poate continua să câștige dacă nu face decât mutări optime. Și, din nou, mutările optime pot fi identificate prin evaluarea unei funcții matematice de paritate.

Așadar, există motive să credem că procesul de antrenament care a funcționat pentru șah ar putea să nu fie eficient pentru Nim. Surpriza este cât de rău a fost de fapt.

Zhou și Riis au descoperit că, pentru o tablă Nim cu cinci rânduri, IA-ul s-a îmbunătățit destul de repede și încă se îmbunătățea după 500 de iterații de antrenament. Adăugarea a doar un rând în plus, totuși, a făcut ca rata de îmbunătățire să încetinească dramatic. Și, pentru o tablă cu șapte rânduri, câștigurile în performanță se opriseră practic până când IA-ul s-a jucat de 500 de ori.

Pentru a ilustra mai bine problema, cercetătorii au înlocuit subsistemul care sugera mutări potențiale cu unul care funcționa aleatoriu. Pe o tablă Nim cu șapte rânduri, performanța versiunilor antrenate și aleatorizate a fost indistinguibilă pe parcursul a 500 de câștiguri de antrenament. Practic, odată ce tabla a devenit suficient de mare, sistemul a fost incapabil să învețe din observarea rezultatelor jocurilor.

Starea inițială a configurației cu șapte rânduri are trei mutări potențiale care sunt toate în concordanță cu o victorie finală. Cu toate acestea, atunci când evaluatorul de mutări antrenat al sistemului lor a fost rugat să verifice toate mutările potențiale, a evaluat fiecare dintre ele ca fiind aproximativ echivalentă. Cercetătorii concluzionează că Nim cere jucătorilor să învețe funcția de paritate pentru a juca eficient. Iar procedura de antrenament care funcționează atât de bine pentru șah și Go este incapabilă să facă acest lucru.

Nu doar Nim

Un mod de a vedea concluzia este că Nim (și, prin extensie, toate jocurile imparțiale) este pur și simplu ciudat. Dar Zhou și Riis au găsit, de asemenea, unele semne că probleme similare ar putea apărea și în IA-urile care joacă șah și care au fost antrenate în acest mod. Ei au identificat mai multe mutări „greșite” la șah – cele care au ratat un atac de mat sau au aruncat o finală de joc – care au fost inițial evaluate la un nivel înalt de către evaluatorul de tablă al IA-ului. Numai pentru că software-ul a luat un număr de ramuri suplimentare cu mai multe mutări în viitor a fost capabil să evite aceste gafe.

Pentru multe configurații de tablă Nim, ramurile optime care duc la o victorie trebuie jucate până la sfârșitul jocului pentru a demonstra valoarea lor, așa că acest tip de evitare a unei potențiale gafe este mult mai greu de gestionat. Și au observat că jucătorii de șah au găsit combinații de mat care necesită lanțuri lungi de mutări pe care software-ul care joacă șah le ratează adesea complet.

Ei sugerează că problema nu este că șahul nu are aceleași probleme, ci mai degrabă că configurațiile de tablă asemănătoare cu Nim sunt, în general, rare în șah. Presupunem că lucruri similare se aplică și jocului Go, după cum ilustrează punctele slabe ciudate ale IA-urilor din acel joc.

„AlphaZero excelează la învățarea prin asociere”, susțin Zhou și Riis, „dar eșuează atunci când o problemă necesită o formă de raționament simbolic care nu poate fi învățată implicit din corelația dintre stările jocului și rezultate”. Cu alte cuvinte, chiar dacă regulile care guvernează un joc permit reguli simple pentru a decide ce să faci, nu ne putem aștepta ca antrenamentul în stil Alpha să permită unei IA să le identifice. Rezultatul este ceea ce ei numesc un „mod de eșec tangibil, catastrofal”.

De ce este important acest lucru?

Multe persoane explorează utilitatea IA-urilor pentru problemele de matematică, care necesită adesea tipul de raționament simbolic implicat în extrapolarea de la o configurație a tablei la reguli generale, cum ar fi funcția de paritate. Deși poate că nu este evident cum să antrenezi o IA să facă asta, poate fi util să știi ce abordări nu vor funcționa în mod clar.

Machine Learning, 2026. DOI: 10.1007/s10994-026-06996-1 (Despre DOI-uri).