Google, prin grupul său DeepMind și seria de AI-uri Alpha, părea să fi descoperit cheia pentru a stăpâni orice joc, de la șah la Go, prin antrenamente intensive în care AI-ul juca împotriva propriei versiuni. Totuși, odată cu identificarea unor configurații specifice în jocul de Go, unde AI-ul era învins de jucători novici, s-au ridicat semne de întrebare privind capacitățile acestuia.
Deși pare trivial să învingi un AI la un joc de masă, aceste confruntări ne ajută să înțelegem modurile în care AI-ul poate eșua și să identificăm metode prin care să îmbunătățim antrenamentul acestuia pentru a evita astfel de puncte oarbe, ceea ce este esențial pe măsură ce ne bazăm tot mai mult pe AI în diverse probleme.
Un studiu recent publicat în revista Machine Learning a dezvăluit o categorie întreagă de jocuri unde metoda de antrenament folosită pentru AlphaGo și AlphaChess se dovedește a fi ineficientă. Un exemplu clar este jocul Nim, care implică doi jucători ce îndepărtează chibrituri de pe o tablă piramidală până când unul dintre ei nu mai are mutări legale.
Nim se joacă cu un set de rânduri de chibrituri, primul rând având un singur chibrit, iar fiecare rând de sub acesta având cu două chibrituri mai mult decât cel de deasupra. Jucătorii se succed în a îndepărta chibrituri din orice rând, de la unul la toate chibriturile din acel rând. Jocul continuă până când nu mai există mutări legale. Este un joc simplu, ușor de învățat chiar și de către copii.
Nim este un exemplu vital pentru o categorie întreagă de jocuri numite „jocuri imparțiale”, unde jucătorii împart aceleași piese și aceleași reguli, spre deosebire de jocuri ca șahul, unde fiecare jucător are piesele sale. Importanța lui Nim vine de la un teorem care demonstrează că orice poziție dintr-un joc imparțial poate fi reprezentată printr-o configurație a piramidei de la Nim. Așadar, orice se aplică pentru Nim, se aplică pentru toate jocurile imparțiale.
O caracteristică distinctivă a jocului Nim și a altor jocuri imparțiale este că, în orice moment al jocului, este ușor să evaluezi tabla și să determini care jucător are potențialul de a câștiga. Acest lucru presupune doar introducerea configurației tablei într-o funcție de paritate, care calculează matematic câștigătorul.
Într-un studiu recent, Bei Zhou și Soren Riis au investigat ce se întâmplă dacă aplici metoda de antrenament AlphaGo pentru a dezvolta un AI care să joace Nim și au descoperit că abordările tradiționale pot fi insuficiente.
Sursa: Ars Technica
Poll: Care dintre următoarele opțiuni considerați că ar îmbunătăți antrenamentul unui AI pentru a juca jocuri imparțiale, precum Nim?


Revista “Ştiinţă şi Tehnică“, cea mai cunoscută şi longevivă publicaţie de popularizare a ştiintelor din România



























Leave a Reply