Za 14 godina koliko profesionalno igra poker, Deren Ilajas nikada se nije suočio ni sa kim ko igra tako neustrašivo.
Tipični pokeraš bi kada mu podjele dva žandarma – jednog otvorenog, drugog sakrivenog, ruka ni dobra ni loša – nastavio da igra sa oprezom. Ali ne i Ilajasov protivnik; činilo se da dobro zna šta radi. Čak i kada je Ilajas odlučio da blefira, protivnik je pratio ulog. Naposljetku je i pobjedio. Još fascinantnije: ovaj protivnik je bila mašina.
Automatizovani igrač pokera nazvan Pluribus dizajnirali su istraživači sa Univerziteta Carnegie Mellon u Pennsylvaniaii i Facebookova laboratorija za vještačku inteligenciju u NewYorku.
U tekstu objavljenom 11. jula u časopisu Science, istraživači su objasnili kako je Pluribus pobjedio Ilajasa i još nekoliko drugih elitnih profesionalaca u igri „Texas Hold ‘Em“, najpopularnijoj vrsti pokera.
Istraživači su u posljednjih trideset godina izgradili sisteme koji uspjevaju da poraze najbolje igrače u šahu, igri „Go“, pa čak i televizijskim kvizovima. Ali za razliku od ovih igara, poker se temelji na skrivenim informacijama. Svaki igrač u rukama drži karte koje protivnik ne smije da vidi.
Pluribus je znao kada treba da blefira, kada da prati ulog i kada da promeni ponašanje tako da drugi igrači ne mogu da dokuče njegovu strategiju.
“On radi sve ono što rade najbolji igrači na svijetu”, kaže Ilajas (32), četvorostruki osvajač titule na Svjetskom prvenstvu u pokeru. “Radi, doduše, i neke stvari koje ljudi ne umiju.”
Stručnjaci smatraju da bi tehnike koje pokreću ovaj i slične sisteme mogle da se uspješno koriste na Volstritu, aukcijama, u političkim pregovorima i cyber bezbjednosti, odnosno aktivnostima koje, kao i poker, podrazumjevaju skrivene informacije.
Pluribus je naučio nijanse u igranju „Texas Hold’ Em“ tako što je bilione partija odigrao protiv sebe. Poslije svake ruke izvršio bi evaluaciju odluka i odredio da li bi drugačiji izbor doveo do boljeg rezultata.
Sistemima koji briljiraju u trodimenzionalnim video-igrama poput „StarCraft“ potrebne su nedjelje, čak mjeseci da bi naučili kako da igraju protiv ljudi. Pluribus je vježbao svega osam dana na potpuno običnom kompjuteru vrijednom 150 dolara. Teži dio bilo je stvaranje detaljnog algoritma koji je analizirao posljedice svake odluke koju sistem donese.
Pluribus je na kraju naučio kako da primjeni kompleksne strategije, uključujući blefiranje i nepredvidivost u realnom vremenu. Potom je, dok je igrao protiv ljudi, brusio strategije tako što je unaprijed analizirao moguće ishode.
Sve partije odigrane su online, tako da sistem nije mogao da dešifruje emocionalni odgovor ili gestikulaciju svojih protivnika. Uspjeh Pluribusa je pokazao da se poker može svesti na prostu matematiku, kaže Ilajas. “Čisti brojevi i procenti.”
(TBT, NYT)