Close
Duh iz arkade

Duh iz arkade

Video igre su odavno poligon za ispitivanja veštačke inteligencije. Šta su uspele da nam otkriju?

piše Vasilije Glomazić

 

O
tkad je 1952. godine u primitivnoj formi korišćena u matematičkoj strateškoj igri Nim, veštačka inteligencija živi kao tema u industriji video igara. Pitanje koje se nameće je sledeće: da li može apsolutno svaku video igru igrati bolje nego što to može najbolji (ljudski) igrač?

Tačno dve decenije nakon igre Nim pojavila se jedna od prvih arkadnih video igara pod nazivom Pong. Bila je to simulacija stonog tenisa za dva igrača koji su upravljanjem „reketom“ koji se kretao samo gore-dole sprečavali „lopticu“ da prođe. Iza ove jednostavne genijalnosti stajala je kompanija Atari koja će u narednim godina ispisati najznačajnije stranice istorije video igara, ali i neizmerno uticati na primenu veštačke inteligencije u savremenoj gejming industriji. Tokom 1974. godine pojavile su se prve igre u kojima je igrač mogao da igra protiv računara, te se Speed Race, Qwak i najčuvenija Atarijeva video igra Space Invaders smatraju za začetak, uslovno rečeno, primene veštačke inteligencije.

Devedesetih godina prošlog veka dolazi do proboja tzv. strategija u realnom vremenu (RTS) kao žanra koji je značajno usložnio situaciju. Značaj veštačke inteligencije povećao se usled potrebe da se kontrolišu brojni tzv. neigrivi karakteri (non-player characters), te reše problemi kao što su traženje najkraće putanje, planiranja resursa i donošenja odluka u realnom vremenu. Prve video igre iz ovog žanra Herzog Zwei i Dune II bile su zasnovane na sekvencijalnom modelu računananja poznatom kao konačni automat (finite-state machine).

Međutim, ove Tjuringove mašine bez memorije koje menjaju svoja stanja u zavisnosti od ulaznih podataka pokazale su se kao nepouzdano rešenje. Kasnije igre ovog žanra koristile su metodu emergentnog ponašanja, u kojoj funckionisanje sistema ne zavisi od delova koji ga čine, već isključivo od njihovih međusobnih relacija.

 

Kasparov nije izgubio ni od kakve veštačke inteligencije već od veoma brzog kalkulatora sa širim opsegom taktičkih poteza“

 

P
romena paradigme u primeni veštačke inteligencije dogodila se 1997. godine, kada je superračunar Deep Blue pobedio tada najboljeg šahistu sveta Garija Kasparova. Nadmoć veštačke inteligencije nad čovekom je, iz domena hipotetike i naučne fantastike, prvi put postala stvarnost koja istovremeno budi divljenje i zazor.

Međutim, mnogi naučnici i inženjeri, a među njima i neki od tvoraca mašine-šahiste Deep Blue, danas se slažu da je optimizam koji je pratio pobedu bio prenagljen. Dobitnik Pulicerove nagrade i kolumnista Vašington Posta Čarls Krauthamer je nakon završenog meča rekao da Kasparov nije izgubio ni od kakve veštačke inteligencije, već od veoma brzog kalkulatora sa širim opsegom taktičkih poteza“.

Ovaj računar je koristio pristup iscrpne pretrage, konkretno tzv. paralelnu alfa-beta pretragu karakterističnu za potezne igre, koja funckioniše po sistemu nabrajanja svih mogućih varijanti za rešenje, te isključenja iz pretrage onih rešenja (poteza) za koje se ispostavilo da su lošiji od prethodno ispitanih.

Ipak, pristup iscrpne pretrage je ironično iscrpeo svoje moći i sa šahom dostigao vrhunac svoje primene. Za uspeh u igrama poput drevne kineske igre Go, čiji broj kombinacija iznosi gotovo nezamislivih deset na sto sedamdeseti, veštačka inteligencija je morala da bude inteligentnija.

AlphaGo, računarski program kompanije DeepMind, prošle godine je pobedio svetskog prvaka Lija Sidola. Softver AlphaGo se pokazao toliko superiornim da najbolji igrač ove igre nije imao mnogo šansi. Demis Hasabis, kreator softvera izgradio ga je kombinujući „učenje potkrepljenjem“ (reinforcement learning) sa postupkom zvanim duboko učenje putem neuralnih mreža (po kojem na primer Fejsbuk prepoznaje lica na fotografijama), dok su ispitivanja ovakvog udruživanja metoda isprva sprovođena testiranjem računara u igrama kao što su Space Invaders i Breakout, igri nalik Pongu.

U postupku pojačanog učenja nagrađuje se dobar odabir te softver vremenom pravi sve bolje i bolje izbore. Dodatni kvalitet softvera AlphaGo se ogledao u  predefinisanju oko 30 miliona realnih ljudskih poteza iz kojih je AlphaGo vremenom nadograđivao svoju igru, adaptirajući se prema situaciji na tabli.

 

Problem se neočekivano pojavio sa jednom drugom legendarnom video igrom: PacMan

 

T
ekuća godina je donela još jedan napredak. Kopmanija Open AI Sema Altmana i Ilona Maska razvila je tim tzv. botova (kompjuterskih igrača) nazvan Open AI Five, koji se tokom godine nadmetao u popularnoj video igri Dota 2 sa timovima amaterskih i profesionalnih igrača. Tim sačinjen od pet amaterskih igrača nije predstavljao naročit problem za Open AI Five, ali je u duelu koji je održan krajem avgusta u okviru takmičenja International 2018 u Vankuveru, tim profesionalaca bar je za neko vreme odložio dominaciju veštačke inteligencije. U dve partije koje su odigrane, botovi su doživeli dva tesna poraza.

Botovi su, kao i u primeru Alpha Go, bili vođeni metodom pojačanog učenja, ali su ovog puta počinjali igru kao tabula rasa. Ispostavilo se da nedostatak predefinisanih poteza uopšte nije manjkavost, štaviše, botovi su već posle početnih nekoliko sekundi tumaranja po mapi učili iz svojih grešaka i igrali sve bolje i bolje. To je samo po sebi fascinantno, jer složenost igre kao što je Dota 2 uveliko prevazilazi kompleksnost igre Go. Broj mogućih poteza koji igrač može da odigra u bilo kom trenutku, a koji uključuju strategije napada i odbrane, upravljanje herojima i resursima te mnogim drugim elementima u igri, procenjuje se na oko hiljadu, što kombinatoriku ove igre čini gotovo beskonačnom.

Iako se čini da je samo pitanje trenutka kada će botovi dovoljno uznapredovati da brzinom svojih pretraga čine poteze bolje od ljudskih, postoje oni koji smatraju da to opet neće biti dovoljno. Jun Vang, istraživač sa Univerzitetskog koledža u Londonu apostrofira kolaboraciju kao sledeću stepenicu u razvoju veštačke inteligencije. Da bi uspešno anticipirali želje i akcije ljudi ali i drugih botova, algoritmi moraju da razviju mogućnost komunikacije koristeći teoriju uma – psihološku teoriju prema kojoj je jedinka sposobna da prepozna različite namere, verovanja, potrebe i razmišljanja kod drugih. To znači da bi botovi međusobnom komunikacijom učili jedni od drugih i time brže napredovali.

Vang kaže da je jedna druga mejnstrim igra, StarCraft II, idealan poligon za dalji razvoj veštačke inteligencije, jer ona zahteva dodatne veštine dugoročnog planiranja i međusobne saradnje – upravo onih faktora koji su timu profesionalaca doneli pobedu nad timom botova OPEN AI Five.

U naizgled nezaustavljivom napretku veštačke inteligencije u svetu video igara, jedan događaj predstavlja anomaliju. Iako je tehnika pojačanog učenja radila savršeno u jednostavnim igrama kao što su Pong ili Space Invaders, problem se neočekivano pojavio sa jednom drugom legendarnom video igrom, PacMan. U njoj je veštačka inteligencija beležila, može se reći, katastrofalne rezultate.

PacMan je glavni protagonista i ima dvostruki cilj, da sakupi sve tačkice u lavirintu, i da pritom beži od duhova koji ga jure. Ispostavilo se da drugi deo zadatka za veštačku inteligenciju predstavlja veliki problem, jer koristeći metodu pojačanog učenja ona uopšte nije obraćala pažnju na svoje protivnike.

U tekstu Zašto veštačka inteligencija ne ume da igra neke igre objavljenom u časopisu Science, novinar Metju Hatson analizirao je razloge zbog kojih se u rezultatima veštačke inteligencije u video igrama naizgled jednakih kompleksnosti javlja tolika razlika. Istakao je, i to samo donekle u šali, da se greške veštačke inteligencije mogu ispravljati, ali da je ne možete naučiti da se plaši duhova.

Close