A. I.

BLIŽI SE KRAJ LJUDSKE NADMOĆI U STRATEŠKIM IGRAMA Nakon što su nas računala davno sredila u šahu, umjetna inteligencija prijeti nam u StarCraftu

 iStock
Strateška igra StarCraft sljedeći je najveći izazov umjetne inteligencije, a stručnjaci iz Googleove podružnice DeepMind razvili su programe koji su uspjeli svladati 99,8 posto ljudskih igrača

Umjetna inteligencija - UI - postaje svakim danom sve prisutnija u našim životima. Već sad upravlja našim životom kroz selekciju sadržaja na društvenim mrežama, prikaz reklamnih sadržaja i rangiranje rezultata pretrage na internetskim tražilicama, a interni “proces razmišljanja” tih neuralnih mreža, algoritama za strojno učenje, ljudi već dulje vremena ne mogu razumjeti osim u najgrubljim crtama.

Algoritmi UI već su nas nadmašili u zadaćama koje ovise o obradi velikih količina podataka, poput trendova dijeljenja sadržaja na društvenim mrežama.

Tu se radi o jednostavnim procesima koje bi ljudski mozak možda odradio jednako dobro ili bolje, samo da nije preopterećen informacijama. S druge strane, imamo zadaće u kojima računala još uvijek pokušavaju uhvatiti korak s ljudima, poput prepoznavanja što se nalazi na fotografijama, smještanja pojmova u apstraktne kategorije, pisanja priča ili scenarija i drugih kreativnih poslova.

Između te dvije krajnosti nalazi se posebno zanimljivo područje u kojem se ljudi i računala još uvijek mogu ravnopravno natjecati, a to je igranje strateških igara. No, ako je suditi po rezultatima koje postiže Googleova podružnica DeepMind, razdoblju u kojem su ljudi i računala ravnopravni ubrzano se bliži kraj.

U čemu su nas pobijedila računala?

Prva velika pobjeda stroja protiv čovjeka dogodila se 1997. godine, kada je IBM-ov “Deep Blue” pobijedilo svjetskog prvaka u šahu, Garija Kasparova. No, šah je za današnje pojmove jednostavna algoritamska igra, pa za pobjedu nisu bili potrebne neuralne mreže.

IBM je prvi put iskoristio UI algoritme u računalu Watson, koje je naučilo igrati kviz “Izazov!” i pobijediti dva ljudska šampiona 2011. Kako je imao brojne enciklopedije na raspolaganju, najveći izazov za Watsona bio je - shvatiti pitanja.

Sljedeći veliki napredak postigao je upravo DeepMind sa svojim UI programom, takozvanim agentom, nazvanim AlphaGo. On je naučio igrati tradicionalnu kinesku igru go, znatno složeniju od šaha, koju je nemoguće svladati čistim računanjem.

AlphaGo je 2016. svladao svjetskog prvaka Leeja Sedola, nakon što je proučio oko sto tisuća ljudskih partija, i potom igrao tisuće i tisuće partija sam protiv sebe. U tom “treningu”, za koji bi čovjeku bilo potrebno nekoliko života, AlphaGo je razvio verziju umjetne intuicije - gotovo instinktivnog razumijevanja koji bi sljedeći potez bio najbolji.

Koji je sljedeći izazov?

Velik broj računalnih stručnjaka smatra kako je sljedeći najveći izazov za UI računalna igra StarCraft. Radi se o strategiji u realnom vremenu, algoritamski gotovo beskonačno složenijoj od igre go.

U StarCraftu, dva se protivnika bore koristeći jednu od tri različite rase, od kojih svaka ima različite jedinice za borbu i izgradnju, a bitke se odvijaju na brojnim mapama. Istovremeno moraju skupljati resurse, graditi infrastrukturu, otkrivati što sprema protivnik i organizirati napade i diverzije.

Problem za računalo je što se radi o igri nesavršenih informacija - umjesto cijele mape igrači vide samo ono što vide njihove jedinice. Potrebno je slati izvidnice, koje je moguće i presresti ili uništiti, pri čemu je potrebno na temelju vrlo malo dostupnih informacija pretpostaviti koja je strategija vašeg protivnika. Kriva pretpostavka nerijetko znači gubitak.

U partijama između ljudi, StarCraft je igra strategije, brzih refleksa, nevjerojatne koncentracije, sposobnosti “čitanja” protivnika, blefiranja i varki, skretanja pozornosti i, najvažnije, kreativnosti i snalažljivosti.

Kako se računalo nosi s time?

Za sada, iznenađujuće dobro. Početkom ove godine DeepMind je objavio rezultate testiranja koje su proveli s dva europska profesionalna igrača StarCrafta. Nijemac Dario Wünsch alias TLO, tada 85. na ljestvici najboljih, i Poljak Grzegorz Komincz alias MaNa, tada 16.

U dva ogledna susreta, DeepMindovi AlphaStar agenti pobijedili su Wünscha i Komincza u svih deset odigranih partija. No, radilo se o kontroliranim uvjetima. AlphaStar je bio u stanju igrati samo kao jedna od tri rase, i to samo protiv iste te rase. Imao je i pregled nad cijelom mapom, kao da je cijela na ekranu, dok su ljudi morali ručno pomicati pogled. Iako su mu programeri ograničili broj akcija koje može odigrati po minuti, kako ne bi pobijedio na čistu brzinu refleksa, AlphaStar je na trenutke svejedno izvodio koordinirane poteze koji su ovisili o nadljudskoj brzini reakcija.

Kada su programeri prisilili AlphaStar da mora pomicati pogled na mapu, poput ljudi, te dodatno ograničili njegovu brzinu reakcija, sljedeću je partiju protiv Komincza izgubio. No, samo par mjeseci kasnije, sredinom ove godine, DeepMind je pustio AlphaStar “u divljinu”, da igra u istoj online ligi kao i pravi ljudi.

Kakav je uspjeh postigao?

DeepMind se ovaj tjedan pohvalio rezultatima u znanstvenom istraživanju objavljenom u časopisu Nature. Najnoviji agenti - po jedan za svaku rasu - naučili su igrati bez ikakvih ograničenja. Igrali su protiv pravih ljudi na svim dostupnim mapama, protiv svih dostupnih rasa.

AlphaStar agenti pušteni su u divljinu samo u Europi, gdje su do kraja listopada sva tri postigli rang velemajstora - ušli su u grupu najboljih 200 igrača, što znači da su bili bolji od 99,8 posto svih igrača u europskoj ligi.

Da bi postignuće bilo još veće, AlphaStar agentima dodatno je ograničena brzina reakcija - mogu poduzimati najviše 22 akcije u pet sekundi, u što se ubraja i pomicanje kamere. Možda se čini kao mnogo, no najbolji ljudski igrači imaju znatno više akcija u istom vremenskom periodu. Tijekom oglednih partija, primjerice, Komincz je u prosjeku odigrao oko 32 akcije svakih pet sekundi.

Koja je tajna AlphaStarovog uspjeha?

Treniranje agenata samih protiv sebe, koje je bilo učinkovito u igri go, nije se iskazalo u StarCraftu. Radi se o presloženoj igri u kojoj je previše mogućih kombinacija. Svaka strategija, koliko god uspješna u prosjeku, ima i protustrategiju koja je svladava, iako sama po sebi nije najuspješnija.

DeepMind je bio prisiljen kreirati agente kojima je jedina svrha bila da budu “izazivači” - agenti koji su tražili rupe u strategijama najuspješnijim agentima, iako sami nisu bili osobito uspješni. Time je DeepMind emulirao način na koji i profesionalni igrači vježbaju nove strategije.

AlphaStar još nije na razini na kojoj je bio AlphaGo kada je igrao protiv Sedola, no nije ni daleko. Za sada ga još uvijek mogu pobijediti snalažljivi i kreativni igrači, koji ga suočavaju s nepoznatim strategijama i rješenjima, no radi se samo o najboljima od najboljih.

Sam voditelj projekta, Oriol Vinyals, za Nature je rekao kako žali što se nije odvažio ranije okušati protiv AlphaStara. Dok je bio mlađi bio je solidan igrač. No, kada se konačno odlučio zaigrati protiv vlastite kreacije već je bilo prekasno - računalo je bez problema svladalo svojeg tvorca.

Koja je svrha AlphaStara?

DeepMind koristi strateške igre kao idealni poligon za razvoj UI. Mnoge karakteristike StarCrafta imaju paralele u stvarnom svijetu - donošenje bitnih odluka temeljenih na nepotpunim informacijama, reagiranje na neočekivane promjene, dugoročno planiranje i učinkovitost korištenja resursa.

Način na koji DeepMind trenira AlphaStar poslužit će kao nacrt za razvoj UI sustava koji će moći svladati vrlo ozbiljne izazove modernog svijeta - od logistike, zdravstva, infrastrukture pa do tržišta kapitala. IBM-ov Watson, primjerice, je nakon pobjede na kvizu “Izazov!” postao izrazito uspješan dijagnostičar na onkologiji sveučilišne bolnice Johns Hopkins.

Za sada, ipak, AlphaStar još uvijek nije završen. Tri agenta ušla su među najbolje svjetske igrače, no 0,2 posto ljudi još uvijek postiže bolje rezultate. Jednom kada postane nepobjediv, DeepMind će nastaviti svoju primarnu misiju, kako je vidi direktor Demis Hassabis: “Riješiti problem opće umjetne inteligencije. Potom riješiti sve druge probleme na svijetu”.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
01. prosinac 2024 11:30