JEZIVA BUDUĆNOST TEHNOLOGIJE

OVI LJUDI NE POSTOJE Umjetna inteligencija postala je posebno uspješna u vrlo neočekivanoj zadaći - stvaranju uvjerljivih fotografija ljudskih lica

Razvoj umjetne inteligencije prijeti gašenjem brojnih radnih mjesta, čega su već mnogi svjesni. S napretkom automatizacije bit će potrebno sve manje radnika u tvornicama, u skladištima, sve manje vozača kamiona i dostavnih vozila, sve manje taksista i raznovrsnih fizičkih radnika, ugroženi su čak i brojni administrativni poslovi. No, odnedavno su postala ugrožena i radna mjesta manekena i manekenki.

Nekolicina startupova koji se bave umjetnom inteligencijom, počeli su nuditi fotografije ljudi koji uopće ne postoje, lica koja su zamislili hladni strojevi temeljito obučeni da prepoznaju i stvaraju uvjerljiva ljudska lica. Osim što se radi o impresivnom tehnološkom postignuću, ono za sobom povlači i brojna sigurnosna i etička pitanja.

Kako izgledaju lažni ljudi?

Gotovo identično kao i pravi. Nitko od ljudi na fotografijama objavljenim uz ovaj članak nikada nije živio. Stari, mladi, bijeli, crni, dječaci i djevojčice... koliko god se uvjerljivo doimali, oni nisu stvarni. Nitko od njih nije začet ni rođen. Radi se o konačnom proizvodu GAN neuralnih mreža (Generative Adversarial Network), koje su svoj zanat ispekle na tisućama ili stotinama tisuća fotografija pravih ljudi, do trenutka kada su naučili stvarati fotografije koje gotovo nitko ne može razlikovati od fotografija pravih ljudi.

Što je veća baza raznolikih lica na kojoj se algoritam može učiti, to će i konačni produkt biti raznovrsniji. Baze temeljene na malom broju modela proizvode relativno slična, dosta homogena lica, no uz dovoljno podataka sve je moguće. Radi se i o jednom od boljih razloga zašto svoje lice ne bi trebalo pretjerano izlagati internetu - društvene mreže poput Facebooka, Googleove fotografije ili appovi poput FaceAppa prikupljaju velike količine podataka kojima se umjetne inteligencije mogu služiti za razne svrhe, bez vašeg znanja.

Kako se uči izmišljati ljude?

Generativne suparničke mreže primarno se sastoje od tri komponente. Prva je generator, umjetna inteligencija zadužena za proizvodnju lažnih fotografija. Druga je baza stvarnih fotografija, a treća je diskriminator, umjetna inteligencija čija je zadaća prepoznati radi li se o stvarnoj fotografiji ili lažiranoj. Generator i diskriminator su pritom suparnici - cilj generatora je prevariti diskriminatora. Nakon što diskriminator donese odluku, dobije informaciju je li pogodio ili nije, te na temelju toga uči za sljedeći put.

U praksi, to izgleda tako da, na početku treninga, diskriminator uopće ne zna razliku između lica i bezlične mase, a generator proizvodi nasumične mrlje umjesto realistične fotografije. No, s vremenom i jedan i drugi postaju sve bolji. Diskriminator počinje shvaćati koje elemente mora imati fotografija ljudskog lica - oči, uši, kosu, pozadinu, usne... Generator počinje shvaćati da mora uključiti te elemente kako bi prevario diskriminatora. Kako jedan postaje uspješniji, tako se i drugi mora više potruditi da bi ga nadmašio.

Kako računalo “vidi” lica?

Nama ljudima, razaznavanje lica jedna je od prvih zadaća kojima se naši mozgovi posvećuju. Bebe vrlo brzo počinju prepoznavati lica općenito, a ubrzo i razlikovati različita lica. Radi se o vještini koja nam je toliko instinktivno usađena da uopće ne razmišljamo o njoj. Vidimo fotografiju i znamo da li je na njoj lice ili nije. Naš se mozak naučio to raditi kroz tisuće i tisuće lica koja smo vidjeli kroz život, te kroz tisuće i tisuće fotografija lica koje smo vidjeli.

Računalo te iste fotografije doživljava znatno apstraktnije, na razini digitalne informacije. Umjetna inteligencija razaznaje individualne piksele fotografije, njihove boje, i njihov položaj u odnosu jedne na druge. Iz tih odnosa, neuralna mreža, koja je sposobna učiti, mora naučiti prepoznavati ključne elemente lica - omjere i boje koji predstavljaju usne, zube, oči i sve ostale detalje.

Kako nastaju fotografije?

Računalna tvrtka nVidia, inače specijalizirana za grafičke kartice i procesore, razvila je GAN tehnologiju i učinila je javno dostupnom. Ovisno o timu koji se koristi tehnologijom, postoje različiti procesi kojima se generatori mogu služiti. Većina se koristi nasumičnim brojem kao “ulazom” u proces stvaranja lažnog čovjeka, a na temelju tog broja bira elemente koje usklađuje sa svojom listom obveznih uvjeta.

Naime, svaki put kada diskriminator prepozna lažnu fotografiju, otkriva generatoru koji kriterij ga je razotkrio. Generator potom dodaje dodatne uvjete na svoju proizvodnju.

Neki generatori započinju stvaranje fotografija vrlo niske rezolucije, prvo 4x4 piksela, pa je potom čine detaljnijom, na 8x8 piksela, pa taj proces nastavljaju dok ne dobiju fotografiju visoke rezolucije koja je pri svakom sljedećem prolazu postajala sve detaljnija i preciznija.

Griješi li umjetna inteligencija?

Još uvijek je dalek put od suštog vizualnog prepoznavanja detalja do potpunog razumijevanja kakvo ima čovjek. Greške se događaju, pogotovo u ranijim fazama treninga generatora, a one znaju varirati od komičnih pa do prizora iz noćnih mora.

Katkad usta zamijene oči, katkad kovrče kose rastu iz čela. Katkad je pozadina fotografije psihodelična amorfna masa boja i oblika, a katkad se uz sasvim ispravno i uvjerljivo lice nalazi i nešto što bi trebalo biti dio druge osobe koja kao pozira pored, no tu se najčešće radi o izvitoperenoj spodobi, čudovištu poput onih iz filmova Davida Cronenberga. Kako generator postaje sve bolji, najveći problem postaju naočale i nakit. Umjetnoj inteligenciji potrebne su tisuće i tisuće ponavljanja kako bi shvatila kako ispravno prikazati naočale, kako uvjerljivo iskriviti rubove lica iza stakala kako bi se stvorila iluzija dioptrijskih stakala, a da istovremeno ne izgleda neprirodno i nemoguće. Konačni izazov su naušnice, jer računalo nikako da shvati da većina žena nosi dvije iste naušnice, koje izgledaju različito pod različitim kutem fotografije. Generatori uglavnom stvaraju dvije potpuno različite naušnice, vjerojatno inspirirane modelima koje je diskriminator vidio u bazi stvarnih fotografija.

Čemu služe ovi lažni ljudi?

Nekolicina startupova počela je prodavati fotografije nepostojećih ljudi, i to tvrtkama koje žele brzo i jeftino “povećati rasnu raznolikost” na svojim fotografijama, u svojim katalozima i prospektima.

Tvrtka rosebud.ai prodaje ilustrativne fotografije na koje se automatski mogu namontirati različita lažna lica, koja pripadaju željenim etničkim skupinama. Isti model u istoj pozi može, uz samo jedan klik mišem, postati azijatkinja ili crnkinja, bjelkinja ili Južnoamerikanka. Tvrtka Icon8 nudi fotografije po brojnim kriterijima, mlade, stare, djecu, odrasle, svih rasa i izraza lica, od osmijeha, tuge, zamišljenosti, dosade i brojnih drugih. Radi se o neviđenoj količini fotografija koju bi jednostavno bilo nepraktično snimati s pravim ljudima. No, ista ta tehnologija ima i svoju mračnu stranu. Neke aplikacije za spojeve počele su koristiti fotografije lažnih djevojaka kako bi stvorile dojam da je na njihovim platformama više privlačnih mladih žena. Internetski prevaranti, te agenti koji šire dezinformacije za račun država, počeli su koristiti fotografije lažnih ljudi za otvaranje lažnih profila na društvenim mrežama poput Facebooka i LinkedIna.

GAN mreže postajat će sve bolje, a lažni ljudi koje rade sve uvjerljiviji. U budućnosti pred nama, bit će sve teže vjerovati bilo kojem licu kojeg ne poznajemo osobno.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
11. studeni 2024 10:04