AI alatima za stvaranje slika poput Midjourney i Dalle-e smo se u početku smijali. A onda su postali popularni i evoluirali. Šta su ovi alati, kako rade i kakva im je budućnost, pitali smo Radoslava Dejanovića, IT stručnjaka i novinara.
Piše: Radoslav Dejanović
Sigurno ste čuli za to: ChatGPT i cijela vojska AI sustava koji znaju napraviti sliku, nacrtati nešto umjetničko, ispričati novu priču ili sastaviti domaću zadaću… revolucionarna umjetna inteligencija koja će pola čovječanstva učiniti nezapošljivim, a pisanje lektire besmislenim trudom zaostalih profesora materinjeg jezika.
Demistificirajmo to. Ne, nećete ostati bez posla. I ne, djeco, žao mi je, i dalje ćete morati pisati lektiru.
Umjetna inteligencija je područje na kojem znanstvenici i inženjeri rade već desetljećima: prvi ekvivalent onoga što možemo smatrati umjetnom inteligencijom program je za igranje dame, a nastao je 1951. godine, dok je prvi AI program koji je u sebi imao mogućnost učenja na osnovu odigranih partija načinjen 1955. godine.
Naravno, mogućnosti hardvera tog doba ne možemo baš nikako uspoređivati s mogućnostima modernog hardvera, pa ti programi koji se danas čine smiješno jednostavnim u svoje su doba predstavljale senzaciju ravnu onoj koju su moderni AI programi izazvali u najnovije doba.
Jedan od prvih „kućnih“ AI programa dostupnih svima bila je ELIZA, stvorena 1964. godine i kasnije dostupna za mnoga računala, uključujući i tada popularna kućna 8-bitna računala. Taj program simulirao je razgovor s psihoterapeutom koristeći jednostavan ali efektan skup logičkih i semantičkih pravila, zbog čega se sugovornicima činilo kako razgovaraju s živom osobom.
Moderna umjetna inteligencija zapravo je samo značajno kompleksnija, time i uvjerljivija varijacija na već odavno poznatu temu. Izniman napredak hardvera omogućio je visoku sofisticiranost nove tehnologije, korištenje novih, boljih i bržih algoritama i eksperimentiranje s novim matematičkim konceptima. Rezultat toga je pojava značajno „uvjerljivijih“ modela umjetne inteligencije koji se nama danas čine jednako čudesnima kao što je ELIZA izgledala čudesno našim roditeljima, ali na kraju priče to je i dalje ELIZA efekt.
Razvoj umjetne inteligencije ostavio je traga na mnoštvu ljudskih aktivnosti, no često na nevidljiv, suptilan način: američka FDA odobrila je već preko pet stotina različitih implementacija umjetne inteligencije za različite namjene u medicinske svrhe, i ti se algoritmi koriste u mnoštvu uređaja.
Čak i “obični ljudi“ imaju velike koristi od umjetne inteligencije, iako obično niti ne znaju da je koriste: svaki puta kada koristite „pametne mogućnosti“ softvera za, primjerice, uređivanje slike, pa vam on uljepša ten, poštima boje i izreže sliku da lijepo izgleda, ili pak obriše neki detalj sa slike koji vam baš smeta – taj posao obavlja umjetna inteligencija.
Zato, ne treba paničariti: umjetna inteligencija je već tu, vrlo je korisna za mnoge stvari, i neće dovesti do sloma ekonomije i vala nezaposlenosti.
Jedno od žarišta umjetne inteligencije je stvaranje slika, što je relativno nova AI pojava: još do prije par godina slike koje su takvi sustavi stvarali bile su vrlo apstraktne i nedorečene; fantastično brza evolucija ovih sustava dovela je do toga da danas umjetnici otvoreno govore protiv umjetne inteligencije u strahu da će ostati bez posla.
Taj je strah ipak, barem zasad, neosnovan: jednako kao i njihovi preci, moderni primjeri umjetne inteligencije, ma koliko sofisticirani, i dalje nisu u stanju parirati ljudskom mozgu. Tako slike napravljene pomoću umjetne inteligencije, ma koliko laicima dobro izgledale, još uvijek imaju neke očite nedostatke. No, ne možemo poreći da su računala danas u stanju proizvesti poprilično spektakularne uratke.
I, ono što je u toj priči najzanimljivije: umjetna inteligencija otvorila je vrata ljudima koji nemaju slikarskog dara u jedan novi kreativni svijet – i to je možda najveća dobrobit ove tehnologije, to omogućavanje ljudima da se kreativno izražavaju na njima posve novi način. Mnogi entuzijasti rado su uskočili u tu za njih novu kreativnu nišu i rezultat su doslovce milijuni korisnika raznih verzija softvera za stvaranje slika – u samo nekoliko mjeseci.
Ulazak u taj fantastičan novi svijet kreativnosti gdje korisnik opisuje sliku koju zatim stvara računalo (što je najjednostavnije objašnjenje svih tih popularnih novotarija) relativno je jednostavan, jer korisnik može birati između mnoštva opcija: od relativno povoljnog rješenja koje se pokreće na (malo jačem) kućnom računalu i ne košta ništa, do ne tako povoljnog rješenja koje ne zahtjeva nikakvo lokalno računalo, već se sve obavlja u oblaku – naravno, uz pretplatu.
Midjourney je jedan od korifeja te moderne scene: riječ je o servisu koji slike stvara u oblaku, i komercijalne je naravi. Nije jeftin, no kvalitetom slika i jednostavnošću uporabe zasad daleko odskače od svih sličnih rješenja. Upoznajmo se s njim.
Za korištenje Midjourney-a potrebno je imati otvoren račun na servisu Discord (besplatno) i, naravno, uplatiti mjesečnu ili godišnju pretplatu na Midjourney servis, za što se dobiva određena količina procesorskog vremena koje se troši na stvaranje novih slika.
Za lakše upravljanje korisno je (ali ne i nužno) stvoriti vlastiti server na Discordu (besplatno) i u njega pozvati Midjourney Bot kojemu potom zadajemo zapovjedi što želimo da stvori.
Korištenje je iznimno jednostavno: u novostvorenom kanalu ili u direktnoj poruci botu jednostavno napišemo:
/imagine (i zatim na engleskom jeziku opišemo što želimo da nam Midjourney naslika)
Nakon nekog vremena bot će nazad vratiti četiri slike, četiri prijedloga kako MJ vidi vaš opis. Ispod njih biti će četiri gumba za uvećanje željene slike (U1 – U4) ili za stvaranje nove četiri varijacije na temu jedne od tih slika (V1 – V4). Gumb s ikonicom recikliranja naložiti će botu da zatraži izradu četiri posve nove slike.
U praksi, to izgleda ovako:
U prvom redu nalazi se opis kojeg sam poslao botu naredbom /imagine, a ispod toga nalaze se četiri slike koje je MJ kreirao na osnovu mojeg opisa. Kako možete vidjeti, one su stilom različite, no sve četiri se drže osnovne teme. Izabrati ćemo treću sliku po redu, i klikom na gumb U3 ćemo je uvećati:
Impresivno, zar ne? No, pažljiviji pogled na sliku otkriva nam kako je riječ o slici koju je stvorila umjetna inteligencija: lijeva ruka ima sedam prstiju.
Razlog tome je jednostavan i posve logičan: baš kao i baka ELIZA koja je bila samo lukavo složen program koji je znao postaviti gramatički ispravna pitanja bazirana na korisnikovom unosu i ništa više od toga, moderni programi za stvaranje slika jednako tako nisu ni samosvjesni, ni inteligentni – oni su samo vrlo sofisticirani strojevi koji uzimaju ulazni podatak od korisnika (opis), raščlanjuju ga na logičke dijelove koje mogu strpati u kategorije, i potom na ekranu stvaraju naprosto statistički značajne digitalne mrlje na digitalnom platnu: računalo u bilo kojem trenutku nema svijest o tome što radi. Zbog toga stvara pogreške koje ljudski umjetnik nikada ne bi počinio, a koje se vrlo često mogu otkriti naprosto pažljivim promatranjem elemenata slike.
Naravno, napredak umjetne inteligencije popeglati će i te nedostatke, no u ovom trenutku oni jasno pokazuju ograničenja umjetne inteligencije i otkrivaju srž stvari: ma koliko slike koje vam računalo napravi bile fantastične i izgledale maštovito, one su i dalje samo reprodukcija nastala na osnovu hladnog, nemaštvitog matematičkog modela.
Otkud, pak, izvire ta nedvojbena raznolikost i ponekad i hrabrost u prikazivanu slika? Ti sustavi nastali su kompleksnim procesom treniranja umjetne inteligencije na ogromnom broju stvarnih slika: popularni Stable Difussion (kojeg možete isprobati ovdje) treniran je na 2.3 milijarde slika!
I tu dolazimo do etičkog problema: mnogi od tih alata koristili su za trening slike živućih autora bez njihova znanja ili privole, zbog čega je nastao mali skandal. Rezultat tog etičkog sukoba je svojevrstan kompromis, pa se novi modeli treniraju samo pomoću etički ispravno pribavljenih slika (tj. slika izvan domene važećeg autorskog prava). To je privremeno donekle umanjilo kvalitetu treniranih podataka javno dostupnih modela, no vrlo je vjerojatno da će i taj pad kvalitete biti prevaziđen u skoroj budućnosti.
Eto, to je ta budućnost koja je digla tako mnogo prašine. Svakako revolucionarna, svakako disruptivna, apsolutno fantastično zabavna, ali daleko od toga da će značiti kraj umjetnosti. Transformaciju zanata? Vrlo vjerojatno, no ne zaboravimo: umjetnici već neko vrijeme koriste umjetnu inteligenciju da si olakšaju posao – često toga nisu niti svjesni.
I, za kraj, sve gore navedeno vrijedi i za ChatGPT: poigrajte se s njim malo ozbiljnije i primjetiti ćete kako halucinira stvari – ali ih halucinira na vrlo uvjerljiv način. Jer je ChatGPT zamišljen kao umjetna inteligencija koja zna osmisliti konverzaciju, a ne stvarati logičke zaključke. Ili pisati zadaćnice umjesto vas.
Uostalom, već sutra sve će vaše zadaćnice, eseji i lektire biti provjeravani na originalnost i plagiranje – budnim digitalnim okom umjetne inteligencije.