Znate onu staru – s kim si takav si? Kada su nas upozoravali da ne upadnemo u loše društvo? E, danas je to loše društvo internet, i brain rot sadržaji, slopovi na društvenim mrežama, koje su od sredstva da se ljudi povezuju postale sredstvo društvene i kognitivne degradacije, uz mali procenat kvalitetnih sadržaja. Ovaj enšitificiran prostor, prema terminu koji je izmislio Cory Doctorow nije dobar za nas, pogotovo ne mlade, ali nije dobar ni za vještačku inteligenciju.

Također se pokazalo da se ljudi praktično zaglupljuju kada svoje kognitivne sposbnosti – pamćenje, povezivanje informacija i zaključivanje prepuste umjetnoj inteligenciji. No, ako se mi zaglupljujemo umjetnom/vještačkom inteligencijom, da li postoji obrnut proces – da mi zaglupljujemo AI?

Izgleda da je itekako moguć.

Na predavanjima koja držim širom BiH, zahvaljujući podršci Ambasade Kraljevine Nizozemske, kada govorim o etici i manama vještačke inteligencije, spominjem i akronim GIGO – garbage in – garbage out koji kaže da ako neki sistem, pa i sistem umjetne/vještačke inteligencije hranimo materijalom loše kvalitete, on će kao krajnji produkt imati slop, pulp fiction materijal loše kvalitete. I to ne loše kvalitete u smislu rezolucije nego, kada to kažemo, mislimo da kič, besmislen i omalovažavajući, bezvrijedan i zaglupljujuć produkt.

Naučnici su otkrili da AI chatbotovi trenirani na sadržaju lošeg kvaliteta – tzv. „brain rot” materijalu, odnosno plitkim i senzacionalističkim objavama sa društvenih mreža – proizvode lošije i manje tačne odgovore. Studija, koja je objavljena u formi preprinta na platformi arXiv, dakle još nije recenzirana,  pokazala je da modeli koji uče iz takvih kratkih, popularnih i površnih postova na X/Twitteru preskaču korake u zaključivanju ili ih uopšte ne koriste, češće griješe i čak pokazuju „mračne crte ličnosti” poput povećane narcisoidnosti i znakova psihopatije.

Autori ovog preprinta predlažu hipotezu LLM brain rota – da kontinuirano izlaganja velikih jezičkih modela (Large Language Models – LLMs tj. chatbotova) junk sadržaju niske kvalitete i punog predrasuda i rasizma dovodi do kognitivnog pada modela. Već znamo da se ljudske pristranosti mogu replicirati u ovim modelima, a sad znamo i da glup sadržaj koji mi proizvodimo može da dovede i do digitalne idiokratije. Također ovo treba povezati i sa fenomenom AI kanibalizma, da, kada se model hrani, tj, trenira na sadržaju koji je proizvela vještačka inteligencije, dolazi do degradiranja i urušavanja sadržaja. A slop i brain rot sadržaji, poput italian brainrot slop, uglavnom su proizvedeni putem umjetne inteligencije.

Istraživači objašnjavaju da kvalitet podataka nije samo u tome da tekst bude gramatički ispravan i razumljiv. Bitan je i sadržaj, njegova dubina i pouzdanost. Tim je želio da ispita šta se dešava kada se veliki jezički modeli treniraju na takvim niskokvalitetnim podacima. Fokusirali su se na uticaj na logičko zaključivanje, sposobnost izvlačenja relevantnih informacija iz dugih tekstova, etičnost odgovora i „ličnost” modela.

Rezultati su pokazali da što više sadržaja niske kvalitete modeli primaju, to više opada njihova sposobnost zaključivanja. U mješavinama gdje je dio podataka bio kvalitetan, loš uticaj se pojačavao kako je rastao udio površnih sadržaja. Modeli su davali pogrešne informacije, padali na pitanjima sa više ponuđenih odgovora i ispuštali logičke korake. Istraživanje, napominjem, još nije prošlo stručnu recenziju.

Tim je koristio milion javnih objava sa platforme X da bi trenirao nekoliko otvorenih AI modela, uključujući Meta-in Llama 3 i tri verzije Qwen modela kompanije Alibaba. Posebno je zanimljivo da je Llama, prije izlaganja lošim podacima, pokazivala osobine poput druželjubivosti, savjesnosti i otvorenosti. Međutim, kako je unosila sve više “toksičnih” podataka, te pozitivne karakteristike slabile su, dok su tamnije osobine poput psihopatskih tendencija postajale izraženije prema korištenim psihološkim testovima.

Ukratko – loši podaci čine AI lošijom, ne samo u tačnosti već i u „ponašanju”.

Očito i ovdje važi ona – druži se sa boljima od sebe da naučiš nešto i postaneš bolji, sa ravnima sebi, da se zajedno borite, a ne sa gorima od sebe.

 

Naslovna slika je kreirana pomoću alata GAI