Česti medijski napisi o novim i sve složenijim primjenama umjetne inteligencije stvaraju dojam da je vrlo blizu trenutak dominacije računala nad ljudima. Naime, na temelju informacija o pojedinačnim dostignućima u primjeni ove tehnologije – poput pobjede Deep Blue računala nad šahovskim prvakom Garryiem Kasparovim i kasnije dominacije računalnog programa u igri Go, a onda i sve češćih napisa o uspjesima u razvoju autonomnih vozila ili naprednom i preciznom prepoznavanju bolesti prije nego se ona manifestira – lako je povjerovati da je umjetna inteligencija najnovija tehnologija koja strelovito napreduje na svim poljima i da su njeni dosezi neograničeni.
Ipak, tehnologija umjetne inteligencije nije nova. Pojavila se pedesetih godina prošlog stoljeća i već onda je najavljivana njena brza dominacija nad ljudima. Ipak, kako povijest pokazuje, trenutak dominacije se neprestano odgađao. Čini se da vodeći znanstvenici i futuristi, dosezanje ljudske razine inteligencije, od pedesetih godina prošlog stoljeća pa do danas, neprestano smještaju dvadeset godina u budućnost. S druge strane, neki stručnjaci smatraju da se ne radi odgađanju zbog pogrešnih procjena, nego da “ljudski” prag uopće ne može biti dostignut. Oni vjeruju da računalna tehnologija nema predispozicije za inteligenciju ljudskog tipa pa je očito je da postoji ozbiljno međusobno neslaganje u procjenama i očekivanjima.
Drastično neslaganje u percepciji doživio je i Douglas Hofstadter, američki znanstvenik, fizičar i pisac te autor knjige “Gödel, Escher, Bach” – kultne u redovima istraživačima umjetne inteligencije, na predavanju koje je prije nekoliko godina održao pred djelatnicima Googlea. Naime, predavaču i svim sudionicima je postalo je jasno da čak i među stručnjacima, izravno uključenima u stvaranje umjetne inteligencije, postoji potpuno različiti doživljaj njenog trenutnog statusa, očekivanog dosega i reperkusija razvoja. Dok je Douglas Hofstadter bio zabrinut, čak i užasnut mogućnošću da umjetna inteligencija dosegne ili prestigne ljudsku, Googleovi inženjeri su tu mogućnost doživljavali kao vrlo vjerojatnu i po ničemu posebno zabrinjavajuću posljedicu svog svakodnevnog rada.
Saznanje o tako drastično suprotstavljenim doživljajima iste tehnologije bio je neposredni motiv da Melanie Mitchell, asistentica Douglasa Hofstadtera, 2019. godine napiše knjigu “Artificial Intelligence”. Njena glavna intencija je bila potražiti istinu – napreduje li umjetna inteligencija tako brzo da će vrlo skoro prestići ljudsku – ili taj trenutak još nije na vidiku, a možda neće niti nastupiti.
Radi se o izuzetno zanimljivoj knjizi, bogatoj sadržajem koji nije samo tehnički, već se bavi i psihologijom – uspoređujući ljudsku s umjetnom inteligencijom, a dijelom i sociologijom, odnosno utjecajem razvoja umjetne inteligencije na društvo.
Knjiga na sistematičan, čak i tehničkom laiku na pristupačan način, raščlanjuje pojam umjetne inteligencije na tehnološke komponente koje trenutno nalazimo u primjeni pa analizira njihove dosege kao i dosege koje možemo očekivati u doglednoj budućnosti. Osim što, radi dubljeg razumijevanja teme, ovu tehnologiju opisuje na funkcionalnom nivou – govoreći o principima i načinu na koji djeluje, mnogo truda ulaže i u rasvjetljavanje razlika u funkcioniranju umjetne i “prirodne” inteligencije pa na temelju tih razlika procjenjuje dosege daljeg tehnološkog razvoja.
Umjetna inteligencija oduvijek izaziva kontroverze. Nekoliko je puta u povijesti doživljavala intenzivni procvat koji je otvarao vrata financijskim injekcijama, nakon čega je slijedilo otrežnjenje u obliku izostanka primjena koje bi ekonomski opravdale tolike investicije. Najprije se to desilo sa simboličkom umjetnom inteligencijom i ekspertnim sustavima iz sedamdesetih pa tehnologijom prepoznavanja uzorka osamdesetih, da bi u prvom desetljeću ovog stoljeća ponovo zavladala euforija ubrzanog razvoja i sve većih očekivanja na valu uspjeha dubokih neuronskih mreža i strojnog učenja. Zbog takvih naglih skokova i padova, poželjno je kritički razmotriti sadašnju situaciju ne bi li pronašli odgovor na pitanje jesmo i pred novim “zahlađenjem” ili možemo očekivati nastavak rasta, a možda i ubrzano dostizanje ili prestizanje opće ljudske inteligencije.
Da bi mogli razumjeti trenutni doseg – autorica započinje opis s danas vrlo popularnom i široko primjenjivom tehnologijom prepoznavanja slike. Prve primjene započinju sredinom prošlog stoljeća, najprije s pokušajem simboličkog prepoznavanja unaprijed definiranih objekata, preko “jednoslojnog” prepoznavanja rasporeda svijetlih i tamnih točaka do najmodernije “deep network” višeslojne tehnologije s povratnom vezom (back propagation) – čiji trenutni dosezi su, uspoređujući ih s onim ranijima pa čak i ne tako davnima – od prije desetak godina, zapanjujući.
No, kako se vidi iz tehničkih opisa navedenih u knjizi, radi se o prepoznavanju koje nema karakteristike ljudskog. Temeljeno je na vođenom (supervised) učenju kod kojeg sustav uči prepoznati objekte na slici temeljem unaprijed provedene “ljudske” kategorizacije sličnih objekata na mnoštvu različitih slika. No, kako računalo ne prepoznaje kontekst, već prepoznaje samo zajedničke – karakteristične detalje objekata koji se ponavljaju na slikama korištenima za učenje – tako nema mogućnost prepoznati “skrivene” informacije čiji je prikaz djelomično izostavljen ili sakriven. Na primjer – čovjek se neće zabuniti u prepoznavanju psa koji je djelomično zaklonjen ogradom ili koji je nesrazmjerno malih dimenzija u odnosu na druge objekte, dok su za računalo to ozbiljne poteškoće.
Također, na temelju primjera iz knjige, jasno se može uočiti da je prepoznavanje objekata na složenim fotografijama posebno veliki izazov. Računalo, naime, ne može dokučiti sve informacije sadržane na slici. Ono nema potrebnu širinu uvida za “čitanje” informacija iz konteksta. Ovaj problem je posebno izražen u prepoznavanju objekata u sustavima za navođenje autonomnih vozila. Čovjek će, osim situacije, intuitivno prepoznati i izvanredne objekte, kao i namjeru sudionika u prometu. To je jedan od razloga zbog kojeg još ne postoje potpuno autonomna vozila. Od definiranih pet stupnjeva autonomije – trenutno smo dosegli treći – autonomno vožnja u određenim uvjetima (na primjer na autoputu), uz aktivni nadzor vozača. Doduše, postoje sustavi koji se predstavljaju kao vozila četvrtog stupnje autonomije, što je vožnja bez asistencije vozača u određenim okolnostima – ali za sada je taj stupanj moguće demonstrirati samo u vrlo kontroliranim uvjetima i dobro poznatom, odnosno “stabilnom” okruženju bez neočekivanih situacija.
Primjer iz knjige prikazuje moguću situaciju koju sustav umjetne inteligencije vrlo teško ili nikako ne može razumjeti. Da bi autonomno vozilo moglo u ovakvoj situaciji ispravno reagirati, navigacijski sustav bi morao razumjeti razliku između fizike kretanja živih i neživih objekata, imati sposobnost modeliranja mentalnih stanja sudionika na temelju kojih bi procijenio njihove namjere a onda i predvidio najvjerojatniji razvoj događaja.
Autonomna vozila ali i brojne druge primjene koje djeluju u promjenjivim okolnostima, osim o prepoznavanju objekata u okruženju, značajno ovise i o tehnologiji strojnog učenja. Radi se ne-nadziranom (unsupervised) učenju, kod kojeg sustav uči bez stalnog ljudskog nadzora. Nova dostignuća u razvoju umjetne inteligencije, nastala kao posljedica razvoja i primjene višeslojnih neuronskih mreža te brzog napretka računalne tehnologije, značajno su ubrzala istraživanja na ovom području. Jedan od dokaza uspješne primjene je bila pobjeda Alpha Go algoritma u dvoboju sa osamnaesterostrukim Go prvakom Lea Sedol-om, 2016. godine kod kojeg je sustav samostalno pronalazio “najbolje” poteze djelomično na temelju učenja iz iskustva postojećih, ranije odigranih partija. Za mnoge je ovo bio dokaz da je umjetne inteligencije dosegla stupanj ljudske.
Ipak, treba biti oprezan s takvim tvrdnjama. Istina, radi se o obliku strojnog učenja koje kombinira nekoliko tehnika i koje znanje igre postiže bez ljudskih uputa ili nadzora. Međutim – igra Go, kao i šah, a zapravo kao i sve računalne igre – vrlo su pogodne za primjenu algoritama strojnog učenja. Radi se o ograničenom, iako ponekad izrazito širokom broju opcija čija količina za čovjeka predstavlja kognitivni problem, dok se računalo s time dobro nosi. S druge strane, neki oblici inteligencije i ponašanja u nepoznatim situacijama su za računala potpuno nedokučiva, dok su za čovjeka lagana i zabavna. Jedna od igara, na primjer, koja za umjetnu inteligenciju može predstavljati nepremostivu prepreku je igra pantomime (Sharade). Ta igra je posebna po tome što je izrazito oslonjena na kontekst, asocijacije i poopćenja – a način prezentacije nije unaprijed određen ili ograničen, čemu su sustavi umjetne inteligencije slabo prilagođeni.
Ipak, najsloženiji problem – možda zato što se izravno bavi smislom – je razumijevanje govora. Može se reći da je to, zapravo, sljedeća stepenica u primjeni umjetnine inteligencije. Nije bezrazložno već i Alan Touring, pionir u oblikovanju ideje umjetne inteligencije, u konceptu igre imitiranja (imitation game) predložio jezik kao alat u prepoznavanju ljudske razine inteligencije.
Radi se tehnologiji pri kojoj računalna obrada prirodnog jezika (NLP) objedinjuje različite tehnike i alate za prepoznavanje govora, pretraživanje teksta u slobodnoj formi, analizi slobodno izgovorenih ili napisanih pitanja i pronalaženju adekvatnih odgovora, kao i u prevođenju tekstova napisanih jednim jezikom u tekst na drugom.
Osim što se primjenjuje vrlo napredna tehnologija dubokog učenja, prepoznavanja uzoraka u kombinaciji sa strojnim učenjem (deep learning), ona se mora prilagoditi i otežanim okolnostima promjenjive dužine rečenice. Naime, sliku je moguće normirati na neku standardnu veličinu pa alate za analizu prilagoditi tom standardu. U analizi rečenice – to nije moguće. Također, postoji i tehnička poteškoća transkodiranja izgovorenog u zapis, jer su vrlo česte primjene prepoznavanja izgovorenog teksta koji se onda analizira i uspoređuje sa zapisanim informacijama.
Iako su prva tehnička rješenja naginjala simboličkom pristupu analizi, slično kao i kod prepoznavanja objekata – a to znači prepoznavanje značenja na temelju unaprijed kodiranih pravila – taj pristup je napušten zbog slabih rezultata. Moderni algoritmi se baziraju na tehnologiji dubokog učenja – prepoznajući riječi iz standardnog rječnika te uspostavljajući njihov međusobni odnos u mnogo dimenzionalnom semantičkom prostoru. Taj postupak se provodi analizom velikog broja tekstova – te prepoznavanje međusobne povezanosti kao i smislene “udaljenosti” između riječi. No, uspostava odnosa među riječima je tek preduvjet prepoznavanja značenja. Da bi moderni NLP (Natural Language Processing) sustav mogao prepoznati značenje neke rečenice – pa iz toga zaključiti o raspoloženju u rečenici, kontekstu opisanog događaja, subjektu, objektu ili radnji – potrebno je prepoznati položaj vektorske interpretacije svake riječi u semantičkom prostoru te omogućiti sukcesivnu analizu rečenice – dio po dio.
Ipak, prema nekim procjenama na ovaj način se može analizirati i prepoznati smisao teksta u 90% slučajeva, dok je za ostatak potrebno znatno više. Naime, NLP sustavi se teško snalaze u složenim rečenicama ili dužim tekstualnim odlomcima. U takvoj analizi je potrebno stvarno razumijevanje konteksta – što se od računala, za sada, ne može očekivati.
Možda je u javnosti najuočljiviji napredak primjene umjetne inteligencije u obradi jezika primijećen nakon 2016 godine na području strojnog prevođenja. I ta tehnologija se bazira na dubokom učenju – i to na temelju usporedbe identičnih višejezičnih tekstova koji su nastali za potrebe državne administracije u zemljama gdje se službeno primjenjuje više jezika. Iako su tehnike koje uspoređuju tekstove, pa dekonstruiraju rečenice iz jednog i naknadno konstruiraju u drugom jeziku vrlo napredne i moćne, i one pate od nedostatka stvarnog razumijevanja – što je posebno vidljivo kod smislenih razlika koje nastaju prevođenjem teksta u jednom, pa povratno u drugom smijeru.
Uglavnom, izostanak razumijevanja konteksta je ograničenje tehnologije koje se manifestira u svim oblicima primjene umjetne inteligencije. Čini se da čovjek ima niz evolucijom razvijenih karakteristika koje mu daju prednost nad umjetno razvijenom inteligencijom.
Naime, čovjek od rođenja ima urođenu intuitivno razumijevanja fizike objekata, kao i biologije – u smislu razlikovanja živog i neživog te naprednu sposobnost stvaranja vlastitih i tuđih mentalnih modela – pa onda i prepoznavanja namjera te simuliranja, odnosno predviđanja budućih događaja. Dodatno, posebno važna ljudska osobina je mogućnost prepoznavanja biti (srži) nekog konteksta. Naime, gotovo svi procesi na kojima se zasniva ljudsko zaključivanje ovise o izdvajanju bitnog – od kategorizacije, prepoznavanja sličnog, generalizacije do podsjećanja (prepoznavanja iskustva). Posebno je važna mogućnost proširena mogućnost prepoznavanja – u smislu prepoznavanja analogija i metaforičkog razmišljanja.
Na slici je primjer s wikipedije, na kojem su s lijeve strane koveksni objekti, a s desne strane su konkavni – što današnji sustavi umjetne inteligencije – osim ako nisu prilagođeni točno toj vrsti problema, ne mogu zaključiti
Intuitivna fizika i biologija, te prepoznavanje bitnog, kao i mogućnost modeliranja i predviđanja su to “duboko” ljudske osobine. Njih ne nalazimo u tehnologiji prepoznavanja uzoraka ili objekata, strojnog učenja pa niti u kombinaciji metoda u prepoznavanju i obradi govora. U pojedinačnim, trenutnim primjenama možda nisu niti potrebne. Moguće je da će sužavanjem okvira u kojem djeluje i daljim napretkom tehnologije, postojeća umjetna inteligencija rješavati sve više konkretnih problema, bez da se natječe s ljudskom.
Ipak, da bi algoritam koji pobjeđuje šahovske velemajstore naučio igrati Go ili da bi algoritam za upravljanje autonomnim vozilom zaigrao šah – bit će potrebna potpuno nova vrsta umjetne inteligencije, a takve trenutno nema na vidiku.
Melanie Mitchell is a professor of computer science at Portland State University. She has worked at the Santa Fe Institute and Los Alamos National Laboratory. Her major work has been in the areas of analogical reasoning, complex systems, genetic algorithms and cellular automata, and her publications in those fields are frequently cited.
She received her PhD in 1990 from the University of Michigan under Douglas Hofstadter and John Holland, for which she developed the Copycat cognitive architecture. She is the author of “Analogy-Making as Perception”, essentially a book about Copycat. She has also critiqued Stephen Wolfram’s A New Kind of Science and showed that genetic algorithms could find better solutions to the majority problem for one-dimensional cellular automata. She is the author of An Introduction to Genetic Algorithms, a widely known introductory book published by MIT Press in 1996. She is also author of Complexity: A Guided Tour (Oxford University Press, 2009), which won the 2010 Phi Beta Kappa Science Book Award, and Artificial Intelligence: A Guide for Thinking Humans (Farrar, Straus, and Giroux).