Vedrana Pribičević: Veliki jezični modeli nisu inteligencija
Njihova 'inteligencija' je statistička regularnost, a ne razumijevanje, pa sve veći modeli daju sve manje pouzdanosti
Piše: Vedrana Pribičević, ZŠEM
Intenziviranje rasprave o umjetnoj inteligenciji i njezinim ekonomskim učincima u hrvatskome javnom prostoru zahtijeva preciznije razgraničenje pojmova. U dominantnome diskursu veliki jezični modeli često se tretiraju kao sinonim za umjetnu inteligenciju u cjelini, pa takva redukcija zamagljuje ključnu razliku između statističkih sekvencijskih modela i sustava s postojanom internom reprezentacijom svijeta.
U tehničkom su smislu LLM-ovi (engl. large language models, veliki jezični modeli) modeli za predviđanje sljedećega tokena uvjetovanoga kontekstom. Oni ne posjeduju eksplicitne kauzalne strukture i stabilne modele fizičke i društvene realnosti. U tom smislu njihova je 'inteligencija' funkcija statističke regularnosti, a ne razumijevanja, stoga daljnje povećavanje veličine modela donosi opadajuće prinose kad je riječ o postojanosti, pouzdanosti i dugoročnom planiranju.
