Aktualno
StoryEditor

Googleov Deep Mind AI ovladao ‘pamćenjem‘

16. Ožujak 2017.

Kompanija DeepMind, lider u području umjetne inteligencije (Artificial intelligence, skraćeno AI ), razvila je sustav koji može igrati Atari igre u kojima može pobijediti i osvojiti više bodova od ljudi. Ipak, takva umjetna inteligencija nije bila u stanju naučeno primijeniti na drugoj igri.

Prije je za svaku Atari igru trebalo stvoriti zasebnu neuronsku mrežu jer isti sustav nije mogao igrati, recimo, igru Space Invaders a zatim se prebaciti na Breakout.

Kompanija je u suradnji s timom istraživača sa sveučilišta Imperial College London stvorila algoritam koji omogućuje neuronskim mrežama da uče i zadrže informacije kako bi ih ponovno iskoristile.

-Donedavno smo imali razvijen sustav koji je mogao naučiti igrati bilo koju igru, ali je samo jedna igra bila u pitanju. Sada je riječ o sustavu koji može naučiti igrati nekoliko igara jednu za drugom, rekao je James Kirkpatrick, glavni autor istraživačkog rada, prenosi portal Wired.

>>>Umjetna inteligencija: Poduzetnici ulaze u novu dimenziju delegiranja poslova pametnijima

Rad je objavljen u časopisu Proceedings of the National Academy of Sciences, a u njemu je objašnjeno kako DeepMind-ova umjetna inteligencija može učiti u sekvencama koristeći nadzirano učenje i testove pojačanja.

- Sposobnost uspješnog učenja zadataka bez zaborava je osnovna komponenta biološke i umjetne inteligencije, piše u radu.

Kirkpatrick je objasnio kako je značajan nedostatak neuronskih mreža i umjetne inteligencije njihova nesposobnost da prenesu znanje s jednog zadatka na drugi. Razvojni tim je uočio kako sustav nije bio u stanju primijeniti kontinuirano učenje temeljeno na sinaptičkoj konsolidaciji, a u ljudskom mozgu taj proces je opisan kao osnove učenja i pamćenja.

>>>Uvođenje digitalnih tehnologija u poslovanje nije isto što i digitalna transformacija

Kako bi AI sustavi mogli memorirati, istraživači su razvili algoritam pod nazivom ‘elastična masa konsolidacije‘ (elastic weight consolidation, EWC). Dotični algoritam koristi zapamćene informacije da uspješno odigra jednu igru, a zatim najkorisnije dijelove prenosi u drugu igru.

Prilikom testiranja algoritma, korištene su duboke neuronske mreže nazvane Deep Q-Network (DQN) koje su ranije služile za svladavanje Atari igara, a sada su pojačane EWC algoritmom.

Algoritam i neuronske mreže testirane su na desetak Atari igara koje su odabrane nasumičnom selekcijom, a u kojima AI već dokazao da može odigrati bolje od ljudi.

Svaka igra odigrana je 20 milijuna puta prije nego je sustav automatski prešao na sljedeću igru. Prije toga, DQN je morao naučiti igrati svaku igru posebno.

>>>Osam ključnih tehnologija kojima bi se poduzeća trebala pozabaviti

Sustav nije savršen

U radu piše i kako je proširenjem DQN sustava s EWC-om, omogućeno da nauči igrati više igara u slijedu bez rizika od katastrofalnog zaboravljanja.

U suštini, duboka neuronska mreža pomoću EWC algoritma u stanju naučiti igrati jednu igru, a zatim naučeno prenijeti u druge igre.

Ipak, sustav nije savršen. Iako je u stanju učiti iz svojih prethodnih iskustava i zadržati najkorisnije informacije, nije u stanju to obavljati jednako efikasno kao neuronska mreža koja igra samo jednu igru.

-U ovom trenutku smo prikazali sekvencijalno učenje, no nismo dokazali da je efikasnost učenja poboljšana. Naši sljedeći koraci bit će usmjereni na to da pokušamo iskoristiti sekvencijalno učenje kako bi poboljšali učenje u uvjetima stvarnog svijeta.

22. studeni 2024 05:51