Info

Vanja Škurić i Domagoj Marić (Comping): Kad je umjetna inteligencija u pitanju, važno je imati najbolje podatke

25. ožujka 2024.

Vanja Škurić i Domagoj Marić, Comping

Autor: Zvonko Pavić

Svaka industrija ima aspekt koji se može poboljšati i optimizirati primjenom strojnog učenja, tj. umjetne inteligencije općenito, bilo da je riječ o automatizaciji poslovnog ili nekog drugog procesa ili izradi digitalnog proizvoda specifične namjene.

Kojom vrstom umjetne inteligencije se bavite u Compingu i zašto?

Naš odjel za podatkovnu znanost i razvoj rješenja umjetne inteligencije dominantno se bavi prediktivnom analitikom, dijagnostikom prošlih događaja i ponašanja, a po potrebi, i izradom virtualnih asistenata. Riječ je o proširenju Compingovih projekata poslovnog izvještavanja primjenom alata umjetne inteligencije, strojnog – dubokog učenja i velikih jezičnih modela. Primjerice, umjetnu inteligenciju primjenjujemo u dijagnostici kvarova uređaja spojenima na našu platformu Interneta stvari (ThingsTalk), implementiranima na mreže za distribuciju energenata. Na taj način dolazimo do poslovnih i tehničkih uvida koji se ne mogu steći drukčijim, klasičnim, metodama, jer algoritmi strojnoga učenja analizom golemih količina podataka vide puno toga što se drugim tehnologijama ne može ustanoviti.

Imate li problema u stjecanju tako velikih količina podataka?

Količina i struktura podataka dosta ovise o industriji u kojoj se provodi projekt, a kako smo mi najviše angažirani u sektorima koji po prirodi svog poslovanja generiraju i pohranjuju velike količine podataka – to su tvrtke iz financijskog (banke i osiguranja), maloprodajnog, logističkog i energetskog sektora – nemamo problema s prikupljanjem dovoljne količine podataka za naše sustave umjetne inteligencije. Svaka industrija ima aspekt koji se može poboljšati i optimizirati nekim aspektom umjetne inteligencije, odnosno strojnoga učenja, bilo da je riječ o automatizaciji poslovnog ili nekog drugog procesa ili izradi digitalnog proizvoda specifične namjene.

KOMBINACIJA ALATA

Kada na konkretnome projektu modeliramo ponašanje pojedinih sustava u svrhu prediktivnih analiza, odabiremo one modele koji za konkretan slučaj daju najbolje rezultate. Odabir modela ovisi o prirodi problema, tj. tipu industrije i konkretnog poslovnog slučaja koji se želi modelirati, odnosno o količini, kvaliteti i kvantiteti dostupnih podataka. Odabir modela i njihova implementacija nisu jednosmjeran proces, već iterativan gdje na temelju dobivenih rezultata mijenjamo postavke i karakteristike samih modela, odnosno širimo lepezu modela tijekom ovoga procesa, u svrhu dobivanja što kvalitetnijih rezultata samih predikcija.

S druge strane, ako je potrebno brzo izvući korisne informacije iz novog zakona za svoje poslovanje, upotrebljavaju se jezični modeli. No, niste u mogućnosti uvijek koristiti, za tu svrhu, javno dostupne alate jer neke ustanove i tvrtke ne žele dijeliti podatke. Također, potrebno je paziti na lažno pozitivne rezultate kada koristite velike jezične modele, jer ne želite da vaš chatbot izazove reputacijsku štetu ili napravi pogrešku. Te situacije rješavamo korištenjem hibridnih pristupa, kombinirajući velike jezične modele s uputama za unos dobivenim iz tradicionalnih alata umjetne inteligencije. Koristimo sve dostupne velike jezične modele, odabirući najprikladniji za problem koji rješavamo. Neovisno o tome radi li se o generativnom ili tradicionalnom AI-ju, analiziramo vrstu podataka i prirodu problema (npr. fizikalni ili ekonomski), te odabiremo odgovarajući alat. Ako postignemo zadovoljavajuću točnost, koristimo taj model. U suprotnom, istražujemo i druge modele kako bismo pronašli rješenje.

Gdje, kako i koje velike jezične modele koristite u razvoju svojih UI rješenja?

Velike jezične modele (Large Language Model - LLM) koristimo u dvije svrhe – u samom procesu razvoja rješenja umjetne inteligencije, te kao komponentu u rješenjima koja izrađujemo za korisnike. Kad je riječ o razvoju pojedinog rješenja u nekom projektu, velike jezične modele kombiniramo s klasičnim chatbotovima kako bismo dobili hibridni i kontroliran pristup. U razvoju rješenja LLM-ovi nam služe kao alati pomoću kojih kodiramo specifične komponente.

PRIMJER IZ PRAKSE

Primjerice, na projektu na kojem upravo radimo, iz područja industrije energetike, odmah smo odabrali adekvatan model strojnog učenja pomoću kojega dobivamo solidna rješenja. U svrhu testiranja i unapređenja rezultata, postupak odabira i podešavanja postavki modela ponovili smo nekoliko puta. Na taj način, identificirali smo model koji nam je za određene podskupove podataka dao značajno bolje predikcije od ostalih, a njega inicijalno nismo ni razmatrali jer smo na temelju dosadašnjeg iskustva i njegovih karakteristika ponašanja zaključili da nije u mogućnosti dati dovoljno dobre rezultate. Drugim riječima, u primjeni umjetne inteligencije često se dogodi nešto što niste očekivali. Zato, svakom projektu pristupamo pragmatično - ne ograničavamo se samo na određene alate. Eksperimentiramo s više modela i pristupa, sve dok ne dođemo do najboljeg rješenja. Važno je naglasiti i specifičnosti industrija u kojima se tehnologija umjetne inteligencije primjenjuje. Mi radimo u sektorima koji su u pravilu visoko regulirani. Iz tog razloga, s posebnom pažnjom razvijamo naše alate za koje moramo biti sigurni da daju konzistentna rješenja. Poseban naglasak stavljamo na kvalitetu podataka s kojima radimo i koje unosimo u modele.

Što su najveći organizacijski i tehnološki izazovi s kojima se vaš odjel suočava u projektima implementacije tehnologija umjetne inteligencije kod vaših korisnika?

Kao i tradicionalni alati za obradu poslovnih izvještaja - kao što je poslovna inteligencija - i umjetna inteligencija se temelji na podacima. Zato je prvi izazov doći do pravih informacija. Uvijek to počinje razgovorom o tome koje podatke mi kao implementator rješenja trebamo vidjeti, a koje ne. Kad to riješimo, na red dolazi izazov tumačenja dostupnih informacija. To se razlikuje od projekta do projekta, od korisnika do korisnika. Imali smo klijente iz iste industrije, s identičnom djelatnošću, no s različitim softverskim sustavima, s drukčijom strukturom podataka i raznim pravilima izvještavanja.

SKLADIŠTE I KVALITETA IZVJEŠTAVANJA

Dosta je čest slučaj - i ne samo u Hrvatskoj - da poduzeće nema skladište podataka. Ili su ta skladišta podataka na razini koja nije zadovoljavajuća za upotrebu u tehnologijama umjetne inteligencije. Ili je u tom skladištu premalo podataka koji bi se mogli iskoristiti za umjetnu inteligenciju. Algoritmi strojnog učenja trebaju veliku količinu što raznovrsnijih, ali strukturiranih, podataka kako bi u njima mogli pronaći posebne odnose i izvući potrebne uvide. Važna je i kvaliteta softvera za poslovno izvještavanje, odnosno do koje razine izvještavanja je taj softver konfiguriran. Minimalan zahtjev za primjenu tehnologija umjetne inteligencije je da korisnik ima stalno održavano skladište dobro strukturiranih podataka i softver za poslovno izvještavanje koji svakodnevno, aktivno koristi za donošenje strateških odluka.

Koji su ciljevi odjela za umjetnu inteligenciju?

Comping, uz primjenu modela strojnoga učenja u rješavanju raznih poslovnih problema korisnika, planira pokrenuti i razvoj vlastitih rješenja utemeljenih na strojnom učenju i umjetnoj inteligenciji. Počevši od usluga, do kreiranja raznih novih digitalnih proizvoda. Uz to, do kraja godine završit ćemo i vlastito istraživanje tržišta – želimo ustanoviti koliko je tvrtki u Hrvatskoj doista spremno za opsežnu primjenu umjetne inteligencije. Treći cilj je ugraditi umjetnu inteligenciju u našu ThingsTalk platformu, za upravljanje mrežama interneta stvari.

Recimo da želim doći u vaš odjel za razvoj rješenja umjetne inteligencije: što moram znati i naučiti da biste me zaposlili? Koje vještine i znanja smatrate ključnima?

Osim tehničkog fakultetskog obrazovanja (FER, FOI, Strojarstvo, PMF, Algebra, itd.) i određene specijalizacije u podatkovnoj znanosti, morali biste dobro poznavati Python programski jezik. Taj jezik je danas alfa i omega umjetne inteligencije. Morate dobro poznavati njegovu sintaksu, no važniji od programiranja su strast za rad s podacima, logičko razmišljanje, vještina obrade i analize informacija. Takva kombinacija – dobro poznavanje programiranja i vještina analize podataka – dosta je rijetka. Zapošljavanje takvih osoba traži drukčiji pristup: upoznavanje na stručnim konferencijama, specijaliziranim online forumima i udru-gama, hackhatonima, itd. Nadamo se da ćemo i među Compingovim ovogodišnjim stipendistima pronaći bar dva dobra podatkovna znanstvenika koji će se kod nas razviti u vrhunske stručnjake za umjetnu inteligenciju.

Kakvu suradnju vaš odjel ima s akademskim institucijama ili istraživačkim centrima u području umjetne inteligencije? Kako to doprinosi vašem radu?

Comping već dugo godina, surađuje s tehničkim fakultetima u Hrvatskoj, počevši od FER-a, FOI-a, Algebre do ostalih. S kolegama na Fakultetu elektrotehnike i računarstva radimo na primjeni umjetne inteligencije u energetici, na jednom tekućem projektu. To su komercijalni i nekomercijalni projekti, a suradnju ćemo širiti i dalje. I na samom FER-u, a i s ostalim zainteresiranim akademskim ustanovama.

ETIKA UMJETNE INTELIGENCIJE

Što mislite o etičkim aspektima umjetne inteligencije, gledano generalno i kroz prizmu društvene odgovornosti vaše kompanije?

Etika je bitna tema za sve u području umjetne inteligencije. Ponekad je teško ustanoviti zašto je umjetna inteligencija zaključila nešto što je načelno neprimjereno. Načelno, u dizajnu sustava umjetne inteligencije važna je reprezentativnost podataka. U skupu podataka (datasetu) koji koristite ne smije biti nikakvih krajnosti i neravnoteža jer će se one poslije odraziti na same zaključke koje umjetna inteligencija donosi. Važno je imati dobre algoritme, no još je važnije imati bolje, dobro strukturirane podatke.

MENTORI UMJETNE INTELIGENCIJE

Mentori ste i na AI Business Hackhatonu koji Comping organizira s tvrtkom Dell – kakvi su dojmovi?

Nama je to iznimno zanimljivo događanje, a najviše nas zanimaju ideje koje će timovi osmisliti i predstaviti. Želimo vidjeti kakve će se sve ideje pojaviti.. Prijavilo se gotovo pedeset timova, pa će, nadamo se, i inovativnih ideja o primjeni umjetne inteligencije u svakodnevnom poslovanju biti sasvim dovoljno. Nama dvojici javilo se već nekoliko timova, uglavnom iz „težih” industrija. Uglavnom, očekujemo da će neke od dobrih ideja ući i u sljedeću fazu, možda u neki novi hackhaton u kojem bi se pokazale najbolje implementacije tih ideja.