Tragikomedije

Sintetička populacija: Simulacija se potvrđuje simulacijom

Kampanja je bila uspješna, a prodaja stagnira?! Dobro došli u zamku sintetičkih podataka! Veliki jezični modeli katkad fundamentalno pogrešno razumiju društvenu stvarnost

U suvremenome poslovnom okružju organizacije su pod pritiskom rezanja troškova, a istodobno moraju povećavati učinkovitost. U takvome svijetu u kojemu se tržišni trendovi mijenjaju svakoga tjedna odluke se moraju donositi brže nego ikada, a da bi se donosile dobre odluke, potrebni su snažni podaci. Međutim, upravo tu nastaje paradoks jer tradicionalno istraživanje tržišta gubi bitku s vremenom i proračunima, posebno na fragmentiranim i nišnim terenima, a metodologija doseže limite. I strogi standardi zaštite podataka ostaju nezaobilazna zapreka koja dodatno otežava brzo testiranje hipoteza.

Upravo u tom procijepu između potrebe za brzinom i proračunskim ograničenjem sintetičke populacije pojavljuju se kao nužan i vrijedan suputnik klasičnim metodama istraživanja tržišta. A danas, kada je umjetna inteligencija dosegnula razinu na kojoj može uvjerljivo simulirati ljudsko ponašanje, stajalište i reakcije, otvaraju se vrata posve novim pristupima u istraživanju tržišta, od digitalnih dvojnika koji statistički oponašaju stvarne potrošače do sintetičkih populacija koje zamjenjuju tradicionalne ankete i fokus-skupine.

No, kako upozorava dr. sc. Karlo Knežević, head of AI u tvrtki Sofascore, upravo ta sposobnost simulacije postavlja neka od najvažnijih pitanja digitalne ekonomije: Gdje završava korisna aproksimacija, a počinje opasna iluzija?

– Odgovori na to pitanje odredit će ne samo budućnost marketinga nego i kvalitetu informacija na kojima temeljimo poslovne, regulativne i društvene odluke – tvrdi Knežević.

Fotokopija fotokopije

Upravo ondje gdje tehnologija otvara nove mogućnosti, pojavljuju se i nova ograničenja. Jedno od najvažnijih pitanja koje se danas postavlja jest ono o dugoročnoj kvaliteti podataka na kojima takvi sustavi počivaju. Odnosno, što se događa u trenutku kada modeli počnu učiti iz sadržaja koji su generirali drugi modeli, a ne iz stvarnih ljudskih odgovora?

Sintetička populacija, tj. umjetno generirani, ali statistički utemeljeni dvojnici stvarnih stvari i korisnika koji se upotrebljavaju za simulacije, testiranja i predviđanja u istraživanju tržišta, itekako su isplativi jer omogućuju brže i jeftinije testiranje scenarija bez invazivnog prikupljanja informacija. No to što je već više od pola interneta sintetičko, umjetno stvoreno, izaziva dvojbe jesu li doista korisni

Knežević kaže da to pitanje pogađa u srž jednog od najozbiljnijih tehničkih problema današnje umjetne inteligencije, poznatoga kao 'kolaps modela'. Upozorava na to kako tehnički rizik postaje sve veći kako generativni sustavi preplavljuju digitalni prostor. Kao primjer navodi istraživanje objavljeno 2024. u časopisu Nature koje je pokazalo da generativni modeli koji iterativno uče iz vlastitih rezultata postupno gube raznolikost i reproduciraju sve uži spektar obrazaca.

– Pojednostavnjeno rečeno, model koji uči od drugogA modela nalikuje na fotokopiju fotokopije. Svaka sljedeća generacija ​bljeđa je od prethodne – objašnjava Knežević.

BESPLATNO nastavite čitati ovaj članak
Registrirajte se bez troškova i otvorite vrata Liderova sadržaja. Prvih 5 zaključanih članaka vam poklanjamo svaki mjesec.
Lider digital
čitajte lider u digitalnom izdanju