
Grubost prema AI-ju povećava točnost odgovora za četiri posto

Umjetna inteligencija, AI, direktor
Novo istraživanje s Penn Statea otkriva neobičan fenomen: AI asistenti poput ChatGPT-a preciznije odgovaraju na neuljudne upite
Ljubaznost je možda vrlina u ljudskim odnosima, no kada je riječ o komunikaciji s umjetnom inteligencijom, učinkovitost bi mogla biti sasvim suprotna. Najnovije istraživanje s Penn State sveučilišta donosi neočekivane rezultate koji bi mogli promijeniti način na koji razgovaramo s AI asistentima.
Studija 'Mind Your Tone' autora Oma Dobariye i Akhila Kumara pokazuje da neuljudni upiti dosljednog postižu bolje rezultate od ljubaznih prilikom postavljanja pitanja velikim jezičnim modelima. Konkretno, 'vrlo grubi' upiti proizveli su točne odgovore u 84,8 posto slučajeva, dok su 'vrlo ljubazni' postigli 80,8 posto točnosti.
Preokret u odnosu na ranije nalaze
Ovi rezultati izravno proturječe ranijim istraživanjima iz 2024. godine koja su sugerirala da AI modeli oponašaju ljudske društvene norme i nagrađuju pristojnost. Studija 'Should We Respect LLMs?' zaključila je da neuljudni upiti često smanjuju učinkovitost modela, dok pretjerana ljubaznost nije donosila jasne prednosti.
Penn State istraživači proveli su opsežan eksperiment s 250 prompta nastalih preoblikovanjem 50 osnovnih pitanja iz područja matematike, znanosti i povijesti. Svako pitanje formulirano je u pet tonalitetnih razina, od 'vrlo ljubazno' do 'vrlo grubo', a zatim postavljeno ChatGPT-4o modelu.
Zašto direktnost pobjeđuje?
Jedno od mogućih objašnjenja leži u samoj strukturi ljubaznih poruka. Fraze poput 'Možete li mi, molim vas, reći...' unose dodatnu lingvističku složenost i potencijalnu dvosmislenost. Nasuprot tome, direktan zahtjev 'Reci mi odgovor' eliminira suvišne elemente i AI-ju pruža jasniju namjeru.
Dakle, iste riječi koje olakšavaju međuljudsku komunikaciju mogu zakomplicirati strojnu logiku. Noviji AI modeli, čini se, više ne funkcioniraju kao društvena ogledala već kao striktno funkcionalni sustavi koji prioritiziraju direktnost nad pristojnošću.
Promjena paradigme
Istraživanje podupire nedavne nalaze Wharton School of Businessa o važnosti prompt inženjeringa, odnosno vještine preciznog formuliranja upita za postizanje boljih AI rezultata. Ton koji je dugo smatran nevažnim se (barem za sada) pokazuje gotovo jednako značajnim kao i sam odabir riječi.
Kalifornija je u međuvremenu postala prva američka država koja je uvela eksplicitna pravila za AI 'companion' chatbotove, zahtijevajući da se identificiraju kao umjetna inteligencija i ograničavajući razgovore o osjetljivim temama s maloljetnicima.
Premda studija još nije prošla recenzijski proces, već izaziva rasprave među stručnjacima koji u njoj vide znak da će budući modeli možda trebati društvenu kalibraciju, ne samo tehničko usavršavanje. CEO OpenAI-ja Sam Altman ranije je upozorio da govorenje 'molim' i 'hvala' ChatGPT-u predstavlja gubljenje vremena i novca, a čini se da je bio u pravu.