Zeleno i digitalno

Googleov Gemini 3 preuzima tron: preskočio GPT-5.1 i Claude 4.5

25. studenoga 2025.

Google Gemini AI

foto Shutterstock

Novi Googleov AI je u 24 sata privukao više od milijun korisnika, i na ključnim testovima gotovo udvostručio rezultate nad konkurentima

Dugo se čekalo da Google, div koji je praktički izumio tehnologiju na kojoj počivaju današnji jezični modeli, zada konačni udarac u trenutnom AI ratu. S lansiranjem modela Gemini 3, čini se da se taj trenutak dogodio. Kad objava novog AI modela u istom danu proizvede memove i dramatične objave tipa 'game over za konkurenciju', znate da se dogodilo nešto što industrija ne može ignorirati.

Upravo to se zbiva s Googleovim Gemini 3. modelom koji je predstavljen uz fanfare, i koji je u samo 24 sata privukao više od milijun korisnika i zasjeo na prvo mjesto LMArene, platforme koja služi kao neslužbeni, ali najutjecajniji arbitar kvalitete AI modela. Na toj je crowdsourcing platformi novi Gemini nadmašio konkurente u nizu standardnih testova.

No, ono što je posebno odjeknulo u poslovnoj zajednici nije samo statistika, već svjedočanstva industrijskih teškaša i rivala. Tako su svoje javne čestitke uputili i šef OpenAI-a Sam Altman kao i vlasnik xAI-a Elon Musk dok je šef Salesforcea Marc Benioff nakon par sati rada s modelom napisao da nakon tri godine s ChatGPT-om sada 'više nema povratka' jer je skok u brzini, rezoniranju i radu sa slikama i videom 'lud'.

Što Gemini 3 stvarno radi bolje

Prema LMAreni, Gemini 3 Pro ima jasnu prednost u nizovima 'stručnih' kategorija, od programiranja i matematike do kreativnog pisanja, a sposobnosti 'agentskog' kodiranja u nekim slučajevima nadmašuju i specijalizirane modele poput Claudea 4.5 ili OpenAI-evih najnovijih koderskih modela. U vizualnom razumijevanju slika drži prvo mjesto, a na tekstualnim zadacima prvi je probio prag od ~1500 bodova na njihovoj ljestvici.

Posebno odjekuje rezultat na 'ARC-AGI-2' benchmarku za kompleksno rezoniranje. Gemini 3, prema jednoj analizi, postiže gotovo dvostruko bolji rezultat od OpenAI-eva GPT-5 Pro, uz deset puta niži trošak po zadatku. Na SimpleQA testu, jednostavna pitanja, ali iz vrlo nišnih područja, Gemini 3 Pro postiže više nego dvostruko bolji rezultat u odnosu na GPT-5.1. Ukratko, model je jak u 'dubokom kopanju' po specijaliziranim temama, znanstvenim poljima i najnovijoj literaturi.

Za industriju koja se zadnjih mjeseci pitala jesu li veliki modeli došli blizu plafona, ovi brojevi izgledaju kao čvrst dokaz da prostora za napredak još ima i to uz sve niže troškove.

Novi korisnici

No, jedno je pobijediti na testovima, a sasvim drugo preoteti stvarne korisnike. U praksi je vrlo lako istrenirati model da briljira na uskom skupu benchmarkova, a da istovremeno padne na realnim, prljavim poslovnim zadacima. Iako je Gemini 3 vrlo impresivan i široko upotrebljiv model te predstavlja veliki skok u odnosu na Gemini 2.5., to ipak ne znači da će odmah zamijeniti konkurentske modele.

Programeri i inženjeri i dalje u velikoj mjeri ostaju na Claudeu za kodiranje, iako Gemini 3 na papirima izgleda konkurentno ili bolje. Jedan istraživač s Carnegie Mellona kaže da je model odličan', ali djeluje 'sirovo' u korisničkom iskustvu, te da ne prati uvijek upute onako precizno kao najbolji konkurenti. I iz Googlea priznaju da tek kroz realnu upotrebu vide gdje nastaju problemi i da će kasnije varijante biti 'ispeglanije'.

Bez pobjednika

Gemini 3 je ozbiljan skok za Google i vjerojatno trenutno najbolji univerzalni model za širok spektar zadataka, od kreativnog pisanja do rada sa slikama i videom. I to je dobro za korisnike jer pokazuje da se plafon modela može i dalje pomicati prema gore. A što je više takvih 'skokova' to će biti i veća mogućnost da ti modeli budu jeftiniji, fleksibilniji i bolje prilagođeni konkretnim poslovnim slučajevima.

U realnim organizacijama različite jedinice i dalje će koristiti različite modele za različite poslove. Cijene padaju, a mogućnosti rastu. Novi modeli nisu samo pametniji, nego i jeftiniji po zadatku, što otvara prostor za eksperimente koje si prije godinu dana nitko ne bi mogao priuštiti. Prednost je privremena. A utrka je takva da jedan mjesec vodi Google, drugi Open Ai, pa Anthropic ili netko četvrti.