Gemini 3.1 Pro: dubbelt så smart på tre månader
Google släpper Gemini 3.1 Pro med mer än dubblad resonemangsförmåga. Vi testade modellen med Teknikministeriets eget genombrottstest.

Tre månader. Så lång tid tog det för Google att mer än dubblera resonemangsförmågan i sin flaggskeppsmodell.
Gemini 3.1 Pro släpptes den 19 februari och markerar en ny rytm i Googles AI-utveckling. Tidigare har företaget uppgraderat sina modeller i 0,5-steg. Nu kommer ett 0,1-steg. Det är blygsamt med tanke på de språng den nya modellen tar inom vissa områden.
Siffrorna som sticker ut
På ARC-AGI-2, ett benchmark som testar abstrakt resonemang, når Gemini 3.1 Pro 77,1 procent. Föregångaren Gemini 3 Pro landade på 31,1 procent. Det är en ökning på 148 procent.
Mönstret upprepas. SWE-Bench Verified, ett kodförståelsetest, visar 80,6 procent. GPQA Diamond, som testar vetenskapligt resonemang, hamnar på 94,3 procent.
Men bilden är inte ensidig. På Humanity's Last Exam, ett test designat för att vara extremt svårt, hamnar Gemini 3.1 Pro på 44,4 procent. Det slår OpenAIs GPT 5.2 med god marginal (34,5 procent). Anthropics Claude Opus 4.6 når dock 53,1 procent med verktyg aktiverade.
Konkurrensen mellan toppmodellerna har aldrig varit jämnare.
Samma pris, mer kapacitet
Google håller prissättningen oförändrad: två dollar per miljon input-tokens och tolv dollar per miljon output-tokens för de första 200 000 tokens. Kontextfönstret rymmer en miljon tokens, vilket motsvarar ungefär 750 000 ord i en enda fråga.
Modellen finns som preview i Google AI Studio, Vertex AI och Gemini CLI. Prenumeranter på AI Pro och Ultra får tillgång via Gemini-appen och NotebookLM. Gemini 3.1 Pro bygger på Gemini 3 Deep Think som släpptes veckan innan. 0.1-steget signalerar att Google ökar leveranstakten.
Vi testade den själva
Benchmarks berättar bara halva historien. Vi ville se hur Gemini 3.1 Pro faktiskt resonerar när den ställs inför en öppen forskningsfråga utan facit.
Vi körde Teknikministeriets genombrottstest: en prompt som ber modellen identifiera det forskningsområde där ett paradigmskifte är närmast. Modellen ska motivera med specifik teknik, timing, det största hindret och en icke-uppenbar koppling till ett annat fält som kan accelerera genombrottet.
Gemini 3.1 Pro valde: AI-driven proteindesign
Modellen pekar på generativa diffusionsmodeller för biomolekyler som det område närmast ett paradigmskifte. Biologin håller på att transformeras från en upptäckande vetenskap till en ingenjörskonst. Grundmodeller som AlphaFold 3 och ESM3 har flyttat gränsen från strukturprediktion till faktisk skapelse av proteiner som aldrig existerat i naturen.
Det intressanta är inte bara valet utan resonemanget. Modellen identifierar "sim-to-real gap" som det största hindret: AI kan designa hundratusentals proteiner på minuter, men fysisk syntes och testning tar fortfarande månader.
Mest anmärkningsvärt är den icke-uppenbara kopplingen. Gemini 3.1 Pro drar en linje från kvantinformationsteori och tensornätverk till proteindesign. Om matematiska ramverk från kvantfysiken tillämpas på proteindesign, menar modellen, kan klyftan mellan simulering och verklighet krympa dramatiskt.
Det är den typen av tvärvetenskapligt tänkande som skiljer resonemang från mönsterigenkänning.
Vad det säger om takten
Gemini 3.1 Pro är inte bara en kapabel modell. Den är en signal om var AI-utvecklingen befinner sig. Dubblad prestanda på tre månader till samma pris.
Google har gått från att jaga OpenAI till att driva sin egen takt. För den som bygger med AI i produkter och tjänster innebär accelerationen att valet av modell blivit både enklare och svårare. Enklare för att alla toppmodeller nu presterar på hög nivå. Svårare för att det som var bäst förra kvartalet kan vara omsprunget innan kontraktet löper ut.
Gemini 3.1 Pro finns tillgänglig i preview via Google AI Studio.
