Hoppa till huvudinnehåll

Gemini 3.5 Flash: Googles snabbaste agentiska modell

Google lanserade Gemini 3.5 Flash på I/O 2026, en modell som överträffar Gemini 3.1 Pro på agentiska och kodningsrelaterade benchmarktester samtidigt som den kör fyra gånger snabbare än konkurrenterna.
Uppdaterad 19 maj 2026  · 8 min läsa

Google tillkännagav Gemini 3.5 Flash på I/O 2026 den 19 maj, en modell som slår Gemini 3.1 Pro på agentiska och kodningsrelaterade benchmarktester samtidigt som den kör fyra gånger snabbare än andra toppmodeller i samma nivå.

Lanseringen kommer i en tid då AI-branschens konkurrensfokus har förflyttats tydligt mot agentisk prestanda. Kodningsagenter, flerstegs arbetsflödesautomatisering och uppgifter med lång horisont har blivit de främsta slagfälten, och Google positionerar 3.5 Flash som sitt svar på den utvecklingen.

För alla typer av yrkesverksamma, inklusive data scientists, ML-ingenjörer och utvecklare, spelar detta roll eftersom 3.5 Flash nu (eller inom kort) är standardmodellen i Gemini-appen och AI-läget i Sök, och den finns tillgänglig redan idag via Gemini API. I den här artikeln går jag igenom vad som tillkännagavs, vad som sticker ut, benchmarksiffrorna och vad det betyder för ditt arbete.

Vad är nytt med Gemini 3.5 Flash

Det främsta budskapet med Gemii 3.5 Flash är hastighet kombinerad med prestanda på toppnivå. Google säger att 3.5 Flash är fyra gånger snabbare i utdata-token per sekund än andra toppmodeller, samtidigt som den överträffar Gemini 3.1 Pro på de benchmarktester som är viktigast för agentiskt arbete.

På Terminal-Bench 2.1 får den 76,2 %. På GDPval-AA når den 1 656 Elo. På MCP Atlas når den 83,6 %. För multimodal förståelse får den 84,2 % på CharXiv Reasoning.

Kort sagt innebär dessa siffror att den gamla regeln ”snabb, billig eller smart – välj två” är mindre tillämplig inom AI. Vi får en lättviktig modell som klarar komplexa, flerstegade agentarbetsflöden utan massiv latens.

Google säger att modellen blir allmänt tillgänglig idag i Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform och Gemini Enterprise. Den är också ny standardmodell i Gemini-appen och AI-läget i Sök globalt.

Google meddelade också att Gemini 3.5 Pro är under utveckling, redan används internt och förväntas rullas ut nästa månad. Lanseringen av 3.5 Flash är öppningsdraget i vad Google kallar en ny modelfamilj byggd kring agentisk exekvering.

Bakgrund till Gemini 3.5

Gemini 3-serien etablerade Googles nuvarande position i racet om toppmodeller. Gemini 3.1 Pro, som släpptes i februari 2026, toppade Artificial Analysis Intelligence Index vid lanseringen och fick 77,1 % på ARC-AGI-2, mer än en fördubbling av Gemini 3 Pros 31,1 % på det benchmarktestet.

Som vi tog upp i vår jämförelse mellan GPT-5.5 och Gemini 3.1 Pro låg Gemini 3.1 Pros styrka i komplex visuell slutledning och multimodala uppgifter.

Namngivningen Flash i Gemini-familjen har alltid signalerat hastighetsoptimerade modeller. Det som skiljer 3.5 Flash är att Google hävdar intelligens på toppnivå i Flash-hastigheter, inte en kvalitetskompromiss. Artificial Analysis-indexet placerar 3.5 Flash i den övre högra kvadranten (enligt Google), vilket betyder hög intelligens och hög utdatahastighet samtidigt.

Antigravity-selen, Googles ramverk för att distribuera samarbetande subagenter, är central för hur 3.5 Flash positioneras. Det är inte bara en fristående modell utan en komponent i en multiagentarkitektur som Google har byggt parallellt med själva modellen.

Viktiga funktioner i Gemini 3.5

Här är en genomgång av den mest intressanta informationen från tillkännagivandet.

Benchmarkprestanda

Googles benchmarkpåståenden för 3.5 Flash är konkreta och värda att granska direkt. Modellen överträffar Gemini 3.1 Pro på följande:

  • Terminal-Bench 2.1: 76,2 % (Gemini 3.1 Pro testades på Terminal-Bench 2.0 med 68,5 %, enligt vår tidigare bevakning)
  • GDPval-AA: 1 656 Elo (Claude Opus 4.7 ledde detta benchmark med 1 753 Elo vid lansering, enligt vår recension av Claude Opus 4.7 vs Gemini 3.1 Pro)
  • MCP Atlas: 83,6 % (Gemini 3.1 Pro fick 73,9 % på MCP Atlas i våra tidigare tester)
  • CharXiv Reasoning: 84,2 % för multimodal förståelse

Hastighetspåståendet är också anmärkningsvärt: fyra gånger snabbare i utdata-token per sekund än andra toppmodeller. Google specificerar inte vilka modeller jämförelsen avser i forskningsanteckningarna, så betrakta siffran som vägledande snarare än en exakt huvud-mot-huvud.

Agentisk arkitektur och Antigravity

3.5 Flash är utformad för att fungera med Antigravity-selen, Googles ramverk för att köra samarbetande subagenter. Med Antigravity kan modellen distribuera flera subagenter parallellt, köra flerstegsarbetsflöden och upprätthålla prestanda över uppgifter med lång horisont.

Googles exempel inkluderar att syntetisera AlphaZero-artikeln och koda ett fullt spelbart spel på sex timmar med två agenter, samt att transformera en äldre kodbas till Next.js. Det här är inte leksaksdemos. De speglar den typ av flerdagars utvecklaruppgifter som agentiska system nu ombeds hantera.

Verkliga implementationer i företag

Flera företag kör redan 3.5 Flash i produktion eller pilot. De konkreta användningsfallen är värda att notera eftersom de visar var modellens agentiska styrkor används:

  • Shopify: Kör subagenter parallellt för att analysera komplex data över lång horisont för prognoser om handlar­tillväxt
  • Macquarie Bank: Pilotar kundonboarding genom att resonera över dokument på 100+ sidor med låg latens
  • Salesforce: Integreras i Agentforce för företagsautomation med flera subagenter och flervänds verktygsanrop
  • Xero: Distribuerar agenter för att hantera flerveckors arbetsflöden, inklusive förberedelse av 1099-skattblanketter för småföretag
  • Databricks: Använder agentiska arbetsflöden för att övervaka realtidsinformation, diagnostisera problem och föreslå lösningar över stora datamängder
  • Ramp: Förbättrar OCR-noggrannhet på komplexa fakturor genom multimodal förståelse kombinerad med resonemang över historiska mönster

Gemini Spark och tillgänglighet för konsumenter

3.5 Flash är också modellen bakom Gemini Spark, Googles nya personliga AI-agent som körs dygnet runt och agerar på användares vägnar. Google rullar nu ut Spark till betrodda testare, med en Beta planerad för Google AI Ultra-prenumeranter i USA veckan efter I/O-annonseringen.

Modellen är tillgänglig idag för miljarder användare globalt via Gemini-appen och AI-läget i Sök, vilket gör detta till en av de bredaste samtidiga konsument- och utvecklarlanseringar Google har gjort för en Gemini-modell.

Säkerhet och skydd

Google säger att 3.5 Flash utvecklades inom ramen för dess Frontier Safety Framework, med förstärkta cyber- och CBRN-skydd. Företaget använder tolkningsverktyg som kontrollerar modellens interna resonemang innan den svarar, vilket ska minska både skadliga utdata och felaktiga avslag på säkra frågor.

Gemini 3.5 för data- och AI-praktiker

Den mest omedelbara praktiska implikationen är att 3.5 Flash blir tillgänglig omgående via Gemini API i Google AI Studio. Om du bygger agentiska pipelines gör kombinationen av MCP Atlas-poängen (83,6 %) och Antigravitys multiagentsel det här värt att testa mot det du använder idag.

GDPval-AA-poängen på 1 656 Elo ligger efter Claude Opus 4.7:s 1 753 Elo från vår tidigare recension, men 3.5 Flashs hastighetsfördel kan vara viktigare beroende på dina latenskrav.

För team som kör arbetsflöden med lång horisont är implementationerna hos Xero och Shopify de mest lärorika signalerna. Flerveckors arbetsflöden som komprimeras till automatiserade agentkörningar är användningsfallet Google optimerar för, och Antigravity-selen är infrastruktur­lagret som möjliggör det. Om du inte redan är bekant med orkestreringsmönster för multiagenter är detta ett bra tillfälle att sätta dig in.

En sak jag skulle följa noga: Google säger att 3.5 Flash kostar mindre än hälften av priset för andra toppmodeller för jämförbara uppgifter. Det påståendet beror starkt på din specifika arbetsbelastning, men om det håller i praktiken ändrar det ekonomin för att köra agentiska system i skala. Modellen 3.5 Pro, som väntas nästa månad, blir den mer intressanta jämförelsepunkten för team som gör det tyngsta resonemangsarbetet.

Avslutande tankar

Gemini 3.5 Flash visar att Google avser att konkurrera i båda ändarna av kurvan för prestanda och hastighet, inte bara på flaggskeppsnivå. Att överträffa Gemini 3.1 Pro på agentiska benchmarktester samtidigt som den körs i Flash-hastigheter är en meningsfull förskjutning, och företagsimplementationerna hos Shopify, Macquarie och Salesforce antyder att modellen håller även utanför kontrollerade benchmarktester.

Den bredare bilden är att Google satsar tungt på agentisk infrastruktur, där Antigravity, Gemini Spark och 3.5 Flash alla pekar åt samma håll. Om den satsningen lyckas beror på hur 3.5 Pro presterar när den anländer nästa månad, och hur Antigravity-selen står sig mot konkurrerande multiagentramverk i verkliga utvecklararbetsflöden.

Om du vill komma ikapp med agentiska AI-koncept och hur du bygger med modeller som dessa rekommenderar jag att du kollar in AI Agent Fundamentals-skill track på DataCamp.

Ämnen

Toppkurser på DataCamp

track

Grunderna i AI-agenter

6 timmar
Upptäck hur AI-agenter kan förändra hur du arbetar och levererar värde för din organisation!
Se detaljerRight Arrow
Starta kursen
Se merRight Arrow