Hoppa till huvudinnehållet

Claude Fable 5 vs. Gemini 3.5 Flash: Benchmark, prissättning och mer

Claude Fable 5 dominerar på rå kapacitet, men Gemini 3.5 Flash levererar prestanda nära frontnivå till en bråkdel av kostnaden och flera gånger hastigheten. Läs vidare för att få veta mer.
Uppdaterad 11 juni 2026  · 9 min läsa

Om du väljer mellan Claude Fable 5 (som, varning, lanserades för bara två dagar sedan) och Gemini 3.5 Flash, väljer du egentligen mellan två olika filosofier om vad en frontmodells roll ska vara.

Claude Fable 5 är Anthropics kapacitetstak: den starkaste publikt tillgängliga modellen på de flesta benchmark, prissatt därefter till $10/$50 per miljon token, och inlindad i ett klassificeringssystem som kan omdirigera känsliga frågor till en annan modell mitt i sessionen.

Gemini 3.5 Flash är Googles satsning på den perfekta balansen mellan hastighet, kostnad och intelligens: en "Flash"-nivåmodell som presterar bättre än Googles egen större Gemini 3.1 Pro på kodnings- och agentiska benchmark. Den kör ungefär 4x snabbare än jämförbara frontmodeller och kostar $1,50/$9 per miljon token – alltså betydligt billigare.

I den här artikeln jämför jag de två modellerna utifrån fem dimensioner:

  • kodnings- och agentisk prestanda
  • hastighet och latens
  • arbete med långa kontexter
  • prissättning

Om du i stället väger Fable 5 mot OpenAIs flaggskepp har vi en separat artikel: Claude Fable 5 vs GPT-5.5.

Vi håller våra läsare uppdaterade om det senaste inom AI genom The Median, vårt kostnadsfria nyhetsbrev på fredagar som sammanfattar veckans viktigaste nyheter. Klicka på länken ovan, prenumerera och håll dig uppdaterad på bara några minuter i veckan.

Vad är Claude Fable 5?

Claude Fable 5 är Anthropics första Mythos-klassmodell tillgänglig för allmän användning. Fable 5 delar underliggande modell med Claude Mythos 5, men levereras med säkerhetsklassificerare aktiverade: en prob övervakar interna aktiveringar över all trafik, och flaggade förfrågningar eskaleras till en tränad LLM-klassificerare. Blockerade förfrågningar omdirigeras till Claude Opus 4.8.

Fable 5 är det senaste inom nästan alla testade benchmark och är verkligen extremt stark inom mjukvaruteknik, kunskapsarbete, visuell förståelse och agentiska uppgifter med långa tidshorisonter. Dessutom gäller att ju längre och mer komplext uppdraget är, desto större är försprånget mot tidigare Claude-modeller. 

Vad är Gemini 3.5 Flash?

Gemini 3.5 Flash är Google DeepMinds majsläpp, annonserat på Google I/O 2026 som den första modellen i den nya Gemini 3.5-familjen. Trots "Flash"-varumärket är det här inte en budgetmodell i traditionell mening: den presterar bättre än Googles egen större Gemini 3.1 Pro på kodnings- och agentiska sviter samtidigt som den kör cirka 4x snabbare än jämförbara frontmodeller.

Gemini 3.5 Flash är en resonemangsmodell med konfigurerbara parametrar för tänkandeinsats (minimal, low, medium, high). (Den använder medium som standard, om du undrade.) Modellen har ett kontextfönster på 1M token, multimodal inmatning (text, bild, ljud, video, PDF) och genererar utdata i ungefär 280+ token per sekund. Google gjorde den till standardmodell i Gemini-appen och AI-läget i Sök på lanseringsdagen. Vi har förväntat oss att Gemini 3.5 Pro ska följa när som helst.

En sak värd att notera: 3.5 Flash är ungefär 3x högre per token än sin föregångare, Gemini 3 Flash ($0,50/$3,00). Så den är billig i förhållande till flaggskepp, inte i förhållande till sin egen släkt. Och eftersom "tänkandetoken" debiteras till utdatahastighet kan resonemangstunga arbetsbelastningar på hög insats kosta mer än prislappen antyder. Det är något att vara medveten om.

Claude Fable 5 vs. Gemini 3.5 Flash: Direkt jämförelse

Här är en snabb sammanfattning innan vi går in på detaljerna. Jag har gjort två tabeller: en för benchmarkresultaten och en annan för mer praktiska överväganden kring prissättning, hastighet och tillgång.

Benchmarkresultat

Benchmark Claude Fable 5 Gemini 3.5 Flash
SWE-Bench Pro 80,3% 55,1% (Publik)
Terminal-Bench 2.1 88,0%* 76,2%
Humanity's Last Exam (med verktyg) 64,5% Ligger efter Gemini 3.1 Pro (inte direkt jämförbar)
OSWorld-Verified 85,0% Inte publicerat
MCP Atlas (koordination av flera verktyg) Inte publicerat 83,6%

Som du ser vinner Claude Fable 5 i alla head-to-head-benchmark där det finns lättillgängliga data för jämförelse.

Prissättning, hastighet och tillgång

Jag nämnde det tidigare: Prissättningen är definitivt bättre (mycket bättre) för Gemini 3.5 Flash.

Funktion Claude Fable 5 Gemini 3.5 Flash
API-pris för input (per 1M token) $10 $1,50
API-pris för output (per 1M token) $50 $9,00
Cachad input-prissättning $0,15 per 1M (90% rabatt)
Utdatahastighet Standardlatens för frontmodeller ~280+ token/sek, ~4x snabbare än frontjämförelser
Kontextfönster Långtgående agentiska uppgifter med flera miljoner token påstås; ingen publicerad MRCR vid 512K+ 1M token (1 048 576 inputgräns)
Allmän tillgänglighet Begränsad (användningskrediter krävs efter 22 juni) Ja (Gemini-app, AI Studio, Antigravity, API, AI-läge i Sök)

Kodnings- och agentisk prestanda

Prestanda på kodning och agentiskt arbete är värt att diskutera separat eftersom det är här kapacitetsgapet är som störst.

På SWE-Bench Pro, som du ser i den första tabellen, får Fable 5 80,3% jämfört med Gemini 3.5 Flashs 55,1% på den publika uppsättningen. Det är ett gap på 25 poäng. För utveckling på arkivnivå i komplexa kodbaser är detta en verklig skillnad. Troligen kan Fable 5 autonomt lösa riktiga GitHub-ärenden för det mesta, och jag är inte säker på att man kan säga detsamma om Gemini 3.5 Flash.

Där Gemini 3.5 Flash kontrar är i agentiskt throughput snarare än agentiskt djup. Flash är uttryckligen optimerad för parallella executionsloopar, distribution av subagenter och snabb iteration. Dess 83,6% på MCP Atlas — ett benchmark för koordination av flera verktyg där den slår GPT-5.5:s 75,3% — antyder en modell byggd för att orkestrera många snabba verktygsanrop snarare än att upprätthålla en enda lång, djup resonemangs-kedja. Google rapporterar också betydande tokeneffektivitet i verkliga agentiska scenarier jämfört med tidigare Flash-versioner.

Det rätta sättet att tänka på det: Om din agent behöver tänka djupt kring ett litet antal svåra steg (komplexa refaktoriseringar, arkitektoniska förändringar, knepig felsökning) vinner Fable 5. Om din agent behöver utföra många snabba, måttligt svåra steg i parallell (pipelines för skrapning-och-sammanfattning, orkestrering av flera verktyg, högvolymtriage) är Flashs hastighets- och kostnadsprofil vettig.

Hastighet och latens

Gemini 3.5 Flash genererar ungefär 280+ token per sekund — flera gånger snabbare än typiska frontflaggskepp. 

Fable 5, å andra sidan, är inte positionerad som en snabb modell. Den är positionerad som modellen du använder när uppgiften är tillräckligt svår för att du ska vara beredd att vänta på svaret.

Prestanda med långa kontexter

Gemini 3.5 Flash stödjer ungefär ett kontextfönster på 1M token, och Gemini-serien har historiskt varit stark på hämtning i långa kontexter. Dock ligger Flash enligt uppgift efter Googles egen Gemini 3.1 Pro på MRCR v2.

Anthropic hävdar att Fable 5 håller fokus över miljontals token i långvariga uppgifter och förbättrar utdata med hjälp av sina egna anteckningar. Men Anthropic har inte publicerat MRCR-liknande poäng i intervallet 512K–1M, så en rättvis jämförelse är inte möjlig.

För dokumentgranskning på miljon-token-nivå har ingen av modellerna ett avgörande publicerat övertag här. Om långkontexttillförlitlighet är din enskilt viktigaste faktor får GPT-5.5:s publicerade 74,0% på MRCR v2 vid 512K–1M vår uppmärksamhet.

Prissättning och tillgänglighet

Det finns en prisskillnad. Fable 5 kostar $10 per miljon inputtoken och $50 per miljon outputtoken. Gemini 3.5 Flash kostar $1,50 respektive $9,00, och har även cachad input för $0,15 per miljon, vilket är 90% rabatt. Gemini 3.5 Flash är ungefär sex till sju gånger billigare på input och fem till sex gånger billigare på output.

Prishistorien är dock aldrig riktigt så enkel: Vet först att Flash är en resonemangsmodell vars tänkandetoken debiteras till utdatatakten, så arbetsbelastningar med hög resonemangsinsats kan förbruka avsevärt fler outputtoken än prompten antyder. Benchmarka din egen belastning innan du antar att Flash är billigt för ditt användningsfall. Dessutom, när Fable 5:s klassificerare omdirigerar en fråga debiteras du enligt Opus 4.8:s priser ($5/$25), inte Fable 5:s. Även om detta förmodligen bara är en liten kostnadsdämpande faktor.

Tillgänglighet är den andra asymmetrin. Gemini 3.5 Flash blev allmänt tillgänglig dag ett i Gemini-appen, Google AI Studio, Antigravity, Gemini API och AI-läge i Sök. Fable 5:s prenumerationsåtkomst har en tröskel: Pro-, Max-, Team- och Enterprise-prenumeranter hade fri tillgång endast till 22 juni 2026, vilket närmar sig snabbt, därefter krävs användningskrediter utöver den befintliga prenumerationen.

När ska du välja Claude Fable 5 vs Gemini 3.5 Flash

Beslutet kokar ner till två variabler:

  • om dina uppgifter är tillräckligt svåra för att behöva Fable 5:s tak
  • om hastighet och kostnad per anrop dominerar din ekonomi
Användningsfall Rekommenderas Varför
Mjukvaruteknik på arkivnivå i komplexa kodbaser Claude Fable 5 80,3% vs 55,1% på SWE-Bench Pro är ett gap på 25 poäng som speglar verkliga kapacitetsskillnader
Agentiska pipelines med hög volym och känslighet för latens Gemini 3.5 Flash ~280+ tok/s utdata, parallell exekvering av subagenter och 5–7x lägre tokenkostnader kumulerar över tusentals anrop
Interaktiva konsumentprodukter och chatt-UX Gemini 3.5 Flash 4x hastighetsfördel är en produktfunktion; Fable 5:s latens och prissättning passar inte för högfrekvent konsumentanvändning
Komplex finans och kunskapsarbete Claude Fable 5 Leder Hebbias Finance Benchmark och Humanity's Last Exam med verktyg (64,5%)
Orkestrering av flera verktyg över många tjänster Gemini 3.5 Flash 83,6% på MCP Atlas är den starkaste publicerade koordineringspoängen för flera verktyg bland frontmodeller
Multimodala pipelines (video, ljud, PDF-input) Gemini 3.5 Flash Inbyggd multimodal input över text, bild, ljud, video och PDF
Reglerade branscher som kräver noll datalagring Gemini 3.5 Flash Fable 5:s obligatoriska 30 dagars lagring är en hård spärr för vissa företag

Välj Claude Fable 5 om...

  • Ditt primära användningsfall är mjukvaruteknik på arkivnivå
  • Du behöver det högsta tillgängliga taket för komplext analytiskt arbete — finans, tvärvetenskapligt resonemang, agentiska uppgifter med lång horisont — och latens är sekundär.
  • Ditt arbete ligger inte nära cybersäkerhet, biologi eller kemi, så klassificeraromdirigeringar påverkar sannolikt inte dina sessioner.

Välj Gemini 3.5 Flash om...

  • Din ekonomi drivs av volym: tusentals anrop per dag där kostnadsskillnaden kumulerar till storleksordningar i utgifter.
  • Hastighet är ett produktkrav — interaktiv UX, realtidsagenter eller pipelines där väggklocktid över många verktygsanrop är viktigare än djup per steg.
  • Du behöver bred multimodal input (video, ljud, PDF) i en och samma modell.
  • Din företagsdatapolicy kan inte hantera Fable 5:s obligatoriska 30 dagars lagring, eller så behöver du en modell som inte byts ut tyst mitt i en pipeline.

Avslutande tankar

Det här är egentligen inte en jämförelse av likvärdiga modeller. Fable 5 och Gemini 3.5 Flash intar olika positioner på marknaden: den ena är kapacitetstaket med viss friktion, den andra är effektivitetsfronten med ett lägre tak.

Om rå kapacitet på svåra uppgifter är din enda variabel vinner Fable 5 övertygande. Men Flashs värdeerbjudande är inte "nästan lika bra för mindre pengar." Jag vill inte undersälja den: Det är intelligens nära frontnivå, levererad tillräckligt snabbt och billigt för att användas där Fable 5 aldrig var ekonomiskt gångbar.

Ämnen

Lär dig med DataCamp

course

Large Language Models (LLMs) Concepts

2 timmar
99.1K
Discover the full potential of LLMs with our conceptual course covering LLM applications, training methodologies, ethical considerations, and latest research.
Se detaljerRight Arrow
Starta kursen
Se merRight Arrow