Claude Fable 5 vs. Gemini 3.5 Flash: benchmark-uri, prețuri și altele

Claude Fable 5 domină la capabilitate brută, dar Gemini 3.5 Flash oferă performanță aproape de vârf la o fracțiune din cost și de câteva ori mai rapid. Continuă să citești pentru detalii.

Actualizat 11 iun. 2026 · 9 min. citire

Explorează cu AI

Deschide în ChatGPT Deschide în Claude Deschide în Perplexity

Dacă alegi între Claude Fable 5 (care, avertisment corect, a fost lansat acum două zile) și Gemini 3.5 Flash, de fapt alegi între două filozofii diferite despre ce ar trebui să fie un model de vârf.

Claude Fable 5 este plafonul de capabilitate al Anthropic: cel mai puternic model disponibil public pe majoritatea testelor, cu un preț pe măsură de 10$/50$ per milion de tokeni, și învelit într-un sistem de clasificare care poate redirecționa solicitările sensibile către un alt model în timpul sesiunii.

Gemini 3.5 Flash este pariul Google pe combinația ideală viteză-cost-inteligență: un model din clasa „Flash” care depășește propriul Gemini 3.1 Pro, mai mare, la testele de programare și agenți. Rulează aproximativ de 4 ori mai rapid decât modelele comparabile de vârf și costă 1,50$/9$ per milion de tokeni — deci mult mai ieftin.

În acest articol, voi compara cele două modele pe cinci dimensiuni:

performanță la programare și sarcini agentice
viteză și latență
muncă în context lung
prețuri

Dacă pui în balanță Fable 5 cu flagship-ul OpenAI, avem un articol separat: Claude Fable 5 vs GPT-5.5.

Îi ținem pe cititorii noștri la curent cu tot ce e nou în AI prin The Median, newsletterul nostru gratuit de vineri, care explică pe scurt poveștile-cheie ale săptămânii. Dă click pe linkul de mai sus, abonează-te și rămâi în priză în doar câteva minute pe săptămână.

Ce este Claude Fable 5?

Claude Fable 5 este primul model din clasa Mythos al Anthropic disponibil pentru uz general. Fable 5 împarte modelul de bază cu Claude Mythos 5, dar este livrat cu clasificatori de siguranță activi: o sondă monitorizează activările interne pe tot traficul, iar solicitările marcate sunt escaladate către un clasificator LLM antrenat. Solicitările blocate sunt redirecționate către Claude Opus 4.8.

Fable 5 este la nivelul artei pe aproape toate testele evaluate și este într-adevăr incredibil de puternic în ingineria software, munca de cunoaștere, viziune și sarcini agentice pe orizont lung. Mai mult, cu cât sarcina e mai lungă și mai complexă, cu atât avansul său față de modelele Claude anterioare este mai mare.

Ce este Gemini 3.5 Flash?

Gemini 3.5 Flash este lansarea din mai a Google DeepMind, anunțată la Google I/O 2026 ca primul model din noua familie Gemini 3.5. În ciuda brandingului „Flash”, acesta nu este un model bugetar în sensul tradițional: îl depășește pe Gemini 3.1 Pro al Google, mai mare, la suita de programare și agenți, rulând cam de 4 ori mai rapid decât modelele de vârf comparabile.

Gemini 3.5 Flash este un model de raționare cu parametri configurabili pentru efortul de gândire (minimal, low, medium, high). (Implicit este medium, dacă te întrebai.) Modelul suportă o fereastră de context de 1M tokeni, input multimodal (text, imagine, audio, video, PDF) și livrează aproximativ 280+ tokeni pe secundă. Google l-a făcut modelul implicit în aplicația Gemini și în AI Mode din Search chiar din ziua lansării. Ne așteptăm ca Gemini 3.5 Pro să urmeze dintr-o zi în alta.

Un aspect de reținut: 3.5 Flash are un preț per token de aproximativ 3 ori mai mare decât predecesorul său, Gemini 3 Flash (0,50$/3,00$). Deci e ieftin în raport cu flagship-urile, nu în raport cu propria linie. Și pentru că tokenii de gândire sunt facturați la rata de output, sarcinile cu mult raționament la efort înalt pot costa mai mult decât sugerează prețul de listă. Merită să fii conștient de asta.

Claude Fable 5 vs. Gemini 3.5 Flash: comparație directă

Iată un rezumat rapid înainte de detalii. Am făcut două tabele: unul pentru rezultate la benchmark și altul pentru aspecte practice precum prețuri, viteză și acces.

Rezultate la benchmark

Benchmark	Claude Fable 5	Gemini 3.5 Flash
SWE-Bench Pro	80.3%	55.1% (Public)
Terminal-Bench 2.1	88.0%*	76.2%
Humanity's Last Exam (cu unelte)	64.5%	Îl urmează pe Gemini 3.1 Pro (nu sunt direct comparabile)
OSWorld-Verified	85.0%	Nepublicat
MCP Atlas (coordonare multi-unelte)	Nepublicat	83.6%

După cum se vede, Claude Fable 5 câștigă în toate comparațiile directe unde există date ușor de pus față în față.

Prețuri, viteză și acces

Am menționat mai devreme: prețurile sunt cu siguranță mai bune (mult mai bune) pentru Gemini 3.5 Flash.

Caracteristică	Claude Fable 5	Gemini 3.5 Flash
Preț input API (per 1M tokeni)	$10	$1.50
Preț output API (per 1M tokeni)	$50	$9.00
Preț input în cache	—	$0.15 per 1M (reducere 90%)
Viteză de output	Latență standard pentru modelele de vârf	~280+ tokeni/sec, ~4x mai rapid decât modelele de vârf similare
Fereastră de context	Sarcini agentice de lungă durată, cu milioane de tokeni, declarate; fără MRCR publicat la 512K+	1M tokeni (limită input 1.048.576)
Disponibilitate generală	Limitată (credite de utilizare necesare după 22 iunie)	Da (aplicația Gemini, AI Studio, Antigravity, API, AI Mode în Search)

Performanță la programare și sarcini agentice

Performanța la programare și muncă agentică merită discutată separat, pentru că aici este cel mai mare decalaj de capabilitate.

La SWE-Bench Pro, după cum vezi în primul tabel, Fable 5 obține 80,3% față de 55,1% pentru Gemini 3.5 Flash pe setul public. Este un decalaj de 25 de puncte. Pentru inginerie la nivel de repository pe codebase-uri complexe, aceasta este o diferență reală. Probabil că Fable 5 poate rezolva autonom probleme reale de pe GitHub de cele mai multe ori, și nu sunt sigur că se poate spune același lucru despre Gemini 3.5 Flash.

Unde contrabalansează Gemini 3.5 Flash este în debitul agentic, nu în profunzimea agentică. Flash este optimizat explicit pentru bucle de execuție paralele, lansare de sub-agenți și iterație rapidă. Scorul său de 83,6% la MCP Atlas — un benchmark de coordonare multi-unelte, unde depășește 75,3% al GPT-5.5 — sugerează un model creat pentru a orchestra multe apeluri de unelte rapide, mai degrabă decât pentru a susține un singur lanț lung și profund de raționament. Google raportează, de asemenea, câștiguri substanțiale de eficiență a tokenilor în scenarii agentice reale față de versiunile Flash anterioare.

Cum să gândești corect despre asta: dacă agentul tău trebuie să gândească intens la un număr mic de pași dificili (refactorizări complexe, schimbări de arhitectură, depanare complicată), Fable 5 câștigă. Dacă agentul tău trebuie să execute mulți pași rapizi, de dificultate moderată, în paralel (pipeline-uri de scraping-și-sumarizare, orchestrație multi-unelte, triere de volum mare), profilul de viteză și cost al lui Flash are mult sens.

Viteză și latență

Gemini 3.5 Flash livrează aproximativ 280+ tokeni pe secundă — de câteva ori mai rapid decât flagship-urile tipice de vârf.

Fable 5, pe de altă parte, nu este poziționat ca un model rapid. Este poziționat ca modelul pe care îl folosești când sarcina este suficient de grea încât ești dispus să aștepți răspunsul.

Performanță în context lung

Gemini 3.5 Flash suportă aproximativ un context de input de 1M tokeni, iar linia Gemini a fost istoric puternică la regăsirea în context lung. Totuși, se pare că Flash este în urma propriului Gemini 3.1 Pro al Google la MRCR v2.

Anthropic susține că Fable 5 rămâne concentrat pe parcursul a milioane de tokeni în sarcini de lungă durată și își îmbunătățește rezultatele folosindu-și propriile notițe. Dar Anthropic nu a publicat scoruri de tip MRCR în intervalul 512K–1M, astfel încât o comparație „mere cu mere” nu este posibilă.

Pentru revizuirea de documente de un milion de tokeni, niciun model nu are aici un avantaj publicat decisiv. Dacă fiabilitatea pe context lung este variabila ta cea mai importantă, MRCR v2 publicat de 74,0% la 512K–1M al GPT-5.5 ne atrage atenția.

Prețuri și disponibilitate

Există un decalaj de preț. Fable 5 costă 10$ per milion de tokeni input și 50$ per milion de tokeni output. Gemini 3.5 Flash costă 1,50$ și 9,00$ respectiv, și are și input în cache la 0,15$ per milion, adică o reducere de 90%. Gemini 3.5 Flash este aproximativ de șase sau șapte ori mai ieftin la input și de cinci sau șase ori mai ieftin la output.

Totuși, povestea prețurilor nu e niciodată chiar așa simplă: În primul rând, Flash este un model de raționare ale cărui tokeni de gândire se facturează la rata de output, așa că sarcinile cu mult raționament la efort ridicat pot consuma semnificativ mai mulți tokeni de output decât sugerează promptul. Evaluează-ți propriul flux de lucru înainte să presupui că Flash e ieftin pentru cazul tău. De asemenea, când clasificatorii lui Fable 5 redirecționează o interogare, ești taxat la tarifele Opus 4.8 (5$/25$), nu la tarifele Fable 5. Deși probabil acesta e un factor mic de atenuare a costului.

Disponibilitatea este cealaltă asimetrie. Gemini 3.5 Flash a devenit disponibil în general încă din prima zi în aplicația Gemini, Google AI Studio, Antigravity, API-ul Gemini și AI Mode în Search. Accesul pe bază de abonament la Fable 5 are un prag: abonații Pro, Max, Team și Enterprise au avut acces gratuit doar până pe 22 iunie 2026, dată care se apropie rapid, după care sunt necesare credite de utilizare peste abonamentul existent.

Când să alegi Claude Fable 5 vs Gemini 3.5 Flash

Decizia se reduce la două variabile:

dacă sarcinile tale sunt suficient de grele încât să ceară plafonul lui Fable 5
dacă viteza și costul per apel îți domină economia

Caz de utilizare	Recomandat	De ce
Inginerie software la nivel de repository pe codebase-uri complexe	Claude Fable 5	80,3% vs 55,1% la SWE-Bench Pro e un decalaj de 25 de puncte care reflectă diferențe reale de capabilitate
Pipeline-uri agentice cu volum mare și sensibile la latență	Gemini 3.5 Flash	~280+ tok/s output, execuție paralelă cu sub-agenți și costuri per token de 5–7x mai mici care se compun peste mii de apeluri
Produse consumer interactive și UX de chat	Gemini 3.5 Flash	Avantajul de 4x la viteză este o caracteristică de produs; latența și prețurile lui Fable 5 nu se potrivesc cu utilizarea frecventă în consumer
Finanțe complexe și muncă de cunoaștere	Claude Fable 5	Conduce Finance Benchmark al Hebbia și Humanity's Last Exam cu unelte (64,5%)
Orchestrație multi-unelte între multe servicii	Gemini 3.5 Flash	83,6% la MCP Atlas este cel mai puternic scor publicat de coordonare multi-unelte printre modelele de vârf
Pipeline-uri multimodale (input video, audio, PDF)	Gemini 3.5 Flash	Input multimodal nativ pentru text, imagine, audio, video și PDF
Industrii reglementate care cer retenție zero a datelor	Gemini 3.5 Flash	Retenția obligatorie de 30 de zile a lui Fable 5 este un blocaj dur pentru unele companii

Alege Claude Fable 5 dacă...

Cazul tău principal este ingineria software la nivel de repository
Ai nevoie de cel mai înalt plafon disponibil pentru muncă analitică complexă — finanțe, raționament multidisciplinar, sarcini agentice pe orizont lung — iar latența este secundară.
Munca ta nu este adiacentă securității cibernetice, biologiei sau chimiei, astfel încât redirecționările clasificatorului sunt puțin probabil să îți afecteze sesiunile.

Alege Gemini 3.5 Flash dacă...

Economia ta este determinată de volum: mii de apeluri pe zi, unde diferența de cost se compune în ordine de mărime ale cheltuielii.
Viteza este o cerință de produs — UX interactiv, agenți în timp real sau pipeline-uri în care timpul total pe perete peste multe apeluri de unelte contează mai mult decât profunzimea pe pas.
Ai nevoie de input multimodal larg (video, audio, PDF) într-un singur model.
Politica de date a companiei tale nu poate acomoda retenția obligatorie de 30 de zile a lui Fable 5 sau ai nevoie de un model care nu se va schimba silențios la mijlocul pipeline-ului.

Gânduri finale

Nu este cu adevărat o comparație de tip „același lucru cu același lucru”. Fable 5 și Gemini 3.5 Flash ocupă poziții diferite pe piață: unul este plafonul de capabilitate cu un anumit grad de fricțiune atașat, celălalt este frontiera eficienței cu un plafon mai jos.

Dacă singura ta variabilă este capabilitatea brută la sarcini grele, Fable 5 câștigă decisiv. Dar propunerea de valoare a lui Flash nu este „aproape la fel de bun, dar mai ieftin”. Nu vreau să-l subestimez: este inteligență aproape de vârf livrată suficient de rapid și suficient de ieftin pentru a fi folosită în locuri unde Fable 5 nu a fost niciodată viabil economic.

Subiecte

Inteligență artificială

Învață cu DataCamp

course

Concepte privind Modelele de Limbaj de Mari Dimensiuni (LLM)

2 oră

104K

Descoperă potențialul maxim al LLM-urilor cu acest curs conceptual despre aplicații LLM, metodologii de antrenare, aspecte etice și cele mai noi cercetări.

Vezi detalii

Începeți Cursul

course