Claude Fable 5 vs. Gemini 3.5 Flash: benchmark, prezzi e altro

Claude Fable 5 domina per capacità pura, ma Gemini 3.5 Flash offre prestazioni quasi di frontiera a una frazione del costo e con una velocità di gran lunga superiore. Continua a leggere per saperne di più.

Aggiornato 11 giu 2026 · 9 min leggi

Esplora con l'AI

Apri in ChatGPT Apri in Claude Apri in Perplexity

Se stai scegliendo tra Claude Fable 5 (che, avviso, è stato lanciato solo due giorni fa) e Gemini 3.5 Flash, in realtà stai scegliendo tra due filosofie diverse su cosa debba essere un modello di frontiera.

Claude Fable 5 è il tetto massimo delle capacità di Anthropic: il modello pubblico più forte sulla maggior parte dei benchmark, con un prezzo proporzionato di $10/$50 per milione di token, e dotato di un sistema di classificazione che può reindirizzare le richieste sensibili a un modello diverso durante la sessione.

Gemini 3.5 Flash è la scommessa di Google sul giusto equilibrio tra velocità, costo e intelligenza: un modello di fascia "Flash" che supera il più grande Gemini 3.1 Pro di Google sui benchmark di coding e agentici. È circa 4 volte più veloce dei modelli di frontiera comparabili e costa $1,50/$9 per milione di token, quindi è molto meno costoso.

In questo articolo, confronterò i due modelli su cinque dimensioni:

prestazioni nel coding e nei compiti agentici
velocità e latenza
lavoro con contesti lunghi
prezzi

Se invece stai confrontando Fable 5 con il modello di punta di OpenAI, sappi che abbiamo un articolo a parte: Claude Fable 5 vs GPT-5.5.

Teniamo i nostri lettori aggiornati sulle ultime novità dell’AI con The Median, la nostra newsletter gratuita del venerdì che riassume le notizie chiave della settimana. Clicca sul link qui sopra, iscriviti e resta sul pezzo dedicando solo pochi minuti ogni settimana.

Che cos’è Claude Fable 5?

Claude Fable 5 è il primo modello di classe Mythos di Anthropic disponibile per l’uso generale. Fable 5 condivide il modello sottostante con Claude Mythos 5, ma viene distribuito con i classificatori di sicurezza attivi: una sonda monitora le attivazioni interne su tutto il traffico e le richieste segnalate vengono inoltrate a un classificatore LLM addestrato. Le richieste bloccate vengono reindirizzate a Claude Opus 4.8.

Fable 5 è all’avanguardia su quasi tutti i benchmark testati ed è davvero fortissimo in ingegneria del software, lavori di conoscenza, visione e compiti agentici di lungo orizzonte. Inoltre, più il compito è lungo e complesso, maggiore è il suo vantaggio rispetto ai precedenti modelli Claude.

Che cos’è Gemini 3.5 Flash?

Gemini 3.5 Flash è la release di maggio di Google DeepMind, annunciata al Google I/O 2026 come primo modello della nuova famiglia Gemini 3.5. Nonostante il branding "Flash", non è un modello economico nel senso tradizionale: supera il più grande Gemini 3.1 Pro di Google nella suite di coding e agentica, pur andando circa 4 volte più veloce dei modelli di frontiera comparabili.

Gemini 3.5 Flash è un modello di ragionamento con parametri di impegno nel pensiero configurabili (minimal, low, medium, high). (Per la cronaca, l’impostazione predefinita è medium.) Il modello supporta una finestra di contesto da 1 milione di token, input multimodale (testo, immagine, audio, video, PDF) e produce a circa 280+ token al secondo. Google lo ha reso il modello predefinito nell’app Gemini e nell’AI Mode in Search dal giorno del lancio. Ci aspettiamo che Gemini 3.5 Pro segua a breve.

Una nota importante: 3.5 Flash costa circa 3 volte in più per token rispetto al suo predecessore, Gemini 3 Flash ($0,50/$3,00). Quindi, è economico rispetto ai modelli di punta, non rispetto alla sua stessa linea. E poiché i token di pensiero vengono fatturati alla tariffa di output, i carichi di lavoro ad alto sforzo di ragionamento con impegno elevato possono costare più di quanto sembri dal prezzo di listino. È qualcosa di cui tenere conto.

Claude Fable 5 vs. Gemini 3.5 Flash: confronto diretto

Ecco un rapido riepilogo prima di entrare nei dettagli. Ho preparato due tabelle: una per i risultati dei benchmark e un’altra per aspetti più pratici come prezzi, velocità e accesso.

Risultati dei benchmark

Benchmark	Claude Fable 5	Gemini 3.5 Flash
SWE-Bench Pro	80.3%	55.1% (Pubblico)
Terminal-Bench 2.1	88.0%*	76.2%
Humanity's Last Exam (con strumenti)	64.5%	È dietro a Gemini 3.1 Pro (non direttamente comparabile)
OSWorld-Verified	85.0%	Non pubblicato
MCP Atlas (coordinamento multi-strumento)	Non pubblicato	83.6%

Come vedi, Claude Fable 5 vince in tutti i confronti diretti sui benchmark in cui esistono dati facilmente comparabili tra i due.

Prezzi, velocità e accesso

Come accennato prima: il prezzo è decisamente migliore (molto migliore) per Gemini 3.5 Flash.

Caratteristica	Claude Fable 5	Gemini 3.5 Flash
Prezzo input API (per 1M token)	$10	$1,50
Prezzo output API (per 1M token)	$50	$9,00
Prezzo input in cache	—	$0,15 per 1M (sconto 90%)
Velocità di output	Latenza standard da modello di frontiera	~280+ token/s, ~4x più veloce dei pari di frontiera
Finestra di contesto	Compiti agentici multimilionari a lunga esecuzione dichiarati; nessun MRCR pubblicato a 512K+	1M token (limite input 1.048.576)
Disponibilità generale	Limitata (crediti di utilizzo richiesti dopo il 22 giugno)	Sì (app Gemini, AI Studio, Antigravity, API, AI Mode in Search)

Prestazioni nel coding e nei compiti agentici

Le prestazioni nel coding e nel lavoro agentico meritano una discussione a parte perché è qui che il divario di capacità è più ampio.

Su SWE-Bench Pro, come vedi nella prima tabella, Fable 5 ottiene 80,3% contro il 55,1% di Gemini 3.5 Flash sul set pubblico. È un gap di 25 punti. Per l’ingegneria a livello di repository su codebase complesse, è una differenza concreta. Probabilmente Fable 5 può risolvere autonomamente problemi reali su GitHub nella maggior parte dei casi, e non sono sicuro si possa dire lo stesso di Gemini 3.5 Flash.

Dove Gemini 3.5 Flash recupera è nella capacità di throughput agentico più che nella profondità. Flash è esplicitamente ottimizzato per cicli di esecuzione paralleli, deployment di sotto-agenti e iterazione rapida. Il suo 83,6% su MCP Atlas — un benchmark di coordinamento multi-strumento, dove batte il 75,3% di GPT-5.5 — suggerisce un modello pensato per orchestrare molte chiamate a strumenti veloci, più che sostenere una singola catena di ragionamento lunga e profonda. Google riporta inoltre notevoli guadagni di efficienza in token in scenari agentici reali rispetto alle versioni Flash precedenti.

Il modo giusto di pensarci: se il tuo agente deve riflettere a fondo su un numero ridotto di passaggi difficili (refactor complessi, cambiamenti architetturali, debugging spinoso), vince Fable 5. Se il tuo agente deve eseguire molti passaggi veloci e moderatamente difficili in parallelo (pipeline di scraping-e-sintesi, orchestrazione multi-strumento, triage ad alto volume), il profilo di velocità e costo di Flash ha molto senso.

Velocità e latenza

Gemini 3.5 Flash produce a circa 280+ token al secondo — diverse volte più veloce rispetto ai tipici modelli di punta di frontiera.

Fable 5, invece, non è posizionato come modello veloce. È il modello che usi quando il compito è abbastanza difficile da valere l’attesa per la risposta.

Prestazioni su contesti lunghi

Gemini 3.5 Flash supporta un input di contesto di circa 1 milione di token e la linea Gemini è storicamente forte nel recupero su contesti lunghi. Tuttavia, a quanto pare Flash è dietro al Gemini 3.1 Pro di Google su MRCR v2.

Anthropic afferma che Fable 5 resta focalizzato per milioni di token in compiti di lunga durata e migliora gli output usando le proprie note. Ma Anthropic non ha pubblicato punteggi in stile MRCR nell’intervallo 512K–1M, quindi un confronto alla pari non è possibile.

Per la revisione di documenti da un milione di token, nessuno dei due modelli ha qui un vantaggio pubblicato e decisivo. Se l’affidabilità su contesti lunghi è la tua variabile più importante, il 74,0% pubblicato di GPT-5.5 su MRCR v2 a 512K–1M attira la nostra attenzione.

Prezzi e disponibilità

C’è una differenza di prezzo. Fable 5 costa $10 per milione di token in input e $50 per milione di token in output. Gemini 3.5 Flash costa rispettivamente $1,50 e $9,00, e offre anche input in cache a $0,15 per milione, cioè uno sconto del 90%. Gemini 3.5 Flash è circa sei o sette volte più economico in input e cinque o sei volte più economico in output.

Detto ciò, i prezzi non sono mai così semplici: innanzitutto sappi che Flash è un modello di ragionamento i cui token di pensiero vengono fatturati alla tariffa di output, quindi i carichi di lavoro di ragionamento ad alto sforzo possono consumare significativamente più token di output di quanto sembri dal prompt. Valuta il tuo carico prima di dare per scontato che Flash sia economico per il tuo caso d’uso. Inoltre, quando i classificatori di Fable 5 reindirizzano una richiesta, la fatturazione avviene alle tariffe di Opus 4.8 ($5/$25), non a quelle di Fable 5. Anche se probabilmente è un fattore di mitigazione dei costi limitato.

La disponibilità è l’altra asimmetria. Gemini 3.5 Flash è diventato generalmente disponibile dal primo giorno su app Gemini, Google AI Studio, Antigravity, API Gemini e AI Mode in Search. L’accesso in abbonamento a Fable 5 ha una scadenza: gli abbonati Pro, Max, Team ed Enterprise avevano accesso gratuito solo fino al 22 giugno 2026, data ormai vicina, dopo di che sono richiesti crediti di utilizzo oltre all’abbonamento esistente.

Quando scegliere Claude Fable 5 vs Gemini 3.5 Flash

La decisione si riduce a due variabili:

se i tuoi compiti sono abbastanza difficili da richiedere il tetto di Fable 5
se velocità e costo per chiamata dominano la tua economia

Caso d’uso	Consigliato	Perché
Ingegneria software a livello di repository su codebase complesse	Claude Fable 5	80,3% vs 55,1% su SWE-Bench Pro è un gap di 25 punti che riflette differenze di capacità reali
Pipeline agentiche ad alto volume e sensibili alla latenza	Gemini 3.5 Flash	~280+ tok/s in output, esecuzione parallela di sotto-agenti e costi per token 5–7x inferiori si sommano su migliaia di chiamate
Prodotti consumer interattivi e chat UX	Gemini 3.5 Flash	Il vantaggio di velocità 4x è una feature di prodotto; latenza e prezzi di Fable 5 non si adattano all’uso consumer ad alta frequenza
Finanza complessa e lavori di conoscenza	Claude Fable 5	Guida l’Hebbia Finance Benchmark e Humanity’s Last Exam con strumenti (64,5%)
Orchestrazione multi-strumento su molti servizi	Gemini 3.5 Flash	L’83,6% su MCP Atlas è il punteggio pubblicato più alto di coordinamento multi-strumento tra i modelli di frontiera
Pipeline multimodali (input video, audio, PDF)	Gemini 3.5 Flash	Input multimodale nativo su testo, immagine, audio, video e PDF
Settori regolamentati che richiedono zero data retention	Gemini 3.5 Flash	La conservazione obbligatoria di 30 giorni di Fable 5 è un blocco rigido per alcune aziende

Scegli Claude Fable 5 se...

Il tuo caso d’uso principale è l’ingegneria software a livello di repository
Hai bisogno del tetto massimo disponibile per lavori analitici complessi — finanza, ragionamento multidisciplinare, compiti agentici di lungo orizzonte — e la latenza è secondaria.
Il tuo lavoro non è vicino a cybersecurity, biologia o chimica, quindi i reindirizzamenti del classificatore difficilmente incideranno sulle tue sessioni.

Scegli Gemini 3.5 Flash se...

La tua economia è guidata dal volume: migliaia di chiamate al giorno in cui la differenza di costo si accumula fino a ordini di grandezza di spesa.
La velocità è un requisito di prodotto — UX interattive, agenti in tempo reale o pipeline in cui il tempo totale su molte chiamate a strumenti conta più della profondità per singolo passaggio.
Ti serve un ampio input multimodale (video, audio, PDF) in un unico modello.
La policy dati della tua azienda non può accettare la conservazione obbligatoria di 30 giorni di Fable 5, o ti serve un modello che non venga sostituito silenziosamente a metà pipeline.

Considerazioni finali

Non è davvero un confronto alla pari. Fable 5 e Gemini 3.5 Flash occupano posizioni diverse sul mercato: uno è il tetto delle capacità con un certo attrito, l’altro è il fronte dell’efficienza con un tetto più basso.

Se la capacità pura su compiti difficili è la tua unica variabile, Fable 5 vince nettamente. Ma la proposta di valore di Flash non è "quasi altrettanto buono a meno". Non voglio sminuirlo: offre un’intelligenza quasi di frontiera, erogata abbastanza velocemente e a un costo sufficientemente basso da poterla usare in contesti in cui Fable 5 non era mai stato economicamente sostenibile.

Author

Josef Waples

Argomenti

Intelligenza artificiale

Impara con DataCamp

Corso

Concetti sui Large Language Models (LLM)

2 h

104K

Scopri il pieno potenziale degli LLM con il nostro corso concettuale su applicazioni, metodologie di training, aspetti etici e ultime ricerche.

Vedi dettagli

Inizia Il Corso

Corso

Introduzione ai modelli Claude

3 h

12.4K

Scopri come usare Claude con l'API di Anthropic per risolvere problemi del mondo reale e creare app basate sull'intelligenza artificiale.

Vedi dettagli

Inizia Il Corso

Corso

AI pratica con Google Gemini e NotebookLM

2 h

8.1K

Impara a usare Gemini e NotebookLM per automatizzare le attività, aumentare la produttività e lavorare in modo più intelligente nell'ecosistema AI di Google.

Vedi dettagli

Inizia Il Corso

Mostra altro

Che cos’è Claude Fable 5?

Che cos’è Gemini 3.5 Flash?

Claude Fable 5 vs. Gemini 3.5 Flash: confronto diretto

Risultati dei benchmark

Prezzi, velocità e accesso

Prestazioni nel coding e nei compiti agentici

Velocità e latenza

Prestazioni su contesti lunghi

Prezzi e disponibilità

Quando scegliere Claude Fable 5 vs Gemini 3.5 Flash

Scegli Claude Fable 5 se...

Scegli Gemini 3.5 Flash se...

Considerazioni finali

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Concetti sui Large Language Models (LLM)

Introduzione ai modelli Claude

AI pratica con Google Gemini e NotebookLM

Concetti sui Large Language Models (LLM)