Corso
Se stai scegliendo tra Claude Fable 5 (che, avviso, è stato lanciato solo due giorni fa) e Gemini 3.5 Flash, in realtà stai scegliendo tra due filosofie diverse su cosa debba essere un modello di frontiera.
Claude Fable 5 è il tetto massimo delle capacità di Anthropic: il modello pubblico più forte sulla maggior parte dei benchmark, con un prezzo proporzionato di $10/$50 per milione di token, e dotato di un sistema di classificazione che può reindirizzare le richieste sensibili a un modello diverso durante la sessione.
Gemini 3.5 Flash è la scommessa di Google sul giusto equilibrio tra velocità, costo e intelligenza: un modello di fascia "Flash" che supera il più grande Gemini 3.1 Pro di Google sui benchmark di coding e agentici. È circa 4 volte più veloce dei modelli di frontiera comparabili e costa $1,50/$9 per milione di token, quindi è molto meno costoso.
In questo articolo, confronterò i due modelli su cinque dimensioni:
- prestazioni nel coding e nei compiti agentici
- velocità e latenza
- lavoro con contesti lunghi
- prezzi
Se invece stai confrontando Fable 5 con il modello di punta di OpenAI, sappi che abbiamo un articolo a parte: Claude Fable 5 vs GPT-5.5.
Teniamo i nostri lettori aggiornati sulle ultime novità dell’AI con The Median, la nostra newsletter gratuita del venerdì che riassume le notizie chiave della settimana. Clicca sul link qui sopra, iscriviti e resta sul pezzo dedicando solo pochi minuti ogni settimana.
Che cos’è Claude Fable 5?
Claude Fable 5 è il primo modello di classe Mythos di Anthropic disponibile per l’uso generale. Fable 5 condivide il modello sottostante con Claude Mythos 5, ma viene distribuito con i classificatori di sicurezza attivi: una sonda monitora le attivazioni interne su tutto il traffico e le richieste segnalate vengono inoltrate a un classificatore LLM addestrato. Le richieste bloccate vengono reindirizzate a Claude Opus 4.8.
Fable 5 è all’avanguardia su quasi tutti i benchmark testati ed è davvero fortissimo in ingegneria del software, lavori di conoscenza, visione e compiti agentici di lungo orizzonte. Inoltre, più il compito è lungo e complesso, maggiore è il suo vantaggio rispetto ai precedenti modelli Claude.
Che cos’è Gemini 3.5 Flash?
Gemini 3.5 Flash è la release di maggio di Google DeepMind, annunciata al Google I/O 2026 come primo modello della nuova famiglia Gemini 3.5. Nonostante il branding "Flash", non è un modello economico nel senso tradizionale: supera il più grande Gemini 3.1 Pro di Google nella suite di coding e agentica, pur andando circa 4 volte più veloce dei modelli di frontiera comparabili.
Gemini 3.5 Flash è un modello di ragionamento con parametri di impegno nel pensiero configurabili (minimal, low, medium, high). (Per la cronaca, l’impostazione predefinita è medium.) Il modello supporta una finestra di contesto da 1 milione di token, input multimodale (testo, immagine, audio, video, PDF) e produce a circa 280+ token al secondo. Google lo ha reso il modello predefinito nell’app Gemini e nell’AI Mode in Search dal giorno del lancio. Ci aspettiamo che Gemini 3.5 Pro segua a breve.
Una nota importante: 3.5 Flash costa circa 3 volte in più per token rispetto al suo predecessore, Gemini 3 Flash ($0,50/$3,00). Quindi, è economico rispetto ai modelli di punta, non rispetto alla sua stessa linea. E poiché i token di pensiero vengono fatturati alla tariffa di output, i carichi di lavoro ad alto sforzo di ragionamento con impegno elevato possono costare più di quanto sembri dal prezzo di listino. È qualcosa di cui tenere conto.
Claude Fable 5 vs. Gemini 3.5 Flash: confronto diretto
Ecco un rapido riepilogo prima di entrare nei dettagli. Ho preparato due tabelle: una per i risultati dei benchmark e un’altra per aspetti più pratici come prezzi, velocità e accesso.
Risultati dei benchmark
| Benchmark | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| SWE-Bench Pro | 80.3% | 55.1% (Pubblico) |
| Terminal-Bench 2.1 | 88.0%* | 76.2% |
| Humanity's Last Exam (con strumenti) | 64.5% | È dietro a Gemini 3.1 Pro (non direttamente comparabile) |
| OSWorld-Verified | 85.0% | Non pubblicato |
| MCP Atlas (coordinamento multi-strumento) | Non pubblicato | 83.6% |
Come vedi, Claude Fable 5 vince in tutti i confronti diretti sui benchmark in cui esistono dati facilmente comparabili tra i due.
Prezzi, velocità e accesso
Come accennato prima: il prezzo è decisamente migliore (molto migliore) per Gemini 3.5 Flash.
| Caratteristica | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| Prezzo input API (per 1M token) | $10 | $1,50 |
| Prezzo output API (per 1M token) | $50 | $9,00 |
| Prezzo input in cache | — | $0,15 per 1M (sconto 90%) |
| Velocità di output | Latenza standard da modello di frontiera | ~280+ token/s, ~4x più veloce dei pari di frontiera |
| Finestra di contesto | Compiti agentici multimilionari a lunga esecuzione dichiarati; nessun MRCR pubblicato a 512K+ | 1M token (limite input 1.048.576) |
| Disponibilità generale | Limitata (crediti di utilizzo richiesti dopo il 22 giugno) | Sì (app Gemini, AI Studio, Antigravity, API, AI Mode in Search) |
Prestazioni nel coding e nei compiti agentici
Le prestazioni nel coding e nel lavoro agentico meritano una discussione a parte perché è qui che il divario di capacità è più ampio.
Su SWE-Bench Pro, come vedi nella prima tabella, Fable 5 ottiene 80,3% contro il 55,1% di Gemini 3.5 Flash sul set pubblico. È un gap di 25 punti. Per l’ingegneria a livello di repository su codebase complesse, è una differenza concreta. Probabilmente Fable 5 può risolvere autonomamente problemi reali su GitHub nella maggior parte dei casi, e non sono sicuro si possa dire lo stesso di Gemini 3.5 Flash.
Dove Gemini 3.5 Flash recupera è nella capacità di throughput agentico più che nella profondità. Flash è esplicitamente ottimizzato per cicli di esecuzione paralleli, deployment di sotto-agenti e iterazione rapida. Il suo 83,6% su MCP Atlas — un benchmark di coordinamento multi-strumento, dove batte il 75,3% di GPT-5.5 — suggerisce un modello pensato per orchestrare molte chiamate a strumenti veloci, più che sostenere una singola catena di ragionamento lunga e profonda. Google riporta inoltre notevoli guadagni di efficienza in token in scenari agentici reali rispetto alle versioni Flash precedenti.
Il modo giusto di pensarci: se il tuo agente deve riflettere a fondo su un numero ridotto di passaggi difficili (refactor complessi, cambiamenti architetturali, debugging spinoso), vince Fable 5. Se il tuo agente deve eseguire molti passaggi veloci e moderatamente difficili in parallelo (pipeline di scraping-e-sintesi, orchestrazione multi-strumento, triage ad alto volume), il profilo di velocità e costo di Flash ha molto senso.
Velocità e latenza
Gemini 3.5 Flash produce a circa 280+ token al secondo — diverse volte più veloce rispetto ai tipici modelli di punta di frontiera.
Fable 5, invece, non è posizionato come modello veloce. È il modello che usi quando il compito è abbastanza difficile da valere l’attesa per la risposta.
Prestazioni su contesti lunghi
Gemini 3.5 Flash supporta un input di contesto di circa 1 milione di token e la linea Gemini è storicamente forte nel recupero su contesti lunghi. Tuttavia, a quanto pare Flash è dietro al Gemini 3.1 Pro di Google su MRCR v2.
Anthropic afferma che Fable 5 resta focalizzato per milioni di token in compiti di lunga durata e migliora gli output usando le proprie note. Ma Anthropic non ha pubblicato punteggi in stile MRCR nell’intervallo 512K–1M, quindi un confronto alla pari non è possibile.
Per la revisione di documenti da un milione di token, nessuno dei due modelli ha qui un vantaggio pubblicato e decisivo. Se l’affidabilità su contesti lunghi è la tua variabile più importante, il 74,0% pubblicato di GPT-5.5 su MRCR v2 a 512K–1M attira la nostra attenzione.
Prezzi e disponibilità
C’è una differenza di prezzo. Fable 5 costa $10 per milione di token in input e $50 per milione di token in output. Gemini 3.5 Flash costa rispettivamente $1,50 e $9,00, e offre anche input in cache a $0,15 per milione, cioè uno sconto del 90%. Gemini 3.5 Flash è circa sei o sette volte più economico in input e cinque o sei volte più economico in output.
Detto ciò, i prezzi non sono mai così semplici: innanzitutto sappi che Flash è un modello di ragionamento i cui token di pensiero vengono fatturati alla tariffa di output, quindi i carichi di lavoro di ragionamento ad alto sforzo possono consumare significativamente più token di output di quanto sembri dal prompt. Valuta il tuo carico prima di dare per scontato che Flash sia economico per il tuo caso d’uso. Inoltre, quando i classificatori di Fable 5 reindirizzano una richiesta, la fatturazione avviene alle tariffe di Opus 4.8 ($5/$25), non a quelle di Fable 5. Anche se probabilmente è un fattore di mitigazione dei costi limitato.
La disponibilità è l’altra asimmetria. Gemini 3.5 Flash è diventato generalmente disponibile dal primo giorno su app Gemini, Google AI Studio, Antigravity, API Gemini e AI Mode in Search. L’accesso in abbonamento a Fable 5 ha una scadenza: gli abbonati Pro, Max, Team ed Enterprise avevano accesso gratuito solo fino al 22 giugno 2026, data ormai vicina, dopo di che sono richiesti crediti di utilizzo oltre all’abbonamento esistente.
Quando scegliere Claude Fable 5 vs Gemini 3.5 Flash
La decisione si riduce a due variabili:
- se i tuoi compiti sono abbastanza difficili da richiedere il tetto di Fable 5
- se velocità e costo per chiamata dominano la tua economia
| Caso d’uso | Consigliato | Perché |
|---|---|---|
| Ingegneria software a livello di repository su codebase complesse | Claude Fable 5 | 80,3% vs 55,1% su SWE-Bench Pro è un gap di 25 punti che riflette differenze di capacità reali |
| Pipeline agentiche ad alto volume e sensibili alla latenza | Gemini 3.5 Flash | ~280+ tok/s in output, esecuzione parallela di sotto-agenti e costi per token 5–7x inferiori si sommano su migliaia di chiamate |
| Prodotti consumer interattivi e chat UX | Gemini 3.5 Flash | Il vantaggio di velocità 4x è una feature di prodotto; latenza e prezzi di Fable 5 non si adattano all’uso consumer ad alta frequenza |
| Finanza complessa e lavori di conoscenza | Claude Fable 5 | Guida l’Hebbia Finance Benchmark e Humanity’s Last Exam con strumenti (64,5%) |
| Orchestrazione multi-strumento su molti servizi | Gemini 3.5 Flash | L’83,6% su MCP Atlas è il punteggio pubblicato più alto di coordinamento multi-strumento tra i modelli di frontiera |
| Pipeline multimodali (input video, audio, PDF) | Gemini 3.5 Flash | Input multimodale nativo su testo, immagine, audio, video e PDF |
| Settori regolamentati che richiedono zero data retention | Gemini 3.5 Flash | La conservazione obbligatoria di 30 giorni di Fable 5 è un blocco rigido per alcune aziende |
Scegli Claude Fable 5 se...
- Il tuo caso d’uso principale è l’ingegneria software a livello di repository
- Hai bisogno del tetto massimo disponibile per lavori analitici complessi — finanza, ragionamento multidisciplinare, compiti agentici di lungo orizzonte — e la latenza è secondaria.
- Il tuo lavoro non è vicino a cybersecurity, biologia o chimica, quindi i reindirizzamenti del classificatore difficilmente incideranno sulle tue sessioni.
Scegli Gemini 3.5 Flash se...
- La tua economia è guidata dal volume: migliaia di chiamate al giorno in cui la differenza di costo si accumula fino a ordini di grandezza di spesa.
- La velocità è un requisito di prodotto — UX interattive, agenti in tempo reale o pipeline in cui il tempo totale su molte chiamate a strumenti conta più della profondità per singolo passaggio.
- Ti serve un ampio input multimodale (video, audio, PDF) in un unico modello.
- La policy dati della tua azienda non può accettare la conservazione obbligatoria di 30 giorni di Fable 5, o ti serve un modello che non venga sostituito silenziosamente a metà pipeline.
Considerazioni finali
Non è davvero un confronto alla pari. Fable 5 e Gemini 3.5 Flash occupano posizioni diverse sul mercato: uno è il tetto delle capacità con un certo attrito, l’altro è il fronte dell’efficienza con un tetto più basso.
Se la capacità pura su compiti difficili è la tua unica variabile, Fable 5 vince nettamente. Ma la proposta di valore di Flash non è "quasi altrettanto buono a meno". Non voglio sminuirlo: offre un’intelligenza quasi di frontiera, erogata abbastanza velocemente e a un costo sufficientemente basso da poterla usare in contesti in cui Fable 5 non era mai stato economicamente sostenibile.

Sono uno scrittore e editor di data science, con contributi a articoli di ricerca su riviste scientifiche. Sono particolarmente interessato ad algebra lineare, statistica, R e affini. Inoltre, gioco anche parecchio a scacchi!