Gemini 3.5 Flash: il modello agentico più veloce di Google

Google ha lanciato Gemini 3.5 Flash a I/O 2026, un modello che supera Gemini 3.1 Pro nei benchmark agentici e di coding, funzionando quattro volte più velocemente dei concorrenti.

Aggiornato 19 mag 2026 · 8 min leggi

Il 19 maggio, a I/O 2026, Google ha annunciato Gemini 3.5 Flash, un modello che supera Gemini 3.1 Pro nei benchmark agentici e di coding, offrendo al contempo una velocità quattro volte superiore rispetto ad altri modelli d’avanguardia della stessa categoria.

Il rilascio arriva mentre l’attenzione competitiva dell’industria dell’AI si è spostata decisamente sulle prestazioni agentiche. Agenti per il coding, automazione di workflow multi-step ed esecuzione di task di lunga durata sono diventati il terreno di scontro principale, e Google sta posizionando 3.5 Flash come la sua risposta a questo momento.

Per ogni tipo di professionista, inclusi data scientist, ML engineer e sviluppatori, questo è importante perché 3.5 Flash è ora (o lo sarà a breve) il modello predefinito nell’app Gemini e nella Modalità AI in Ricerca, ed è disponibile oggi tramite la Gemini API. In questo articolo, tratto ciò che è stato annunciato, cosa spicca, i numeri dei benchmark e cosa significa per il tuo lavoro.

Novità di Gemini 3.5 Flash

La promessa principale di Gemini 3.5 Flash è la velocità unita a prestazioni di livello frontiera. Google afferma che 3.5 Flash è quattro volte più veloce in termini di token di output al secondo rispetto ad altri modelli d’avanguardia, superando Gemini 3.1 Pro nei benchmark più rilevanti per il lavoro agentico.

Su Terminal-Bench 2.1, ottiene il 76,2%. Su GDPval-AA, raggiunge 1.656 Elo. Su MCP Atlas, arriva all’83,6%. Per la comprensione multimodale, segna l’84,2% su CharXiv Reasoning.

In breve, questi numeri indicano che la vecchia regola “veloce, economico o intelligente; scegline due” nell’AI è meno applicabile. Stiamo ottenendo un modello leggero capace di gestire workflow agentici complessi e multi-step senza un’enorme latenza.

Google afferma che il modello sarà generalmente disponibile oggi su Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform e Gemini Enterprise. È anche il nuovo modello predefinito nell’app Gemini e nella Modalità AI in Ricerca a livello globale.

Google ha inoltre annunciato che Gemini 3.5 Pro è in sviluppo, già in uso interno, e dovrebbe essere distribuito il mese prossimo. Il rilascio di 3.5 Flash è la prima mossa in quella che Google definisce una nuova famiglia di modelli basata sull’esecuzione agentica.

Contesto di Gemini 3.5

La serie Gemini 3 ha consolidato l’attuale posizione di Google nella corsa ai modelli d’avanguardia. Gemini 3.1 Pro, rilasciato a febbraio 2026, guidava l’Artificial Analysis Intelligence Index al lancio e ha ottenuto il 77,1% su ARC-AGI-2, più che raddoppiando il 31,1% di Gemini 3 Pro su quel benchmark.

Come abbiamo trattato nel nostro confronto tra GPT-5.5 e Gemini 3.1 Pro, il punto di forza di Gemini 3.1 Pro era il ragionamento visivo complesso e i task multimodali.

La denominazione Flash nella famiglia Gemini ha sempre indicato modelli ottimizzati per la velocità. La novità con 3.5 Flash è che Google rivendica un’intelligenza di livello frontiera a velocità Flash, senza compromessi sulla qualità. L’indice Artificial Analysis colloca 3.5 Flash nel quadrante in alto a destra (secondo Google), ovvero alta intelligenza e alta velocità di output simultaneamente.

L’harness Antigravity, il framework di Google per distribuire subagent collaborativi, è centrale nel posizionamento di 3.5 Flash. Non è solo un modello standalone, ma un componente in un’architettura multi-agente che Google ha sviluppato in parallelo al modello stesso.

Caratteristiche chiave di Gemini 3.5

Ecco una panoramica delle informazioni più interessanti dall’annuncio.

Prestazioni nei benchmark

Le affermazioni di Google sui benchmark di 3.5 Flash sono specifiche e vale la pena esaminarle direttamente. Il modello supera Gemini 3.1 Pro nei seguenti:

Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro era stato misurato su Terminal-Bench 2.0 al 68,5%, secondo la nostra precedente copertura)
GDPval-AA: 1.656 Elo (Claude Opus 4.7 guidava questo benchmark a 1.753 Elo al lancio, secondo la nostra analisi Claude Opus 4.7 vs Gemini 3.1 Pro)
MCP Atlas: 83,6% (Gemini 3.1 Pro ha ottenuto il 73,9% su MCP Atlas nei nostri test precedenti)
CharXiv Reasoning: 84,2% per la comprensione multimodale

Rilevante anche la velocità: quattro volte più rapido in token di output al secondo rispetto ad altri modelli d’avanguardia. Google non specifica contro quali modelli avvenga il confronto nelle note di ricerca, quindi considera questa cifra come indicativa, non un testa a testa preciso.

Architettura agentica e Antigravity

3.5 Flash è progettato per funzionare con l’harness Antigravity, il framework di Google per eseguire subagent collaborativi. Con Antigravity, il modello può distribuire più subagent in parallelo, eseguire workflow multi-step e mantenere prestazioni su task di lunga durata.

Gli esempi di Google includono la sintesi del paper AlphaZero e la programmazione di un gioco completamente giocabile in sei ore usando due agent, e la trasformazione di una codebase legacy in Next.js. Non sono demo giocattolo. Riflettono il tipo di task da sviluppatore che durano giorni e che oggi si chiede ai sistemi agentici di gestire.

Implementazioni reali in azienda

Diverse aziende stanno già eseguendo 3.5 Flash in produzione o in pilota. I casi d’uso specifici meritano attenzione perché mostrano dove vengono applicati i punti di forza agentici del modello:

Shopify: Esecuzione di subagent in parallelo per analizzare dati complessi su un orizzonte esteso per previsioni di crescita dei merchant
Macquarie Bank: Pilota per l’onboarding dei clienti ragionando su documenti di oltre 100 pagine con bassa latenza
Salesforce: Integrazione in Agentforce per l’automazione di task enterprise con più subagent e chiamate a tool multi-turn
Xero: Distribuzione di agent per gestire workflow di più settimane, inclusa la preparazione dei moduli fiscali 1099 per le piccole imprese
Databricks: Utilizzo di workflow agentici per monitorare informazioni in tempo reale, diagnosticare problemi e proporre soluzioni su grandi dataset
Ramp: Miglioramento dell’accuratezza OCR su fatture complesse grazie alla comprensione multimodale combinata con il ragionamento su pattern storici

Gemini Spark e disponibilità consumer

3.5 Flash è anche il modello alla base di Gemini Spark, il nuovo agente AI personale di Google che opera 24/7 ed esegue azioni per conto degli utenti. Google sta distribuendo Spark a tester fidati ora, con una Beta prevista per gli abbonati a Google AI Ultra negli Stati Uniti nella settimana successiva all’annuncio di I/O.

Il modello è disponibile oggi per miliardi di utenti a livello globale tramite l’app Gemini e la Modalità AI in Ricerca, rendendolo uno dei lanci consumer e developer più ampi in simultanea che Google abbia fatto per un modello Gemini.

Sicurezza e salvaguardie

Google afferma che 3.5 Flash è stato sviluppato secondo il suo Frontier Safety Framework, con salvaguardie rafforzate in ambito cyber e CBRN. L’azienda utilizza strumenti di interpretabilità che controllano il ragionamento interno del modello prima che risponda, con l’obiettivo di ridurre sia output dannosi sia rifiuti ingiustificati su query sicure.

Gemini 3.5 per professionisti Data e AI

L’implicazione pratica più immediata è che 3.5 Flash è disponibile a brevissimo tramite la Gemini API in Google AI Studio. Se stai costruendo pipeline agentiche, la combinazione del punteggio MCP Atlas (83,6%) e dell’harness multi-agente Antigravity rende questo modello degno di test rispetto a ciò che stai usando ora.

Il punteggio GDPval-AA di 1.656 Elo è inferiore ai 1.753 Elo di Claude Opus 4.7 dal nostro esame precedente, ma il vantaggio di velocità di 3.5 Flash può pesare di più in base ai tuoi requisiti di latenza.

Per i team che eseguono workflow di lunga durata, le implementazioni di Xero e Shopify sono i segnali più istruttivi. La compressione di workflow di più settimane in esecuzioni automatizzate di agent è il caso d’uso su cui Google sta ottimizzando, e l’harness Antigravity è lo strato infrastrutturale che lo rende possibile. Se non conosci già i pattern di orchestrazione multi-agente, questo è un buon momento per metterti al passo.

Una cosa che terrei d’occhio: Google afferma che 3.5 Flash costa meno della metà rispetto ad altri modelli d’avanguardia per task comparabili. Questa affermazione dipende molto dal carico specifico, ma se regge nella pratica, cambia l’economia della gestione di sistemi agentici su larga scala. Il modello 3.5 Pro, atteso il mese prossimo, sarà il punto di confronto più interessante per i team impegnati nei compiti di ragionamento più pesanti.

Considerazioni finali

Gemini 3.5 Flash mostra che Google intende competere su entrambe le estremità della curva prestazioni-velocità, non solo al livello di punta. Superare Gemini 3.1 Pro nei benchmark agentici pur funzionando a velocità Flash è un cambiamento significativo, e le implementazioni enterprise presso Shopify, Macquarie e Salesforce suggeriscono che il modello regge anche fuori dai benchmark controllati.

Il quadro più ampio è che Google sta puntando con decisione sull’infrastruttura agentica: Antigravity, Gemini Spark e 3.5 Flash vanno tutti nella stessa direzione. Se la scommessa pagherà dipende da come si comporterà 3.5 Pro quando arriverà il mese prossimo e da come l’harness Antigravity si confronterà con framework multi-agente concorrenti nei workflow reali degli sviluppatori.

Se vuoi aggiornarti sui concetti di AI agentica e su come costruire con modelli di questo tipo, ti consiglio di dare un’occhiata allo skill track AI Agent Fundamentals su DataCamp.

Author

Matt Crabtree

Argomenti

Intelligenza artificiale

AI Agents

I migliori corsi DataCamp

Programma

Nozioni di base sugli agenti AI

6 h

Scopri come gli agenti di intelligenza artificiale possono cambiare il tuo modo di lavorare e dare un valore aggiunto alla tua azienda!

Vedi dettagli

Inizia il corso

Corso

Introduzione all'AI per il lavoro

2 h

87.4K

Scopri cos’è l’intelligenza artificiale e come usarla responsabilmente per lavorare meglio ed essere più produttivo.

Vedi dettagli

Inizia il corso

Corso

AI pratica con Google Gemini e NotebookLM

2 h

7.4K

Impara a usare Gemini e NotebookLM per automatizzare le attività, aumentare la produttività e lavorare in modo più intelligente nell'ecosistema AI di Google.

Vedi dettagli

Inizia il corso

Mostra altro

Correlato

blog

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Scopri i 15 migliori server MCP remoti che stanno trasformando lo sviluppo AI nel 2026. Scopri come migliorano automazione, ragionamento, sicurezza e velocità dei workflow.

Abid Ali Awan

15 min

blog

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Guida al preprocessing NLP nel machine learning. Copriamo spaCy, i transformer di Hugging Face e come funziona la tokenizzazione in casi d'uso reali.

Abid Ali Awan

10 min

blog

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

Esplora le basi di Snowflake, la piattaforma dati cloud. Scopri la sua architettura, le sue funzionalità e come integrarla nelle tue pipeline di dati.

Tim Lu

12 min

Mostra altro Mostra altro

Novità di Gemini 3.5 Flash

Contesto di Gemini 3.5

Caratteristiche chiave di Gemini 3.5

Prestazioni nei benchmark

Architettura agentica e Antigravity

Implementazioni reali in azienda

Gemini Spark e disponibilità consumer

Sicurezza e salvaguardie

Gemini 3.5 per professionisti Data e AI

Considerazioni finali

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Nozioni di base sugli agenti AI

Introduzione all'AI per il lavoro

AI pratica con Google Gemini e NotebookLM

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

Nozioni di base sugli agenti AI