Vai al contenuto principale

Google I/O 2026: l'inizio dell'era agentica di Gemini

Da Gemini 3.5 Flash e Gemini Omni ad Antigravity 2.0 e Gemini Spark, ecco cosa conta di più dal keynote di I/O 2026 incentrato sugli agenti di Google.
Aggiornato 20 mag 2026  · 12 min leggi

Il filo conduttore di quasi ogni annuncio del primo giorno della conferenza Google I/O 2026 è stato lo stesso: gli agenti. Non chatbot, non assistenti, ma agenti persistenti che eseguono compiti in background e si integrano nell'intero stack di prodotti Google. Il CEO Sundar Pichai l'ha definita esplicitamente l'"era agentica di Gemini", e gli annunci hanno confermato questa impostazione.

Google ha anche risposto agli abbonamenti Claude Max di Anthropic e ChatGPT Pro di OpenAI introducendo un nuovo livello Google AI Ultra all'I/O, che ha lo stesso prezzo di 100 $/mese e limita l'accesso ad alcune delle funzionalità agentiche trattate di seguito.

In questo articolo ti guiderò attraverso gli annunci che contano di più per chi lavora con l'AI e per gli sviluppatori. Mi concentrerò sugli aggiornamenti già disponibili o in arrivo a breve. 

Gemini 3.5 Flash

Gemini 3.5 Flash è il rilascio di punta dei modelli presentati a I/O 2026. Supera Gemini 3.1 Pro nei benchmark agentici e di coding, mentre Google afferma che genera output con una velocità in token al secondo 4 volte superiore rispetto ad altri modelli di frontiera. Non possiamo ancora confermarlo, ma è sicuramente un'affermazione coraggiosa.

Nei benchmark, il salto prestazionale è visibile, soprattutto in MCP Atlas, CharXiV Reasoning e Finance Agent v2, tutti guidati da Gemini 3.5 Flash. Nel complesso, 3.5 Flash sembra competitivo con Claude Opus 4.7 e GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Qui vale la pena considerare anche il costo. Google sostiene che le aziende che elaborano circa 1 trilione di token al giorno potrebbero risparmiare oltre 1 miliardo di dollari all'anno spostando l'80% dei carichi di lavoro da altri modelli di frontiera a 3.5 Flash. È un messaggio diretto ai clienti enterprise di OpenAI e Anthropic. Gemini 3.5 Flash è disponibile da oggi tramite la Gemini API, Google AI Studio e l'app Gemini. Gemini 3.5 Pro è già in uso interno e atteso per il mese prossimo.

Per maggiori dettagli, ti consigliamo di leggere il nostro articolo su Gemini 3.5 Flash, dove trattiamo il nuovo modello più a fondo.

Gemini Omni

Gemini Omni è il nuovo modello generativo multimediale nativamente multimodale di Google, in grado di accettare qualsiasi combinazione di testo, immagini, audio e video in input e produrre output video. Il primo modello della famiglia, Gemini Omni Flash, è disponibile oggi nell'app Gemini, in Google Flow e su YouTube Shorts.

Il punto architetturale chiave è che Omni unifica ciò che prima era uno stack suddiviso (Veo per i video, Imagen per le immagini, sistemi audio separati) in un unico modello. Questo significa modifiche più coerenti e meno artefatti di pipeline quando si lavora tra modalità diverse. Google non ha pubblicato benchmark numerici per Omni al lancio, quindi la valutazione indipendente è ancora in sospeso. L'accesso API per sviluppatori e clienti enterprise arriverà nelle settimane successive all'I/O.

Lo abbiamo testato e ne abbiamo scritto in dettaglio nel nostro articolo su Gemini Omni. I primi risultati di generazione video sono stati altalenanti (almeno considerando l'asticella alzata da strumenti come Seedance 2.0), ma una versione più potente, Gemini Omni Pro, dovrebbe arrivare a breve.

Antigravity 2.0

Antigravity è la piattaforma di sviluppo di Google con priorità agli agenti, e la versione 2.0 presentata all'I/O è un'espansione significativa. In precedenza era posizionata come ambiente di coding; ora è una piattaforma completa per sviluppare, distribuire e gestire coorti di agenti AI autonomi. Il fulcro è una nuova applicazione desktop standalone che funge da hub centrale per l'orchestrazione degli agenti, permettendoti di eseguire più agenti in parallelo su compiti diversi simultaneamente.

L'ecosistema ora offre quattro superfici distinte per gli sviluppatori:

  • App desktop Antigravity 2.0: Orchestra più agenti in parallelo e supporta attività pianificate in background. Si integra con Google AI Studio, Android e Firebase.
  • Antigravity CLI: Un'interfaccia terminale per creare ed eseguire agenti senza GUI. Google chiede agli utenti di Gemini CLI di migrare qui.
  • Antigravity SDK: Accesso programmatico allo stesso framework di agenti che alimenta i prodotti Google, con supporto per comportamenti personalizzati ospitati sulla tua infrastruttura.
  • Antigravity nella Gemini Enterprise Agent Platform: Collega direttamente Antigravity ai progetti Google Cloud per carichi di lavoro enterprise.

Ci sono anche un paio di nuove funzionalità molto utili per l'agente core. La principale: ora può generare sottoagenti modulari al volo, ognuno in esecuzione in parallelo con isolamento dello spazio di lavoro ed ereditando le configurazioni degli strumenti e le autorizzazioni del genitore. Le operazioni di lunga durata vengono eseguite in modo asincrono, quindi non bloccano più il loop dell'agente.

Simili ai Claude Code Hooks, i JSON Hooks consentono agli utenti di collegare script shell personalizzati in fasi chiave dell'esecuzione (prima/dopo chiamate a strumenti, chiamate al modello o al verificarsi di condizioni di arresto) per logging, personalizzazione degli argomenti o iniezione di istruzioni. Le attività pianificate ti permettono di impostare prompt basati su cron per esecuzioni periodiche dell'agente come riepiloghi PR giornalieri o controlli di deploy orari, con i risultati visibili nella barra laterale per un passaggio senza attriti all'interazione con un umano nel loop.

Sul fronte della gestione, Antigravity introduce i "progetti" come primitiva organizzativa che definisce impostazioni, risorse e permessi per gruppo di agenti, invece di richiedere le autorizzazioni globali più ampie per tutto. Il pannello laterale rinnovato supporta il raggruppamento delle conversazioni per progetto, stato o recentità, con supporto nativo ai worktree Git integrato. Questo layout basato sui progetti è paragonabile alla gestione multi-finestra di Cursor e alla coda di task di Codex, ma con uno scoping dei permessi per progetto più rigoroso.

I worktree Git nativi possono essere creati facilmente all'avvio di una nuova conversazione.

Input vocale tramite i modelli Gemini Audio e nuovi slash command (/goal per esecuzioni autonome, /grill-me per chiarimenti pre-task, /schedule per prompt cron, /browser per l'uso del browser su opt-in) completano l'esperienza utente.

Antigravity 2.0 è disponibile per gli utenti a partire da oggi. Il piano Google AI Ultra (100 $/mese) include un limite d'uso 5 volte superiore in Antigravity rispetto al piano Google AI Pro.

Agent gestiti nella Gemini API

Insieme ad Antigravity 2.0, Google ha annunciato i Managed Agents nella Gemini API, che portano capacità agentiche direttamente nel livello API per gli sviluppatori che vogliono creare applicazioni basate su agenti senza gestire in proprio l'infrastruttura di orchestrazione. È il complemento a livello API dell'esperienza desktop di Antigravity.

La conseguenza pratica per gli sviluppatori è che ora puoi definire comportamenti degli agenti, integrazioni di strumenti e workflow multi-step tramite la Gemini API e lasciare che l'infrastruttura di Google ne gestisca l'esecuzione. Questo ha il potenziale di cambiare davvero le carte in tavola per i team che costruiscono applicazioni in produzione che richiedono esecuzione di compiti a lungo raggio senza dover avviare e gestire un proprio framework per agenti. L'accesso è disponibile tramite Google AI Studio, e i clienti enterprise possono raggiungerlo tramite la Gemini Enterprise Agent Platform.

Un caveat onesto: dai primi feedback degli sviluppatori nella copertura dell'I/O emerge che la documentazione per i flussi agentici complessi e la gestione degli errori è ancora scarsa. Anche i limiti di frequenza e la gestione delle quote sono segnalati come punti di attrito. Sono entrambi aspetti che probabilmente diventeranno meno problematici con il tempo, ma vale la pena saperlo prima di impegnarsi a costruire su questo stack.

Gemini Spark

Gemini Spark (da non confondere con l'LLM più recente di Meta, Muse Spark) è il nuovo agente AI personale di Google, ed è l'annuncio agentico più orientato ai consumatori. Funziona 24/7 su macchine virtuali dedicate in Google Cloud, quindi non richiede che il tuo laptop sia aperto per continuare a lavorare. Spark è alimentato da Gemini 3.5 e dal framework Antigravity, che gli conferisce la capacità di gestire compiti a lungo raggio in background.

Il set di funzionalità al lancio include:

  • Integrazione con gli strumenti Google (Workspace, Gmail, Calendar) al lancio, con supporto per strumenti di terze parti tramite MCP nelle settimane successive.
  • Interazione tramite l'app Gemini e presto anche via email e chat.
  • Operatività direttamente in Chrome come livello di browser agentico, in arrivo più avanti in estate.
  • Avanzamento delle attività in tempo reale visibile tramite Android Halo, un nuovo spazio UI su Android, in arrivo entro fine anno.

Il confronto con l'ecosistema di agenti di OpenAI e le capacità di uso degli strumenti di Anthropic è pertinente. Il fattore distintivo di Spark è l'esecuzione persistente 24/7 sull'infrastruttura Google Cloud, combinata con un'integrazione profonda nella suite di produttività Google. Se il tuo lavoro vive già in Google Workspace, è un vantaggio concreto. Se non è così, la proposta di valore è meno evidente.

La privacy è la preoccupazione legittima qui. Un agente che monitora continuamente la tua casella di posta, il calendario e i documenti solleva domande reali su residenza dei dati e conformità nei settori regolamentati. Una domanda che mi ponevo, ad esempio, era: "Cosa succede alla memoria dell'agente quando un dipendente se ne va?" Google non ha ancora fornito risposte dettagliate a queste domande. Spark viene distribuito a tester fidati questa settimana, con una Beta per gli abbonati a Google AI Ultra (100 $/mese) negli Stati Uniti la settimana successiva.

Agent gestiti vs Gemini Spark

Agenti di ricerca e AI Mode

AI Mode in Search è stato introdotto al precedente I/O. A un anno di distanza, ha superato 1 miliardo di utenti attivi mensili. Ora Google spinge oltre con due nuove capacità agentiche.

La prima sono gli agenti informativi in Search: agenti personalizzati in background che configuri per monitorare argomenti e mostrarti le informazioni rilevanti al momento giusto. L'uscita è prevista per quest'estate, a partire dagli abbonati Google AI Pro e Ultra.

La seconda è la UI generativa in Search, alimentata da Gemini 3.5 Flash e Antigravity. Search ora costruirà layout personalizzati, visualizzazioni interattive e persino dashboard persistenti o mini-app per query complesse e di lunga durata. Le funzionalità di UI generativa arriveranno gratuitamente a tutti gli utenti quest'estate. Le funzionalità di dashboard persistente e app personalizzate saranno disponibili prima per gli abbonati Pro e Ultra negli Stati Uniti.

Questo è un vero problema per editori e professionisti SEO (come già lo sono state le introduzioni di AI Overview e AI Mode). Quando le risposte generate dall'AI risolvono completamente la query dell'utente direttamente in Search, non c'è motivo di fare clic sul sito sorgente. L'abbiamo già visto: sia gli AI Overview sia il rollout iniziale di AI Mode hanno portato a cali di traffico significativi nel settore. Google non ha ancora introdotto un modo chiaro per condividere i ricavi o garantire traffico agli editori i cui contenuti alimentano queste risposte.

Google Flow

Google Flow, presentato a I/O 2025 come strumento di filmmaking con AI, ha fatto un grande passo avanti con tre aggiornamenti chiave:

  • Agente di pianificazione più intelligente. L'agente aggiornato di Flow ora può pianificare e ragionare attraverso progetti creativi multi-step. Tu fornisci gli input (ad esempio un concept, alcune immagini di riferimento, una bozza di script) e lui ti aiuta a passare dal brainstorming iniziale alla creazione e al montaggio, tutto in un unico ambiente. Il nuovo agente è disponibile da oggi per tutti.
  • Video nativo tramite Gemini Omni. Flow ora gestisce nativamente generazione ed editing video tramite il modello Omni. Puoi descrivere in linguaggio naturale le modifiche a una clip del tuo rullino e iterare in modo conversazionale. È migliorata anche la coerenza dei personaggi, così identità e voce vengono preservate tra le scene. Questo è particolarmente utile se stai producendo un cortometraggio o una campagna pubblicitaria con personaggi ricorrenti.
  • Vibe coding per strumenti personalizzati. Invece di essere limitato agli strumenti inclusi in Flow, ora puoi crearne di tuoi direttamente sulla piattaforma. Google ha mostrato esempi come la progettazione di effetti video personalizzati, la creazione di strumenti per animazioni disegnate a mano e la costruzione di workflow di layering del testo, il tutto senza uscire da Flow.

Nel complesso, questi aggiornamenti posizionano Flow come qualcosa di più di un assistente creativo. Sta diventando una piattaforma per costruire workflow creativi, con un'app mobile ora in beta su Android e presto in arrivo su iOS.

Espansione di SynthID

SynthID, il sistema invisibile di watermarking AI di Google, ha ora applicato watermark a oltre 100 miliardi di immagini e video e a 60.000 anni di asset audio dal suo lancio tre anni fa. L'annuncio dell'I/O più importante qui non è la scala, ma i partner: OpenAI, Kakao ed Eleven Labs stanno adottando SynthID insieme a Nvidia, che ha aderito l'anno scorso.

L'adozione trasversale al settore è ciò che la rende significativa. Uno standard di watermarking funziona solo se è sufficientemente diffuso da rendere "non watermarkato" un segnale utile. Google sta anche espandendo la verifica dei Content Credentials (lo standard C2PA) a Search e Chrome, che mostreranno agli utenti se un contenuto proviene dall'AI o da una fotocamera e se è stato modificato con strumenti generativi. La combinazione di SynthID e C2PA offre due livelli indipendenti di provenienza, l'approccio giusto dato quanto facilmente ciascuno dei due può essere rimosso singolarmente.

Menzioni d'onore

Diversi altri annunci dall'I/O meritano una breve nota:

  • Docs Live: Una nuova funzionalità voice-first per Google Docs che ti permette di dettare idee a voce e lasciare che Gemini le strutturi in un documento. In rollout per gli abbonati quest'estate, con funzionalità vocali in arrivo contemporaneamente su Gmail e Keep.
  • Google Pics: Un nuovo strumento AI per creazione e modifica di immagini basato sul modello Nano Banana, che tratta ogni elemento come un oggetto individuale anziché come un'immagine piatta. Disponibile ora per tester fidati, in rollout per gli abbonati Google AI Pro e Ultra più avanti in estate.
  • Android Halo: Un nuovo spazio UI su Android per visualizzare aggiornamenti live e avanzamento delle attività da agenti come Gemini Spark. In arrivo entro fine anno.
  • Daily Brief: Un agente pronto all'uso nell'app Gemini che compila un riepilogo mattutino personalizzato dalla tua inbox, dal calendario e dalle attività, con i prossimi passi suggeriti. Nessun prezzo separato annunciato; dovrebbe far parte dell'esperienza dell'app Gemini.
  • TPU 8t e 8i: Le TPU di ottava generazione di Google adottano un approccio a doppio chip, con 8t ottimizzato per il pretraining su larga scala (quasi 3 volte la potenza di calcolo grezza della generazione precedente, scalabile su oltre 1 milione di TPU a livello globale) e 8i ottimizzato per l'inferenza. Entrambe offrono fino a 2 volte migliori prestazioni per watt rispetto alla generazione precedente.
  • Gemini for Science: Una raccolta di strumenti AI che collega Antigravity a oltre 30 principali database di scienze della vita. Science Skills è disponibile oggi su GitHub e direttamente in Antigravity.

Considerazioni finali

Google I/O 2026 ha puntato sugli agenti come direzione primaria dell'AI, con Gemini 3.5 Flash e Antigravity 2.0 come infrastruttura alla base di quasi tutto il resto annunciato. Le cose che puoi usare subito sono Gemini 3.5 Flash (tramite la Gemini API e AI Studio), il nuovo agente di Flow, Gemini Omni Flash e l'app desktop Antigravity 2.0. Gemini Spark, gli agenti di Search e le funzionalità di UI generativa in Search verranno distribuiti durante l'estate, per lo più dietro il nuovo livello AI Ultra da 100 $/mese (almeno inizialmente).

Per me, l'aggiornamento di Antigravity è stato il rilascio più interessante, perché opera su due livelli contemporaneamente: come app standalone per sviluppatori, compete direttamente con Codex e Claude Code; come piattaforma, il suo ADK sottostante e l'API Managed Agents sfidano framework di orchestrazione come LangChain, AutoGen e l'Agents SDK di OpenAI. L'integrazione con Gemini e il livello di deployment su Google Cloud sono i fattori distintivi (e il rischio di lock-in) su entrambi i fronti.

Google I/O 2026 - Domande frequenti

Come si confronta Gemini 3.5 Flash con GPT-5.5 e Claude Opus 4.7?

Gemini 3.5 Flash è in testa su diversi benchmark agentici come MCP Atlas (83,6%) e Finance Agent v2 (57,9%), mentre GPT-5.5 è avanti su SWE-Bench Pro e ARC-AGI-2. Claude Opus 4.7 resta il più forte su Humanity's Last Exam (46,9%). La conclusione principale è che è competitivo con i modelli di frontiera pur essendo più veloce e significativamente più economico su larga scala, come suggerisce il nome. È attesa a breve una variante Pro più potente.

In cosa differisce Google Antigravity da Claude Code o Codex?

Google Antigravity 2.0 è una piattaforma di sviluppo con priorità agli agenti che ti permette di orchestrare più agenti AI in parallelo tramite un'app desktop, una CLI, un SDK e un'API enterprise. A differenza di Claude Code (un agente di coding nativo da terminale) o Codex (un sistema basato su code di task), Antigravity offre uno scoping dei permessi più rigoroso per progetto, generazione di sottoagenti e integrazione diretta con Google Cloud e Firebase. Il suo doppio ruolo di strumento per sviluppatori e di SDK di piattaforma la rende più paragonabile a un framework di orchestrazione che a un assistente di coding standalone.

Il piano Google AI Ultra da 100 $/mese vale la pena rispetto a ChatGPT Pro o Claude Max?

Tutti e tre i piani costano 100 $/mese, ma il valore dipende dal tuo ecosistema. Il punto distintivo di Google AI Ultra è l'accesso a Gemini Spark (un agente persistente 24/7), limiti d'uso di Antigravity 5 volte superiori e un'integrazione profonda con Google Workspace. Se il tuo workflow vive già in Gmail, Docs e Calendar, Ultra ha un vantaggio naturale. Se hai soprattutto bisogno di assistenza al coding o flessibilità a livello di API, ChatGPT Pro o Claude Max potrebbero servirti meglio.

Che cos'è Gemini Omni e come gestisce la generazione video?

Gemini Omni è il modello nativamente multimodale di Google che accetta qualsiasi combinazione di testo, immagini, audio e video in input e produce output video. Unifica sistemi prima separati (Veo per i video, Imagen per le immagini) in un unico modello, il che dovrebbe portare a modifiche cross-modali più coerenti. La prima versione, Omni Flash, è disponibile ora, con un Omni Pro più capace atteso a breve. Non sono ancora stati pubblicati benchmark indipendenti, quindi la qualità nel mondo reale è ancora in valutazione.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom è un data scientist e formatore tecnico. Scrive e gestisce i tutorial e i post del blog di DataCamp su data science. In precedenza, Tom ha lavorato nella data science presso Deutsche Telekom.

Argomenti

Scopri l'ecosistema AI di Google!

Programma

Google Workspace with Gemini

4 h
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Vedi dettagliRight Arrow
Inizia il corso
Mostra altroRight Arrow
Correlato

blog

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Scopri i 15 migliori server MCP remoti che stanno trasformando lo sviluppo AI nel 2026. Scopri come migliorano automazione, ragionamento, sicurezza e velocità dei workflow.
Abid Ali Awan's photo

Abid Ali Awan

15 min

blog

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Guida al preprocessing NLP nel machine learning. Copriamo spaCy, i transformer di Hugging Face e come funziona la tokenizzazione in casi d'uso reali.
Abid Ali Awan's photo

Abid Ali Awan

10 min

blog

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

Esplora le basi di Snowflake, la piattaforma dati cloud. Scopri la sua architettura, le sue funzionalità e come integrarla nelle tue pipeline di dati.
Tim Lu's photo

Tim Lu

12 min

Mostra altroMostra altro