Accéder au contenu principal

Google I/O 2026 : le début de l’ère Gemini agentique

De Gemini 3.5 Flash et Gemini Omni à Antigravity 2.0 et Gemini Spark, voici l’essentiel du keynote I/O 2026 de Google, axé sur les agents.
Actualisé 20 mai 2026  · 12 min lire

Le fil conducteur de presque toutes les annonces du premier jour de la conférence Google I/O 2026 était clair : les agents. Pas des chatbots, ni de simples assistants, mais des agents persistants, exécutant des tâches en arrière-plan et intégrés à l’ensemble de la pile Google. Le PDG Sundar Pichai l’a présenté sans ambiguïté comme l’« ère Gemini agentique », et les annonces l’ont confirmé.

Google a également répondu aux abonnements Claude Max d’Anthropic et ChatGPT Pro d’OpenAI en introduisant un nouveau palier Google AI Ultra lors d’I/O, au même tarif de 100 $/mois, donnant accès à certaines des fonctionnalités agentiques décrites ci-dessous.

Dans cet article, je vous présente les annonces qui comptent vraiment pour les praticiens de l’IA et les développeurs. Je me concentre sur les mises à jour disponibles dès maintenant ou attendues très prochainement. 

Gemini 3.5 Flash

Gemini 3.5 Flash est la sortie de modèle phare d’I/O 2026. Il dépasse Gemini 3.1 Pro sur les benchmarks agentiques et de code, et Google affirme qu’il génère jusqu’à 4 fois plus vite en jetons de sortie par seconde que d’autres modèles de pointe. Nous ne pouvons pas encore le vérifier, mais c’est une affirmation ambitieuse.

Côté benchmarks, la progression est visible, notamment sur MCP Atlas, CharXiV Reasoning et Finance Agent v2, où Gemini 3.5 Flash prend la tête. Globalement, 3.5 Flash semble rivaliser avec Claude Opus 4.7 et GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Le volet coûts mérite l’attention. Google avance que des entreprises traitant environ 1 billion de jetons par jour pourraient économiser plus d’1 milliard de dollars par an en déplaçant 80 % des charges de travail depuis d’autres modèles de pointe vers 3.5 Flash. Un message adressé directement aux clients grands comptes d’OpenAI et d’Anthropic. Gemini 3.5 Flash est disponible dès aujourd’hui via l’API Gemini, Google AI Studio et l’application Gemini. Gemini 3.5 Pro est déjà utilisé en interne et attendu le mois prochain.

Pour aller plus loin, je vous recommande de lire notre article sur Gemini 3.5 Flash, où nous détaillons davantage le nouveau modèle.

Gemini Omni

Gemini Omni est le nouveau modèle génératif nativement multimodal de Google, capable de prendre en entrée n’importe quelle combinaison de texte, d’images, d’audio et de vidéo, et de produire une sortie vidéo. Le premier modèle de la famille, Gemini Omni Flash, est disponible aujourd’hui dans l’application Gemini, Google Flow et YouTube Shorts.

Point clé d’architecture : Omni réunit ce qui était auparavant une pile séparée (Veo pour la vidéo, Imagen pour l’image, systèmes audio dédiés) en un modèle unique. Résultat : des éditions plus cohérentes et moins d’artéfacts de pipeline entre modalités. Google n’a pas publié de benchmarks chiffrés pour Omni au lancement, donc l’évaluation indépendante est à venir. L’accès API pour les développeurs et entreprises arrivera dans les semaines suivant I/O.

Nous l’avons testé et détaillé dans notre article sur Gemini Omni. Les premiers résultats de génération vidéo sont inégaux (au regard des standards élevés fixés par des outils comme Seedance 2.0), mais un Gemini Omni Pro plus puissant est attendu bientôt.

Antigravity 2.0

Antigravity est la plateforme de développement axée agents de Google, et la version 2.0 annoncée à I/O marque une forte extension. Au-delà d’un simple environnement de code, c’est désormais une plateforme complète pour développer, déployer et gérer des cohortes d’agents d’IA autonomes. La pièce maîtresse est une nouvelle application de bureau autonome, véritable hub d’orchestration permettant d’exécuter plusieurs agents en parallèle sur des tâches différentes simultanément.

L’écosystème propose désormais quatre surfaces distinctes pour les développeurs :

  • Application de bureau Antigravity 2.0 : orchestre plusieurs agents en parallèle et gère des tâches planifiées en arrière-plan. Intégrée à Google AI Studio, Android et Firebase.
  • Antigravity CLI : une interface native terminal pour créer et exécuter des agents sans GUI. Google invite les utilisateurs de Gemini CLI à migrer vers cet outil.
  • Antigravity SDK : accès programmatique au même socle agentique qui propulse les produits Google, avec prise en charge de comportements personnalisés hébergés sur votre propre infrastructure.
  • Antigravity dans Gemini Enterprise Agent Platform : connecte directement Antigravity aux projets Google Cloud pour les charges de travail d’entreprise.

Le cœur de l’agent gagne aussi des fonctions très utiles. La plus marquante : il peut maintenant générer des sous-agents modulaires à la volée, chacun s’exécutant en parallèle avec isolement d’espace de travail et héritant des outils et permissions du parent. Les opérations longues s’exécutent de manière asynchrone et ne bloquent plus la boucle de l’agent.

Dans l’esprit des Claude Code Hooks, les JSON Hooks permettent d’attacher des scripts shell personnalisés à des étapes clés de l’exécution (avant/après les appels d’outils, les appels modèle ou aux conditions d’arrêt) pour la journalisation, l’ajustement des arguments ou l’injection d’instructions. Les tâches planifiées permettent de définir des invites de type cron pour des exécutions périodiques (digest quotidien de PR, vérifs horaires de déploiement), avec les résultats affichés dans la barre latérale pour un passage fluide en mode humain-dans-la-boucle.

Côté gestion, Antigravity introduit les « projets » comme unité d’organisation qui borne les réglages, ressources et permissions par groupe d’agents, plutôt que d’exiger des droits globaux trop larges. Le panneau latéral repensé prend en charge le regroupement des conversations par projet, statut ou récence, avec une prise en charge native des worktrees Git. Cette approche par projet se compare à la gestion multi-fenêtres de Cursor et à la file de tâches de Codex, avec un scoping de permissions plus strict par projet.

Les worktrees Git natifs peuvent être créés facilement lors du démarrage d’une nouvelle conversation.

Saisie vocale via les modèles audio Gemini et nouvelles commandes slash (/goal pour des exécutions autonomes, /grill-me pour clarifier avant tâche, /schedule pour des invites cron, /browser pour l’usage du navigateur sur opt-in) complètent l’expérience.

Antigravity 2.0 est disponible dès aujourd’hui. L’offre Google AI Ultra (100 $/mois) inclut une limite d’usage 5 fois supérieure dans Antigravity par rapport au plan Google AI Pro.

Agents managés dans l’API Gemini

En parallèle d’Antigravity 2.0, Google a annoncé les Agents managés dans l’API Gemini, qui apportent des capacités agentiques directement à la couche API pour les équipes souhaitant créer des applications pilotées par des agents sans gérer elles-mêmes l’infrastructure d’orchestration. C’est le pendant côté API de l’expérience bureau Antigravity.

Concrètement, les développeurs peuvent définir des comportements d’agents, des intégrations d’outils et des workflows multi-étapes via l’API Gemini et laisser l’infrastructure de Google exécuter. Cela peut changer la donne pour les équipes qui doivent exécuter des tâches de longue haleine en production sans déployer leur propre harnais agentique. L’accès se fait via Google AI Studio, et les entreprises y accèdent par la Gemini Enterprise Agent Platform.

Un bémol honnête : les premiers retours développeurs sur place soulignent une documentation encore légère pour les flux agentiques complexes et la gestion d’erreurs. Les limites de taux et la gestion des quotas sont aussi citées comme des points de friction. Ces sujets devraient s’atténuer avec le temps, mais il est utile de les connaître avant de s’engager sur cette pile.

Gemini Spark

Gemini Spark (à ne pas confondre avec le LLM récent de Meta, Muse Spark) est le nouvel agent personnel de Google, et l’annonce agentique la plus orientée grand public. Il tourne 24 h/24 sur des machines virtuelles dédiées dans Google Cloud, ce qui signifie qu’il n’a pas besoin que votre ordinateur portable reste ouvert pour continuer à travailler. Spark est propulsé par Gemini 3.5 et le harnais Antigravity, ce qui lui permet de gérer des tâches de longue durée en arrière-plan.

Les fonctionnalités au lancement incluent :

  • Intégration avec les outils Google (Workspace, Gmail, Calendar) au lancement, avec prise en charge d’outils tiers via MCP dans les semaines suivantes.
  • Interaction via l’application Gemini, et bientôt par email et chat.
  • Fonctionnement directement dans Chrome en tant que couche de navigation agentique, attendue cet été.
  • Suivi en direct de l’avancement des tâches via Android Halo, un nouvel espace d’interface sur Android, prévu plus tard dans l’année.

La comparaison avec l’écosystème d’agents d’OpenAI et les capacités d’utilisation d’outils d’Anthropic s’impose. L’atout de Spark est l’exécution persistante 24 h/24 sur l’infrastructure Google Cloud, combinée à une intégration poussée dans la suite de productivité Google. Si votre travail vit déjà dans Google Workspace, c’est un avantage réel. Sinon, la proposition de valeur est moins évidente.

La confidentialité est une préoccupation légitime ici. Un agent qui surveille en continu votre boîte mail, votre agenda et vos documents soulève de vraies questions de résidence des données et de conformité dans les secteurs réglementés. Une question que je me suis posée, par exemple : « Que devient la mémoire de l’agent quand un employé quitte l’entreprise ? » Google n’a pas encore apporté de réponses détaillées. Spark est déployé cette semaine chez des testeurs de confiance, avec une bêta pour les abonnés Google AI Ultra (100 $/mois) aux États-Unis la semaine suivante.

Agents managés vs Gemini Spark

Agents de recherche et mode IA

Le mode IA dans la recherche a été introduit au dernier I/O. Un an plus tard, il dépasse le milliard d’utilisateurs actifs mensuels. Google va plus loin avec deux capacités agentiques.

La première : des agents d’information dans la recherche : des agents personnalisés en arrière-plan que vous configurez pour surveiller des thèmes et faire remonter les bonnes informations au bon moment. Déploiement cet été, en commençant par les abonnés Google AI Pro et Ultra.

La seconde : une interface générative dans la recherche, propulsée par Gemini 3.5 Flash et Antigravity. Search pourra créer des mises en pages sur mesure, des visuels interactifs, et même des tableaux de bord persistants ou mini-apps pour des requêtes complexes et durables. Les capacités d’UI générative arrivent gratuitement pour tous cet été. Les tableaux de bord persistants et apps personnalisées seront disponibles d’abord pour les abonnés Pro et Ultra aux États-Unis.

C’est une véritable source d’inquiétude pour les éditeurs et les professionnels du SEO (comme l’avaient déjà été les lancements d’AI Overview et du mode IA). Quand des réponses générées par l’IA résolvent entièrement une requête directement dans Search, la visite du site source ne s’impose plus. Nous l’avons déjà constaté : AI Overviews et le déploiement initial du mode IA ont entraîné des baisses de trafic significatives dans le secteur. Google n’a toujours pas proposé de mécanisme clair de partage de revenus ou de garantie de trafic pour les éditeurs dont le contenu alimente ces réponses.

Google Flow

Google Flow, présenté à I/O 2025 comme un outil de création vidéo IA, franchit une étape majeure avec trois évolutions clés :

  • Un agent de planification plus malin. L’agent Flow mis à jour sait désormais planifier et raisonner sur des projets créatifs en plusieurs étapes. Vous lui fournissez vos entrées (par exemple un concept, des images de référence, un script brouillon) et il vous accompagne du brainstorming à la création et au montage, dans un même environnement. Disponible pour tous dès aujourd’hui.
  • Vidéo native via Gemini Omni. Flow gère désormais la génération et l’édition vidéo nativement via le modèle Omni. Vous pouvez décrire en langage naturel les modifications à apporter à un clip de votre pellicule, et itérer de façon conversationnelle. La cohérence des personnages s’améliore aussi, avec une identité et une voix préservées entre les scènes — idéal pour un court métrage ou une campagne avec des personnages récurrents.
  • Vibe coding pour des outils sur mesure. Plutôt que de vous limiter aux outils fournis, vous pouvez maintenant créer les vôtres directement sur la plateforme. Google a montré des exemples comme des effets vidéo personnalisés, des outils d’animation dessinée à la main, ou des workflows de superposition de texte, sans quitter Flow.

Ensemble, ces mises à jour font de Flow plus qu’un assistant créatif : c’est en train de devenir une plateforme de construction de workflows créatifs, avec une application mobile désormais en bêta sur Android et bientôt sur iOS.

Extension de SynthID

SynthID, le système de filigrane invisible de Google pour l’IA, a désormais filigrané plus de 100 milliards d’images et vidéos et 60 000 années d’actifs audio depuis son lancement il y a trois ans. L’annonce la plus importante d’I/O ici n’est pas l’échelle, mais les partenaires : OpenAI, Kakao et Eleven Labs adoptent SynthID aux côtés de Nvidia, engagé depuis l’année dernière.

L’adoption intersectorielle fait la différence. Un standard de filigranage n’est utile que s’il est suffisamment répandu pour que l’absence de filigrane devienne un signal. Google étend également la vérification Content Credentials (le standard C2PA) à Search et Chrome, afin d’indiquer si un contenu provient d’une IA ou d’un appareil photo et s’il a été édité avec des outils génératifs. L’association de SynthID et C2PA offre deux couches indépendantes d’attestation d’origine, la bonne approche étant donné à quel point chacune peut être retirée isolément.

Mentions honorables

Plusieurs autres annonces d’I/O méritent un bref coup d’œil :

  • Docs Live : une nouvelle fonctionnalité vocale pour Google Docs permettant de déverser vos idées à l’oral et de laisser Gemini les structurer en document. Déploiement auprès des abonnés cet été, avec arrivée simultanée des fonctions vocales dans Gmail et Keep.
  • Google Pics : un nouvel outil IA de création et d’édition d’images, basé sur le modèle Nano Banana, qui traite chaque élément comme un objet indépendant plutôt qu’une image plate. Disponible pour les testeurs de confiance, déploiement chez les abonnés Google AI Pro et Ultra plus tard cet été.
  • Android Halo : un nouvel espace d’interface sur Android pour suivre en direct les mises à jour et l’avancement des tâches d’agents comme Gemini Spark. Arrive plus tard cette année.
  • Daily Brief : un agent prêt à l’emploi dans l’application Gemini qui compile un brief matinal personnalisé depuis votre boîte mail, votre agenda et vos tâches, avec des prochaines actions proposées. Pas de tarif séparé annoncé ; attendu comme partie intégrante de l’expérience de l’app Gemini.
  • TPU 8t et 8i : la 8e génération de TPU de Google adopte une approche bi-puce, avec 8t optimisé pour le pré-entraînement à grande échelle (près de 3 fois la puissance de calcul brute de la génération précédente, extensible à plus d’1 million de TPU dans le monde) et 8i optimisé pour l’inférence. Les deux offrent jusqu’à 2 fois de meilleures performances par watt.
  • Gemini for Science : un ensemble d’outils IA connectant Antigravity à plus de 30 grandes bases de données en sciences de la vie. Science Skills est disponible dès aujourd’hui sur GitHub et directement dans Antigravity.

En conclusion

Google I/O 2026 parie sur les agents comme direction principale de l’IA, avec Gemini 3.5 Flash et Antigravity 2.0 comme infrastructure sous-jacente à presque tout le reste. Dès maintenant, vous pouvez utiliser Gemini 3.5 Flash (via l’API Gemini et AI Studio), le nouvel agent Flow, Gemini Omni Flash et l’application de bureau Antigravity 2.0. Gemini Spark, les agents de recherche et les fonctions d’UI générative dans la recherche arriveront durant l’été, en grande partie réservés au nouveau palier AI Ultra à 100 $/mois (au moins au démarrage).

Pour moi, la mise à niveau d’Antigravity est la sortie la plus intéressante, car elle opère simultanément à deux niveaux : en tant qu’application développeur autonome, elle rivalise directement avec Codex et Claude Code ; en tant que plateforme, son ADK sous-jacent et l’API Managed Agents concurrencent des frameworks d’orchestration comme LangChain, AutoGen et l’Agents SDK d’OpenAI. L’intégration à Gemini et la couche de déploiement Google Cloud constituent les différenciants (et le risque de verrouillage) sur les deux volets.

FAQ sur Google I/O 2026

Comment Gemini 3.5 Flash se compare-t-il à GPT-5.5 et Claude Opus 4.7 ?

Gemini 3.5 Flash prend la tête sur plusieurs benchmarks agentiques comme MCP Atlas (83,6%) et Finance Agent v2 (57,9%), tandis que GPT-5.5 garde une courte avance sur SWE-Bench Pro et ARC-AGI-2. Claude Opus 4.7 reste le plus performant sur Humanity’s Last Exam (46,9%). À retenir : il rivalise avec les modèles de pointe tout en tournant plus vite et bien moins cher à l’échelle, comme son nom le suggère. Une variante Pro plus puissante est attendue bientôt.

En quoi Google Antigravity diffère-t-il de Claude Code ou Codex ?

Google Antigravity 2.0 est une plateforme de développement axée sur les agents qui permet d’orchestrer plusieurs agents d’IA en parallèle via une application de bureau, une CLI, un SDK et une API entreprise. Contrairement à Claude Code (agent de code natif terminal) ou Codex (système basé sur une file de tâches), Antigravity offre un cadrage de permissions plus fin par projet, la génération de sous-agents et une intégration directe à Google Cloud et Firebase. Son double rôle d’outil développeur et de SDK plateforme le rapproche davantage d’un framework d’orchestration que d’un simple assistant de codage.

L’offre Google AI Ultra à 100 $/mois en vaut-elle la peine face à ChatGPT Pro ou Claude Max ?

Les trois offres sont facturées 100 $/mois, mais la valeur dépend de votre écosystème. Le différenciateur de Google AI Ultra, c’est l’accès à Gemini Spark (agent persistant 24/7), des limites d’usage Antigravity multipliées par 5 et une intégration poussée à Google Workspace. Si votre flux de travail repose déjà sur Gmail, Docs et Calendar, Ultra a un avantage naturel. Si vous avez surtout besoin d’assistance au codage ou de flexibilité au niveau API, ChatGPT Pro ou Claude Max peuvent mieux convenir.

Qu’est-ce que Gemini Omni et comment gère-t-il la génération vidéo ?

Gemini Omni est le modèle nativement multimodal de Google qui accepte toute combinaison de texte, d’images, d’audio et de vidéo en entrée et produit une vidéo en sortie. Il unifie des systèmes auparavant séparés (Veo pour la vidéo, Imagen pour l’image) en un modèle unique, pour des éditions inter-modales plus cohérentes. La première version, Omni Flash, est disponible maintenant, avec un Omni Pro plus capable attendu prochainement. Des benchmarks indépendants n’ont pas encore été publiés, donc la qualité en conditions réelles reste à évaluer.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Rédacteur en chef Data Science chez DataCamp | Je suis passionné par la prévision et le développement à l'aide d'API.

Sujets

Découvrez l’écosystème IA de Google !

Cursus

Google Workspace with Gemini

4 h
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Contenus associés

blog

ROI de l'IA en 2026 : pourquoi les compétences des équipes déterminent le retour sur investissement

Seuls 21 % des dirigeants font état d'un retour sur investissement « significatif » de leurs investissements dans l'IA.
Lynn Heidmann's photo

Lynn Heidmann

blog

Comprendre les TPU et les GPU dans l'IA : Un guide complet

L'essor du développement de l'intelligence artificielle (IA) a entraîné une augmentation notable de la demande en matière de calcul, d'où la nécessité de disposer de solutions matérielles robustes. Les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) sont devenues des technologies essentielles pour répondre à ces demandes.
Kurtis Pykes 's photo

Kurtis Pykes

9 min

blog

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

Découvrez les principaux types d'agents d'intelligence artificielle, comment ils interagissent avec les environnements et comment ils sont utilisés dans les différents secteurs d'activité. Comprendre les agents réflexes simples, les agents basés sur un modèle, les agents basés sur un but, les agents basés sur l'utilité, les agents d'apprentissage, etc.

blog

Architecture de l'entrepôt de données : Tendances, outils et techniques

Apprenez l'essentiel de l'architecture d'un entrepôt de données, des composants clés aux meilleures pratiques, pour construire un système de données évolutif et efficace !
Kurtis Pykes 's photo

Kurtis Pykes

15 min

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 min

cursor ai code editor

Tutoriel

Cursor AI : Un guide avec 10 exemples pratiques

Apprenez à installer Cursor AI sur Windows, macOS et Linux, et découvrez comment l'utiliser à travers 10 cas d'utilisation différents.
Voir plusVoir plus