Gemini 3.5 Flash : le modèle agentique le plus rapide de Google

Google a lancé Gemini 3.5 Flash à I/O 2026, un modèle qui surpasse Gemini 3.1 Pro sur les benchmarks agentiques et de code tout en fonctionnant quatre fois plus vite que ses concurrents.

Actualisé 19 mai 2026 · 8 min lire

Google a annoncé Gemini 3.5 Flash à I/O 2026 le 19 mai, un modèle qui dépasse Gemini 3.1 Pro sur les benchmarks agentiques et de code, tout en fonctionnant quatre fois plus vite que les autres modèles de pointe de même catégorie.

Cette sortie intervient alors que la compétition dans l'IA se concentre désormais sur la performance agentique. Agents de codage, automatisation de workflows en plusieurs étapes et exécution de tâches au long cours sont devenus les terrains d'affrontement majeurs, et Google positionne 3.5 Flash comme sa réponse à ce tournant.

Pour tous les professionnels — y compris data scientists, ingénieurs ML et développeurs — c'est important, car 3.5 Flash est désormais (ou le sera très bientôt) le modèle par défaut dans l'application Gemini et l'AI Mode de la recherche, et il est disponible dès aujourd'hui via l'API Gemini. Dans cet article, je passe en revue les annonces, les points saillants, les chiffres de benchmarks et ce que cela implique pour votre travail.

Quoi de neuf avec Gemini 3.5 Flash

La promesse phare de Gemini 3.5 Flash, c'est la vitesse alliée à des performances de niveau frontier. Google affirme que 3.5 Flash est quatre fois plus rapide en jetons de sortie par seconde que les autres modèles de pointe, tout en surpassant Gemini 3.1 Pro sur les benchmarks les plus pertinents pour le travail agentique.

Sur Terminal-Bench 2.1, il atteint 76,2 %. Sur GDPval-AA, il obtient 1 656 Elo. Sur MCP Atlas, il affiche 83,6 %. En compréhension multimodale, il obtient 84,2 % sur CharXiv Reasoning.

En bref, ces chiffres montrent que l'ancienne règle « rapide, économique ou intelligent ; choisissez-en deux » s'applique de moins en moins. On dispose désormais d'un modèle léger capable de gérer des workflows agentiques complexes et multi-étapes sans une latence massive.

Google indique que le modèle est généralement disponible dès aujourd'hui dans Google AI Studio, l'API Gemini, Android Studio, Gemini Enterprise Agent Platform et Gemini Enterprise. Il devient aussi le modèle par défaut de l'application Gemini et de l'AI Mode de la recherche dans le monde entier.

Google a également annoncé que Gemini 3.5 Pro est en développement, déjà utilisé en interne, et devrait être déployé le mois prochain. La sortie de 3.5 Flash constitue le premier mouvement d'une nouvelle famille de modèles centrée sur l'exécution agentique.

Contexte de Gemini 3.5

La série Gemini 3 a consolidé la position actuelle de Google dans la course aux modèles de pointe. Publié en février 2026, Gemini 3.1 Pro menait l'Artificial Analysis Intelligence Index lors de son lancement et a atteint 77,1 % sur ARC-AGI-2, plus du double des 31,1 % de Gemini 3 Pro sur ce benchmark.

Comme nous l'avons expliqué dans notre comparatif GPT-5.5 vs Gemini 3.1 Pro, la force de Gemini 3.1 Pro résidait dans le raisonnement visuel complexe et les tâches multimodales.

Dans la famille Gemini, l'appellation Flash a toujours signalé des modèles optimisés pour la vitesse. La différence avec 3.5 Flash, c'est que Google revendique une intelligence de niveau frontier à des vitesses Flash, sans compromis de qualité. L'indice Artificial Analysis place 3.5 Flash dans le cadran supérieur droit (selon Google), c'est-à-dire à la fois une intelligence élevée et une vitesse de sortie élevée.

Le harness Antigravity, le cadre de Google pour le déploiement de sous-agents collaboratifs, est au cœur du positionnement de 3.5 Flash. Ce n'est pas seulement un modèle autonome, mais un composant d'une architecture multi-agents que Google a développée en parallèle.

Fonctionnalités clés de Gemini 3.5

Voici les points les plus intéressants de l'annonce.

Performances aux benchmarks

Les revendications de Google pour 3.5 Flash sont précises et méritent d'être examinées directement. Le modèle surpasse Gemini 3.1 Pro sur :

Terminal-Bench 2.1 : 76,2 % (Gemini 3.1 Pro avait été évalué sur Terminal-Bench 2.0 à 68,5 %, selon notre couverture précédente)
GDPval-AA : 1 656 Elo (Claude Opus 4.7 menait ce benchmark à 1 753 Elo lors de son lancement, d'après notre analyse Claude Opus 4.7 vs Gemini 3.1 Pro)
MCP Atlas : 83,6 % (Gemini 3.1 Pro avait atteint 73,9 % sur MCP Atlas lors de nos tests précédents)
CharXiv Reasoning : 84,2 % en compréhension multimodale

La promesse de vitesse est également notable : quatre fois plus rapide en jetons de sortie par seconde que les autres modèles de pointe. Google ne précise pas les modèles de comparaison dans les notes de recherche ; considérez donc ce chiffre comme indicatif plutôt qu'un duel chiffré modèle contre modèle.

Architecture agentique et Antigravity

3.5 Flash est conçu pour fonctionner avec le harness Antigravity, le cadre de Google pour exécuter des sous-agents collaboratifs. Avec Antigravity, le modèle peut déployer plusieurs sous-agents en parallèle, exécuter des workflows en plusieurs étapes et maintenir ses performances sur des tâches de longue durée.

Les exemples de Google incluent la synthèse de l'article AlphaZero et le développement d'un jeu entièrement jouable en six heures via deux agents, ainsi que la transformation d'une base de code legacy vers Next.js. Ce ne sont pas des démos gadget : ils reflètent le type de tâches de développement sur plusieurs jours que l'on confie désormais aux systèmes agentiques.

Déploiements concrets en entreprise

Plusieurs entreprises exécutent déjà 3.5 Flash en production ou en pilote. Les cas d'usage sont intéressants car ils illustrent là où les points forts agentiques du modèle s'appliquent :

Shopify : Exécution de sous-agents en parallèle pour analyser des données complexes sur une longue période afin d'établir des prévisions de croissance pour les marchands
Macquarie Bank : Expérimentation de l'onboarding client en raisonnant sur des documents de plus de 100 pages avec une faible latence
Salesforce : Intégration à Agentforce pour l'automatisation de tâches d'entreprise avec plusieurs sous-agents et appels d'outils en plusieurs tours
Xero : Déploiement d'agents pour gérer des workflows sur plusieurs semaines, y compris la préparation des formulaires fiscaux 1099 pour les petites entreprises
Databricks : Utilisation de workflows agentiques pour surveiller des informations en temps réel, diagnostiquer des problèmes et proposer des solutions sur de grands jeux de données
Ramp : Amélioration de la précision OCR sur des factures complexes grâce à la compréhension multimodale combinée à un raisonnement sur des schémas historiques

Gemini Spark et disponibilité grand public

3.5 Flash alimente également Gemini Spark, le nouvel agent personnel d'IA de Google qui fonctionne 24 h/24 et agit pour le compte des utilisateurs. Google déploie dès maintenant Spark auprès de testeurs de confiance, avec une bêta prévue pour les abonnés Google AI Ultra aux États-Unis la semaine suivant l'annonce d'I/O.

Le modèle est disponible dès aujourd'hui pour des milliards d'utilisateurs dans le monde via l'application Gemini et l'AI Mode de la recherche, ce qui en fait l'un des lancements simultanés les plus larges côté grand public et développeurs pour un modèle Gemini.

Sécurité et garde-fous

Google indique que 3.5 Flash a été développé dans le cadre de son Frontier Safety Framework, avec des garde-fous renforcés en cybersécurité et CBRN. L'entreprise utilise des outils d'interprétabilité qui vérifient le raisonnement interne du modèle avant réponse, afin de réduire à la fois les sorties nuisibles et les refus à tort sur des requêtes sûrs.

Gemini 3.5 pour les praticiens Data et IA

Conséquence la plus immédiate : 3.5 Flash est disponible très rapidement via l'API Gemini dans Google AI Studio. Si vous construisez des pipelines agentiques, la combinaison du score MCP Atlas (83,6 %) et du harness multi-agents Antigravity justifie de le tester par rapport à vos solutions actuelles.

Le score GDPval-AA de 1 656 Elo est derrière les 1 753 Elo de Claude Opus 4.7 dans notre revue précédente, mais l'avantage de vitesse de 3.5 Flash peut compter davantage selon vos contraintes de latence.

Pour les équipes qui gèrent des workflows au long cours, les déploiements de Xero et Shopify sont les signaux les plus instructifs. La compression de workflows sur plusieurs semaines en exécutions automatisées d'agents est le cas d'usage que Google optimise, et le harness Antigravity est la couche d'infrastructure qui le permet. Si vous ne maîtrisez pas encore les schémas d'orchestration multi-agents, c'est le bon moment pour vous mettre à niveau.

Un point à suivre de près : Google affirme que 3.5 Flash coûte moins de la moitié du prix des autres modèles de pointe pour des tâches comparables. Cette affirmation dépend fortement de votre charge de travail spécifique, mais si elle se vérifie, elle change l'économie des systèmes agentiques à l'échelle. Le modèle 3.5 Pro, attendu le mois prochain, sera le point de comparaison le plus intéressant pour les équipes qui font le raisonnement le plus intensif.

Conclusion

Gemini 3.5 Flash montre que Google entend rivaliser sur les deux extrémités du couple performance-vitesse, pas seulement au niveau porte-drapeau. Dépasser Gemini 3.1 Pro sur les benchmarks agentiques tout en tournant à des vitesses Flash est un vrai changement, et les déploiements en entreprise chez Shopify, Macquarie et Salesforce suggèrent que le modèle tient la route au-delà des benchmarks contrôlés.

Plus largement, Google mise fortement sur l'infrastructure agentique, avec Antigravity, Gemini Spark et 3.5 Flash qui vont tous dans le même sens. La pertinence de ce pari dépendra des performances de 3.5 Pro à son arrivée le mois prochain, et de la comparaison du harness Antigravity face aux cadres multi-agents concurrents dans les workflows réels des développeurs.

Si vous souhaitez vous mettre rapidement à niveau sur les concepts d'IA agentique et apprendre à construire avec ce type de modèles, nous vous recommandons le parcours de compétences AI Agent Fundamentals sur DataCamp.

Author

Matt Crabtree

Sujets

Intelligence artificielle

Agents d'intelligence artificielle

Les meilleurs cours DataCamp

Cursus

Principes fondamentaux des agents IA

6 h

Découvrez comment les agents IA peuvent transformer votre façon de travailler et créer de la valeur pour votre organisation !

Afficher les détails

Commencer le cours

Cours

Introduction à l’IA pour le travail

2 h

86.9K

Découvrez ce qu'est l'IA et comment l'utiliser de manière responsable pour un travail plus intelligent et productif !

Afficher les détails

Commencer le cours

Cours

IA pratique avec Google Gemini et NotebookLM

2 h

7.4K

Maîtrisez Gemini et NotebookLM pour automatiser les tâches, augmenter la productivité et travailler plus efficacement dans l'écosystème IA de Google.

Afficher les détails

Commencer le cours

Contenus associés

blog

Comprendre les TPU et les GPU dans l'IA : Un guide complet

L'essor du développement de l'intelligence artificielle (IA) a entraîné une augmentation notable de la demande en matière de calcul, d'où la nécessité de disposer de solutions matérielles robustes. Les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) sont devenues des technologies essentielles pour répondre à ces demandes.

Kurtis Pykes

9 min

blog

ROI de l'IA en 2026 : pourquoi les compétences des équipes déterminent le retour sur investissement

Seuls 21 % des dirigeants font état d'un retour sur investissement « significatif » de leurs investissements dans l'IA.

Lynn Heidmann

blog

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

Découvrez les principaux types d'agents d'intelligence artificielle, comment ils interagissent avec les environnements et comment ils sont utilisés dans les différents secteurs d'activité. Comprendre les agents réflexes simples, les agents basés sur un modèle, les agents basés sur un but, les agents basés sur l'utilité, les agents d'apprentissage, etc.

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.

Nathaniel Taylor-Leach

8 min

blog

Architecture de l'entrepôt de données : Tendances, outils et techniques

Apprenez l'essentiel de l'architecture d'un entrepôt de données, des composants clés aux meilleures pratiques, pour construire un système de données évolutif et efficace !

Kurtis Pykes

15 min

Tutoriel

Cursor AI : Un guide avec 10 exemples pratiques

Apprenez à installer Cursor AI sur Windows, macOS et Linux, et découvrez comment l'utiliser à travers 10 cas d'utilisation différents.

Voir plus Voir plus

Quoi de neuf avec Gemini 3.5 Flash

Contexte de Gemini 3.5

Fonctionnalités clés de Gemini 3.5

Performances aux benchmarks

Architecture agentique et Antigravity

Déploiements concrets en entreprise

Gemini Spark et disponibilité grand public

Sécurité et garde-fous

Gemini 3.5 pour les praticiens Data et IA

Conclusion

Comprendre les TPU et les GPU dans l'IA : Un guide complet

ROI de l'IA en 2026 : pourquoi les compétences des équipes déterminent le retour sur investissement

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

2022-2023 Rapport annuel DataCamp Classrooms

Architecture de l'entrepôt de données : Tendances, outils et techniques

Cursor AI : Un guide avec 10 exemples pratiques

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Principes fondamentaux des agents IA

Introduction à l’IA pour le travail

IA pratique avec Google Gemini et NotebookLM

Comprendre les TPU et les GPU dans l'IA : Un guide complet

ROI de l'IA en 2026 : pourquoi les compétences des équipes déterminent le retour sur investissement

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

2022-2023 Rapport annuel DataCamp Classrooms

Architecture de l'entrepôt de données : Tendances, outils et techniques

Cursor AI : Un guide avec 10 exemples pratiques

Principes fondamentaux des agents IA