Accéder au contenu principal

Gemini 3.1 : fonctionnalités, benchmarks, tests pratiques et plus encore

Découvrez Gemini 3.1 Pro, le dernier modèle de raisonnement de Google. Explorez ses fonctionnalités, ses benchmarks, des tests pratiques et sa comparaison avec Claude Opus 4.6, Claude Sonnet 4.6 et GPT‑5.2.
Actualisé 12 mai 2026  · 11 min lire

La course à l’IA en février 2026 a été particulièrement intense. Après la sortie rapprochée d’Claude Opus 4.6 et de Claude Sonnet 4.6, Google a répliqué avec Gemini 3.1 Pro.

Google affirme qu’il s’agit d’une mise à jour majeure, surtout parce que Gemini 3.1 Pro a plus que doublé ses performances de raisonnement par rapport à Gemini 3 Pro, mesurées sur le benchmark ARC‑AGI‑2, où il a obtenu un score vérifié de 77,1 %.

ARC‑AGI‑2 est important car il évalue la reconnaissance de schémas inédits plutôt que la connaissance mémorisée. Il est conçu pour empêcher les modèles d’atteindre un score élevé simplement en s’entraînant de manière traditionnelle. Un doublement sur ce test a donc plus de sens qu’un doublement, par exemple, sur MMLU. Nous reviendrons plus loin sur l’importance de ce résultat et nous le mettrons même à l’épreuve nous‑mêmes.

Pour mieux comprendre l’écosystème IA de Google, nous vous recommandons nos guides sur NotebookLM et Nano Banana 2, ainsi que notre tutoriel Gemini CLI. Consultez aussi notre guide sur l’un des rivaux les plus solides de Gemini, le GPT‑5.4 d’OpenAI.

Nous tenons nos lecteurs informés des dernières actualités IA via The Median, notre newsletter gratuite du vendredi qui résume les temps forts de la semaine. Abonnez‑vous et restez à jour en quelques minutes par semaine :

Qu’est‑ce que Gemini 3.1 Pro ?

Gemini 3.1 Pro est le dernier modèle phare de Google, publié en préversion le 19 février 2026. C’est la première fois que Google utilise un incrément « .1 » (les mises à jour intermédiaires précédentes utilisaient « .5 »), signe d’une montée en intelligence ciblée plutôt que d’une expansion large des fonctionnalités. C’est cohérent, car Gemini 3 était déjà une sortie majeure introduisant une nouvelle architecture multimodale.

Le billet de lancement de Google explique que l’intelligence à l’origine des percées scientifiques récentes de Deep Think, dont la réfutation d’une conjecture mathématique vieille de dix ans, a été distillée dans 3.1 Pro pour un usage quotidien.

Deep Think était techniquement disponible auparavant, mais uniquement avec un abonnement Ultra. Google soutient que l’objectif a toujours été d’apporter ce raisonnement à grande échelle au quotidien, mais c’est seulement avec cette version de Gemini 3.1 qu’ils semblent concrétiser cette promesse. Peut‑être Google a‑t‑il constaté que l’abonnement Ultra à 249 $ par mois dépassait ce que les utilisateurs étaient prêts à payer.

Gemini 3.1 ARC-AGI 2 Scores

Quelles nouveautés avec Gemini 3.1 Pro ?

Voici les principales améliorations de cette version :

Un raisonnement nettement plus solide

Comme mentionné en introduction, la grande avancée concerne le raisonnement abstrait et multi‑étapes. Les performances de Gemini 3.1 sur ARC‑AGI‑2 ont plus que doublé par rapport à Gemini 3 Pro en environ trois mois.

Au‑delà des progrès sur ARC‑AGI‑2, le modèle a signé le meilleur score jamais enregistré sur GPQA Diamond, un benchmark de niveau master/doctorat en sciences.

Gemini 3.1 Pro pratique en permanence une « pensée dynamique » : il applique automatiquement un raisonnement en chaîne en fonction de la complexité de la tâche.

L’API introduit un nouveau paramètre thinking_level avec quatre niveaux : low, medium (nouveau en 3.1), high et max, offrant aux développeurs un juste milieu entre vitesse et profondeur.

Des performances agentiques bien meilleures

Un enseignement clair de cette version : les benchmarks orientés agents ont beaucoup progressé. Le modèle obtient désormais des scores bien plus élevés en recherche web autonome, sur des tâches longues et multi‑étapes, et en codage via terminal que son prédécesseur.

Pour celles et ceux qui conçoivent des workflows où le modèle opère avec un minimum de supervision (débogage, recherche web, collecte de données), ces améliorations comptent concrètement.

Les performances agentiques ont à peu près doublé par rapport à Gemini 3 Pro dans certaines catégories, et le modèle devance désormais GPT‑5.2 et Claude sur la plupart de ces benchmarks.

Sorties animées basées sur du code

Ce point a retenu mon attention. Google a mis en avant la capacité de Gemini 3.1 Pro à générer des SVG animés et des tableaux de bord interactifs entièrement via du code. Comme il s’agit de définitions mathématiques et non d’images rendues, l’échelle est infinie sans perte de qualité et la taille des fichiers est bien inférieure à celle des vidéos.

Les exemples présentés au lancement sont parlants : un site portfolio inspiré des thèmes de Wuthering Heights, un tableau de bord aérospatial en direct exploitant la télémétrie de l’ISS, et une nuée d’étourneaux 3D avec suivi des mains et bande‑son générative.

Ce sont des sorties code et non des images : elles sont donc éditables, intégrables et légères.

La troncature des sorties enfin corrigée

C’est moins spectaculaire mais sans doute plus pertinent pour quiconque a utilisé Gemini 3 Pro en production. Une plainte récurrente : le modèle coupait certaines réponses longues en cours de génération.

Les retours après le lancement indiquent que 3.1 Pro résout ce problème. Un utilisateur a signalé avoir généré une réponse massive en un seul run, sans aucune troncature.

JetBrains a également confirmé des gains de qualité concrets, notant des « résultats plus fiables » avec « moins de tokens de sortie » nécessaires. Ce gain d’efficacité, combiné à l’absence de troncature, change la donne pour la génération longue.

Benchmarks de Gemini 3.1 Pro

Google montre que Gemini 3.1 Pro mène sur 13 tests parmi 16 parmi les plus importants, dont ceux liés au raisonnement abstrait, aux tâches agentiques et aux sciences de niveau master/doctorat. (Gemini 3 Pro était déjà en tête sur une poignée de ces benchmarks.)

Voici comment le dernier modèle se positionne face aux autres sorties majeures de février 2026.

Gemini 3.1 Benchmarks

Comme vous le voyez, et comme indiqué plus haut, le résultat en raisonnement abstrait est le plus marquant. Gemini 3.1 Pro devance nettement Opus 4.6, qui lui‑même devance clairement GPT‑5.2. C’est un vrai changement par rapport à l’état de l’art il y a un an.

Là où Claude garde l’avantage

Soyons clairs, car on peut vite se laisser emporter par les gros chiffres. Les modèles Claude gardent l’avance sur plusieurs points importants :

  • Ingénierie logicielle en conditions réelles : Opus 4.6 l’emporte de peu sur SWE‑bench Verified. (Ils sont presque à égalité, mais Anthropic prend l’avantage.)
  • Raisonnement assisté par outils : Opus 4.6 dépasse Gemini 3.1 Pro lorsque les deux modèles peuvent utiliser des outils externes, ce qui suggère une intégration d’outils plus solide.
  • Travaux à forte intensité de connaissances : Sonnet 4.6 devance largement sur GDPval‑AA, qui mesure des tâches à forte valeur économique comme la modélisation financière et la recherche. Un écart à surveiller.
  • Utilisation de l’ordinateur via GUI : Claude mène clairement sur ce terrain, sans équivalent publié côté Gemini.

En résumé honnête : Gemini 3.1 Pro est aujourd’hui le meilleur modèle pour le raisonnement abstrait, les connaissances scientifiques et l’amplitude multimodale. Les modèles Claude gardent l’avance pour le travail de connaissance, l’orchestration d’outils et l’usage logiciel via une interface graphique.

Mise à l’épreuve de Gemini 3.1 Pro

Pour voir comment ces avancées se traduisent en raisonnement réel, j’ai mené trois tests visant différents aspects de la pensée abstraite :

Test 1 : une suite de symboles

Pour évaluer un raisonnement à la ARC‑AGI‑2, nous avons utilisé une énigme simple d’inférence de règles. Le modèle doit déduire une règle de couleur et une règle de forme à partir d’exemples, sans qu’on les lui explicite.

Voici mon prompt :

You are shown these transformations:

- [Red Circle] → [Blue Triangle]
- [Blue Square] → [Red Circle]
- [Red Square] → [Blue Circle]
- [Blue Triangle] → ?

Gemini 3.1 Pro a correctement répondu [Red Square]. Le modèle a identifié les deux règles séparément : les couleurs basculent (Red ↔ Blue) et les formes cyclent (Square → Circle → Triangle → Square). Il a ensuite déroulé la logique pas à pas, montrant comment Blue Triangle devient Red (bascule de couleur) puis Square (forme suivante dans le cycle) — exactement le type de raisonnement compositionnel que ce test vise.

Test 2 : la suite déguisée

Ce test vérifie l’élimination d’hypothèses sur plusieurs niveaux. Nous donnons au modèle deux suites et lui demandons d’identifier la première (nombres de partitions de l’OEIS) et de déterminer les deux transformations appliquées pour produire la seconde.

Here are two sequences. The second was derived from the first in two separate steps. 
Identify the named mathematical sequence that Sequence A belongs to, and work out 
both transformations that were applied to produce Sequence B.

Sequence A: 1, 1, 2, 3, 5, 7, 11, 15, 22, 30, 42, 56, 77
Sequence B: 2, 3, 5, 8, 3, 9, 8, 1, 7, 9, 8, 7

Explain your reasoning step by step.

Gemini 3.1 Pro a correctement identifié la suite A comme les nombres de partitions (A000041) et a expliqué ce que représentent les nombres de partitions en théorie des nombres. Il a ensuite détaillé systématiquement les deux transformations : d’abord la somme des paires consécutives pour produire une suite intermédiaire, puis le calcul de la racine numérique de chaque résultat. Le modèle a vérifié chaque étape par rapport à la suite B, montrant toute la chaîne de raisonnement de la suite d’origine à la sortie finale.

Test 3 : le réseau d’horloges défaillant

Ce test cible la vérification de cohérence des contraintes. Six horloges sont en réseau, chacune appliquant un décalage fixe de 20 minutes. Une horloge est défaillante. Le modèle doit suivre les deux chemins dans le réseau et repérer la contradiction.

Voici le prompt utilisé :

Six clocks (A, B, C, D, E, and F) are connected in a network. Each clock applies 
a fixed offset to the time it receives. A is the root and shows 12:00. You observe:

- B receives from A and shows 12:20
- C receives from A and shows 11:40
- D receives from B and shows 12:40
- E receives from C and shows 11:00
- F receives from both D and E and shows 13:00

There is exactly one broken clock in the network. Based on the pattern of offsets, 
identify which clock is broken, and give two possible answers for what it should 
actually show (one for each path through the network).

Explain your reasoning step by step.

Gemini 3.1 Pro a correctement identifié F comme l’horloge défaillante et a déduit deux valeurs possibles : 13:00 via le chemin de D et 10:00 via le chemin de E. Le modèle a traité le chemin de droite comme un décalage constant de +20 minutes et le chemin de gauche comme une suite arithmétique de −20, −40 puis −60 minutes.

Prise en main de Gemini 3.1 Pro

Au‑delà des tests de raisonnement abstrait, je voulais voir comment le modèle gère des tâches pratiques mettant en valeur ses nouvelles fonctionnalités.

Génération de SVG animés

Google a beaucoup insisté sur les sorties visuelles basées sur du code lors du lancement, je l’ai donc testé directement avec un brief simple, sans modèle.

Voici le prompt utilisé :

Create an animated SVG loading spinner with three bouncing dots. Make it smooth, 
professional, and suitable for embedding on a website. Output only the SVG code.

Gemini 3.1 Pro a renvoyé un code SVG propre avec animations CSS. Le résultat : un loader à trois points avec rebonds décalés dans le temps, exactement ce qui était demandé. Affichage correct dans le navigateur du premier coup, sans ajustement. Taille de fichier minuscule et, comme c’est du vectoriel, mise à l’échelle impeccable.

C’est typiquement une fonctionnalité qui peut sembler gadget dans un communiqué, mais qui s’avère très pratique. Des graphismes animés légers, intégrables et infiniment scalables à partir d’un simple prompt texte : un vrai plus pour le prototypage frontend ou des assets visuels rapides.

Comment accéder à Gemini 3.1 Pro ?

Gemini 3.1 Pro est actuellement en préversion. Google indique une disponibilité générale prochaine, après prise en compte des retours et améliorations des workflows agentiques.

Voici les principales options d’accès :

Gemini CLI

Le Gemini CLI est un agent open‑source en ligne de commande qui donne au modèle un accès direct à votre environnement local. Installez‑le avec la commande suivante :

npm install -g @google/gemini-cli
# Or run directly: npx @google/gemini-cli

Le CLI utilise une boucle ReAct, ce qui lui permet d’écrire du code, de l’exécuter, de lire les erreurs, de corriger et d’itérer en autonomie. Avec les progrès de 3.1 Pro en codage via terminal, cette boucle est sensiblement plus fiable. L’offre gratuite donne 60 requêtes par minute et 1 000 requêtes par jour.

Gemini API

L’API Gemini offre aux développeurs un accès programmatique direct à Gemini 3.1 Pro.

gemini 3.1 api

L’ID du modèle à utiliser : gemini-3.1-pro-preview

Voici un exemple en Python pour démarrer :

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="Your prompt here"
)
print(response.text)

La tarification est la même que pour Gemini 3 Pro Preview.

Taille de contexte

Entrée (par 1 M de tokens)

Sortie (par 1 M de tokens)

≤ 200 K tokens

$2.00

$12.00

> 200 K tokens

$4.00

$18.00

Le paramètre thinking_level accepte low, medium, high ou max. Les outils pris en charge incluent Google Search, le contexte d’URL, l’exécution de code et la recherche de fichiers. Je détaillerai la fenêtre de contexte dans la section de comparaison ci‑dessous.

NotebookLM

NotebookLM est désormais motorisé par Gemini 3.1 Pro pour les abonnés Google AI Pro et Ultra. NotebookLM répond uniquement à partir des documents que vous importez, ce qui en fait un outil de recherche très utile lorsque vous souhaitez que le modèle reste ancré dans des sources précises.

Accès grand public

Google a commencé à déployer Gemini 3.1 Pro dans ses produits grand public et développeurs, mais sans publier une correspondance simple « forfait X = modèle Y ». Concrètement, vous verrez 3.1 Pro apparaître dans l’app Gemini et l’API au fil du déploiement, avec AI Ultra offrant l’accès le plus large.

Forfait

Prix mensuel (US)

Ce que vous obtenez côté Gemini

Gratuit

$0

Gemini 3 Flash dans l’app Gemini, fonctionnalités limitées

Google AI Pro

$19.99

Limites supérieures et accès aux modèles Gemini Pro dans l’app Gemini

Google AI Ultra

$249.99 (souvent réduit à $124.99 les 3 premiers mois)

Limites maximales, mode Deep Think et accès aux dernières fonctionnalités IA de Google dans l’ensemble des produits

Gemini 3.1 Pro vs modèles Claude

Les sorties de février 2026 de Google et Anthropic créent de vrais arbitrages intéressants. Il n’y a pas un modèle qui l’emporte partout. Le bon choix dépend fortement de ce que vous construisez.

L’écart de prix mérite l’attention. Gemini 3.1 Pro est bien moins cher en entrée comme en sortie que Claude Opus 4.6. Si vous exécutez des appels API à fort volume, ce n’est pas un petit détail.

Choisissez Gemini 3.1 Pro si :

  • Le raisonnement abstrait et l’analyse scientifique sont prioritaires
  • Vous avez besoin d’un support multimodal natif robuste pour la vidéo et l’audio dans le même modèle
  • Vous voulez la fenêtre de contexte 1 M dans sa forme stable, non bêta
  • Le coût compte, surtout à l’échelle

Choisissez Claude Opus 4.6 si :

  • Il vous faut jusqu’à 128 K tokens en sortie (Gemini est limité à 64 K)
  • L’orchestration multi‑agents est au cœur de votre workflow (Agent Teams fait la différence)
  • L’utilisation de l’ordinateur via une interface graphique est importante
  • Vous faites un travail à forte intensité de connaissances où la qualité de la recherche est clé

Choisissez Claude Sonnet 4.6 si :

  • Les tâches principales sont le travail de connaissance, l’analyse de documents ou l’analyse financière
  • Vous voulez des performances proches du haut de gamme à un prix inférieur
  • Vous utilisez déjà les outils Anthropic et Sonnet est votre défaut

Cas d’usage de Gemini 3.1 Pro

D’après les benchmarks et les tests pratiques, voici les domaines où Gemini 3.1 Pro est particulièrement pertinent :

  • Recherche et analyse scientifiques : de bonnes performances sur GPQA Diamond, plus une fenêtre de contexte 1 M, en font un outil pratique pour la revue de littérature, la génération d’hypothèses et la synthèse multi‑articles.
  • Agents de recherche autonomes : les progrès sur les benchmarks agentiques se traduisent par de vraies performances sur des tâches multi‑étapes : collecte d’informations multi‑sources, vérification des faits et production de rapports structurés avec un minimum de supervision.
  • Analyse et refactoring de bases de code : une grande fenêtre de contexte et un meilleur raisonnement pour repérer des incohérences d’architecture entre modules ou suivre des bugs à travers plusieurs fichiers.
  • Analyse de contenus multimodaux : support natif de la vidéo et de l’audio pour analyser des réunions enregistrées, extraire des insights de cours en vidéo ou traiter des podcasts sans prétraitement.
  • Déploiements en production sensibles aux coûts : à environ la moitié du coût de Claude Opus 4.6, il est pertinent pour de l’inférence à fort volume où la qualité du raisonnement compte mais où le budget est contraint.
  • Prototypage et assets visuels : les sorties animées basées code génèrent des loaders, graphiques animés ou tableaux de bord interactifs à partir de prompts texte, directement intégrables.

Dernières réflexions

Gemini 3.1 Pro illustre bien la trajectoire actuelle de ces modèles : moins de focus sur de nouveaux types d’entrées, davantage sur un meilleur raisonnement, des agents plus fiables et une meilleure gestion de contextes longs. Même s’il ne s’agit « que » d’une version .1, les progrès au benchmark et le lien avec Deep Think donnent l’impression d’un vrai pas en avant dans la façon de raisonner.

Pour les équipes qui construisent des produits, il n’existe pas de « meilleur » modèle unique. Gemini 3.1 Pro fonctionne très bien pour le raisonnement scientifique, les agents de recherche et l’analyse de grandes bases de code, surtout au regard du prix et du support vidéo. Claude reste meilleur pour le travail de connaissance et l’usage de l’ordinateur à l’écran, et GPT‑5.3‑Codex domine encore certains tests de code.

La vraie question sera la sortie de préversion. Google a indiqué travailler sur des améliorations agentiques avant la disponibilité générale. Si ces avancées arrivent en même temps que les gains actuels de raisonnement, l’écart entre des modèles de recherche comme Deep Think et des modèles du quotidien va se réduire. Pour l’instant, c’est le bon moment pour essayer différents modèles et bâtir des systèmes capables d’exploiter le meilleur de chacun.

Pour démarrer avec les outils IA de Google, découvrez notre cours Introduction to Google Gemini. Pour travailler avec l’API en Python, notre tutoriel Working with the Gemini API couvre l’essentiel.


Khalid Abdelaty's photo
Author
Khalid Abdelaty
LinkedIn

Je suis ingénieur de données et créateur de communautés. Je travaille sur les pipelines de données, le cloud et les outils d'IA, tout en rédigeant des tutoriels pratiques et percutants pour DataCamp et les développeurs émergents.

Gemini 3.1 : FAQ

Gemini 3.1 Pro est‑il gratuit ?

Vous pouvez le tester gratuitement via Google AI Studio avec des quotas journaliers. Pour la production, il vous faudra un forfait payant. Google AI Pro coûte 19,99 $/mois et Google AI Ultra 249,99 $/mois (souvent réduit à 124,99 $ pendant les 3 premiers mois). L’app Gemini gratuite utilise par défaut Gemini 3 Flash, pas 3.1 Pro.

Quelle est la différence entre Gemini 3.1 Pro et Deep Think ?

Deep Think est la version de labo : plus lente, plus chère, mais avec de meilleurs scores de raisonnement. Gemini 3.1 Pro reprend ces gains d’intelligence et les rend assez rapides et abordables pour un usage quotidien. Voyez‑le comme la version prête pour la production de la même technologie cœur.

Comprend‑il vraiment la vidéo ou se contente‑t‑il d’extraire des images ?

Gemini 3.1 Pro est nativement multimodal et peut prendre la vidéo en entrée aux côtés du texte, des images et de l’audio. En pratique, vous pouvez téléverser un enregistrement et poser des questions à la fois sur ce qui est dit et ce qui est affiché à l’écran. Les modèles concurrents restent plus limités dans l’exposition de la compréhension vidéo aux utilisateurs finaux.

Comment la fenêtre de contexte 1 M se compare‑t‑elle à celle de Claude ?

Comme indiqué dans la comparaison, la fenêtre 1 M de Gemini est stable et prête pour la production, tandis que celle de Claude est actuellement en bêta. La sortie maximale par requête est de 64 K tokens.

Quand sort‑il de préversion ?

Google n’a pas donné de date, mais indique travailler sur des améliorations agentiques avant la GA. D’après les précédents, les périodes de préversion durent généralement quelques mois.

Sujets

Apprenez avec DataCamp

Cours

Éthique de l'IA

1 h
118.8K
Explorez les principes éthiques de l’IA : équité, réduction des biais et confiance dans le design responsable.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Contenus associés

blog

Comprendre les TPU et les GPU dans l'IA : Un guide complet

L'essor du développement de l'intelligence artificielle (IA) a entraîné une augmentation notable de la demande en matière de calcul, d'où la nécessité de disposer de solutions matérielles robustes. Les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) sont devenues des technologies essentielles pour répondre à ces demandes.
Kurtis Pykes 's photo

Kurtis Pykes

9 min

blog

ROI de l'IA en 2026 : pourquoi les compétences des équipes déterminent le retour sur investissement

Seuls 21 % des dirigeants font état d'un retour sur investissement « significatif » de leurs investissements dans l'IA.
Lynn Heidmann's photo

Lynn Heidmann

blog

Architecture de l'entrepôt de données : Tendances, outils et techniques

Apprenez l'essentiel de l'architecture d'un entrepôt de données, des composants clés aux meilleures pratiques, pour construire un système de données évolutif et efficace !
Kurtis Pykes 's photo

Kurtis Pykes

15 min

blog

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

Découvrez les principaux types d'agents d'intelligence artificielle, comment ils interagissent avec les environnements et comment ils sont utilisés dans les différents secteurs d'activité. Comprendre les agents réflexes simples, les agents basés sur un modèle, les agents basés sur un but, les agents basés sur l'utilité, les agents d'apprentissage, etc.
cursor ai code editor

Tutoriel

Cursor AI : Un guide avec 10 exemples pratiques

Apprenez à installer Cursor AI sur Windows, macOS et Linux, et découvrez comment l'utiliser à travers 10 cas d'utilisation différents.

Tutoriel

Séquence de Fibonacci en Python : Apprenez et explorez les techniques de codage

Veuillez découvrir le fonctionnement de la suite de Fibonacci. Veuillez explorer ses propriétés mathématiques et ses applications concrètes.
Laiba Siddiqui's photo

Laiba Siddiqui

Voir plusVoir plus