Réflexion approfondie sur les Gémeaux : Un test sur 5 problèmes concrets

J'ai testé le nouveau mode Gemini 2.5 Deep Think de Google sur cinq problèmes concrets, allant de questions de niveau doctorat à des défis commerciaux.

Actualisé 12 août 2025 · 8 min lire

Google a récemment lancé le modeDeep Think pour l' Gemini 2.5 Pro. Deep Think est une fonctionnalité conçue pour résoudre des problèmes complexes. Il fonctionne en utilisant la pensée parallèle pour explorer plusieurs idées simultanément, les comparer, puis sélectionner la solution la plus efficace.

Dans cet article, j'explorerai ses capacités en lui demandant de résoudre des problèmes concrets. Des questions de niveau doctoral aux défis commerciaux, j'ai évalué les performances de Deep Think sur cinq problèmes complexes.

Nous tenons nos lecteurs informés des dernières actualités en matière d'IA grâce à The Median, notre newsletter hebdomadaire gratuite qui résume les articles les plus importants de la semaine. Abonnez-vous et restez informé en quelques minutes par semaine :

Qu'est-ce que Gemini Deep Think ?

Gemini Deep Think est une nouvelle amélioration ajoutée au modèle Gemini 2.5 Pro, qui élève les compétences en matière de résolution de problèmes à un niveau supérieur. La version mise à disposition est une version simplifiée du modèle qui a récemment obtenu les meilleurs résultats lors de l'l'Olympiade internationale de mathématiques (IMO) de cette année.

La version originale nécessite plusieurs heures pour résoudre des problèmes mathématiques complexes, mais la version publiée aujourd'hui est beaucoup plus rapide et mieux adaptée aux tâches quotidiennes, tout en atteignant le niveau Bronze à l'IMO 2025.

Deep Think est conçu pour les questions quotidiennes, mais conserve néanmoins de solides capacités de résolution de problèmes. Les utilisateurs peuvent s'attendre à des réponses approfondies et pertinentes, car Deep Think traite des tâches complexes en prolongeant son « temps de réflexion », ce qui lui permet de générer, d'évaluer et de combiner diverses idées de manière très efficace.

Veuillez noter que la fonctionnalité Deep Think n'est pas identique à Deep Research, qui est conçue pour collecter et résumer des informations provenant du Web, avec leurs sources et des rapports structurés. L'un réfléchit davantage, l'autre approfondit ses recherches.

Comment accéder à Deep Think ?

À l'heure actuelle, Deep Think est accessible sur l' application Gemini , mais uniquement dans le cadre de l'abonnement Google AI Ultra, qui coûte 274,99 € par mois.

Il est également accessible via l'API, mais uniquement pour un groupe restreint d'utilisateurs. Nous ne savons pas encore si cette fonctionnalité sera déployée pour tous les utilisateurs.

Si vous disposez d'un abonnement Google AI Ultra, vous pouvez activer Deep Think en cliquant sur le bouton situé en bas de la fenêtre de saisie.

Veuillez noter que même avec l'abonnement Ultra, vous êtes limité à environ cinq messages par jour.

Comment fonctionne la réflexion approfondie

Gemini Deep Think fonctionne selon un processus similaire au brainstorming humain, où il explore simultanément de nombreuses possibilités pour résoudre un problème.

Ceci est rendu possible grâce à une réflexion parallèle, qui permet à l'IA d'envisager simultanément différentes pistes et alternatives, plutôt que de se limiter à une approche linéaire unique. En accordant un « temps de réflexion » prolongé, Gemini Deep Think analyse, compare et fusionne différentes idées afin de parvenir à la meilleure solution possible.

Cette méthode permet à Gemini de traiter efficacement des tâches complexes en simulant plusieurs résultats et stratégies, offrant ainsi aux utilisateurs des réponses fiables et innovantes à des questions complexes dans un délai relativement court.

Test 1 : Aborder un problème de doctorat ouvert

Lorsque j'ai rédigé ma thèse de doctorat, j'ai laissé quelques problèmes en suspens que je n'ai pas pu résoudre. J'ai décidé de tester Gemini Deep Think sur l'un d'entre eux.

Le problème concerne les réseaux informatiques. Le trafic circule dans un réseau informatique en empruntant les chemins les plus courts, de la même manière qu'un GPS lors de la navigation routière en voiture. La longueur de chaque liaison réseau est simplement un nombre positif et peut être configurée à votre convenance.

Cependant, il n'est pas pratique de configurer des longueurs très importantes sur les liaisons réseau. Nous souhaitons donc réduire autant que possible le poids maximal.

Voici la question envoyée à Gemini Deep Think :

Après environ 15 minutes, il est revenu avec une réponse. Il a proposé un algorithme glouton. Il s'agit d'un algorithme qui n'est pas optimal, mais qui tente de trouver une solution satisfaisante.

Je me suis rendu compte que ma première suggestion ne correspondait pas à ce que je souhaitais. Je souhaitais soit trouver un algorithme permettant de déterminer la meilleure solution, soit démontrer qu'un tel algorithme n'existe probablement pas.

J'ai donc poursuivi la conversation :

Après 15 minutes supplémentaires, il a répondu que le problème était NP-difficile. Cela signifie qu'il n'existe probablement pas d'algorithme rapide pour résoudre ce problème.

C'est également ce que je pense. J'ai commencé à relire la version préliminaire, mais il manquait de nombreux détails importants. Au lieu de cela, il fournirait quelques détails de haut niveau et indiquerait que la réponse est très complexe :

J'ai insisté et demandé les informations manquantes, mais je n'ai jamais réussi à obtenir une preuve complète et détaillée, je n'ai donc pas pu vérifier que cela résolvait le problème.

Cela ressemblait un peu au mème mathématique classique de Sidney Harris:

Dans les réponses, j'ai remarqué que la façon dont elles étaient rédigées donnait l'impression que la réponse n'avait pas été trouvée, mais qu'il s'agissait plutôt d'une preuve connue. J'ai posé la question, et il m'a été répondu qu'il s'agissait d'un résultat connu, publié dans un article en 2002.

Il a fourni le nom de l'article, mais je ne l'ai trouvé nulle part en ligne. Il s'avère que l'auteur faisait partie de mon comité de thèse. Ce serait assez amusant s'ils avaient déjà résolu le problème et ne m'en avaient simplement pas informé.

Je ne sais pas quoi penser de cet exemple. Avez-vous trouvé la réponse, mais vous n'avez pas partagé tous les détails ? A-t-il simplement affiché une réponse existante ? Ou bien les détails manquent-ils parce que la réponse n'est pas correcte ?

Test 2 : Trouver la meilleure façon de jouer à un jeu

Je joue à un jeu de cartes stratégique et, récemment, j'ai essayé de déterminer la quantité maximale de ressources que je peux générer dans une situation de jeu spécifique.

J'ai élaboré il y a quelque temps des formules qui me semblent optimales, mais je n'ai pas démontré qu'elles le sont réellement. À l'époque, j'ai demandé à d'autres modèles de raisonnement IA de trouver la solution, mais ils ont tous échoué lamentablement. Ce n'était pas seulement que les réponses qu'ils fournissaient n'étaient pas optimales ; elles n'avaient aucun sens par rapport aux règles du jeu.

J'ai donc décidé d'essayer Gemini Deep Think pour résoudre ce problème. Je n'ai pas fourni les règles du jeu (je pensais qu'elles faisaient partie de la formation). Cependant, j'ai bien fourni les règles de chaque carte. Il n'est pas nécessaire de comprendre le jeu ou ma consigne pour suivre cet exemple.

Voici l'invite :

Il est important de noter que Gemini est relativement lent par rapport à d'autres modèles. Il faut donc s'attendre à attendre entre 5 et 20 minutes pour obtenir une réponse. Cet exemple était plutôt rapide et a pris environ 5 minutes.

Voici une partie de la réponse que nous avons reçue. Cette partie présente les étapes et les formules. Auparavant, il avait expliqué son raisonnement :

Cependant, comme j'avais déjà résolu ce problème auparavant, je savais que ce n'était pas correct et qu'il était possible de faire mieux. Cela est dû à une règle qui permet de contourner certaines contraintes des cartes, que je n'avais pas explicitement mentionnée. Je ne sais pas si cela a été omis en raison d'un raisonnement incorrect ou parce que les règles n'ont pas été pleinement utilisées lors de la formation.

Cependant, cela montre qu'il peut exister des lacunes dans des domaines spécifiques, il convient donc de rester prudent quant aux réponses obtenues. Si cela avait été une question importante à laquelle je n'avais jamais répondu auparavant, je n'aurais pas su que la réponse n'était pas correcte et je l'aurais peut-être utilisée à l'aveuglette, en supposant qu'elle l'était. D'un autre côté, si je dois résoudre le problème moi-même, je n'ai pas besoin de l'IA en premier lieu.

J'ai indiqué que la réponse était incorrecte et fourni des informations supplémentaires afin de voir si elle pouvait être améliorée.

Cette fois-ci, j'ai obtenu la même réponse que précédemment. Voici une partie de la réponse fournie :

Une chose qui m'a déçu, c'est qu'il n'a pas été prouvé qu'il s'agissait de la meilleure réponse possible.

Test 3 : Résoudre un casse-tête logique

Ensuite, j'ai essayé de lui faire résoudre un casse-tête logique que j'apprécie beaucoup.

Dans ce cas, la réponse a été beaucoup plus rapide. La réponse a commencé par dire qu'il s'agissait d'un problème de logique classique.

Il a ensuite expliqué une stratégie pour résoudre le casse-tête. Dans ce cas, il est évident qu'il n'y a pas eu beaucoup de réflexion et que l'IA avait déjà été entraînée à trouver la solution.

C'est l'une des questions difficiles qui se posent lors de l'évaluation de ces modèles. A-t-il trouvé la réponse parce qu'il l'a imaginée, ou bien la réponse était-elle déjà codée et il n'avait plus qu'à la restituer ?

Pour aller plus loin, j'ai ajouté une autre contrainte afin d'observer le résultat. J'ai imaginé cette variante sur le moment et je ne l'avais jamais vue auparavant. Je ne savais pas si cette version avait une solution.

Cette fois-ci, il a fallu beaucoup de temps pour répondre, ce qui est un signe encourageant. Il a déclaré avoir trouvé une solution à cette variante plus complexe :

Cependant, après avoir lu la réponse complète, il semble que la solution comporte quelques erreurs. À la fin de la réponse, il fournit un exemple de mise en œuvre du plan et se rend compte que cela ne fonctionne pas.

Il est indiqué qu'il existe une solution, mais je n'ai pas approfondi la question. Le comportement est similaire à l'exemple précédent, où certaines étapes importantes sont omises, et nous ne savons pas vraiment si cela peut résoudre le problème.

Exemple 4 : Stratégie de carte de fidélité pour une entreprise

Je suis en train de mettre en place un programme de carte de fidélité numérique dans mon café et je me demandais quelle était la meilleure stratégie à adopter. J'ai fourni les détails à Gemini Deep Think et demandé une analyse complète des différentes stratégies ainsi qu'une recommandation.

Voici l'invite que j'ai utilisée :

Il s'agissait d'un autre cas où la réponse n'a pas nécessité beaucoup de temps. Il a proposé quatre solutions et présenté les avantages et les inconvénients de chacune d'entre elles.

Première solution :

Deuxième solution :

Troisième solution :

Quatrième solution :

Pour ce problème, bien que j'apprécie la réponse, je ne l'ai pas trouvée très différente de ce que proposent d'autres modèles. Je pense que l'utilisation de Deep Think pour ce type de problèmes est excessive et que des modèles d'IA génériques peuvent tout aussi bien accomplir ces tâches.

Exemple 5 : Écriture de code

Enfin, j'ai testé Gemini Deep Think sur une tâche de codage. Je n'ai pas précisé la langue ni aucun détail technique, seulement le problème que je souhaitais résoudre.

La réponse était très décevante et ne fournissait même pas le code. Il s'agissait peut-être d'un simple bug, mais au vu du prix demandé par Deep Think, cela n'est pas acceptable.

La réponse n'a pas seulement omis de fournir le code, mais n'a pas non plus expliqué comment la solution fonctionne. J'ai atteint la limite de caractères lors de l'envoi de ce message, je me demande donc si cela a pu influencer la réponse. Bien que je trouve cela étrange, car ce message était toujours dans la limite autorisée.

Conclusion

Avec les problèmes que j'ai essayés, je n'ai pas constaté de différence significative entre les réponses fournies par Deep Think et celles d'autres modèles de chaîne de pensée. Ainsi, malgré ses meilleures performances en termes de benchmark et sa capacité à remporter des médailles d'or, je me demande s'il offre une valeur ajoutée significative pour la plupart des utilisateurs. Je le considère comme un outil destiné aux chercheurs.

Ce qui m'a dérangé, c'est qu'une fois la limite de Deep Think atteinte, il n'est plus possible de poursuivre la conversation avec un modèle normal. Souvent, j'ai estimé qu'il aurait été suffisant de démarrer la résolution du problème à l'aide de Deep Think, puis de laisser un modèle standard reprendre les idées initiales pour aboutir à une solution finale.

Je pense sincèrement que Deep Think a accompli des réalisations impressionnantes. Remporter une médaille à l'IMO n'est pas une mince affaire, et à mesure que ces modèles évoluent, ils peuvent devenir des outils extrêmement utiles pour les chercheurs. Je pense que, associé à un être humain, Deep Think peut contribuer à faire avancer la recherche.

Lors de mon doctorat, j'avais souvent des difficultés à partager mes idées avec les autres, même lorsqu'ils ne parvenaient pas à apporter de solution. Il aurait été formidable d'avoir un modèle tel que Deep Think à mes côtés pour réfléchir plus souvent à de nouvelles idées et m'aider à les valider ou à les rejeter plus rapidement.

Author

François Aubry

Ingénieur full-stack et fondateur de CheapGPT. L'enseignement a toujours été ma passion. Dès mes premiers jours d'études, j'ai cherché avec enthousiasme des occasions de donner des cours particuliers et d'aider d'autres étudiants. Cette passion m'a amenée à poursuivre un doctorat, où j'ai également été assistante d'enseignement pour soutenir mes efforts académiques. Au cours de ces années, j'ai trouvé un immense épanouissement dans le cadre d'une classe traditionnelle, en favorisant les liens et en facilitant l'apprentissage. Cependant, avec l'avènement des plateformes d'apprentissage en ligne, j'ai reconnu le potentiel de transformation de l'éducation numérique. En fait, j'ai participé activement au développement d'une telle plateforme dans notre université. Je suis profondément engagée dans l'intégration des principes d'enseignement traditionnels avec des méthodologies numériques innovantes. Ma passion est de créer des cours qui sont non seulement attrayants et instructifs, mais aussi accessibles aux apprenants à l'ère du numérique.

Sujets

Intelligence artificielle

Grands modèles linguistiques

Apprenez l'IA grâce à ces cours !

Cours

Building Agentic Workflows with LlamaIndex

2 h

641

Build AI agentic workflows that can plan, search, remember, and collaborate, using LlamaIndex.

Afficher les détails

Commencer le cours

Cours

Introduction aux agents d’IA

1 h 30 min

40K

Découvrez les bases des agents d’IA, leurs composants et cas d’usage réels, le tout sans coder.

Afficher les détails

Commencer le cours

Cours

Introduction to SQL with AI

3 h

2.4K

Learn SQL with AI by writing prompts, generating queries, and analyzing data to solve real-world problems.

Afficher les détails

Commencer le cours

Qu'est-ce que Gemini Deep Think ?

Comment accéder à Deep Think ?

Comment fonctionne la réflexion approfondie

Test 1 : Aborder un problème de doctorat ouvert

Test 2 : Trouver la meilleure façon de jouer à un jeu

Test 3 : Résoudre un casse-tête logique

Exemple 4 : Stratégie de carte de fidélité pour une entreprise

Première solution :

Deuxième solution :

Troisième solution :

Quatrième solution :

Exemple 5 : Écriture de code

Conclusion

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Building Agentic Workflows with LlamaIndex

Introduction aux agents d’IA

Introduction to SQL with AI

Building Agentic Workflows with LlamaIndex