Accéder au contenu principal

Réflexion approfondie sur les Gémeaux : Un test sur 5 problèmes concrets

J'ai testé le nouveau mode Gemini 2.5 Deep Think de Google sur cinq problèmes concrets, allant de questions de niveau doctorat à des défis commerciaux.
Actualisé 12 août 2025  · 8 min de lecture

Google a récemment lancé le modeDeep Think pour l' Gemini 2.5 Pro. Deep Think est une fonctionnalité conçue pour résoudre des problèmes complexes. Il fonctionne en utilisant la pensée parallèle pour explorer plusieurs idées simultanément, les comparer, puis sélectionner la solution la plus efficace.

Dans cet article, j'explorerai ses capacités en lui demandant de résoudre des problèmes concrets. Des questions de niveau doctoral aux défis commerciaux, j'ai évalué les performances de Deep Think sur cinq problèmes complexes.

Nous tenons nos lecteurs informés des dernières actualités en matière d'IA grâce à The Median, notre newsletter hebdomadaire gratuite qui résume les articles les plus importants de la semaine. Abonnez-vous et restez informé en quelques minutes par semaine :

Qu'est-ce que Gemini Deep Think ?

Gemini Deep Think est une nouvelle amélioration ajoutée au modèle Gemini 2.5 Pro, qui élève les compétences en matière de résolution de problèmes à un niveau supérieur. La version mise à disposition est une version simplifiée du modèle qui a récemment obtenu les meilleurs résultats lors de l'l'Olympiade internationale de mathématiques (IMO) de cette année.

La version originale nécessite plusieurs heures pour résoudre des problèmes mathématiques complexes, mais la version publiée aujourd'hui est beaucoup plus rapide et mieux adaptée aux tâches quotidiennes, tout en atteignant le niveau Bronze à l'IMO 2025.

Deep Think est conçu pour les questions quotidiennes, mais conserve néanmoins de solides capacités de résolution de problèmes. Les utilisateurs peuvent s'attendre à des réponses approfondies et pertinentes, car Deep Think traite des tâches complexes en prolongeant son « temps de réflexion », ce qui lui permet de générer, d'évaluer et de combiner diverses idées de manière très efficace.

Veuillez noter que la fonctionnalité Deep Think n'est pas identique à Deep Research, qui est conçue pour collecter et résumer des informations provenant du Web, avec leurs sources et des rapports structurés. L'un réfléchit davantage, l'autre approfondit ses recherches.

Comment accéder à Deep Think ?

À l'heure actuelle, Deep Think est accessible sur l' application Gemini , mais uniquement dans le cadre de l'abonnement Google AI Ultra, qui coûte 274,99 € par mois.

Il est également accessible via l'API, mais uniquement pour un groupe restreint d'utilisateurs. Nous ne savons pas encore si cette fonctionnalité sera déployée pour tous les utilisateurs.

Si vous disposez d'un abonnement Google AI Ultra, vous pouvez activer Deep Think en cliquant sur le bouton situé en bas de la fenêtre de saisie.

Interface de l'application Gemini présentant la fonctionnalité expérimentale Deep Think, avec des options pour la vidéo, la recherche approfondie, le canevas, l'image et le bouton Deep Think.

Veuillez noter que même avec l'abonnement Ultra, vous êtes limité à environ cinq messages par jour.

Comment fonctionne la réflexion approfondie

Gemini Deep Think fonctionne selon un processus similaire au brainstorming humain, où il explore simultanément de nombreuses possibilités pour résoudre un problème.

Ceci est rendu possible grâce à une réflexion parallèle, qui permet à l'IA d'envisager simultanément différentes pistes et alternatives, plutôt que de se limiter à une approche linéaire unique. En accordant un « temps de réflexion » prolongé, Gemini Deep Think analyse, compare et fusionne différentes idées afin de parvenir à la meilleure solution possible.

Cette méthode permet à Gemini de traiter efficacement des tâches complexes en simulant plusieurs résultats et stratégies, offrant ainsi aux utilisateurs des réponses fiables et innovantes à des questions complexes dans un délai relativement court.

Test 1 : Aborder un problème de doctorat ouvert

Lorsque j'ai rédigé ma thèse de doctorat, j'ai laissé quelques problèmes en suspens que je n'ai pas pu résoudre. J'ai décidé de tester Gemini Deep Think sur l'un d'entre eux.

Le problème concerne les réseaux informatiques. Le trafic circule dans un réseau informatique en empruntant les chemins les plus courts, de la même manière qu'un GPS lors de la navigation routière en voiture. La longueur de chaque liaison réseau est simplement un nombre positif et peut être configurée à votre convenance.

Cependant, il n'est pas pratique de configurer des longueurs très importantes sur les liaisons réseau. Nous souhaitons donc réduire autant que possible le poids maximal.

Voici la question envoyée à Gemini Deep Think :

Veuillez concevoir un algorithme sur un graphe orienté afin d'attribuer des poids aux arêtes, en veillant à ce que chaque chemin le plus court soit unique et que le poids maximal des arêtes soit minimisé.

Après environ 15 minutes, il est revenu avec une réponse. Il a proposé un algorithme glouton. Il s'agit d'un algorithme qui n'est pas optimal, mais qui tente de trouver une solution satisfaisante.

Je me suis rendu compte que ma première suggestion ne correspondait pas à ce que je souhaitais. Je souhaitais soit trouver un algorithme permettant de déterminer la meilleure solution, soit démontrer qu'un tel algorithme n'existe probablement pas.

J'ai donc poursuivi la conversation :

Message texte demandant une preuve de la complexité NP-difficile ou un algorithme en temps polynomial pour un problème complexe.

Après 15 minutes supplémentaires, il a répondu que le problème était NP-difficile. Cela signifie qu'il n'existe probablement pas d'algorithme rapide pour résoudre ce problème.

C'est également ce que je pense. J'ai commencé à relire la version préliminaire, mais il manquait de nombreux détails importants. Au lieu de cela, il fournirait quelques détails de haut niveau et indiquerait que la réponse est très complexe :

Gemini Deep Think omet des détails fondamentaux dans ses preuves.

J'ai insisté et demandé les informations manquantes, mais je n'ai jamais réussi à obtenir une preuve complète et détaillée, je n'ai donc pas pu vérifier que cela résolvait le problème.

Cela ressemblait un peu au mème mathématique classique de Sidney Harris:

Caricature représentant deux scientifiques devant un tableau noir ; l'un d'eux montre « Puis un miracle se produit » dans une équation complexe. L'autre dit : « Je pense que vous devriez être plus explicite ici, à l'étape deux. »

Dans les réponses, j'ai remarqué que la façon dont elles étaient rédigées donnait l'impression que la réponse n'avait pas été trouvée, mais qu'il s'agissait plutôt d'une preuve connue. J'ai posé la question, et il m'a été répondu qu'il s'agissait d'un résultat connu, publié dans un article en 2002.

Il a fourni le nom de l'article, mais je ne l'ai trouvé nulle part en ligne. Il s'avère que l'auteur faisait partie de mon comité de thèse. Ce serait assez amusant s'ils avaient déjà résolu le problème et ne m'en avaient simplement pas informé.

Je ne sais pas quoi penser de cet exemple. Avez-vous trouvé la réponse, mais vous n'avez pas partagé tous les détails ? A-t-il simplement affiché une réponse existante ? Ou bien les détails manquent-ils parce que la réponse n'est pas correcte ?

Test 2 : Trouver la meilleure façon de jouer à un jeu

Je joue à un jeu de cartes stratégique et, récemment, j'ai essayé de déterminer la quantité maximale de ressources que je peux générer dans une situation de jeu spécifique.

J'ai élaboré il y a quelque temps des formules qui me semblent optimales, mais je n'ai pas démontré qu'elles le sont réellement. À l'époque, j'ai demandé à d'autres modèles de raisonnement IA de trouver la solution, mais ils ont tous échoué lamentablement. Ce n'était pas seulement que les réponses qu'ils fournissaient n'étaient pas optimales ; elles n'avaient aucun sens par rapport aux règles du jeu.

J'ai donc décidé d'essayer Gemini Deep Think pour résoudre ce problème. Je n'ai pas fourni les règles du jeu (je pensais qu'elles faisaient partie de la formation). Cependant, j'ai bien fourni les règles de chaque carte. Il n'est pas nécessaire de comprendre le jeu ou ma consigne pour suivre cet exemple.

Voici l'invite :

Capture d'écran d'une demande d'aide mathématique dans Magic: The Gathering pour calculer la génération maximale de mana à l'aide du Prêtre de Titania, avec des paramètres incluant les forêts, le Ranger de Quirion, le Prêtre de Titania, le Symbiote de Wirewood et les elfes.

Il est important de noter que Gemini est relativement lent par rapport à d'autres modèles. Il faut donc s'attendre à attendre entre 5 et 20 minutes pour obtenir une réponse. Cet exemple était plutôt rapide et a pris environ 5 minutes.

Voici une partie de la réponse que nous avons reçue. Cette partie présente les étapes et les formules. Auparavant, il avait expliqué son raisonnement :

Explication détaillée du processus mathématique permettant de maximiser la génération de mana à l'aide de formules pour les stratégies de mise en jeu et de dégagement dans un jeu comportant des éléments tels que Prêtre de Titania et Symbiote de Wirewood.

Cependant, comme j'avais déjà résolu ce problème auparavant, je savais que ce n'était pas correct et qu'il était possible de faire mieux. Cela est dû à une règle qui permet de contourner certaines contraintes des cartes, que je n'avais pas explicitement mentionnée. Je ne sais pas si cela a été omis en raison d'un raisonnement incorrect ou parce que les règles n'ont pas été pleinement utilisées lors de la formation.

Cependant, cela montre qu'il peut exister des lacunes dans des domaines spécifiques, il convient donc de rester prudent quant aux réponses obtenues. Si cela avait été une question importante à laquelle je n'avais jamais répondu auparavant, je n'aurais pas su que la réponse n'était pas correcte et je l'aurais peut-être utilisée à l'aveuglette, en supposant qu'elle l'était. D'un autre côté, si je dois résoudre le problème moi-même, je n'ai pas besoin de l'IA en premier lieu.

J'ai indiqué que la réponse était incorrecte et fourni des informations supplémentaires afin de voir si elle pouvait être améliorée.

Correction de Gemini Deep Think

Cette fois-ci, j'ai obtenu la même réponse que précédemment. Voici une partie de la réponse fournie :

Formules mathématiques expliquant les variables intermédiaires pour l'optimisation des jeux de cartes stratégiques, notamment les activations efficaces de symbiotes, les rebonds maximaux en forêt, les dégagements initiaux des rangers, les rebonds restants et le nombre de boucles de réinitialisation.

Une chose qui m'a déçu, c'est qu'il n'a pas été prouvé qu'il s'agissait de la meilleure réponse possible.

Test 3 : Résoudre un casse-tête logique

Ensuite, j'ai essayé de lui faire résoudre un casse-tête logique que j'apprécie beaucoup.

Image d'un scénario de casse-tête logique : deux personnes sont en prison. Le geôlier leur propose un défi impliquant un échiquier (8x8) avec des pièces de monnaie sur chaque case, représentant une face ou un pile. Le geôlier indique une case cible. Une personne lance une seule pièce, puis s'en va. La tâche de son ami est de deviner la case choisie par le geôlier pour gagner sa liberté.

Dans ce cas, la réponse a été beaucoup plus rapide. La réponse a commencé par dire qu'il s'agissait d'un problème de logique classique.

Image d'un document texte expliquant la solution d'un casse-tête logique classique basé sur la représentation binaire et la parité. Il décrit la méthode permettant d'identifier de manière unique l'un des 64 carrés à l'aide d'un nombre binaire à 6 bits et décrit la responsabilité du premier prisonnier dans le scénario du casse-tête.

Il a ensuite expliqué une stratégie pour résoudre le casse-tête. Dans ce cas, il est évident qu'il n'y a pas eu beaucoup de réflexion et que l'IA avait déjà été entraînée à trouver la solution.

C'est l'une des questions difficiles qui se posent lors de l'évaluation de ces modèles. A-t-il trouvé la réponse parce qu'il l'a imaginée, ou bien la réponse était-elle déjà codée et il n'avait plus qu'à la restituer ?

Pour aller plus loin, j'ai ajouté une autre contrainte afin d'observer le résultat. J'ai imaginé cette variante sur le moment et je ne l'avais jamais vue auparavant. Je ne savais pas si cette version avait une solution.

Condition supplémentaire concernant le problème du geôlier.

Cette fois-ci, il a fallu beaucoup de temps pour répondre, ce qui est un signe encourageant. Il a déclaré avoir trouvé une solution à cette variante plus complexe :

Nouvelle stratégie expliquant la solution d'un casse-tête logique complexe, avec une case clé spéciale et une règle de décodage, ainsi que des groupes de numérotation et de parité pour l'encodage.

Cependant, après avoir lu la réponse complète, il semble que la solution comporte quelques erreurs. À la fin de la réponse, il fournit un exemple de mise en œuvre du plan et se rend compte que cela ne fonctionne pas.

Extrait de la solution expliquant la faille dans le casse-tête logique, l'erreur de calcul avec la devinette sur la pièce, la référence au cycle hamiltonien et la nécessité d'une preuve complexe.

Il est indiqué qu'il existe une solution, mais je n'ai pas approfondi la question. Le comportement est similaire à l'exemple précédent, où certaines étapes importantes sont omises, et nous ne savons pas vraiment si cela peut résoudre le problème.

Exemple 4 : Stratégie de carte de fidélité pour une entreprise

Je suis en train de mettre en place un programme de carte de fidélité numérique dans mon café et je me demandais quelle était la meilleure stratégie à adopter. J'ai fourni les détails à Gemini Deep Think et demandé une analyse complète des différentes stratégies ainsi qu'une recommandation.

Voici l'invite que j'ai utilisée :

Capture d'écran d'un message texte traitant de la mise en place d'une carte de fidélité pour un café, détaillant deux stratégies pour gagner et échanger des points, et demandant une analyse complète et une recommandation sur la meilleure stratégie à adopter.

Il s'agissait d'un autre cas où la réponse n'a pas nécessité beaucoup de temps. Il a proposé quatre solutions et présenté les avantages et les inconvénients de chacune d'entre elles.

Première solution :

Description d'un programme de fidélité basé sur la fréquence pour les cafés, mettant en évidence son fonctionnement, ses variantes, ses avantages et ses inconvénients.

Deuxième solution :

Programmes basés sur les dépenses (systèmes de points) : diagramme présentant les récompenses liées au montant dépensé, mettant l'accent sur la valeur moyenne des transactions (ATV). Comprend deux variantes avec un tableau des avantages et des inconvénients en termes d'équité, de complexité opérationnelle et d'exigences numériques.

Troisième solution :

Tableau présentant les avantages et les inconvénients des modèles hybrides de bonus de durabilité et de seuil dans les programmes de fidélité, en mettant l'accent sur la flexibilité commerciale et les défis en matière de communication.

Quatrième solution :

Stratégie de programme de fidélité à plusieurs niveaux et principaux compromis pour les cafés, mettant l'accent sur la gamification, la fréquence par rapport aux dépenses, la simplicité par rapport à l'équité et les types de récompenses.

Pour ce problème, bien que j'apprécie la réponse, je ne l'ai pas trouvée très différente de ce que proposent d'autres modèles. Je pense que l'utilisation de Deep Think pour ce type de problèmes est excessive et que des modèles d'IA génériques peuvent tout aussi bien accomplir ces tâches.

Exemple 5 : Écriture de code

Enfin, j'ai testé Gemini Deep Think sur une tâche de codage. Je n'ai pas précisé la langue ni aucun détail technique, seulement le problème que je souhaitais résoudre.

La réponse était très décevante et ne fournissait même pas le code. Il s'agissait peut-être d'un simple bug, mais au vu du prix demandé par Deep Think, cela n'est pas acceptable.

Discutez avec Gemini Deep Think pour créer un planificateur d'appels sociaux. La réponse de l'IA présente une solution impliquant une classe Python, SocialPlanner, qui utilise des algorithmes pour optimiser la mise en correspondance, la gestion des contraintes, la gestion des nombres impairs et le suivi historique.

La réponse n'a pas seulement omis de fournir le code, mais n'a pas non plus expliqué comment la solution fonctionne. J'ai atteint la limite de caractères lors de l'envoi de ce message, je me demande donc si cela a pu influencer la réponse. Bien que je trouve cela étrange, car ce message était toujours dans la limite autorisée.

Conclusion

Avec les problèmes que j'ai essayés, je n'ai pas constaté de différence significative entre les réponses fournies par Deep Think et celles d'autres modèles de chaîne de pensée. Ainsi, malgré ses meilleures performances en termes de benchmark et sa capacité à remporter des médailles d'or, je me demande s'il offre une valeur ajoutée significative pour la plupart des utilisateurs. Je le considère comme un outil destiné aux chercheurs.

Ce qui m'a dérangé, c'est qu'une fois la limite de Deep Think atteinte, il n'est plus possible de poursuivre la conversation avec un modèle normal. Souvent, j'ai estimé qu'il aurait été suffisant de démarrer la résolution du problème à l'aide de Deep Think, puis de laisser un modèle standard reprendre les idées initiales pour aboutir à une solution finale.

Je pense sincèrement que Deep Think a accompli des réalisations impressionnantes. Remporter une médaille à l'IMO n'est pas une mince affaire, et à mesure que ces modèles évoluent, ils peuvent devenir des outils extrêmement utiles pour les chercheurs. Je pense que, associé à un être humain, Deep Think peut contribuer à faire avancer la recherche.

Lors de mon doctorat, j'avais souvent des difficultés à partager mes idées avec les autres, même lorsqu'ils ne parvenaient pas à apporter de solution. Il aurait été formidable d'avoir un modèle tel que Deep Think à mes côtés pour réfléchir plus souvent à de nouvelles idées et m'aider à les valider ou à les rejeter plus rapidement.


François Aubry's photo
Author
François Aubry
LinkedIn
Ingénieur full-stack et fondateur de CheapGPT. L'enseignement a toujours été ma passion. Dès mes premiers jours d'études, j'ai cherché avec enthousiasme des occasions de donner des cours particuliers et d'aider d'autres étudiants. Cette passion m'a amenée à poursuivre un doctorat, où j'ai également été assistante d'enseignement pour soutenir mes efforts académiques. Au cours de ces années, j'ai trouvé un immense épanouissement dans le cadre d'une classe traditionnelle, en favorisant les liens et en facilitant l'apprentissage. Cependant, avec l'avènement des plateformes d'apprentissage en ligne, j'ai reconnu le potentiel de transformation de l'éducation numérique. En fait, j'ai participé activement au développement d'une telle plateforme dans notre université. Je suis profondément engagée dans l'intégration des principes d'enseignement traditionnels avec des méthodologies numériques innovantes. Ma passion est de créer des cours qui sont non seulement attrayants et instructifs, mais aussi accessibles aux apprenants à l'ère du numérique.
Sujets

Apprenez l'IA grâce à ces cours !

Cours

Building Agentic Workflows with LlamaIndex

2 h
499
Build AI agentic workflows that can plan, search, remember, and collaborate, using LlamaIndex.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow