Accéder au contenu principal

DeepSeek V3 vs R1 : Un guide avec des exemples

Découvrez les différences entre DeepSeek-R1 et DeepSeek-V3 pour choisir le modèle adapté à vos besoins.
Actualisé 7 févr. 2025  · 8 min de lecture

Lorsque nous utilisons l'application DeepSeek sur notre téléphone ou notre ordinateur, nous ne savons pas toujours quand choisir R1, également connu sous le nom de DeepThink, par rapport au modèle V3 par défaut pour nos tâches quotidiennes.

Pour les développeurs, le défi est un peu différent. Lors de l'intégration de DeepSeek par le biais de son API, le défi consiste à déterminer le modèle qui correspond le mieux aux exigences de notre projet et qui améliore les fonctionnalités.

Dans ce blog, j'aborderai les aspects clés des deux modèles pour vous aider à faire ces choix plus facilement. Je donnerai des exemples pour illustrer le comportement et les performances de chaque modèle dans différentes situations. Je vous donnerai également un guide de décision que vous pourrez utiliser pour choisir entre DeepSeek-R1 et DeepSeek-V3.

Que sont DeepSeek-V3 et DeepSeek-R1 ?

DeepSeek est une start-up chinoise spécialisée dans l'IA qui a attiré l'attention internationale après avoir développé DeepSeek-R1 à un coût bien inférieur à celui de l'o1 d'OpenAI. À l'instar d'OpenAI, la ChatGPT que nous connaissons tous, DeepSeek dispose également d'un chatbot similaire, qui se décline en deux modèles : DeepSeek-V3 et DeepSeek-R1.

Qu'est-ce que DeepSeek-V3 ?

DeepSeek-V3 est le modèle par défaut utilisé lorsque nous interagissons avec l'application DeepSeek. Il s'agit d'un grand modèle de langage (LLM) qui se distingue en tant qu'outil polyvalent capable de gérer un large éventail de tâches.L'interface par défaut de DeepSeek V3

Ce modèle est en concurrence avec d'autres modèles linguistiques bien connus, tels que le modèle GPT-4o.

L'une des principales caractéristiques de DeepSeek-V3 est son utilisation d'un mélange d'experts (MoE). Cette méthode permet au modèle de choisir parmi différents "experts" pour effectuer des tâches spécifiques. Une fois que vous avez donné votre ordre au modèle, seule la partie la plus pertinente du modèle est active pour une tâche donnée, ce qui permet d'économiser des ressources informatiques tout en obtenant des résultats précis. Pour en savoir plus, consultez cet article de blog sur le Le mélange d'experts (MoE).

En résumé, DeepSeek-V3 est un choix fiable pour la plupart des tâches quotidiennes que nous attendons d'un LLM. Cependant, comme la plupart des LLM, il utilise la prédiction du mot suivant, ce qui limite sa capacité à résoudre des problèmes nécessitant un raisonnement ou à trouver de nouvelles réponses qui ne sont pas encodées d'une manière ou d'une autre dans les données d'apprentissage.

Qu'est-ce que DeepSeek-R1 ?

DeepSeek-R1 est un puissant modèle de raisonnement conçu pour résoudre des tâches nécessitant un raisonnement avancé et une résolution approfondie des problèmes. Il est idéal pour les défis de codage qui vont au-delà de la régurgitation d'un code qui a été écrit des milliers de fois et pour les questions de logique.

Considérez-le comme votre option de choix lorsque la tâche que vous souhaitez résoudre exige des opérations cognitives de haut niveau, similaires à un raisonnement professionnel ou d'expert.

Nous l'activons en cliquant sur le bouton "DeepThink (R1)" :

Activation du modèle DeepSeek-R1 en cliquant sur le modèle DeepThink (R1)

Ce qui distingue DeepSeek-R1, c'est son utilisation particulière de l'apprentissage par renforcement. l'apprentissage par renforcement. Pour entraîner R1, DeepSeek s'est appuyé sur les bases posées par V3, en utilisant ses capacités étendues et son vaste espace de paramètres. Ils ont procédé à un apprentissage par renforcement en permettant au modèle de générer diverses solutions pour des scénarios de résolution de problèmes. Un système de récompense basé sur des règles a ensuite été utilisé pour évaluer l'exactitude des réponses et des étapes du raisonnement. Cette approche d'apprentissage par renforcement a encouragé le modèle à affiner ses capacités de raisonnement au fil du temps, en apprenant effectivement à explorer et à développer des voies de raisonnement de manière autonome.

DeepSeek-R1 est un concurrent direct de o1 d'OpenAI.

Comparaison de DeepSeek avec des modèles d'IA ouverts

Une différence entre V3 et R1 est que lorsque nous discutons avec R1, nous n'obtenons pas immédiatement une réponse. Le modèle utilise d'abord la chaîne de pensée pour réfléchir au problème. Ce n'est qu'une fois qu'il a fini de réfléchir qu'il commence à produire la réponse.

Structure de sortie de DeepSeek R1 

Cela signifie également qu'en général, R1 est beaucoup plus lent que V3 pour répondre, car le processus de réflexion peut prendre plusieurs minutes, comme nous le verrons dans les exemples suivants.

Différences entre V3 et R1

Passons en revue les différences entre DeepSeek-R1 et DeepSeek-V3 en fonction de divers aspects :

Capacité de raisonnement

DeepSeek-V3 n'a pas de capacité de raisonnement. Comme nous l'avons mentionné, il fonctionne comme un prédicteur du mot suivant. Cela signifie qu'il peut répondre à des questions dont les réponses sont encodées dans les données d'apprentissage.

La quantité de données utilisées pour former ces modèles est si importante qu'elle permet de répondre à des questions sur presque tous les sujets. Comme d'autres LLM, il excelle dans les conversations à consonance naturelle et la créativité. C'est le modèle que nous voulons pour la création d'écrits, la création de contenu ou la réponse à des questions génériques qui ont probablement déjà été résolues à de nombreuses reprises.

DeepSeek-R1, en revanche, brille lorsqu'il s'agit de tâches complexes de résolution de problèmes, de logique et de raisonnement étape par étape. Il est conçu pour répondre à des requêtes difficiles qui nécessitent une analyse approfondie et des solutions structurées. Lorsque vous êtes confronté à des défis de codage complexes ou à des puzzles logiques détaillés, R1 est l'outil sur lequel vous pouvez compter.

Comparaison des raisonnements de DeepSeek V3 et DeepSeek R1

Rapidité et efficacité

DeepSeek-V3 bénéficie de son architecture "Mixture-of-Experts" (MoE), ce qui lui permet de réagir plus rapidement et plus efficacement. V3 est donc idéal pour les interactions en temps réel où la rapidité est cruciale.

DeepSeek-R1 prend généralement un peu plus de temps pour générer des réponses, mais c'est parce qu'il se concentre sur la fourniture de réponses plus profondes et plus structurées. Le temps supplémentaire est mis à profit pour garantir des solutions complètes et bien pensées.

Comparaison des vitesses V3 et R1

Gestion de la mémoire et du contexte

Les deux modèles peuvent traiter jusqu'à 64 000 éléments d'entrée, mais DeepSeek-R1 est particulièrement doué pour maintenir la logique et le contexte au cours d'interactions prolongées. Il convient donc aux tâches qui exigent un raisonnement et une compréhension soutenus dans le cadre de conversations prolongées ou de projets complexes.

Comparaison des contextes de DeepSeekV3 et DeepSeek R1

Le meilleur pour les utilisateurs de l'API

Pour ceux qui utilisent l'API, DeepSeek-V3 offre une expérience d'interaction plus naturelle et plus fluide. Sa force en matière de langage et de conversation rend les interactions avec les utilisateurs fluides et attrayantes. 

Le temps de réponse de R1 peut être un problème pour de nombreuses applications, c'est pourquoi je vous recommande de ne l'utiliser que lorsque c'est strictement nécessaire.

Notez que les noms des modèles lorsque vous utilisez l'API ne sont pas V3 et R1. Le modèle V3 est nommé deepseek-chat et le modèle R1 est nommé deepseek-reasoner.

Différences de prix

Au moment de choisir le modèle à utiliser, il convient de noter que le modèle V3 est moins cher que le modèle R1. Bien que ce blog se concentre sur les fonctionnalités, il est important d'évaluer les coûts associés à chaque modèle en fonction de nos besoins spécifiques et de notre budget. Pour plus de détails sur les coûts, consultez la documentation sur les prix de l'API.

DeepSeek-R1 vs. V3 : Exemples tirés de DeepSeek Chat

Exemple 1 : Résolution de problèmes et tâches logiques

Comparons la capacité de raisonnement des deux modèles en posant la question suivante :

"Utilisez les chiffres [0-9] pour former trois nombres : x,y,z de sorte que x+y=z".

Par exemple, une solution possible est : x = 26, y = 4987, et z = 5013. Il utilise tous les chiffres de 0 à 9 et x + y = z.

Lorsque nous posons cette question à V3, il commence immédiatement à produire une longue réponse et arrive finalement à la conclusion incorrecte qu'il n'y a pas de solution :

Exemple de V3 ne parvenant pas à résoudre un problème mathématique complexe

En revanche, R1 peut trouver une solution après avoir réfléchi pendant environ 5 minutes :

Exemple de R1 résolvant le même problème mathématique

Cela montre que R1 est plus adapté à un problème nécessitant un raisonnement mathématique, car une prédiction du mot suivant comme V3 a beaucoup moins de chances de suivre la bonne voie si de nombreux problèmes similaires n'ont pas été utilisés lors de l'entraînement du modèle.

Exemple 2 : Créer l'écriture

Concentrons-nous à présent sur l'écriture créative. Demandons aux deux modèles d'écrire une microfiction sur la solitude dans la foule.

"Rédigez une microfiction sur la solitude dans la foule.

Voici la sortie de V3 :

Exemple de DeepSeek V3 pour la création littéraire

Nous obtenons immédiatement une histoire en rapport avec le thème. Nous pouvons l'apprécier ou non, c'est subjectif, mais la réponse est cohérente avec ce que nous avons demandé.

Lorsqu'il utilise le raisonnement, le modèle raisonne pour créer l'histoire. Nous ne montrerons pas tous les détails ici, mais il a décomposé la tâche en plusieurs étapes :

  • Tout d'abord, il convient de planter le décor...
  • Ensuite, les détails sensoriels...
  • Je dois montrer leur état interne...
  • Pour terminer sur une image poignante...
  • Permettez-moi de vérifier si je couvre tous les éléments...

Nous pouvons constater que le processus de création est très structuré, ce qui peut réduire la créativité du produit.

Exemple de DeepSeek R1 pour l'écriture créative

Je pense que nous ne devrions utiliser R1 pour ce type de tâche que si nous sommes intéressés par le processus de raisonnement, car le résultat que nous voulons n'est pas le fruit d'un processus de pensée logique, mais plutôt d'un processus créatif.

Exemple 3 : Assistance au codage

Dans ce troisième exemple, nous avons demandé à DeepSeek de nous aider à corriger une fonction Python légèrement erronée destinée à résoudre le problème suivant :

"Les participants à une course en ville devaient inscrire leur nom au départ et à l'arrivée de la course. Nous savons qu'une seule personne n'a pas terminé la course. Cette fonction Python tente de trouver le nom de cette personne, mais cela ne fonctionne pas. Réparez-la".

def find_person(names):
  freq = {}
  # Calculate the frequency of each name
  for name in names:
    if name not in freq:
      freq[name] = 0
      freq[name] += 1
  # Find the name that appears only once
  for name in names:
    if freq[name] == 1:
      return name
  return None

Avant de l'envoyer à l'IA, essayons de comprendre ce qui ne va pas dans le code.

Puisque chaque personne écrit son nom au départ et à l'arrivée de la course, ce code tente de résoudre le problème en trouvant le nom qui n'apparaît qu'une seule fois. Chaque personne qui termine la course écrira son nom deux fois, tandis que celle qui ne la termine pas ne l'écrira qu'une seule fois. Toutefois, ce code suppose à tort que tous les noms sont distincts.

La bonne réponse n'est pas le nom dont la fréquence est égale à 1, mais le nom dont la fréquence est impaire. La solution consiste donc à remplacer la deuxième boucle for check if freq[name] == 1: par if freq[name] % 2 == 1 pour trouver le nom à fréquence impaire.

Voyons comment les deux modèles se comportent face à ce problème. Nous avons fourni l'invite suivante :

Exemple de problème de codage 

Voici la réponse de V3 :

Deepseek V3 ne parvient pas à résoudre une question de codage

Le modèle V3 ne parvient pas à trouver la bonne réponse. Non seulement elle modifie les paramètres du problème en introduisant deux listes d'entrée, mais la solution proposée ne fonctionnerait pas même si nous disposions de deux listes distinctes.

En revanche, R1 peut trouver le problème avec le code même si sa solution modifie le code au lieu de corriger le code fourni :

Deepseek R1 résoudre la même question de codage

Le modèle a été assez lent à trouver la réponse. Nous constatons qu'il a raisonné pendant près de huit minutes. La partie surlignée indique le moment où le modèle a réalisé ce qui n'allait pas dans le code.

Quand choisir DeepSeek-R1 vs. DeepSeek-V3

Le choix du bon modèle entre DeepSeek-R1 et DeepSeek-V3 dépend de ce que vous souhaitez réaliser dans le cadre de vos tâches ou de vos projets. 

Pour la plupart des tâches, je recommande généralement d'utiliser V3 et de passer à R1 si vous vous retrouvez dans une boucle où V3 ne trouve pas de réponse. Toutefois, ce processus suppose que nous puissions déterminer si la réponse que nous obtenons est correcte. En fonction du problème, nous ne sommes pas toujours en mesure de faire cette distinction.

Par exemple, lorsque vous écrivez un simple script qui résume certaines données, vous pouvez exécuter le code et voir s'il fait ce que vous voulez. Cependant, si nous construisons un algorithme complexe, il n'est pas aussi simple de vérifier si le code est correct.

Il est donc important de disposer de quelques lignes directrices pour choisir entre les deux modèles. Voici un guide pour savoir quand opter pour l'un ou l'autre :

Tâche

Modèle

Rédaction, création de contenu, traduction

V3

Tâches pour lesquelles vous pouvez évaluer la qualité du résultat

V3

Questions génériques sur le codage

V3

Assistant IA

V3

Recherche

R1

Questions mathématiques, de codage ou de logique complexes

R1

Conversation longue et itérative pour résoudre un problème unique

R1

Intéressé par le processus de réflexion qui a mené à la réponse

R1

Conclusion

DeepSeek V3 est idéal pour les tâches quotidiennes telles que l'écriture, la création de contenu et les questions de codage rapide, ainsi que pour la création d'assistants d'intelligence artificielle où la conversation naturelle et fluide est essentielle. Il est également idéal pour les tâches qui vous permettent d'évaluer rapidement la qualité du résultat.

Cependant, pour les défis complexes qui exigent un raisonnement approfondi, tels que la recherche, les problèmes complexes de codage ou de mathématiques, ou les conversations prolongées de résolution de problèmes, DeepSeek R1 est un meilleur choix.

Pour en savoir plus sur DeepSeek, consultez également ces blogs :


François Aubry's photo
Author
François Aubry
LinkedIn
L'enseignement a toujours été ma passion. Dès mes premiers jours d'études, j'ai cherché avec enthousiasme des occasions de donner des cours particuliers et d'aider d'autres étudiants. Cette passion m'a amenée à poursuivre un doctorat, où j'ai également été assistante d'enseignement pour soutenir mes efforts académiques. Au cours de ces années, j'ai trouvé un immense épanouissement dans le cadre d'une classe traditionnelle, en favorisant les liens et en facilitant l'apprentissage. Cependant, avec l'avènement des plateformes d'apprentissage en ligne, j'ai reconnu le potentiel de transformation de l'éducation numérique. En fait, j'ai participé activement au développement d'une telle plateforme dans notre université. Je suis profondément engagée dans l'intégration des principes d'enseignement traditionnels avec des méthodologies numériques innovantes. Ma passion est de créer des cours qui sont non seulement attrayants et instructifs, mais aussi accessibles aux apprenants à l'ère du numérique.
Sujets

Apprenez l'IA avec ces cours !

cursus

Principes de l'IA

10 heures hr
Découvrez les fondamentaux de l'IA, plongez dans des modèles comme ChatGPT et décodez les secrets de l'IA générative pour naviguer dans le paysage dynamique de l'IA.
Afficher les détailsRight Arrow
Commencer le cours
Certification disponible

cours

Comprendre la loi européenne sur l'IA

1 hr
2.2K
Rassemblez vos forces en matière d'intelligence artificielle ! Comprendre les obligations, les risques et les exigences de la loi européenne sur l'IA.
Voir plusRight Arrow