Accéder au contenu principal

Grok 3 : Fonctionnalités, accès, comparaison entre O1 et R1, etc.

Découvrez Grok 3, le dernier modèle d'IA de xAI, et comparez-le à o1 d'OpenAI et R1 de DeepSeek.
Actualisé 18 févr. 2025  · 8 min de lecture

Après avoir lancé une offre d'achat pour OpenAI la semaine dernière, Elon Musk a publié Grok 3 par l'intermédiaire de sa société, xAI, en la qualifiant d'"IA la plus puissante au monde à l'heure actuelle". Si les résultats de la démonstration en direct se confirment, il pourrait avoir raison.

Grok 3 entre dans le domaine croissant des modèles de raisonnement, en concurrence avec OpenAI, o1 d'OpenAI et R1 de DeepSeek. Contrairement aux modèles à usage général comme le ChatGPT, qui génèrent des réponses d'emblée, les modèles de raisonnement montrent leur processus de réflexion, décomposant les problèmes étape par étape avant d'arriver à une conclusion.

Cependant, il semble que xAI positionne Grok 3 à la fois comme un modèle de raisonnement et comme une IA généraliste. Lorsque le mode Think est désactivé (nous y reviendrons), il fonctionne comme le GPT-4o ou le Claude 3.5 Sonnet - rapide, conversationnel et conçu pour les tâches générales. Mais l'activation du mode réflexion le transforme en modèle de raisonnement.

Si vous n'avez pas eu le temps d'assister à la démonstration en direct d'une heure de Grok 3, ne vous inquiétez pas, je vais faire le tour de la question et vous présenter l'essentiel.

L'amélioration de l'IA pour les débutants

Apprenez les bases de l'IA et du ChatGPT en partant de zéro.
Apprendre l'IA gratuitement

Qu'est-ce que Grok 3 ?

Grok 3 est le dernier modèle d'IA de xAI, positionné comme un concurrent direct de o1 d'OpenAI et de R1 de DeepSeek. L'équipe de xAI affirme qu'il est 10 à 15 fois plus puissant que Grok 2, et d'après les benchmarks présentés dans la démo, il pourrait bien tenir tête aux meilleurs modèles du marché.

Grok 3 : repères

Source : xAI

En quoi les modèles de raisonnement sont-ils différents ?

Si vous avez utilisé ChatGPT, Claude ou Gemini, vous savez comment fonctionnent la plupart des modèles d'IA : vous posez une question, ils génèrent une réponse, et c'est tout.

Les modèles de raisonnement comme Grok 3 adoptent une approche différente. Au lieu de donner immédiatement une réponse, ils décomposent les problèmes étape par étape, montrent leurs réflexions intermédiaires et affinent même leur résultat avant de présenter une réponse finale. Ils sont donc particulièrement performants pour des tâches telles que les mathématiques, le codage et la résolution de problèmes réels.

grok 3 processus de réflexion

Source : xAI

Grok 3 Mini

Toutes les tâches ne nécessitent pas le raisonnement à grande échelle de Grok 3. Grok 3 mini est optimisé pour la vitesse et l'utilisation réduite des ressources informatiques, tout en conservant les capacités de raisonnement de Grok 3.

Grok 3 mini peut s'avérer particulièrement utile pour les développeurs qui souhaitent optimiser leurs dépenses liées à l'utilisation de jetons lors de l'utilisation de l'API.

Nous pouvons également passer à Grok 3 Mini pour une réponse plus rapide dans l'interface de chat. D'après les critères de référence, il n'y aura pas beaucoup de questions qu'il ne pourra pas traiter.

Grok 3 Think Mode

Le mode réflexion est un réglage optionnel qui active le processus de raisonnement en plusieurs étapes de Grok 3. Au lieu de sauter directement à une réponse, il décompose les problèmes en étapes plus petites, évalue différentes solutions et affine sa réponse avant de produire un résultat final.

grok 3 think mode

Ce mode est particulièrement utile pour la résolution de problèmes complexes, les preuves mathématiques, les défis de codage et les tâches logiques. Il imite la pensée structurée humaine, ce qui le rend idéal pour les situations où la qualité du raisonnement importe plus que la rapidité.

D'après ce que je peux voir, xAI positionne Grok 3 comme un modèle de raisonnement et un modèle généraliste. Lorsque le mode Think est désactivé, il se comporte plus comme un GPT-4o ou un GPT-4o. Claude 3.5 Sonnet-rapide, conversationnel et optimisé pour une utilisation générale. Mais lorsque le mode réflexion est activé, il passe en mode raisonnement, décomposant les problèmes complexes étape par étape.

Cette approche hybride devient encore plus claire lorsque l'on regarde les benchmarks. xAI n'a pas seulement comparé Grok 3 à des modèles de raisonnement comme OpenAI's O1 ou DeepSeek R1 - il l'a également testé contre des modèles généralistes comme GPT-4o, DeepSeek-V3, et Claude 3.5 Sonnet. Cela suggère qu'ils veulent que le produit soit compétitif dans les deux catégories, plutôt que d'être limité à une seule d'entre elles.

 

Source : xAI

Grok 3 Big Brain Mode

Le mode Big Brain est le réglage haute performance de Grok 3, qui alloue des ressources de calcul supplémentaires pour traiter les tâches exigeantes.

Lorsqu'il est activé, Grok 3 prend plus de temps pour traiter les requêtes mais offre une plus grande précision, des informations plus approfondies et des réponses plus détaillées. Ce mode est particulièrement utile pour la recherche scientifique, les tâches d'IA à plusieurs niveaux et les scénarios de résolution de problèmes très complexes, où l'inférence standard peut ne pas suffire.

grok 3 mode grand cerveau

Grok 3 DeepSearch

DeepSearch est l'outil de recherche intégré à xAI, qui permet à Grok 3 de parcourir le web, de vérifier les sources et de synthétiser les informations en temps réel avant de générer une réponse.

Contrairement aux modèles d'IA standard qui s'appuient sur des données pré-entraînées, DeepSearch tire parti d'informations fraîches, ce qui le rend idéal pour les actualités, les tendances du marché, la recherche technique et la vérification des faits. Ce mode positionne Grok 3 comme un concurrent de Gemini's Deep Research et de Deep Research d'OpenAI.

Grok 3 DeepSearch

Source : xAI

Comment Grok 3 a-t-il été développé ?

Grok 3 repose sur des mises à jour majeures de l'infrastructure, de nouvelles techniques de formation et une augmentation massive de la puissance de calcul. Contrairement à ses prédécesseurs, qui ont été formés sur un matériel relativement limité, xAI a construit l'une des plus grandes grappes de formation à l'IA au monde pour soutenir le développement de Grok 3.

cluster gpu colossus pour grok 3

Source : xAI

Colossus : le superordinateur personnalisé de xAI

L'un des plus grands défis de la formation de modèles d'IA à grande échelle est la disponibilité des ordinateurs. Pour contourner ce problème, xAI a construit sa propre grappe de superordinateurs appelée Colossus (vous pouvez voir l'entrepôt sur l'image ci-dessus).

La première phase, achevée en 122 jours seulement, a permis de déployer 100 000 GPU H100, ce qui en fait l'une des plus grandes grappes d'entraînement à l'IA au monde.

Lors de la deuxième phase, xAI a doublé la capacité de calcul en 92 jours supplémentaires. Cette infrastructure permet une formation continue, ce qui signifie que Grok 3 continue de s'améliorer en temps réel au fur et à mesure que les utilisateurs interagissent avec lui.

De Grok 0 à Grok 3

Grok 1 a été publié en novembre 2023, et s'il avait de la personnalité, il était loin d'atteindre le niveau de GPT-4o ou de Claude 3.5 Sonnet. Grok 2 a suivi quelques mois plus tard, montrant des améliorations majeures, mais toujours à la traîne des meilleurs modèles.

progrès en matière de grok xai

Source : xAI

Grok 3, cependant, marque un saut beaucoup plus important. L'équipe affirme que Grok 3 est 10 à 15 fois plus puissant que Grok 2, grâce à l'amélioration des modèles et à une augmentation spectaculaire des calculs de formation.

Benchmarks Grok 3

xAI affirme que Grok 3 est l'un des modèles d'IA les plus puissants à ce jour, et les benchmarks de sa démo en direct suggèrent qu'il pourrait en fait rivaliser avec les meilleurs. Analysons les résultats en mathématiques, en sciences et en codage pour voir comment il se compare à GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro et DeepSeek-V3, ainsi qu'à d'autres modèles de raisonnement tels que O1 et DeepSeek-R1.

Performances par rapport aux modèles généralistes

La première série de tests compare Grok 3 et Grok 3 Mini à d'autres modèles à usage général.

Source : xAI

Grok 3 arrive largement en tête dans toutes les catégories, mais les mathématiques, les sciences et le codage ne représentent qu'une fraction des cas d'utilisation du modèle généraliste - les utilisateurs s'en servent également pour rédiger, analyser des rapports, fournir une assistance à la clientèle, etc.

Il serait intéressant de voir les performances de Grok 3 sur des critères de référence tels que MMLU (connaissances étendues sur 57 sujets), BBH (raisonnement complexe et résolution de problèmes abstraits) ou TruthfulQA (précision des réponses à des questions ambiguës ou controversées) afin d'obtenir une image plus complète de ses capacités dans le monde réel.

Performance par rapport aux modèles de raisonnement

Lorsque les capacités de raisonnement de Grok 3 sont pleinement utilisées, c'est-à-dire lorsque les modes Think et Big Brain sont activés, les performances du modèle augmentent considérablement. Cette deuxième série de tests compare Grok 3 Reasoning Beta et Grok 3 mini Reasoning à d'autres modèles de raisonnement avancés, notamment O1, DeepSeek-R1 et Gemini-2 Flash Thinking. Gemini-2 Flash Thinking.

Grok 3 : repères

Source : xAI

Les capacités de raisonnement de Grok 3 font grimper ses performances en mathématiques à 93-96, ce qui représente un bond considérable par rapport à son mode généraliste (52).

Les scores en sciences et en codage s'améliorent également de manière significative, dépassant o1, DeepSeek-R1 et Gemini-2 Flash Thinking.

Grok 3 mini Reasoning est aussi performant que Grok 3 complet dans les tâches de raisonnement (voire plus - je dois admettre que le graphique est un peu déroutant avec ces couches de couleur), ce qui signifie que même la variante la plus petite reste compétitive dans la résolution de problèmes complexes.

Comment accéder à Grok 3 ?

xAI déploie Grok 3 progressivement, avec une disponibilité plus large attendue dans les mois à venir. Nous pourrons utiliser Grok 3 dans une interface basée sur le chat et via l'API.

Interface basée sur le chat

Le modèle est actuellement intégré à X (anciennement Twitter) et disponible pour les abonnés Premium+. Les utilisateurs peuvent discuter avec lui directement au sein de la plateforme, à l'instar des versions précédentes de Grok. Vous trouverez le bouton Grok dans le menu de gauche :

grok sur X

Au-delà du X, le xAI est lancé grok.comune interface web autonome où les utilisateurs peuvent interagir avec le modèle en dehors de la plateforme de médias sociaux. L'accès à Grok via ce site web n'est pas encore disponible dans l'UE et au Royaume-Uni.

grok sur le site web de grok

Il existe également une application mobile dédiéemais elle n'est disponible que sur iOS.

Grok 3 API

Au moment de la publication de cet article, Grok 3 n'a pas encore été publié par l'intermédiaire de l'API, mais il devrait l'être bientôt. Gardez un œil sur la page des modèles pour les dernières mises à jour.

Conclusion

Grok 3 est sans conteste la version la plus ambitieuse de xAI à ce jour, mais j'attends de voir comment elle se comportera en dehors de ses propres démonstrations. Pour l'instant, il semble s'agir d'un modèle de raisonnement solide, qui rivalise avec OpenAI et DeepSeek dans la résolution de problèmes en plusieurs étapes.

L'approche hybride, qui permet de passer de réponses rapides et conversationnelles à un raisonnement plus approfondi avec le mode "Think", est logique sur le papier. Mais j'aimerais voir dans quelle mesure elle se généralise au-delà des mathématiques, du codage et des sciences, en particulier dans des tâches telles que la rédaction, la synthèse et la recherche dans le monde réel.

FAQ

Quels sont les développements futurs prévus pour Grok 3 ?

xAI a annoncé son intention d'introduire une fonction de synthèse vocale dans Grok 3, afin d'en améliorer l'interactivité. En outre, il est prévu d'ouvrir Grok-2 dans les mois à venir. Ces développements visent à étendre les capacités et l'accessibilité de Grok 3. 

Existe-t-il des restrictions géographiques pour accéder à Grok 3 ?

Actuellement, l'accès à Grok 3 via grok.com n'est pas disponible dans l'Union européenne et au Royaume-Uni. Les utilisateurs de ces régions peuvent être confrontés à des restrictions et doivent vérifier les mises à jour concernant la disponibilité.

Quelles sont les options d'abonnement pour accéder à Grok 3 ?

Grok 3 est disponible à différents niveaux d'abonnement. Sur la plateforme X (anciennement Twitter), elle est accessible aux abonnés Premium+. En outre, xAI propose une interface web autonome et une application mobile dédiée avec un niveau d'abonnement SuperGrok, qui offre des fonctionnalités avancées. Pour l'instant, il n'y a pas d'API publique disponible pour Grok 3. 

Grok 3 est-il capable de gérer des entrées multimodales ?

Oui, Grok 3 prend en charge les capacités multimodales, y compris la compréhension et la génération d'images.

Sujets

Apprenez l'IA avec ces cours !

cursus

AI Business Fundamentals

11hrs hr
Accelerate your AI journey, conquer ChatGPT, and develop a comprehensive Artificial Intelligence strategy.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Apparenté

blog

Les 32 meilleures questions d'entretien sur AWS et leurs réponses pour 2024

Un guide complet pour explorer les questions d'entretien AWS de base, intermédiaires et avancées, ainsi que des questions basées sur des situations réelles. Il couvre tous les domaines, garantissant ainsi une stratégie de préparation bien équilibrée.

Zoumana Keita

30 min

blog

Les 20 meilleures questions d'entretien pour les flocons de neige, à tous les niveaux

Vous êtes actuellement à la recherche d'un emploi qui utilise Snowflake ? Préparez-vous à répondre à ces 20 questions d'entretien sur le flocon de neige pour décrocher le poste !
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 min

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 min

blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates a offert plus de 20k bourses d'études à nos partenaires à but non lucratif au deuxième trimestre 2023. Découvrez comment des apprenants défavorisés et assidus ont transformé ces opportunités en réussites professionnelles qui ont changé leur vie.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Célébration de Saghar Hazinyar : Une boursière de DataCamp Donates et une diplômée de Code to Inspire

Découvrez le parcours inspirant de Saghar Hazinyar, diplômée de Code to Inspire, qui a surmonté les défis en Afghanistan et s'est épanouie grâce à une bourse de DataCamp Donates.
Fereshteh Forough's photo

Fereshteh Forough

4 min

blog

Nous avons fait don de bourses DataCamp Premium à un million de personnes, et ce n'est pas fini.

Réparties entre nos deux programmes d'impact social, DataCamp Classrooms et #DCDonates, les bourses offrent un accès illimité à tout ce que DataCamp Premium a à offrir.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

Voir plusVoir plus