Cours
Si vous hésitez entre Claude Fable 5 (précision utile : il est sorti il y a deux jours) et Gemini 3.5 Flash, vous choisissez en réalité entre deux visions de ce que doit être un modèle de pointe.
Claude Fable 5 représente le plafond de capacités d’Anthropic : le modèle public le plus performant sur la plupart des benchmarks, avec des tarifs en conséquence (10 $/50 $ par million de tokens), et un système de classification qui peut rediriger en cours de session les requêtes sensibles vers un autre modèle.
Gemini 3.5 Flash est le pari de Google sur le juste équilibre vitesse/coût/intelligence : un modèle de la gamme « Flash » qui surpasse le plus grand Gemini 3.1 Pro de Google sur les benchmarks de code et d’agents. Il tourne environ 4× plus vite que des modèles de pointe comparables et coûte 1,50 $/9 $ par million de tokens — nettement moins cher, donc.
Dans cet article, je compare les deux modèles selon cinq dimensions :
- performances en codage et sur les tâches agentiques
- vitesse et latence
- travail en long contexte
- tarification
Si vous comparez plutôt Fable 5 au modèle phare d’OpenAI, nous avons un article dédié : Claude Fable 5 vs GPT-5.5.
Nous tenons nos lecteurs informés de l’actualité de l’IA avec The Median, notre newsletter gratuite du vendredi qui décrypte les infos clés de la semaine. Cliquez sur le lien ci-dessus pour vous abonner et rester affûté en quelques minutes par semaine.
Qu’est-ce que Claude Fable 5 ?
Claude Fable 5 est le premier modèle de classe Mythos d’Anthropic disponible pour un usage général. Fable 5 partage son modèle sous-jacent avec Claude Mythos 5, mais est livré avec des classifieurs de sécurité actifs : une sonde surveille les activations internes sur tout le trafic et les requêtes signalées sont transmises à un classifieur LLM entraîné. Les requêtes bloquées sont redirigées vers Claude Opus 4.8.
Fable 5 est à l’état de l’art sur quasiment tous les benchmarks testés, et il est réellement excellent en ingénierie logicielle, travail de connaissance, vision et tâches agentiques de longue haleine. Mieux encore, plus la tâche est longue et complexe, plus son avance sur les précédents modèles Claude se creuse.
Qu’est-ce que Gemini 3.5 Flash ?
Gemini 3.5 Flash est la version de mai de Google DeepMind, annoncée lors de Google I/O 2026 comme le premier modèle de la nouvelle famille Gemini 3.5. Malgré l’appellation « Flash », ce n’est pas un modèle « low-cost » au sens traditionnel : il surpasse le plus grand Gemini 3.1 Pro de Google sur les suites de codage et d’agents, tout en tournant environ 4× plus vite que des modèles de pointe comparables.
Gemini 3.5 Flash est un modèle de raisonnement avec des paramètres d’effort de réflexion configurables (minimal, low, medium, high). (Par défaut, il est en medium.) Le modèle prend en charge une fenêtre de contexte d’1 million de tokens, l’entrée multimodale (texte, image, audio, vidéo, PDF) et génère à environ 280+ tokens par seconde. Google en a fait le modèle par défaut de l’app Gemini et du mode IA dans Search dès son lancement. Nous nous attendons à voir Gemini 3.5 Pro arriver d’un jour à l’autre.
Un point à noter : 3.5 Flash coûte environ 3× le prix par token de son prédécesseur, Gemini 3 Flash (0,50 $/3,00 $). Il est donc bon marché par rapport aux modèles phares, pas par rapport à sa propre lignée. Et comme les tokens de « réflexion » sont facturés au tarif de sortie, les charges à fort raisonnement avec un effort élevé peuvent coûter plus que ce que le prix affiché laisse penser. À garder en tête.
Claude Fable 5 vs Gemini 3.5 Flash : comparaison directe
Voici un résumé avant d’entrer dans le détail. J’ai préparé deux tableaux : l’un pour les résultats de benchmarks, l’autre pour des considérations pratiques sur les prix, la vitesse et l’accès.
Résultats des benchmarks
| Benchmark | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| SWE-Bench Pro | 80,3 % | 55,1 % (Public) |
| Terminal-Bench 2.1 | 88,0 %* | 76,2 % |
| Humanity's Last Exam (avec outils) | 64,5 % | À la traîne de Gemini 3.1 Pro (non directement comparable) |
| OSWorld-Verified | 85,0 % | Non publié |
| MCP Atlas (coordination multi-outils) | Non publié | 83,6 % |
Comme vous le voyez, Claude Fable 5 l’emporte sur tous les benchmarks en confrontation directe lorsque des données comparables sont disponibles.
Tarifs, vitesse et accès
Je l’ai déjà mentionné : la tarification est clairement plus avantageuse (nettement) pour Gemini 3.5 Flash.
| Fonctionnalité | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| Tarif API en entrée (pour 1 M de tokens) | 10 $ | 1,50 $ |
| Tarif API en sortie (pour 1 M de tokens) | 50 $ | 9,00 $ |
| Tarif des entrées mises en cache | — | 0,15 $ par 1 M (remise de 90 %) |
| Vitesse de génération | Latence standard des modèles de pointe | ~280+ tokens/s, ~4× plus rapide que des pairs de pointe |
| Fenêtre de contexte | Tâches agentiques longues sur plusieurs millions de tokens revendiquées ; aucun MRCR publié au-delà de 512 K | 1 M de tokens (limite d’entrée 1 048 576) |
| Disponibilité générale | Limitée (crédits d’usage requis après le 22 juin) | Oui (appli Gemini, AI Studio, Antigravity, API, mode IA dans Search) |
Performances en codage et tâches agentiques
Les performances en codage et sur le travail agentique méritent un focus à part, car c’est là que l’écart de capacités est le plus marqué.
Sur SWE-Bench Pro, comme dans le premier tableau, Fable 5 obtient 80,3 % contre 55,1 % pour Gemini 3.5 Flash sur l’ensemble public. Un écart de 25 points. Pour de l’ingénierie au niveau dépôt sur des bases de code complexes, c’est une vraie différence. Concrètement, Fable 5 peut probablement résoudre de manière autonome la plupart des issues GitHub réelles, ce qui est moins certain pour Gemini 3.5 Flash.
Là où Gemini 3.5 Flash reprend la main, c’est sur le débit agentique plutôt que sur la profondeur. Flash est explicitement optimisé pour les boucles d’exécution parallèles, le déploiement de sous-agents et l’itération rapide. Son 83,6 % sur MCP Atlas — un benchmark de coordination multi-outils où il dépasse les 75,3 % de GPT-5.5 — laisse penser à un modèle conçu pour orchestrer de nombreux appels d’outils rapides plutôt que pour soutenir une longue chaîne de raisonnement profonde. Google signale aussi des gains substantiels d’efficacité en tokens dans des scénarios agentiques réels par rapport aux versions Flash précédentes.
La bonne lecture est la suivante : si votre agent doit réfléchir intensément sur un petit nombre d’étapes difficiles (refactorings complexes, changements d’architecture, débogage ardu), Fable 5 gagne. Si votre agent doit exécuter en parallèle de nombreuses étapes rapides et d’une difficulté modérée (pipelines d’extraction et de synthèse, orchestration multi-outils, tri à haut volume), le profil vitesse/coût de Flash est très pertinent.
Vitesse et latence
Gemini 3.5 Flash génère environ 280+ tokens par seconde — plusieurs fois plus vite que les modèles phares de pointe classiques.
Fable 5, de son côté, n’est pas positionné comme un modèle rapide. C’est le modèle à utiliser quand la tâche est assez difficile pour que vous acceptiez d’attendre la réponse.
Performances en long contexte
Gemini 3.5 Flash prend en charge une entrée d’environ 1 million de tokens, et la gamme Gemini a historiquement été solide en récupération sur long contexte. Cependant, Flash serait derrière Gemini 3.1 Pro de Google sur MRCR v2.
Anthropic affirme que Fable 5 reste concentré sur des millions de tokens dans des tâches longues et améliore ses sorties grâce à ses propres notes. Mais Anthropic n’a pas publié de scores de type MRCR sur la plage 512 K–1 M, donc la comparaison « à produits égaux » n’est pas possible.
Pour l’analyse de documents à un million de tokens, aucun des deux modèles n’a ici d’avantage publié décisif. Si la fiabilité en très long contexte est votre critère n° 1, les 74,0 % publiés par GPT-5.5 sur MRCR v2 à 512 K–1 M retiennent notre attention.
Tarification et disponibilité
Il y a un écart de prix. Fable 5 coûte 10 $ par million de tokens en entrée et 50 $ en sortie. Gemini 3.5 Flash coûte respectivement 1,50 $ et 9,00 $, avec en plus des entrées mises en cache à 0,15 $ par million (soit 90 % de remise). Gemini 3.5 Flash est environ six à sept fois moins cher en entrée et cinq à six fois moins cher en sortie.
Mais les tarifs ne disent jamais toute l’histoire : sachez d’abord que Flash est un modèle de raisonnement dont les tokens de réflexion sont facturés au tarif sortie, de sorte que des charges de travail à fort raisonnement peuvent consommer nettement plus de tokens de sortie que ce que le prompt laisse croire. Évaluez votre propre charge avant de présumer que Flash sera économique pour votre cas d’usage. Par ailleurs, lorsque les classifieurs de Fable 5 redirigent une requête, la facturation se fait aux tarifs d’Opus 4.8 (5 $/25 $), pas à ceux de Fable 5. C’est sans doute un facteur mineur côté coût, mais à noter.
Côté disponibilité, l’asymétrie est nette. Gemini 3.5 Flash a été disponible dès le premier jour dans l’app Gemini, Google AI Studio, Antigravity, l’API Gemini et le mode IA de Search. L’accès par abonnement à Fable 5 a une limite : les abonnés Pro, Max, Team et Enterprise n’avaient un accès gratuit que jusqu’au 22 juin 2026, date qui approche vite, après quoi des crédits d’usage seront requis en plus de l’abonnement existant.
Quand choisir Claude Fable 5 vs Gemini 3.5 Flash
La décision repose sur deux variables :
- vos tâches exigent-elles le plafond de Fable 5 ?
- la vitesse et le coût par appel dominent-ils votre modèle économique ?
| Cas d’usage | Recommandé | Pourquoi |
|---|---|---|
| Ingénierie logicielle au niveau dépôt sur des bases de code complexes | Claude Fable 5 | 80,3 % vs 55,1 % sur SWE-Bench Pro : 25 points d’écart qui reflètent de vraies différences de capacité |
| Pipelines agentiques à grand volume et sensibles à la latence | Gemini 3.5 Flash | ~280+ tok/s en sortie, exécution parallèle de sous-agents et coûts en tokens 5–7× plus bas se cumulent sur des milliers d’appels |
| Produits grand public interactifs et UX de chat | Gemini 3.5 Flash | Un avantage de vitesse de 4× est un atout produit ; la latence et les tarifs de Fable 5 ne conviennent pas aux usages grand public à haute fréquence |
| Finance complexe et travail de connaissance | Claude Fable 5 | En tête sur le Finance Benchmark d’Hebbia et Humanity’s Last Exam avec outils (64,5 %) |
| Orchestration multi-outils à travers de nombreux services | Gemini 3.5 Flash | 83,6 % sur MCP Atlas : le meilleur score publié en coordination multi-outils parmi les modèles de pointe |
| Pipelines multimodaux (vidéo, audio, PDF en entrée) | Gemini 3.5 Flash | Entrée multimodale native sur texte, image, audio, vidéo et PDF |
| Secteurs réglementés exigeant zéro rétention de données | Gemini 3.5 Flash | La rétention obligatoire de 30 jours de Fable 5 est un blocage pour certaines entreprises |
Choisissez Claude Fable 5 si…
- Votre cas d’usage principal est l’ingénierie logicielle au niveau dépôt
- Vous avez besoin du plafond de capacités le plus élevé sur des travaux analytiques complexes — finance, raisonnement pluridisciplinaire, tâches agentiques de longue haleine — et la latence est secondaire.
- Votre travail n’est pas adjacent à la cybersécurité, à la biologie ou à la chimie, donc les redirections par classifieur sont peu probables.
Choisissez Gemini 3.5 Flash si…
- Votre économie est tirée par le volume : des milliers d’appels par jour où l’écart de coût se cumule en ordres de grandeur de dépenses.
- La vitesse est une exigence produit — UX interactive, agents temps réel, ou pipelines où le temps total sur de nombreux appels d’outils compte plus que la profondeur par étape.
- Vous avez besoin d’une entrée multimodale étendue (vidéo, audio, PDF) dans un seul modèle.
- La politique de données de votre entreprise ne peut pas accepter la rétention obligatoire de 30 jours de Fable 5, ou vous avez besoin d’un modèle qui ne change pas silencieusement en cours de pipeline.
Dernières réflexions
Ce n’est pas une comparaison strictement équivalente. Fable 5 et Gemini 3.5 Flash occupent des positions différentes sur le marché : l’un est le plafond de capacités avec un peu de friction, l’autre est la frontière d’efficacité avec un plafond plus bas.
Si votre seul critère est la performance brute sur des tâches difficiles, Fable 5 l’emporte nettement. Mais la proposition de valeur de Flash n’est pas « presque aussi bon pour moins cher ». Il ne faut pas le sous-estimer : c’est une intelligence proche de l’état de l’art, délivrée assez vite et assez peu cher pour des usages où Fable 5 n’était jamais économiquement viable.

Je suis rédacteur et éditeur dans le domaine de la science des données. Je suis particulièrement intéressé par l'algèbre linéaire, les statistiques, R, etc. Je joue également beaucoup aux échecs !


