Accéder au contenu principal

Sakana Fugu vs Claude Fable 5 : benchmarks, prix et plus encore

Claude Fable 5 domine les benchmarks mais est actuellement suspendu. Sakana Fugu est disponible dès maintenant et coûte deux fois moins cher.
Actualisé 25 juin 2026  · 6 min lire

Sakana présente Fugu comme l’égal de Fable 5, mais exclut Fable 5 de son propre tableau de benchmarks. Nous allons donc comparer les deux modèles en vis-à-vis autant que possible.

\n

Voici le contexte. Le gouvernement américain a suspendu l’accès public à Claude Fable 5 à peine trois jours après son lancement par Anthropic. Or Fable 5 était présenté comme son modèle le plus performant. Deux semaines plus tard, Sakana AI (Tokyo) lance Fugu avec de grandes ambitions. L’une d’elles a particulièrement circulé : Sakana AI affirme que Fugu Ultra \"se hisse au niveau des modèles leaders comme Fable 5 et Mythos Preview\" sur les benchmarks les plus exigeants en ingénierie, sciences et raisonnement, sans le risque lié aux contrôles à l’exportation. Sur X, le CEO David Ha a déclaré que Fugu prouve qu’un pool échangeable d’agents orchestrés peut rivaliser avec des modèles de pointe restreints comme Fable.

\n

Ces affirmations sont délicates à vérifier car Fable 5 n’apparaît tout simplement pas dans la table de benchmarks de Fugu. Sakana l’exclut au motif qu’il n’est pas accessible publiquement. Nous faisons le maximum : nous vérifions la poignée de benchmarks présents à la fois dans les tableaux publiés par les deux laboratoires avec des lignes de base identiques. Enfin, nous aborderons les prix et la question de l’accès.

\n

Si vous voulez un aperçu séparé des deux systèmes, nous avons des articles dédiés : consultez notre analyse de Claude Fable 5 et notre présentation de Sakana Fugu.

\n

Qu’est-ce que Sakana Fugu ?

\n

Sakana Fugu n’est pas un modèle unique entraîné au sens classique. C’est un orchestrateur : un modèle qui reçoit votre requête, décide de répondre directement ou de déléguer à des modèles spécialistes au sein d’un pool, gère la vérification et la synthèse, puis renvoie une réponse via une API compatible OpenAI. De l’extérieur, vous appelez un seul endpoint ; à l’intérieur, un ensemble coordonné de modèles de pointe effectue le travail.

\n

Deux variantes sont proposées. Fugu équilibre qualité et faible latence et se positionne comme le choix quotidien pour le code, la relecture et les services interactifs. Fugu Ultra coordonne un pool plus profond d’agents experts et est optimisé pour la qualité maximale de réponse sur des problèmes difficiles et multi-étapes — reproduction d’articles, analyse cybersécurité, data science type Kaggle, recherches de brevets.

\n

L’idée tient en réalité en deux points.

\n
    \n
  • Premier point : une orchestration apprise — le coordinateur est entraîné à décider quand déléguer et comment combiner les sorties, plutôt que d’exécuter un pipeline codé à la main.
  • \n
  • Deuxième point : un pool d’agents échangeable — lorsqu’un nouveau modèle de pointe devient publiquement disponible, Sakana estime pouvoir l’intégrer en environ deux semaines. (Important pour la suite : Fable 5 ne fait pas partie de ce pool car il n’est pas accessible publiquement.)
  • \n
\n

Qu’est-ce que Claude Fable 5 ?

\n

Claude Fable 5 est un modèle de classe Mythos, un niveau qu’Anthropic positionne au-dessus de sa classe Opus, rendu sûr pour un usage général via un ensemble de classifieurs. C’est le même modèle sous-jacent que Claude Mythos 5 ; la différence, c’est que Fable 5 fonctionne (fonctionnait) avec des classifieurs de sécurité actifs, tandis que Mythos 5 en lève certains et est réservé aux partenaires Project Glasswing et à des chercheurs sélectionnés en biologie.

\n

Anthropic affirme que Fable 5 était à l’état de l’art sur quasiment tous les benchmarks qu’il suit, avec un avantage croissant sur les tâches longues et complexes. Le point pratique clé : lorsqu’une requête touche à la cybersécurité, à la biologie/chimie ou à la distillation de modèles, un classifieur en deux étapes redirige la réponse vers Claude Opus 4.8 et en informe l’utilisateur. 

\n

Sakana Fugu vs Claude Fable 5 : benchmarks

\n

Le tableau comparatif publié par Sakana exclut Fable 5 et Mythos Preview, au motif qu’ils ne sont pas accessibles publiquement et ne peuvent donc pas figurer dans le pool de Fugu. Les chiffres officiels de Fugu sont donc mesurés face à Opus 4.8, GPT-5.5 et Gemini 3.1 Pro, comme dans le tableau ci-dessous. Fugu l’emporte sur 10 benchmarks sur 11. 

\n
\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n
BenchmarkFuguFugu UltraOpus 4.8 †Gemini 3.1 Pro †GPT-5.5 †
SWE-Bench Pro *59.073.769.254.258.6
TerminalBench 2.180.282.174.670.378.2
LiveCodeBench92.993.287.888.585.3
LiveCodeBench Pro87.890.884.882.988.4
Humanity's Last Exam47.250.049.844.441.4
CharXiv Reasoning85.186.684.283.384.1
GPQA-D95.595.592.094.393.6
SciCode60.158.753.558.956.1
τ³ Banking21.720.620.68.420.6
Long Context Reasoning74.773.367.772.774.3
MRCRv286.693.687.984.994.8
\n

* mini-swe-agent scaffolding. † lignes de base déclarées par les fournisseurs. Tous les scores Fugu sont rapportés par Sakana et n’ont pas encore été reproduits de manière indépendante.

\n
\n

Pour intégrer Fable 5 à la comparaison, j’ai croisé les benchmarks présents à la fois dans les tableaux d’Anthropic et de Sakana et vérifié l’alignement des lignes de base. Sur SWE-Bench Pro et Humanity’s Last Exam (sans outils), les chiffres d’Opus 4.8, GPT-5.5 et Gemini 3.1 Pro sont identiques entre les deux sources — ces deux comparaisons sont donc nettes. Réduit aux deux systèmes, le face-à-face ressemble à ceci :

\n
\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n
BenchmarkSakana FuguSakana Fugu UltraClaude Fable 5Leader
SWE-Bench Pro59.073.780.3Fable 5 (+6.6)
Humanity's Last Exam (sans outils)47.250.059.0Fable 5 (+9.0)
Terminal-Bench 2.1 ‡80.282.188.0Fable 5 (+5.9)
\n
\n

‡ Les deux laboratoires rapportent des lignes de base différentes et utilisent des échafaudages distincts pour TerminalBench ; les conditions ne sont donc pas identiques.

\n

Ce sont les trois seuls benchmarks présents dans les deux tableaux avec des lignes de base correspondantes, d’où une comparaison qualitative pour le reste. Fable 5 mène sur les trois.

\n

Ainsi, sur chaque benchmark où une comparaison directe est possible, Fable 5 devance Fugu Ultra d’environ 6 à 9 points. Cela correspond à son terrain de jeu : des tâches longues évaluées a posteriori, où un modèle plus robuste accumule moins d’erreurs composées.

\n

En résumé :

\n
    \n
  1. Tous les chiffres de Fugu sont auto-déclarés et n’apparaissent pas encore sur des classements tiers.
  2. \n
  3. Sakana présente Fugu comme \"au coude-à-coude\" avec Fable 5 et Mythos Preview. Au vu des écarts ci-dessus, c’est défendable mais généreux. \"Proche, mais derrière\" est plus exact.
  4. \n
  5. Les jeux de comparaison ne se recoupent que partiellement. Fable 5 mène sur la vision (il peut reconstruire le code source d’une application web à partir de captures d’écran), un point que Fugu ne met pas en avant ; Fugu publie des benchmarks de long contexte et bancaires qu’Anthropic ne couvre pas. Ils sont donc optimisés pour des types de travaux un peu différents.
  6. \n
\n

Sakana Fugu vs Claude Fable 5 : disponibilité et accès

\n

Claude Fable 5 est actuellement suspendu. Anthropic a coupé l’accès à Fable 5 et Mythos 5 le 12 juin suite à une directive américaine sur les contrôles à l’exportation, et indique travailler à un rétablissement rapide. Les autres modèles d’Anthropic, comme Opus 4.8, restent disponibles.

\n

Sakana Fugu est disponible dès maintenant via console.sakana.ai avec une API compatible OpenAI — sauf dans l’UE et l’EEE, où Sakana a suspendu la disponibilité le temps de se mettre en conformité avec le RGPD. Aucun calendrier précis n’a pu être communiqué.

\n

À l’instant, une équipe européenne pourrait ne pouvoir utiliser ni l’un ni l’autre modèle.

\n

Dernières réflexions

\n

Sur le papier, c’est un vrai duel serré entre deux philosophies.

\n

Anthropic parie sur l’échelle — un modèle de classe Mythos si performant qu’il nécessite un système de classifieurs parallèle.

\n

Sakana mise sur la coordination — l’idée qu’un orchestrateur entraîné au-dessus d’un pool échangeable peut rester au contact de n’importe quel modèle de pointe unique tout en étant moins cher, plus résilient et indépendant des fournisseurs.

\n

Pris au pied de la lettre, les benchmarks indiquent que le pari d’Anthropic produit l’artefact le plus robuste sur les tests comparables, tandis que celui de Sakana produit l’option la plus disponible et la moins coûteuse.


Josef Waples's photo
Author
Josef Waples

Je suis rédacteur et éditeur dans le domaine de la science des données. Je suis particulièrement intéressé par l'algèbre linéaire, les statistiques, R, etc. Je joue également beaucoup aux échecs ! 

Sakana Fugu vs Claude Fable : FAQ

Sakana Fugu est-il meilleur que Claude Fable 5 ?

Sur les benchmarks où une comparaison directe est possible (SWE-Bench Pro, Humanity’s Last Exam, Terminal-Bench), Fable 5 devance Fugu Ultra d’environ 6 à 9 points. 

Pourquoi Fable 5 n’apparaît-il pas dans le tableau de benchmarks de Fugu ?

Sakana exclut Fable 5 et Mythos Preview car ils ne sont pas accessibles publiquement et ne peuvent donc pas faire partie du pool d’agents de Fugu. Sa comparaison officielle porte sur Opus 4.8, GPT-5.5 et Gemini 3.1 Pro, que Fugu Ultra bat sur 10 benchmarks sur 11.

Lequel est le moins cher ?

Fugu Ultra, à 5 $/M en entrée et 30 $/M en sortie, coûte environ moitié moins que Fable 5 (10 $/M en entrée et 50 $/M en sortie). Les deux proposent des abonnements mensuels à 20/100/200 $.

Fable 5 reviendra-t-il ?

Anthropic indique travailler à rétablir l’accès à Fable 5 et Mythos 5 au plus vite, sans calendrier publié. Ses autres modèles, dont Opus 4.8, restent disponibles entre-temps.

Fugu contourne-t-il réellement la suspension de Fable 5 ?

Pas directement — Fable 5 n’a jamais fait partie du pool de Fugu, donc Fugu ne peut pas reproduire ses capacités spécifiques.

Sujets

Apprenez l’IA avec DataCamp

Cursus

L'intelligence artificielle au service du génie logiciel

Écrivez du code et développez des applications logicielles plus rapidement que jamais grâce aux derniers outils de développement IA, notamment GitHub Copilot, Windsurf et Replit.
Afficher les détailsRight Arrow
Commencer le cours

Cours

Software Development with Claude Code

4 h
4.2K
Claude Code brings AI assistance to your terminal. Learn the workflows that turn it into a reliable tool for real software development.
Voir plusRight Arrow
Contenus associés

blog

Célébration de Saghar Hazinyar : Une boursière de DataCamp Donates et une diplômée de Code to Inspire

Découvrez le parcours inspirant de Saghar Hazinyar, diplômée de Code to Inspire, qui a surmonté les défis en Afghanistan et s'est épanouie grâce à une bourse de DataCamp Donates.
Fereshteh Forough's photo

Fereshteh Forough

4 min

blog

ROI de l'IA en 2026 : pourquoi les compétences des équipes déterminent le retour sur investissement

Seuls 21 % des dirigeants font état d'un retour sur investissement « significatif » de leurs investissements dans l'IA.
Lynn Heidmann's photo

Lynn Heidmann

blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates a offert plus de 20k bourses d'études à nos partenaires à but non lucratif au deuxième trimestre 2023. Découvrez comment des apprenants défavorisés et assidus ont transformé ces opportunités en réussites professionnelles qui ont changé leur vie.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 min

blog

Comprendre les TPU et les GPU dans l'IA : Un guide complet

L'essor du développement de l'intelligence artificielle (IA) a entraîné une augmentation notable de la demande en matière de calcul, d'où la nécessité de disposer de solutions matérielles robustes. Les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) sont devenues des technologies essentielles pour répondre à ces demandes.
Kurtis Pykes 's photo

Kurtis Pykes

9 min

cursor ai code editor

Tutoriel

Cursor AI : Un guide avec 10 exemples pratiques

Apprenez à installer Cursor AI sur Windows, macOS et Linux, et découvrez comment l'utiliser à travers 10 cas d'utilisation différents.
Voir plusVoir plus