Sakana Fugu vs. Claude Fable 5: benchmarkuri, prețuri și altele

Claude Fable 5 câștigă la benchmarkuri, dar este momentan suspendat. Sakana Fugu este disponibil acum și costă la jumătate.

Actualizat 25 iun. 2026 · 6 min. citire

Sakana promovează Fugu ca fiind la nivelul lui Fable 5, dar exclude Fable 5 din propriul tabel de benchmarkuri. Așa că vom compara cele două modele, cot la cot, atât cât permite situația.

Pe scurt, contextul e următorul. Guvernul SUA a suspendat accesul public la Claude Fable 5 la abia trei zile după ce Anthropic l-a lansat. Iar Fable 5 a fost prezentat ca fiind cel mai capabil model al său. Acum, două săptămâni mai târziu, Sakana AI din Tokyo a lansat Fugu cu niște afirmații îndrăznețe. Una dintre ele a circulat mult: Sakana AI spune că Fugu Ultra „stă umăr la umăr cu modele de top precum Fable 5 și Mythos Preview” pe cele mai dificile benchmarkuri din industrie pentru inginerie, știință și raționament, și fără niciun risc de control la export. CEO-ul David Ha a spus pe X că Fugu dovedește că un bazin interschimbabil de agenți orchestrați poate egala modelele de frontieră restricționate precum Fable.

Afirmațiile sunt ceva mai greu de verificat pentru că Fable 5 nu apare deloc în tabelul de benchmarkuri al lui Fugu. Sakana îl exclude pe motiv că nu este accesibil public. Facem ce putem: verificăm puținele benchmarkuri care apar în tabelele publicate de ambele laboratoare, cu aceleași repere. Iar la final vom discuta despre prețuri și situația accesului

Dacă vrei context despre fiecare sistem în parte, avem articole dedicate: citește analiza noastră despre Claude Fable 5 și prezentarea Sakana Fugu.

Ce este Sakana Fugu?

Sakana Fugu nu este un singur model antrenat în sensul obișnuit. Este un orchestrator: un model care primește cererea ta, decide dacă răspunde direct sau deleagă către modele specializate dintr-un bazin, gestionează verificarea și sinteza și returnează un singur răspuns printr-un API compatibil cu OpenAI. Din exterior, apelezi un singur endpoint; în interior, un set coordonat de modele de frontieră face treaba.

Există în două variante. Fugu echilibrează calitatea cu latența mică și este poziționat ca implicitul de zi cu zi pentru programare, revizuire și servicii interactive. Fugu Ultra coordonează un bazin mai profund de agenți experți și este reglat pentru calitatea maximă a răspunsurilor la probleme dificile, în mai mulți pași — reproducerea de articole, analiză de securitate cibernetică, data science în stil Kaggle, investigații de brevete.

Ideea e, de fapt, dublă.

Mai întâi, o orchestrare învățată: coordonatorul este antrenat să decidă când să delege și cum să combine ieșirile, în loc să ruleze un pipeline scris manual.
Apoi, un bazin de agenți interșanjabili: când un nou model de frontieră devine public, Sakana se așteaptă să petreacă aproximativ două săptămâni pentru a-l integra. (Important pentru restul articolului: Fable 5 nu se află în acel bazin pentru că nu este accesibil public.

Ce este Claude Fable 5?

Claude Fable 5 este un model din clasa Mythos, un nivel pe care Anthropic îl poziționează deasupra clasei Opus, făcut sigur pentru uz general printr-un set de clasificatoare. Este același model de bază ca Claude Mythos 5; diferența este că Fable 5 rulează (rula) cu clasificatoarele de siguranță active, în timp ce Mythos 5 are unele ridicate și este restricționat pentru partenerii Project Glasswing și anumiți cercetători în biologie.

Anthropic a susținut că Fable 5 este stare‑de‑artă pe aproape fiecare benchmark urmărit de Anthropic, cu un avans crescând pe sarcini mai lungi și mai complexe. Detaliul practic esențial: când o interogare atinge securitatea cibernetică, biologia/chimia sau distilarea de modele, un clasificator în două etape redirecționează răspunsul către Claude Opus 4.8 și îi spune utilizatorului că a făcut acest lucru.

Sakana Fugu vs. Claude Fable 5: benchmarkuri

Tabelul comparativ publicat de Sakana îl exclude pe Fable 5 și pe Mythos Preview, pe motiv că nu sunt accesibile public și deci nu pot fi în bazinul lui Fugu. Așadar, cifrele oficiale pentru Fugu sunt măsurate față de Opus 4.8, GPT-5.5 și Gemini 3.1 Pro, toate vizibile în tabelul de mai jos. Vezi că iese învingător pe 10 din 11 benchmarkuri.

Benchmark	Fugu	Fugu Ultra	Opus 4.8 †	Gemini 3.1 Pro †	GPT-5.5 †
SWE-Bench Pro *	59.0	73.7	69.2	54.2	58.6
TerminalBench 2.1	80.2	82.1	74.6	70.3	78.2
LiveCodeBench	92.9	93.2	87.8	88.5	85.3
LiveCodeBench Pro	87.8	90.8	84.8	82.9	88.4
Humanity's Last Exam	47.2	50.0	49.8	44.4	41.4
CharXiv Reasoning	85.1	86.6	84.2	83.3	84.1
GPQA-D	95.5	95.5	92.0	94.3	93.6
SciCode	60.1	58.7	53.5	58.9	56.1
τ³ Banking	21.7	20.6	20.6	8.4	20.6
Long Context Reasoning	74.7	73.3	67.7	72.7	74.3
MRCRv2	86.6	93.6	87.9	84.9	94.8

* scaffolding mini-swe-agent. † repere raportate de furnizori. Toate scorurile Fugu sunt raportate de Sakana și nu au fost încă reproduse independent.

Pentru a include Fable 5 în discuție, am corelat benchmarkurile care apar atât în tabelele Anthropic, cât și în cele ale Sakana, și am verificat că reperele comune se aliniază. Pe SWE-Bench Pro și Humanity's Last Exam (fără unelte), cifrele pentru Opus 4.8, GPT-5.5 și Gemini 3.1 Pro sunt identice în ambele surse — deci acele două comparații sunt curate. Restrâns la cele două sisteme, duelul arată așa:

Benchmark	Sakana Fugu	Sakana Fugu Ultra	Claude Fable 5	Lider
SWE-Bench Pro	59.0	73.7	80.3	Fable 5 (+6,6)
Humanity's Last Exam (fără unelte)	47.2	50.0	59.0	Fable 5 (+9,0)
Terminal-Bench 2.1 ‡	80.2	82.1	88.0	Fable 5 (+5,9)

‡ Cele două laboratoare raportează repere diferite și folosesc scaffolding diferit pentru TerminalBench, deci condițiile nu sunt identice.

Aceste trei sunt singurele benchmarkuri care apar în tabelele publicate de ambele laboratoare cu repere potrivite, motiv pentru care restul comparației rămâne calitativ. Fable 5 conduce toate trei.

Așadar, pe fiecare benchmark unde o comparație directă este posibilă, Fable 5 iese înaintea lui Fugu Ultra cu aproximativ 6–9 puncte. Asta se potrivește cu punctele forte ale lui Fable 5: sarcini de lungă durată, evaluate la final, unde un singur model mai puternic acumulează mai puține erori compuse.

Pe scurt:

Toate cifrele Fugu sunt auto-raportate și nu au apărut încă pe leaderboarduri terțe.
Sakana caracterizează Fugu ca fiind „umăr la umăr” cu Fable 5 și Mythos Preview. Având în vedere diferențele de mai sus, este o interpretare defensabilă, dar generoasă. „Aproape, dar în urmă” e mai exact.
Seturile de comparație se suprapun doar parțial. Fable 5 conduce la viziune (poate reconstrui sursa unei aplicații web din capturi de ecran), lucru pe care Fugu nu îl pune deloc în prim-plan; Fugu publică benchmarkuri de context lung și banking pe care tabelul Anthropic nu le acoperă. Sunt, deci, optimizate pentru forme de lucru oarecum diferite.

Sakana Fugu vs. Claude Fable 5: disponibilitate și acces

Claude Fable 5 este momentan suspendat. Anthropic a retras accesul la Fable 5 și Mythos 5 pe 12 iunie în urma unei directive guvernamentale SUA privind controlul exporturilor și spune că lucrează pentru a restabili accesul cât mai repede. Celelalte modele Anthropic, precum Opus 4.8, sunt în continuare disponibile.

Sakana Fugu este disponibil acum prin console.sakana.ai cu un API compatibil OpenAI — cu excepția UE și SEE, unde Sakana a pus pauză disponibilității în timp ce lucrează la conformitatea GDPR. Nu am putut obține un calendar exact pentru asta.

În acest moment, o echipă europeană s-ar putea să nu poată folosi niciunul dintre modele.

Gânduri finale

Pe hârtie, avem un duel strâns și autentic între două filozofii.

Anthropic se gândește la scară — un model din clasa Mythos atât de capabil încât are nevoie de un sistem paralel de clasificatoare.

Sakana pariază pe coordonare — că un orchestrator antrenat peste un bazin interschimbabil poate rămâne la mică distanță de orice model de frontieră individual, fiind în același timp mai ieftin, mai rezilient și agnostic față de furnizor.

Benchmarkurile, luate ca atare, spun că pariul Anthropic produce artefactul mai puternic la testele comparabile, în timp ce pariul Sakana produce unul mai disponibil și mai ieftin.

Este Sakana Fugu mai bun decât Claude Fable 5?

De ce nu este Fable 5 în tabelul de benchmarkuri al lui Fugu?

Care este mai ieftin?

Va reveni Fable 5?

Chiar ocolește Fugu suspendarea lui Fable 5?

Subiecte

Inteligență artificială

Învață AI cu DataCamp

track

AI pentru ingineria software

7 oră

Scrie cod și construiește aplicații software mai rapid ca niciodată cu cele mai noi instrumente AI pentru dezvoltatori, inclusiv GitHub Copilot, Windsurf și Replit.

Vezi detalii

Începeți cursul

course

Software Development with Claude Code

4 oră

4.2K

Claude Code brings AI assistance to your terminal. Learn the workflows that turn it into a reliable tool for real software development.

Vezi detalii

Începeți cursul

course

Introduction to Agent Skills

2 oră 30 min

1.4K

Learn how to build, configure, and share Skills in Claude Code — reusable markdown instructions that Claude automatically applies to tasks at the right time.

Vezi detalii

Începeți cursul

Vezi mai mult

Ce este Sakana Fugu?

Ce este Claude Fable 5?

Sakana Fugu vs. Claude Fable 5: benchmarkuri

Sakana Fugu vs. Claude Fable 5: disponibilitate și acces

Gânduri finale

Întrebări frecvente despre Sakana Fugu vs. Claude Fable

Care este mai ieftin?

Va reveni Fable 5?

Chiar ocolește Fugu suspendarea lui Fable 5?

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}AI pentru ingineria software

Software Development with Claude Code

Introduction to Agent Skills

AI pentru ingineria software