Sariți la conținutul principal

Sakana Fugu vs. Claude Fable 5: benchmarkuri, prețuri și altele

Claude Fable 5 câștigă la benchmarkuri, dar este momentan suspendat. Sakana Fugu este disponibil acum și costă la jumătate.
Actualizat 25 iun. 2026  · 6 min. citire

Sakana promovează Fugu ca fiind la nivelul lui Fable 5, dar exclude Fable 5 din propriul tabel de benchmarkuri. Așa că vom compara cele două modele, cot la cot, atât cât permite situația.

Pe scurt, contextul e următorul. Guvernul SUA a suspendat accesul public la Claude Fable 5 la abia trei zile după ce Anthropic l-a lansat. Iar Fable 5 a fost prezentat ca fiind cel mai capabil model al său. Acum, două săptămâni mai târziu, Sakana AI din Tokyo a lansat Fugu cu niște afirmații îndrăznețe. Una dintre ele a circulat mult: Sakana AI spune că Fugu Ultra „stă umăr la umăr cu modele de top precum Fable 5 și Mythos Preview” pe cele mai dificile benchmarkuri din industrie pentru inginerie, știință și raționament, și fără niciun risc de control la export. CEO-ul David Ha a spus pe X că Fugu dovedește că un bazin interschimbabil de agenți orchestrați poate egala modelele de frontieră restricționate precum Fable.

Afirmațiile sunt ceva mai greu de verificat pentru că Fable 5 nu apare deloc în tabelul de benchmarkuri al lui Fugu. Sakana îl exclude pe motiv că nu este accesibil public. Facem ce putem: verificăm puținele benchmarkuri care apar în tabelele publicate de ambele laboratoare, cu aceleași repere. Iar la final vom discuta despre prețuri și situația accesului

Dacă vrei context despre fiecare sistem în parte, avem articole dedicate: citește analiza noastră despre Claude Fable 5 și prezentarea Sakana Fugu.

Ce este Sakana Fugu?

Sakana Fugu nu este un singur model antrenat în sensul obișnuit. Este un orchestrator: un model care primește cererea ta, decide dacă răspunde direct sau deleagă către modele specializate dintr-un bazin, gestionează verificarea și sinteza și returnează un singur răspuns printr-un API compatibil cu OpenAI. Din exterior, apelezi un singur endpoint; în interior, un set coordonat de modele de frontieră face treaba.

Există în două variante. Fugu echilibrează calitatea cu latența mică și este poziționat ca implicitul de zi cu zi pentru programare, revizuire și servicii interactive. Fugu Ultra coordonează un bazin mai profund de agenți experți și este reglat pentru calitatea maximă a răspunsurilor la probleme dificile, în mai mulți pași — reproducerea de articole, analiză de securitate cibernetică, data science în stil Kaggle, investigații de brevete.

Ideea e, de fapt, dublă.

  • Mai întâi, o orchestrare învățată: coordonatorul este antrenat să decidă când să delege și cum să combine ieșirile, în loc să ruleze un pipeline scris manual.
  • Apoi, un bazin de agenți interșanjabili: când un nou model de frontieră devine public, Sakana se așteaptă să petreacă aproximativ două săptămâni pentru a-l integra. (Important pentru restul articolului: Fable 5 nu se află în acel bazin pentru că nu este accesibil public.

Ce este Claude Fable 5?

Claude Fable 5 este un model din clasa Mythos, un nivel pe care Anthropic îl poziționează deasupra clasei Opus, făcut sigur pentru uz general printr-un set de clasificatoare. Este același model de bază ca Claude Mythos 5; diferența este că Fable 5 rulează (rula) cu clasificatoarele de siguranță active, în timp ce Mythos 5 are unele ridicate și este restricționat pentru partenerii Project Glasswing și anumiți cercetători în biologie.

Anthropic a susținut că Fable 5 este stare‑de‑artă pe aproape fiecare benchmark urmărit de Anthropic, cu un avans crescând pe sarcini mai lungi și mai complexe. Detaliul practic esențial: când o interogare atinge securitatea cibernetică, biologia/chimia sau distilarea de modele, un clasificator în două etape redirecționează răspunsul către Claude Opus 4.8 și îi spune utilizatorului că a făcut acest lucru. 

Sakana Fugu vs. Claude Fable 5: benchmarkuri

Tabelul comparativ publicat de Sakana îl exclude pe Fable 5 și pe Mythos Preview, pe motiv că nu sunt accesibile public și deci nu pot fi în bazinul lui Fugu. Așadar, cifrele oficiale pentru Fugu sunt măsurate față de Opus 4.8, GPT-5.5 și Gemini 3.1 Pro, toate vizibile în tabelul de mai jos. Vezi că iese învingător pe 10 din 11 benchmarkuri. 

Benchmark Fugu Fugu Ultra Opus 4.8 † Gemini 3.1 Pro † GPT-5.5 †
SWE-Bench Pro * 59.0 73.7 69.2 54.2 58.6
TerminalBench 2.1 80.2 82.1 74.6 70.3 78.2
LiveCodeBench 92.9 93.2 87.8 88.5 85.3
LiveCodeBench Pro 87.8 90.8 84.8 82.9 88.4
Humanity's Last Exam 47.2 50.0 49.8 44.4 41.4
CharXiv Reasoning 85.1 86.6 84.2 83.3 84.1
GPQA-D 95.5 95.5 92.0 94.3 93.6
SciCode 60.1 58.7 53.5 58.9 56.1
τ³ Banking 21.7 20.6 20.6 8.4 20.6
Long Context Reasoning 74.7 73.3 67.7 72.7 74.3
MRCRv2 86.6 93.6 87.9 84.9 94.8

* scaffolding mini-swe-agent. † repere raportate de furnizori. Toate scorurile Fugu sunt raportate de Sakana și nu au fost încă reproduse independent.

Pentru a include Fable 5 în discuție, am corelat benchmarkurile care apar atât în tabelele Anthropic, cât și în cele ale Sakana, și am verificat că reperele comune se aliniază. Pe SWE-Bench Pro și Humanity's Last Exam (fără unelte), cifrele pentru Opus 4.8, GPT-5.5 și Gemini 3.1 Pro sunt identice în ambele surse — deci acele două comparații sunt curate. Restrâns la cele două sisteme, duelul arată așa:

Benchmark Sakana Fugu Sakana Fugu Ultra Claude Fable 5 Lider
SWE-Bench Pro 59.0 73.7 80.3 Fable 5 (+6,6)
Humanity's Last Exam (fără unelte) 47.2 50.0 59.0 Fable 5 (+9,0)
Terminal-Bench 2.1 ‡ 80.2 82.1 88.0 Fable 5 (+5,9)

‡ Cele două laboratoare raportează repere diferite și folosesc scaffolding diferit pentru TerminalBench, deci condițiile nu sunt identice.

Aceste trei sunt singurele benchmarkuri care apar în tabelele publicate de ambele laboratoare cu repere potrivite, motiv pentru care restul comparației rămâne calitativ. Fable 5 conduce toate trei.

Așadar, pe fiecare benchmark unde o comparație directă este posibilă, Fable 5 iese înaintea lui Fugu Ultra cu aproximativ 6–9 puncte. Asta se potrivește cu punctele forte ale lui Fable 5: sarcini de lungă durată, evaluate la final, unde un singur model mai puternic acumulează mai puține erori compuse.

Pe scurt:

  1. Toate cifrele Fugu sunt auto-raportate și nu au apărut încă pe leaderboarduri terțe.
  2. Sakana caracterizează Fugu ca fiind „umăr la umăr” cu Fable 5 și Mythos Preview. Având în vedere diferențele de mai sus, este o interpretare defensabilă, dar generoasă. „Aproape, dar în urmă” e mai exact.
  3. Seturile de comparație se suprapun doar parțial. Fable 5 conduce la viziune (poate reconstrui sursa unei aplicații web din capturi de ecran), lucru pe care Fugu nu îl pune deloc în prim-plan; Fugu publică benchmarkuri de context lung și banking pe care tabelul Anthropic nu le acoperă. Sunt, deci, optimizate pentru forme de lucru oarecum diferite.

Sakana Fugu vs. Claude Fable 5: disponibilitate și acces

Claude Fable 5 este momentan suspendat. Anthropic a retras accesul la Fable 5 și Mythos 5 pe 12 iunie în urma unei directive guvernamentale SUA privind controlul exporturilor și spune că lucrează pentru a restabili accesul cât mai repede. Celelalte modele Anthropic, precum Opus 4.8, sunt în continuare disponibile.

Sakana Fugu este disponibil acum prin console.sakana.ai cu un API compatibil OpenAI — cu excepția UE și SEE, unde Sakana a pus pauză disponibilității în timp ce lucrează la conformitatea GDPR. Nu am putut obține un calendar exact pentru asta.

În acest moment, o echipă europeană s-ar putea să nu poată folosi niciunul dintre modele.

Gânduri finale

Pe hârtie, avem un duel strâns și autentic între două filozofii.

Anthropic se gândește la scară — un model din clasa Mythos atât de capabil încât are nevoie de un sistem paralel de clasificatoare.

Sakana pariază pe coordonare — că un orchestrator antrenat peste un bazin interschimbabil poate rămâne la mică distanță de orice model de frontieră individual, fiind în același timp mai ieftin, mai rezilient și agnostic față de furnizor.

Benchmarkurile, luate ca atare, spun că pariul Anthropic produce artefactul mai puternic la testele comparabile, în timp ce pariul Sakana produce unul mai disponibil și mai ieftin.

Întrebări frecvente despre Sakana Fugu vs. Claude Fable

Este Sakana Fugu mai bun decât Claude Fable 5?

La benchmarkurile unde este posibilă o comparație directă (SWE-Bench Pro, Humanity's Last Exam, Terminal-Bench), Fable 5 conduce în fața lui Fugu Ultra cu aproximativ 6–9 puncte. 

De ce nu este Fable 5 în tabelul de benchmarkuri al lui Fugu?

Sakana îi exclude pe Fable 5 și Mythos Preview pentru că nu sunt accesibile public și, prin urmare, nu pot face parte din bazinul de agenți al lui Fugu. Comparația oficială este cu Opus 4.8, GPT-5.5 și Gemini 3.1 Pro, pe care Fugu Ultra le depășește în 10 din 11 benchmarkuri.

Care este mai ieftin?

Fugu Ultra, la 5 USD/M input și 30 USD/M output, costă aproximativ jumătate față de Fable 5, la 10 USD/M input și 50 USD/M output. Ambele oferă abonamente lunare de 20/100/200 USD.

Va reveni Fable 5?

Anthropic spune că lucrează pentru a restabili accesul la Fable 5 și Mythos 5 cât mai repede posibil, dar nu a publicat un calendar. Între timp, celelalte modele ale sale, inclusiv Opus 4.8, rămân disponibile.

Chiar ocolește Fugu suspendarea lui Fable 5?

Nu direct — Fable 5 nu a fost niciodată în bazinul lui Fugu, așa că Fugu nu-i poate recupera capabilitățile specifice.

Subiecte

Învață AI cu DataCamp

track

AI pentru ingineria software

7 oră
Scrie cod și construiește aplicații software mai rapid ca niciodată cu cele mai noi instrumente AI pentru dezvoltatori, inclusiv GitHub Copilot, Windsurf și Replit.
Vezi detaliiRight Arrow
Începeți cursul
Vezi mai multRight Arrow