Program
Sakana, Fugu’yu Fable 5 ile denk olarak pazarlıyor, ancak kendi kıyaslama tablosunda Fable 5’e yer vermiyor. Bu yüzden, mümkün olduğu ölçüde iki modeli yan yana karşılaştıracağız.
İşte arka plan. ABD hükümeti, Anthropic’in lansmanından henüz üç gün sonra Claude Fable 5’e kamu erişimini askıya aldı. Oysa Fable 5, şirketin en yetkin modeli olarak lanse edilmişti. İki hafta sonra, Tokyo merkezli Sakana AI iddialı açıklamalarla Fugu’yu piyasaya sürdü. Özellikle bir iddia çok konuşuldu: Sakana AI, Fugu Ultra’nın sektörün en zor mühendislik, bilim ve akıl yürütme kıyaslamalarında “eşdeğer modeller olan Fable 5 ve Mythos Preview ile omuz omuza” durduğunu ve bunu ihracat kontrolü riski olmadan yaptığını söylüyor. CEO David Ha, X’te Fugu’nun, değiştirilebilir bir orkestrasyonlu ajan havuzunun, Fable gibi kısıtlı sınır modelleriyle başa baş gidebildiğinin kanıtı olduğunu belirtti.
Bu iddiaları doğrulamak biraz zor, çünkü Fable 5, Fugu’nun kıyaslama tablosunda hiç yok. Sakana, kamuya açık olmadığı gerekçesiyle onu dışarıda bırakıyor. Biz de elimizden geleni yapıyoruz: Her iki laboratuvarın da yayımladığı tablolarda, aynı taban değerlerle yer alan az sayıdaki kıyaslamayı kontrol ediyoruz. Son olarak da fiyatlandırma ve erişim durumundan bahsedeceğiz
İki sistem hakkında ayrı ayrı arka plan bilgisi isterseniz, bununla ilgili bloglarımız var: Claude Fable 5 incelememizi ve Sakana Fugu yazımızı okuyun.
Sakana Fugu Nedir?
Sakana Fugu, alışıldık anlamda tek bir eğitilmiş model değildir. Bir orkestratördür: İsteğinizi alır, doğrudan yanıt mı vereceğine yoksa havuzdaki uzman modellere mi devredeceğine karar verir, doğrulama ve sentezi yönetir ve OpenAI uyumlu tek bir API üzerinden bir yanıt döndürür. Dışarıdan bakıldığında tek bir uç noktaya çağrı yaparsınız; içeride ise koordineli bir sınır model kümesi işi yürütür.
İki varyantla sunulur. Fugu, kaliteyi düşük gecikmeyle dengeler ve kodlama, inceleme ve etkileşimli hizmetler için günlük varsayılan olarak konumlandırılır. Fugu Ultra ise daha derin bir uzman ajan havuzunu koordine eder ve zor, çok adımlı sorunlarda — makale yeniden üretimi, siber güvenlik analizi, Kaggle tarzı veri bilimi, patent araştırmaları — azami yanıt kalitesi için ayarlanmıştır.
Fikir aslında iki fikirdir.
- Birincisi, öğrenilmiş orkestrasyon: Koordinatör, el yapımı bir boru hattı yerine ne zaman delege edileceğini ve çıktıların nasıl birleştirileceğini belirlemek üzere eğitilir.
- İkincisi, değiştirilebilir bir ajan havuzu: Yeni bir sınır model kamuya açıldığında, Sakana’nın onu entegre etmek için yaklaşık iki hafta harcaması beklenir. (Yazının geri kalanı için önemli: Fable 5, kamuya açık olmadığı için bu havuzda değildir.)
Claude Fable 5 Nedir?
Claude Fable 5, Anthropic’in Opus sınıfının üzerinde konumlandırdığı Mythos sınıfı bir modeldir ve bir dizi sınıflandırıcıyla genel kullanıma uygun hâle getirilmiştir. Claude Mythos 5 ile aynı temel modele dayanır; fark şu ki Fable 5 güvenlik sınıflandırıcıları etkin şekilde (etkin olarak) çalışırken, Mythos 5’te bunların bir kısmı kaldırılmıştır ve Project Glasswing ortakları ile seçili biyoloji araştırmacılarıyla sınırlıdır.
Anthropic’in iddiası, Fable 5’in neredeyse tüm takip ettikleri kıyaslamalarda son teknoloji olduğu ve görevler uzayıp karmaşıklaştıkça farkın açıldığı yönündeydi. Öne çıkan pratik ayrıntı: Bir sorgu siber güvenlik, biyoloji/kimya veya model damıtma konularına temas ettiğinde, iki aşamalı bir sınıflandırıcı yanıtı Claude Opus 4.8’e yönlendirir ve kullanıcıya bunu bildirir.
Sakana Fugu vs. Claude Fable 5: Kıyaslamalar
Sakana’nın yayımladığı karşılaştırma tablosu, kamuya açık olmadıkları ve dolayısıyla Fugu’nun havuzunda yer alamadıkları gerekçesiyle Fable 5 ve Mythos Preview’u dışlıyor. Bu nedenle Fugu’nun resmi rakamları, aşağıdaki tabloda da gördüğünüz Opus 4.8, GPT-5.5 ve Gemini 3.1 Pro ile karşılaştırılıyor. 11 kıyaslamanın 10’unda kazandığını görebilirsiniz.
| Kıyaslama | Fugu | Fugu Ultra | Opus 4.8 † | Gemini 3.1 Pro † | GPT-5.5 † |
|---|---|---|---|---|---|
| SWE-Bench Pro * | 59.0 | 73.7 | 69.2 | 54.2 | 58.6 |
| TerminalBench 2.1 | 80.2 | 82.1 | 74.6 | 70.3 | 78.2 |
| LiveCodeBench | 92.9 | 93.2 | 87.8 | 88.5 | 85.3 |
| LiveCodeBench Pro | 87.8 | 90.8 | 84.8 | 82.9 | 88.4 |
| Humanity's Last Exam | 47.2 | 50.0 | 49.8 | 44.4 | 41.4 |
| CharXiv Reasoning | 85.1 | 86.6 | 84.2 | 83.3 | 84.1 |
| GPQA-D | 95.5 | 95.5 | 92.0 | 94.3 | 93.6 |
| SciCode | 60.1 | 58.7 | 53.5 | 58.9 | 56.1 |
| τ³ Banking | 21.7 | 20.6 | 20.6 | 8.4 | 20.6 |
| Long Context Reasoning | 74.7 | 73.3 | 67.7 | 72.7 | 74.3 |
| MRCRv2 | 86.6 | 93.6 | 87.9 | 84.9 | 94.8 |
* mini-swe-agent iskeleti. † hizmet sağlayıcıların bildirdiği taban değerler. Tüm Fugu puanları Sakana tarafından raporlanmıştır ve henüz bağımsız olarak yeniden üretilmemiştir.
Fable 5’i tabloya dâhil etmek için, Anthropic ve Sakana’nın tablolarında ortak olan kıyaslamaları çapraz referansladım ve paylaşılan taban değerlerin örtüştüğünü doğruladım. SWE-Bench Pro ve Humanity's Last Exam (araçsız) üzerinde, Opus 4.8, GPT-5.5 ve Gemini 3.1 Pro rakamları iki kaynakta da aynıdır — yani bu iki karşılaştırma net. Sadece iki sisteme indirgediğimizde, birebir tablo şöyle görünüyor:
| Kıyaslama | Sakana Fugu | Sakana Fugu Ultra | Claude Fable 5 | Lider |
|---|---|---|---|---|
| SWE-Bench Pro | 59.0 | 73.7 | 80.3 | Fable 5 (+6.6) |
| Humanity's Last Exam (araçsız) | 47.2 | 50.0 | 59.0 | Fable 5 (+9.0) |
| Terminal-Bench 2.1 ‡ | 80.2 | 82.1 | 88.0 | Fable 5 (+5.9) |
‡ İki laboratuvar TerminalBench için farklı taban değerler raporluyor ve farklı iskeletler kullanıyor; dolayısıyla koşullar birebir aynı değil.
Bu üçü, her iki laboratuvarın yayımladığı tablolarda aynı taban değerlerle yer alan tek kıyaslamalar; bu yüzden geri kalan karşılaştırma niteliksel kalmak zorunda. Üçünde de Fable 5 önde.
Özetle, yan yana karşılaştırmanın mümkün olduğu her kıyaslamada, Fable 5, Fugu Ultra’nın yaklaşık 6–9 puan önünde. Bu da Fable 5’in kazanmak üzere inşa edildiği alanla uyumlu: Sonuçta değerlendirilen uzun ufuklu görevlerde, tek ve daha güçlü bir model bileşik hataları daha az biriktirir.
Kısaca:
- Tüm Fugu rakamları kendi beyanlarıdır ve henüz üçüncü taraf listelerinde görünmemiştir.
- Sakana, Fugu’yu Fable 5 ve Mythos Preview ile “omuz omuza” olarak tanımlıyor. Yukarıdaki farklar göz önüne alındığında, bu savunulabilir ama cömert bir yorum. “Yakın, ama geriden geliyor” daha isabetli.
- Karşılaştırma setleri sadece kısmen örtüşüyor. Fable 5 görselde önde (ekran görüntülerinden bir web uygulamasının kaynağını yeniden inşa edebiliyor), Fugu ise buna hiç vurgu yapmıyor; Fugu, Anthropic’in tablosunda yer almayan uzun bağlam ve bankacılık kıyaslamaları yayımlıyor. Yani biraz farklı iş biçimlerine optimize edilmişler.
Sakana Fugu vs. Claude Fable 5: Erişilebilirlik ve Erişim
Claude Fable 5 şu anda askıda. Anthropic, 12 Haziran’da ABD hükümetinin ihracat kontrol direktifinin ardından Fable 5 ve Mythos 5 erişimini kapattı ve erişimi en kısa sürede geri getirmek için çalıştığını söylüyor. Opus 4.8 gibi diğer modellerine erişim devam ediyor.
Sakana Fugu şu anda kullanılabilir; console.sakana.ai üzerinden OpenAI uyumlu bir API ile — ancak AB ve AEA’da, Sakana GDPR uyumluluğu üzerinde çalışırken erişimi duraklattı. Bu konuda net bir zaman çizelgesi alamadım.
Şu anda, Avrupalı bir ekip her iki modeli de kullanamayabilir.
Son Düşünceler
Kâğıt üzerinde, bu iki felsefe arasında yakın ve gerçek bir yarış.
Anthropic ölçek üzerine düşünüyor — o kadar yetkin bir Mythos sınıfı model ki paralel bir sınıflandırıcı sisteme ihtiyaç duyuyor.
Sakana ise koordinasyona oynuyor — değiştirilebilir bir havuz üzerinde eğitilmiş bir orkestratörün, tek bir sınır modelinin menzili içinde kalarak daha ucuz, daha dayanıklı ve sağlayıcıdan bağımsız olabileceği iddiasıyla.
Kıyaslamalar, olduğu gibi alındığında, Anthropic’in bahsinin karşılaştırılabilir testlerde daha güçlü eseri ürettiğini, Sakana’nın ise daha erişilebilir ve daha ucuz olanı ürettiğini söylüyor.

Bilimsel dergilerde yayımlanan araştırma makalelerine katkıları olan bir veri bilimi yazarı ve editörüyüm. Özellikle lineer cebir, istatistik, R ve benzeri konularla ilgileniyorum. Aynı zamanda epey satranç da oynarım!
Sakana Fugu vs. Claude Fable SSS
Sakana Fugu, Claude Fable 5’ten daha iyi mi?
Yan yana karşılaştırmanın mümkün olduğu kıyaslamalarda (SWE-Bench Pro, Humanity's Last Exam, Terminal-Bench), Fable 5, Fugu Ultra’nın yaklaşık 6–9 puan önündedir.
Fable 5 neden Fugu’nun kıyaslama tablosunda yok?
Sakana, Fable 5 ve Mythos Preview’u kamuya açık olmadıkları ve bu nedenle Fugu’nun ajan havuzunun parçası olamayacakları için dışlıyor. Resmi karşılaştırmasını, Fugu Ultra’nın 11 kıyaslamanın 10’unda geçtiği Opus 4.8, GPT-5.5 ve Gemini 3.1 Pro ile yapıyor.
Hangisi daha ucuz?
Fugu Ultra, M başına $5 giriş ve M başına $30 çıkış ile, Fable 5’in M başına $10 giriş ve M başına $50 çıkış fiyatının kabaca yarısıdır. Her ikisi de aylık $20/$100/$200 abonelik katmanları sunar.
Fable 5 geri dönecek mi?
Anthropic, Fable 5 ve Mythos 5’e erişimi mümkün olan en hızlı şekilde geri getirmek için çalıştığını söylüyor, ancak bir zaman çizelgesi yayımlamadı. Bu arada, Opus 4.8 dâhil diğer modelleri erişilebilir durumda.
Fugu gerçekten Fable 5’in askıya alınmasını dolanıyor mu?
Doğrudan değil — Fable 5 hiçbir zaman Fugu’nun havuzunda olmadı, bu yüzden Fugu onun özgül yeteneklerini geri kazanamaz.
