Program
Eğer üretim iş akışınız için Claude Fable 5 ile GPT-5.5 arasında karar veriyorsanız, kıyaslama tabloları size net bir tablo sunar. Kâğıt üzerinde, Fable 5 kodlama ve muhakemede açık ara daha güçlü. Ancak çıktı belirteci başına iki kat daha pahalı, isteğinizi fark ettirmeden daha zayıf bir modele yönlendirebilen bir sınıflandırıcı sistemi var ve bazı kurumsal müşterileri tamamen engelleyen 30 günlük veri saklama zorunluluğu getiriyor.
Bu yazıda Fable 5 ve GPT-5.5’i beş boyutta karşılaştıracağım: kodlama ve aracılık (agentic) performansı, uzun bağlamlı çalışma, güvenlik sınıflandırıcıları ve erişim sürtünmesi, bilgi işi ve akıl yürütme, ve fiyatlandırma. Her bir modeli ayrı ayrı daha derin incelemek için ayrıca Claude Fable 5 ve GPT-5.5 rehberlerimize de göz atabilirsiniz.
Yapay zeka alanındaki en son gelişmelerden haberdar olun. Haftanın öne çıkan hikâyelerini özetleyen ücretsiz Cuma bültenimiz The Median’a abone olun. Haftada sadece birkaç dakikada güncel kalın.
Claude Fable 5 Nedir?
Claude Fable 5, Anthropic’in 9 Haziran 2026’da genel kullanıma sunduğu ilk Mythos sınıfı modelidir. Mythos, Anthropic’in model hiyerarşisinde Opus’un üzerinde yer alan yeni bir yetenek katmanıdır. Fable 5, temelde Claude Mythos 5 ile aynı modeldir; ancak bazı hassas sorguları yerine Claude Opus 4.8’e yönlendiren güvenlik sınıflandırıcıları etkindir. İsim ayrımı önemlidir: Fable genel erişime açık sürümdür; Mythos ise yalnızca Project Glasswing ortaklarına sunulan kısıtsız sürümdür.
Anthropic, Fable 5’i test edilen hemen hemen tüm kıyaslamalarda son teknoloji olarak konumlandırıyor; özellikle yazılım mühendisliği, bilgi işi, görme ve uzun süreli aracılık görevlerinde güçlü. Görevler uzadıkça ve karmaşıklaştıkça, önceki Claude modellerine karşı farkı büyüyor. Stripe, Fable 5’in 50 milyon satırlık bir Ruby kod tabanı geçişinde aylar sürecek mühendislik işini günlere indirdiğini bildirdi.
Fable 5’in yetenekleri ve kıyaslama dökümü hakkında daha fazla bilgi için Claude Fable 5 rehberimize bakın. Ayrıca kısıtlı Mythos 5 varyantını Claude Mythos 5 makalemizde ele aldık.
GPT-5.5 Nedir?
GPT-5.5, OpenAI’ın Nisan 2026 model sürümüdür ve şirketin bugüne kadarki en güçlü aracılık odaklı kodlama modeli olarak tanımlanır. OpenAI, daha yüksek doğruluk için GPT-5.5 Pro varyantını da yayınladı. Model, NVIDIA GB200 ve GB300 NVL72 sistemleri için birlikte tasarlanıp bu sistemlerde sunuldu; OpenAI, gerçek kullanımda belirteç başına gecikmede GPT-5.4 ile eşleşirken anlamlı ölçüde daha yüksek bir zekâ seviyesinde performans gösterdiğini söylüyor.
GPT-5.5 için başlıca mimari hikâye, uzun bağlam güvenilirliğidir. GPT-5.4, MRCR kıyaslamasında yaklaşık 128K belirtecin ötesinde çökerken; GPT-5.5 512K-1M belirteçte tutunuyor (bu aralıkta MRCR v2’de %74,0; GPT-5.4’ün %36,6’sına karşı). Bu, modelin kullanılabileceği şeylerde niteliksel bir değişim; marjinal bir kıyaslama artışı değil.
GPT-5.5’in kıyaslamaları ve uygulamalı bulgularımızın tam dökümü için GPT-5.5 rehberimize bakın. Ayrıca Claude Opus 4.8 vs GPT-5.5 karşılaştırmasını doğrudan ele aldık.
Claude Fable 5 vs GPT-5.5: Bire Bir Karşılaştırma
Ayrıntılara girmeden önce her bir modelin nerede durduğuna dair hızlı bir özet.
| Özellik | Claude Fable 5 | GPT-5.5 |
|---|---|---|
| SWE-Bench Pro | %80,3 | %58,6 |
| Terminal-Bench 2.1 | %88,0* | %83,4 (Codex CLI) |
| Humanity's Last Exam (araçlarla) | %64,5 | %52,2 |
| MRCR v2 (512K-1M belirteç) | Yayınlanmadı | %74,0 |
| OSWorld-Verified | %85,0 | %78,7 |
| API giriş fiyatı (1M belirteç başına) | $10 | $5 |
| API çıkış fiyatı (1M belirteç başına) | $50 | $30 |
| Güvenlik sınıflandırıcı geri dönüşü | Evet (Opus 4.8’e yönlendirir) | Gizli geri dönüş yok |
| Veri saklama gereksinimi | Zorunlu 30 gün | Standart politika |
| Genel erişilebilirlik | Sınırlı (22 Haziran sonrası ek kredi gerekli) | Evet (ChatGPT + API) |
Kodlama ve aracılık performansı
İki model arasındaki farkın en büyük ve karar açısından en önemli olduğu yer burası. Gerçek dünya GitHub sorunlarının çözümü için kıyas olan SWE-Bench Pro’da Fable 5 %80,3, GPT-5.5 ise %58,6 alıyor. Bu 22 puanlık bir fark. Bağlam için: Claude Opus 4.7, bu kıyaslamada %64,3 ile zaten GPT-5.5’i geçiyordu; dolayısıyla Fable 5 gelmeden önce bile GPT-5.5 depo düzeyinde kodlamada gerideydi.
Modellerin üretim kod tabanı standartlarını karşılarken zorlu kodlama görevlerini geçip geçemediğini test eden Cognition’ın FrontierCode değerlendirmesinde, Fable 5 orta çaba düzeyinde bile öncü modeller arasında en yüksek skoru alıyor. Cursor’ın CEO’su Michael Truell, onu FrontierBench’te en yüksek puanı alan model olarak tanımladı; uzun ufuklu akıl yürütmede ve kutudan çıktığı haliyle tanıdık olmayan araçlara genellemede üstün.
Fable 5, bildirilen %88,0* puanıyla Terminal-Bench 2.1’de de önde görünüyor; GPT-5.5 ise %83,4. Yıldız işareti, Fable 5 ile Mythos 5 arasındaki tutarsızlık nedeniyle sayının dikkatle ele alınması gerektiğini gösteriyor. Böyle durumlarda Fable, ikisi arasında daha düşük performanslı olandır; bu nedenle Fable 5’in GPT-5.5 ile başa baş olduğu ya da küçük bir farkla önde olduğu varsayımını yapardım.
GPT-5.5 hâlâ terminal ağırlıklı DevOps ve kabuk otomasyonu için en iyi seçim; ancak SWE-Bench Pro’daki fark gerçek bir sinyal. Birincil kullanım alanınız depo düzeyinde mühendislikse, yalnızca yetenek açısından Fable 5 açık ara tercih olur. Soru, iki kat çıktı belirteci maliyeti ve sınıflandırıcı sürtünmesinin sizin özel iş yükünüz için buna değip değmeyeceğidir.
Uzun bağlam performansı
Bu, GPT-5.5’in gerçek ayırt edici özelliği ve ciddiye alınmayı hak ediyor. GPT-5.4, MRCR v2 kıyaslamasında yaklaşık 128K belirtecin ötesinde dağılıyordu. GPT-5.5 ise dağılmıyor. 512K-1M belirteçte GPT-5.5, MRCR v2’de %74,0 alıyor; aynı aralıkta GPT-5.4 %36,6’daydı. Bu marjinal bir iyileştirme değil; farklı bir yetenek sınıfı.
Anthropic, Fable 5’in uzun süreli görevlerde milyonlarca belirteç boyunca odaklı kaldığını ve çıktıları kendi notlarını kullanarak iyileştirdiğini iddia ediyor. Slay the Spire bellek testi, dosya tabanlı kalıcı belleğin Fable 5’in performansını, Opus 4.8’inkinden üç kat daha fazla artırdığını gösterdi. Ancak Anthropic, Fable 5 için 512K-1M aralığında MRCR tarzı puanlar yayımlamadı; dolayısıyla burada bire bir karşılaştırma mümkün değil.
Yasal belge incelemesi, büyük kod tabanı analizi veya bilimsel literatür sentezi gibi milyon belirteçlik bağlamlar çalıştıran kullanıcılar için GPT-5.5’in yayımlanmış uzun bağlam puanları daha güçlü bir kanıt tabanı sunuyor. Kendi GPT-5.5 testlerimizde, 300K belirteçlik iğne testini geçtiğini ve MRCR puanlarının, GPT-5.4’ün dağıldığı 256K’nın ötesinde korunduğunu gördük. Fable 5 burada da aynı derecede güçlü olabilir; ancak veriler karşılaştırılabilir bir formatta yayımlanmış değil.
Güvenlik sınıflandırıcıları ve erişim sürtünmesi
Bu, Fable 5 ile ilgili en az raporlanan uygulayıcı sorunlarından biri ve sadece bir dipnottan fazlasını hak ediyor. Fable 5 iki aşamalı bir sınıflandırıcı sistemi çalıştırıyor: bir prob tüm trafikte iç etkinlikleri izliyor ve işaretlenen istekler, nihai kararı veren ayrı bir eğitimli LLM sınıflandırıcısına yükseltiliyor. Bir istek engellendiğinde Claude Opus 4.8’e yönlendiriliyor ve kullanıcıya sorguyu hangi modelin işlediği bildiriliyor.
Anthropic, sınıflandırıcıların ortalama olarak oturumların %5’inden azında tetiklendiğini söylüyor. Üç alan kapsanıyor:
- Siber güvenlik: İstismar geliştirme, saldırgan siber görevler ve aracılık tabanlı hackleme iş akışları engellenir. Sınıflandırıcılar etkin olduğunda Fable 5, tüm dört siber kıyaslamada %0,0 aldı; bu, temel Mythos modelinin Firefox istismar geliştirmede %88,4’ünden aşağıdadır.
- Biyoloji ve kimya: Bu alandaki isteklerin çoğu Opus 4.8’e geri döner. Anthropic’in kendi değerlendirmeleri, temel modelin adeno-ilişkili virüs tasarım görevlerinde uzman düzeyine yaklaştığını gösterdiği için kapsam geniştir.
- Damıtma: Claude’un yeteneklerini rakip modelleri eğitmek için çıkarmaya yönelik olarak işaretlenen istekler yönlendirilir.
Geri dönüş mekaniği sadece bir yetenek meselesi değil; aracılık hatları için bir güvenilirlik meselesi. Fable 5 Opus 4.8’e yönlendirdiğinde, faturalandırma Opus 4.8 tarifesiyle yapılır; ancak aynı zamanda görev ortasında farklı (yine de çok iyi!) bir model kullanmış olursunuz. Tüm süreç boyunca Fable 5’in muhakeme derinliğini bekleyen bir hat için, oturum ortasında sessizce Opus 4.8’e geçiş, çıktı kalitesiyle ilgili varsayımları bozabilir.
GPT-5.5’in de potansiyel siber risk için daha sıkı sınıflandırıcılar olarak tanımlanan kendi siber güvenlik önlemleri var. Ancak daha zayıf bir modele sessiz geri dönüş yok. OpenAI’ın yaklaşımı, kademeli güvenilir erişim: doğrulanmış savunucular, daha az kısıtlamayla genişletilmiş erişim için chatgpt.com/cyber üzerinden başvurabilir. Bu yol, hâlâ sınırlı sayıda onaylı ortakla sınırlı olan Anthropic’in Project Glasswing’ine kıyasla daha erişilebilir.
Doğrudan adı konması gereken bir başka engel daha var. Fable 5 ve Mythos 5, Covered Model olarak sınıflandırılıyor; bu da Anthropic’in, daha önce sıfır saklama planlarında olan kurumsal müşteriler için bile, tüm trafik için 30 günlük veri saklama zorunluluğu getirdiği anlamına geliyor. Anthropic verilerin eğitim için kullanılmadığını belirtiyor; ancak saklama gereksiniminin kendisi düzenlemeye tabi sektörler için katı bir engel. Bazı kurumsal müşteriler bu politika nedeniyle Fable 5’i hiç kullanamıyor.
Bilgi işi ve akıl yürütme
Her iki model de burada güçlü ve farklar kodlamadaki kadar geniş değil. Fable 5, kıdemli düzey muhakeme için Hebbia’nın Finans Kıyaslamasında lider; belge bazlı muhakeme, grafik yorumlama ve problem çözmede tüm modeller arasında en yüksek skoru alıyor. IMC, Fable 5’in kök neden analizi ve beklenen değer analizi dâhil olmak üzere ticaret-analizi değerlendirmelerinde her alanda beklentilerini aştığını bildirdi.
GPT-5.5, FrontierMath Seviye 4’te %35,4 ile Fable 5’in yayımlanmış puanlarının önünde. 44 meslek boyunca ajanları test eden GDPval’de GPT-5.5 %84,9 alıyor. Humanity’s Last Exam’de araçlarla Fable 5, %64,5 ile GPT-5.5’in %52,2’sinin önünde; çok disiplinli akıl yürütme görevleri için anlamlı bir fark.
Fiyatlandırma ve erişilebilirlik
Fiyat farkı gerçek ve ölçekte katlanıyor. Fable 5’in fiyatı, milyon giriş belirteci başına $10 ve milyon çıkış belirteci başına $50. GPT-5.5 ise milyon giriş belirteci başına $5 ve milyon çıkış belirteci başına $30. Yüksek hacimli iş yüklerinde bu %100/%67 artış hızla birikiyor.
Abonelik erişimi Fable 5 için başka bir katman daha ekliyor. Pro, Max, Team ve Enterprise aboneleri 22 Haziran’a kadar ücretsiz erişime sahipti. Bu tarihten sonra Fable 5’i kullanmak, mevcut aboneliğe ek olarak kullanım kredileri gerektiriyor. Anthropic, kapasite izin verdiğinde Fable 5’i yeniden standart bir abonelik özelliği olarak sunmayı hedeflediğini söylüyor; ancak kesin bir zaman çizelgesi yok. GPT-5.5, ChatGPT ve Codex’te Plus, Pro, Business ve Enterprise kullanıcılarına ilk günden sunuldu; kısa süre sonra API erişimi de geldi.
Bilmeniz gereken bir fiyatlandırma nüansı: Bir Fable 5 sorgusu sınıflandırıcılar nedeniyle Opus 4.8’e geri döndüğünde, faturalandırma Fable 5 tarifesiyle değil, Opus 4.8 tarifesiyle yapılır ($5 giriş / $25 çıkış).
Claude Fable 5 ve GPT-5.5 Arasında Ne Zaman Hangisini Seçmeli?
Karar üç değişkene bağlı: SWE-Bench Pro farkının işiniz için ne kadar önemli olduğu, alanınızın Fable 5’in sınıflandırıcılarını tetikleyip tetiklemediği ve 256K belirtecin ötesinde güvenilir performansa ihtiyaç duyup duymadığınız.
| Kullanım durumu | Önerilen | Neden |
|---|---|---|
| Depo düzeyinde yazılım mühendisliği | Claude Fable 5 | SWE-Bench Pro’da %80,3’e karşı %58,6, karmaşık kod tabanlarında gerçek yetenek farklarını yansıtan 22 puanlık bir farktır |
| Güvenlik araçları, sızma testi veya saldırgan güvenlik araştırması | GPT-5.5 | Fable 5’in sınıflandırıcıları bu işlerin çoğunu engeller veya yönlendirir; GPT-5.5’in kademeli güvenilir erişim yolu daha erişilebilir |
| 500K+ belirteçte yasal belge incelemesi veya bilimsel literatür sentezi | Her ikisi de | 512K-1M belirteçte yayımlanmış MRCR puanları (%74,0), GPT-5.5’in GPT-5.4’ün dağıldığı yerde tuttuğunu gösteriyor; Fable 5 için karşılaştırılabilir yayımlanmış veri yok, ancak daha iyi performans vaat ediyor |
| Karmaşık belgelerle finans ve bilgi işi | Claude Fable 5 | Hebbia’nın Finans Kıyaslamasında ve araçlarla Humanity’s Last Exam’de lider (%64,5’e karşı %52,2) |
| Maliyetin önemli olduğu yüksek hacimli API iş yükleri | GPT-5.5 | Çıkış belirteci başına $30’a karşı $50; fark ölçekte katlanır |
| Biyomedikal araştırma hatları | GPT-5.5 (veya Fable 5 güvenilir erişimi bekleyin) | Fable 5’in biyoloji sınıflandırıcıları, güvenilir erişim programı açılana kadar biyomedikal sorguların çoğunu Opus 4.8’e yönlendirecektir |
| Sıfır veri saklama gerektiren düzenlemeli sektörler | GPT-5.5 | Fable 5’in zorunlu 30 günlük saklama politikası bazı kurumsal müşteriler için katı bir engeldir |
Şunlar geçerliyse Claude Fable 5’i seçin...
- Birincil kullanım alanınız depo düzeyinde yazılım mühendisliği ve 22 puanlık SWE-Bench Pro farkı, iki kat çıktı belirteci maliyetini haklı çıkarıyor.
- Çalışmanız siber güvenlik, biyoloji veya kimya alanlarına yakın değil; dolayısıyla oturumlarınızda sınıflandırıcıların tetiklenmesi olası değil.
- Fable 5’in çift haneli farkla önde olduğu finans kıyasları ve çok disiplinli akıl yürütme dâhil en karmaşık analitik görevlerde en yüksek tavanı istiyorsunuz.
- API üzerinde çalışıyorsunuz ve yetenek kazanımı için milyon çıkış belirteci başına $50’yi karşılayabiliyorsunuz.
Şunlar geçerliyse GPT-5.5’i seçin...
- Güvenliğe yakın alanlarda geliştiriyor ve isteklerinizin hat ortasında sessizce başka bir modele yönlendirilmeyeceği bir modele ihtiyacınız var.
- Kurumsal veri politikanız sıfır saklama gerektiriyor; bu, Fable 5’in Covered Model statüsü nedeniyle mümkün değil.
- Planınızın üzerine ek bir abonelik eşiği veya kullanım kredisi sistemi olmadan öngörülebilir API erişimine ihtiyacınız var.
- Maliyet etkinliği önemli ve $30 ile $50 arasındaki çıktı belirteci farkı kullanım hacminizde anlamlı.
Son Düşünceler
Fable 5, en önemli kıyaslarda daha yetenekli model. SWE-Bench Pro’daki fark (%80,3’e karşı %58,6) gürültü değil ve Humanity’s Last Exam’deki üstünlük (araçlarla %64,5’e karşı %52,2) muhakeme derinliğinde gerçek bir farkı yansıtıyor. Yalnızca ham yetenek değişkeniyse, kazanan Fable 5.
Ancak Fable 5’in puanlarındaki yıldız işareti gerçek. Bu sayılar temel Mythos modelini yansıtıyor. Fable 5, üstünde sınıflandırıcılar bulunan Mythos’tur ve siber güvenlik, biyomedikal ve bazı çift kullanımlı sorgularda bunun yerine Opus 4.8’e geçersiniz. Aracılık hatları için bu yalnızca bir yetenek meselesi değil; bir güvenilirlik meselesi. Tüm süreç boyunca Fable 5’in muhakeme derinliğini bekleyen bir hat, model görev ortasında sessizce geçiş yaptığında bozulabilir. Zorunlu 30 günlük veri saklama gereksinimini de ekleyin; Fable 5 bazı kurumsal müşteriler için henüz bir seçenek değil.
Adı anılmaya değer üçüncü bir seçenek daha var. Fable 5’in fiyatı caydırıcıysa ve GPT-5.5’in uzun bağlam kazanımları kullanım alanınız için önemli değilse, Claude Opus 4.8 bir teselli ödülü değildir. Zaten SWE-Bench Pro’da %69,2’ye karşı %58,6 ile GPT-5.5’i geride bırakıyor, milyon belirteç başına $5/$25 maliyetli ve Fable 5’in sınıflandırıcı sürtünmesine sahip değil. Opus 4.8 vs GPT-5.5 kararını ayrıntılı olarak Claude Opus 4.8 makalemizde ele alıyoruz.
Üretimde öncü modellerle çalışmaya hızla uyum sağlamak istiyorsanız, AI Fundamentals beceri yolumuzla başlamanızı öneririm.

Tom bir veri bilimci ve teknik eğitmendir. DataCamp'in veri bilimi eğitim içerikleri ve blog yazılarını yazar ve yönetir. Daha önce Tom, Deutsche Telekom'da veri bilimi alanında çalıştı.