track
Dacă alegi între Claude Fable 5 și GPT-5.5 pentru un flux de lucru în producție, tabelele de benchmark îți spun o poveste clară. Pe hârtie, Fable 5 este un model mai puternic cu un avans mare la programare și raționament. Dar costă și de două ori mai mult pe token de ieșire, are un sistem de clasificare care îți poate redirecționa în liniște cererea către un model mai slab și impune o cerință de retenție a datelor de 30 de zile care blochează complet unii clienți enterprise.
În acest articol, voi compara Fable 5 și GPT-5.5 pe cinci dimensiuni: performanță la programare și sarcini agentice, lucru cu context lung, clasificatoare de siguranță și fricțiune la acces, lucru cognitiv și raționament, respectiv prețuri. Poți consulta și ghidurile noastre dedicate pentru Claude Fable 5 și GPT-5.5 pentru detalii aprofundate despre fiecare model în parte.
Rămâi la curent cu tot ce e nou în AI. Abonează-te la The Median, newsletterul nostru gratuit de vineri care explică pe scurt cele mai importante știri ale săptămânii. Rămâi în formă în doar câteva minute pe săptămână.
Ce este Claude Fable 5?
Claude Fable 5 este primul model Anthropic din clasa Mythos disponibil pentru uz general, lansat pe 9 iunie 2026. Mythos este un nou nivel de capabilități, deasupra lui Opus în ierarhia de modele Anthropic. Fable 5 este același model de bază ca Claude Mythos 5, dar cu clasificatoare de siguranță active care direcționează anumite întrebări sensibile către Claude Opus 4.8. Distincția de nume contează: Fable este versiunea accesibilă public; Mythos este versiunea nerestricționată, disponibilă doar partenerilor Project Glasswing.
Anthropic poziționează Fable 5 ca fiind vârful de gamă pe aproape toate benchmarkurile testate, cu puncte tari în inginerie software, lucru cognitiv, viziune și sarcini agentice de lungă durată. Cu cât sarcina este mai lungă și mai complexă, cu atât avansul față de modelele Claude anterioare e mai mare. Stripe a raportat că Fable 5 a comprimat luni de muncă de inginerie în câteva zile într-o migrare a unei baze de cod Ruby de 50 de milioane de linii.
Pentru mai multe despre capabilitățile lui Fable 5 și detalii de benchmark, vezi ghidul nostru Claude Fable 5. Acoperim și varianta restricționată Mythos 5 în articolul despre Claude Mythos 5.
Ce este GPT-5.5?
GPT-5.5 este lansarea de model a OpenAI din aprilie 2026, descrisă ca cel mai puternic model agentic de programare al companiei de până acum. OpenAI a lansat și o variantă GPT-5.5 Pro pentru lucrări cu acuratețe mai mare. Modelul a fost co-proiectat pentru și deservit pe sistemele NVIDIA GB200 și GB300 NVL72, iar OpenAI spune că egalează latența pe token a GPT-5.4 în condiții reale, oferind în același timp un nivel de inteligență semnificativ mai ridicat.
Povestea arhitecturală principală pentru GPT-5.5 este fiabilitatea pe context lung. GPT-5.4 ceda după aproximativ 128K tokeni pe benchmarkul MRCR; GPT-5.5 se menține la 512K-1M tokeni (74,0% pe MRCR v2 în acel interval, față de 36,6% pentru GPT-5.4). Asta este o schimbare calitativă a posibilităților de utilizare a modelului, nu un câștig marginal de benchmark.
Pentru o defalcare completă a benchmarkurilor GPT-5.5 și concluziile noastre practice, vezi ghidul GPT-5.5. L-am comparat și direct cu Claude Opus 4.8 în articolul Claude Opus 4.8 vs GPT-5.5.
Claude Fable 5 vs GPT-5.5: comparație directă
Iată un rezumat rapid al poziției fiecărui model înainte de a intra în detalii.
| Funcționalitate | Claude Fable 5 | GPT-5.5 |
|---|---|---|
| SWE-Bench Pro | 80,3% | 58,6% |
| Terminal-Bench 2.1 | 88,0%* | 83,4% (Codex CLI) |
| Humanity's Last Exam (cu unelte) | 64,5% | 52,2% |
| MRCR v2 la 512K-1M tokeni | Nepublicat | 74,0% |
| OSWorld-Verified | 85,0% | 78,7% |
| Preț API input (per 1M tokeni) | $10 | $5 |
| Preț API output (per 1M tokeni) | $50 | $30 |
| Fallback prin clasificator de siguranță | Da (redirecționează la Opus 4.8) | Fără fallback silențios |
| Cerință de retenție a datelor | 30 de zile obligatoriu | Politică standard |
| Disponibilitate generală | Limitată (credite suplimentare necesare după 22 iunie) | Da (ChatGPT + API) |
Performanță la programare și sarcini agentice
Aici diferența dintre modele este cea mai mare și cea mai relevantă pentru decizie. Pe SWE-Bench Pro, benchmarkul pentru rezolvarea problemelor reale din GitHub, Fable 5 obține 80,3% față de 58,6% pentru GPT-5.5. Este un decalaj de 22 de puncte. Ca referință, Claude Opus 4.7 deja depășea GPT-5.5 pe acest benchmark cu 64,3%, deci GPT-5.5 era deja în urmă la programarea la nivel de repository înainte de apariția lui Fable 5.
La evaluarea FrontierCode a Cognition, care testează dacă modelele pot trece sarcini dificile de programare respectând standardele pentru baze de cod de producție, Fable 5 are cel mai mare scor dintre modelele de vârf chiar și la efort mediu. CEO-ul Cursor, Michael Truell, l-a descris drept modelul cu cel mai mare scor pe FrontierBench, excelând la raționament pe orizont lung și generalizare la unelte necunoscute direct din cutie.
Fable 5 pare, de asemenea, să conducă în Terminal-Bench 2.1 cu un scor raportat de 88,0%*, înaintea lui GPT-5.5 la 83,4%. Asteriscul indică faptul că cifra trebuie privită cu rezerve din cauza unei discrepanțe între Fable 5 și Mythos 5. Oriunde apare această situație, Fable este varianta cu performanță mai mică, deci aș presupune că Fable 5 se află la egalitate cu GPT-5.5 sau are un mic avans.
GPT-5.5 rămâne cea mai bună alegere pentru DevOps intens pe terminal și automatizare shell, dar diferența pe SWE-Bench Pro este un semnal real. Dacă principalul tău caz de utilizare este ingineria la nivel de repository, Fable 5 este alegerea clară doar pe baza capabilității. Întrebarea este dacă dublul cost pe token de ieșire și fricțiunea introdusă de clasificator merită pentru volumul tău specific.
Performanță pe context lung
Aceasta este diferențiatorul autentic al GPT-5.5 și merită tratat cu seriozitate. GPT-5.4 se prăbușea după aproximativ 128K tokeni pe benchmarkul MRCR v2. GPT-5.5 nu o face. La 512K-1M tokeni, GPT-5.5 obține 74,0% pe MRCR v2, comparativ cu 36,6% pentru GPT-5.4 în același interval. Nu e o îmbunătățire marginală; e o clasă de capabilitate diferită.
Anthropic susține că Fable 5 rămâne concentrat pe parcursul a milioane de tokeni în sarcini de lungă durată și își îmbunătățește rezultatele folosindu-și propriile notițe. Testul de memorie Slay the Spire a arătat că memoria persistentă bazată pe fișiere a îmbunătățit performanța lui Fable 5 de trei ori mai mult decât pe cea a lui Opus 4.8. Dar Anthropic nu a publicat scoruri de tip MRCR pentru Fable 5 în intervalul 512K-1M, deci o comparație directă nu este posibilă aici.
Pentru utilizatori care rulează contexte de un milion de tokeni, cum ar fi revizuiri de documente juridice, analiză de baze de cod mari sau sinteză de literatură științifică, scorurile publicate pentru GPT-5.5 pe context lung reprezintă baza de dovezi mai solidă. În propriile noastre teste ale GPT-5.5, am constatat că a trecut un test "ac în carul cu fân" la 300K tokeni și că scorurile MRCR s-au menținut peste 256K, acolo unde GPT-5.4 cedase. Fable 5 poate fi la fel de puternic aici, dar datele nu sunt publicate într-un format comparabil.
Clasificatoare de siguranță și fricțiune la acces
Aceasta este problema practică cea mai puțin raportată la Fable 5 și merită mai mult decât o notă de subsol. Fable 5 rulează un sistem de clasificare în două etape: o probă monitorizează activările interne pe întreg traficul, iar cererile marcate sunt escaladate către un clasificator LLM separat, antrenat, care ia decizia finală. Când o cerere este blocată, ea este redirecționată către Claude Opus 4.8, iar utilizatorul este notificat care model a gestionat interogarea.
Anthropic spune că clasificatoarele se declanșează în mai puțin de 5% dintre sesiuni, în medie. Trei domenii sunt acoperite:
- Cybersecurity: Dezvoltarea de exploaturi, sarcini ofensive de securitate cibernetică și fluxuri de lucru de hacking agentic sunt blocate. Fable 5 a obținut 0,0% la toate cele patru benchmarkuri cyber când clasificatoarele erau active, față de 88,4% pentru modelul de bază Mythos la dezvoltarea de exploaturi pentru Firefox.
- Biologie și chimie: Majoritatea cererilor din acest domeniu revin la Opus 4.8. Evaluările proprii ale Anthropic au arătat că modelul de bază se apropia de performanța la nivel de expert pe sarcini de proiectare a virusului adeno-asociat, motiv pentru care acoperirea este largă.
- Distilare: Cererile marcate ca tentative de extragere a capabilităților lui Claude pentru antrenarea unor modele concurente sunt redirecționate.
Mecanismul de fallback nu este doar o preocupare de capabilitate; este o preocupare de fiabilitate pentru pipeline-uri agentice. Când Fable 5 redirecționează la Opus 4.8, ești taxat la tarifele Opus 4.8, dar primești și un model diferit (încă foarte bun!) la mijlocul sarcinii. Pentru un pipeline care se așteaptă la profunzimea de raționament a lui Fable 5 pe tot parcursul, o comutare silențioasă la Opus 4.8 în mijlocul sesiunii poate invalida presupuneri despre calitatea ieșirii.
GPT-5.5 are propriile măsuri de protecție cibernetică, descrise ca clasificatoare mai stricte pentru potențial risc cibernetic. Dar nu există un fallback silențios către un model mai slab. Abordarea OpenAI este accesul de încredere pe niveluri: apărătorii verificați pot aplica la chatgpt.com/cyber pentru acces extins cu mai puține restricții. Acest traseu este mai accesibil decât Project Glasswing al Anthropic, care este încă limitat la un set mic de parteneri aprobați.
Mai există un blocaj care merită numit direct. Fable 5 și Mythos 5 sunt clasificate drept Covered Models, ceea ce înseamnă că Anthropic cere retenție a datelor de 30 de zile pentru tot traficul, chiar și pentru clienții enterprise care anterior aveau planuri cu retenție zero. Anthropic afirmă că datele nu sunt folosite pentru antrenare, dar cerința de retenție în sine este un blocaj dur pentru industriile reglementate. Unii clienți enterprise nu pot folosi deloc Fable 5 din cauza acestei politici.
Lucru cognitiv și raționament
Ambele modele sunt puternice aici, iar diferențele sunt mai mici decât la programare. Fable 5 conduce pe Hebbia's Finance Benchmark pentru raționament la nivel senior, obținând cel mai mare scor dintre toate modelele la raționament bazat pe documente, interpretarea graficelor și rezolvarea problemelor. IMC a raportat că Fable 5 le-a depășit evaluările de analiză pentru tranzacționare pe toată linia, inclusiv analiza cauzei rădăcină și analiza valorii așteptate.
GPT-5.5 conduce pe FrontierMath Tier 4 cu 35,4%, peste scorurile publicate ale lui Fable 5. Pe GDPval, care testează agenți în 44 de ocupații, GPT-5.5 obține 84,9%. La Humanity's Last Exam cu unelte, Fable 5 conduce cu 64,5% față de 52,2% pentru GPT-5.5, un decalaj semnificativ pentru sarcini de raționament multidisciplinar.
Prețuri și disponibilitate
Diferența de preț este reală și se amplifică la scară. Fable 5 costă 10$ per milion de tokeni input și 50$ per milion de tokeni output. GPT-5.5 costă 5$ per milion de tokeni input și 30$ per milion de tokeni output. Pentru volume mari, această creștere de 100%/67% se adună rapid.
Accesul prin abonament adaugă o altă complicație pentru Fable 5. Abonații Pro, Max, Team și Enterprise au avut acces gratuit până pe 22 iunie. După acea dată, folosirea lui Fable 5 necesită credite de consum pe lângă abonamentul existent. Anthropic spune că intenționează să readucă Fable 5 ca funcționalitate standard a abonamentului când capacitatea permite, dar nu există un termen ferm. GPT-5.5 a fost lansat pentru utilizatorii Plus, Pro, Business și Enterprise în ChatGPT și Codex din prima zi, cu acces API la scurt timp după.
O nuanță de preț utilă: când o interogare Fable 5 revine la Opus 4.8 din cauza clasificatoarelor, ești taxat la tarifele Opus 4.8 (5$ input / 25$ output), nu la tarifele Fable 5.
Când să alegi Claude Fable 5 vs GPT-5.5
Decizia se reduce la trei variabile: cât de mult contează diferența pe SWE-Bench Pro pentru munca ta, dacă domeniul tău declanșează clasificatoarele lui Fable 5 și dacă ai nevoie de performanță fiabilă peste 256K tokeni.
| Caz de utilizare | Recomandat | De ce |
|---|---|---|
| Inginerie software la nivel de repository | Claude Fable 5 | 80,3% vs 58,6% pe SWE-Bench Pro este un decalaj de 22 de puncte care reflectă diferențe reale de capabilitate pe baze de cod complexe |
| Unelte de securitate, penetration testing sau cercetare ofensivă în securitate | GPT-5.5 | Clasificatoarele lui Fable 5 vor bloca sau redirecționa majoritatea acestei munci; calea de acces de încredere pe niveluri a GPT-5.5 este mai accesibilă |
| Revizuire de documente juridice sau sinteză de literatură științifică la 500K+ tokeni | Oricare | Scorurile MRCR publicate la 512K-1M tokeni (74,0%) arată că GPT-5.5 se menține unde GPT-5.4 a cedat; Fable 5 nu are date publicate comparabile, dar promite performanță mai bună |
| Finanțe și lucru cognitiv cu documente complexe | Claude Fable 5 | Conduce pe Hebbia's Finance Benchmark și la Humanity's Last Exam cu unelte (64,5% vs 52,2%) |
| Workload-uri API de volum mare unde costul contează | GPT-5.5 | $30 vs $50 per milion de tokeni output; diferența se amplifică la scară |
| Pipeline-uri de cercetare biomedicală | GPT-5.5 (sau așteaptă accesul de încredere la Fable 5) | Clasificatoarele de biologie ale lui Fable 5 vor redirecționa majoritatea întrebărilor biomedicale către Opus 4.8 până la deschiderea programului de acces de încredere |
| Industrii reglementate care cer retenție zero a datelor | GPT-5.5 | Politica obligatorie de retenție 30 de zile a lui Fable 5 este un blocaj dur pentru unii clienți enterprise |
Alege Claude Fable 5 dacă...
- Cazul tău principal este ingineria software la nivel de repository, iar diferența de 22 de puncte pe SWE-Bench Pro justifică costul dublu pe token de ieșire.
- Munca ta nu este adiacentă domeniilor de securitate cibernetică, biologie sau chimie, astfel încât e puțin probabil ca clasificatoarele să se declanșeze în sesiunile tale.
- Ai nevoie de plafonul cel mai înalt pe sarcini analitice complexe, inclusiv benchmarkuri în finanțe și raționament multidisciplinar, unde Fable 5 conduce cu două cifre.
- Folosești API-ul și poți absorbi 50$ per milion de tokeni output pentru câștigul de capabilitate.
Alege GPT-5.5 dacă...
- Construiești în domenii adiacente securității și ai nevoie de un model care nu îți va redirecționa în liniște cererile la mijlocul pipeline-ului.
- Politica de date a companiei tale cere retenție zero, ceea ce statutul Covered Model al lui Fable 5 face imposibil.
- Ai nevoie de acces API previzibil, fără o prăpastie de abonament sau sistem de credite de utilizare peste planul tău.
- Eficiența costurilor contează, iar diferența de 30$ vs 50$ pe tokenii de ieșire este semnificativă la volumul tău.
Concluzii
Fable 5 este modelul mai capabil pe benchmarkurile care contează cel mai mult. Diferența pe SWE-Bench Pro (80,3% vs 58,6%) nu e zgomot, iar avansul la Humanity's Last Exam (64,5% vs 52,2% cu unelte) reflectă o diferență reală în profunzimea raționamentului. Dacă doar capabilitatea brută contează, Fable 5 câștigă.
Dar asteriscul de pe scorurile lui Fable 5 este real. Aceste numere reflectă modelul de bază Mythos. Fable 5 este Mythos cu clasificatoare deasupra, iar pentru cereri de cybersecurity, biomedicale și anumite solicitări cu dublă utilizare, primești în schimb Opus 4.8. Pentru pipeline-uri agentice, nu e doar o problemă de capabilitate; e una de fiabilitate. Un pipeline care se așteaptă la profunzimea de raționament a lui Fable 5 pe tot parcursul se poate rupe când modelul comută în tăcere la mijlocul sarcinii. Adaugă cerința obligatorie de retenție a datelor de 30 de zile și Fable 5 pur și simplu nu este (încă) o opțiune pentru unii clienți enterprise.
Există o a treia opțiune care merită menționată. Dacă prețul lui Fable 5 este prohibitiv și câștigurile GPT-5.5 pe context lung nu contează pentru cazul tău, Claude Opus 4.8 nu este un premiu de consolare. Deja îl depășește pe GPT-5.5 pe SWE-Bench Pro cu 69,2% față de 58,6%, costă 5$/25$ per milion de tokeni și nu are fricțiunea de clasificator a lui Fable 5. Acoperim decizia Opus 4.8 vs GPT-5.5 în detaliu în articolul Claude Opus 4.8.
Dacă vrei să te pui rapid la punct cu lucrul cu modele de vârf în producție, îți recomand să începi cu skill track-ul AI Fundamentals.