Kursus
Jika Anda memilih antara Claude Fable 5 (yang, peringatan dini, baru diluncurkan dua hari lalu) dan Gemini 3.5 Flash, sebenarnya Anda sedang memilih antara dua filosofi berbeda tentang seperti apa model terdepan seharusnya.
Claude Fable 5 adalah batas kemampuan Anthropic: model terkuat yang tersedia publik pada sebagian besar tolok ukur, dihargai sesuai pada $10/$50 per satu juta token, dan dibalut dalam sistem pengklasifikasi yang dapat mengalihkan kueri sensitif ke model lain di tengah sesi.
Gemini 3.5 Flash adalah taruhan Google pada titik manis kecepatan-biaya-kecerdasan: model kelas "Flash" yang mengungguli Gemini 3.1 Pro milik Google yang lebih besar pada tolok ukur pengkodean dan agentik. Model ini berjalan kira-kira 4x lebih cepat daripada model frontier sebanding, dan biayanya $1,50/$9 per satu juta token — jadi, jauh lebih murah.
Dalam artikel ini, saya akan membandingkan kedua model dalam lima dimensi:
- kinerja pengkodean dan agentik
- kecepatan dan latensi
- pekerjaan konteks panjang
- harga
Jika Anda menimbang Fable 5 dibandingkan produk andalan OpenAI, ketahuilah bahwa kami memiliki artikel terpisah: Claude Fable 5 vs GPT-5.5.
Kami membuat pembaca tetap mengetahui kabar terbaru AI lewat The Median, buletin gratis setiap Jumat yang merangkum cerita-cerita kunci pekan ini. Jadi klik tautan di atas, berlangganan, dan tetap tajam hanya dalam beberapa menit setiap minggu.
Apa Itu Claude Fable 5?
Claude Fable 5 adalah model kelas Mythos pertama Anthropic yang tersedia untuk penggunaan umum. Fable 5 berbagi model dasar dengan Claude Mythos 5, tetapi hadir dengan pengklasifikasi keamanan aktif: sebuah probe memantau aktivasi internal di seluruh trafik, dan permintaan yang ditandai ditingkatkan ke pengklasifikasi LLM terlatih. Permintaan yang diblokir dialihkan ke Claude Opus 4.8.
Fable 5 adalah yang terdepan pada hampir semua tolok ukur yang diuji, dan benar-benar sangat kuat dalam rekayasa perangkat lunak, pekerjaan berbasis pengetahuan, visi, dan tugas agentik berjangka panjang. Lebih dari itu, semakin panjang dan kompleks tugasnya, semakin besar keunggulannya dibanding model Claude sebelumnya.
Apa Itu Gemini 3.5 Flash?
Gemini 3.5 Flash adalah rilis bulan Mei dari Google DeepMind, diumumkan di Google I/O 2026 sebagai model pertama dalam keluarga Gemini 3.5 yang baru. Terlepas dari merek "Flash", ini bukan model anggaran dalam arti tradisional: model ini mengungguli Gemini 3.1 Pro milik Google yang lebih besar pada rangkaian pengkodean dan agentik sambil berjalan sekitar 4x lebih cepat daripada model frontier sebanding.
Gemini 3.5 Flash adalah model penalaran dengan parameter upaya berpikir yang dapat dikonfigurasi (minimal, low, medium, high). (Bawaannya medium, kalau Anda penasaran.) Model ini mendukung jendela konteks 1 juta token, input multimodal (teks, gambar, audio, video, PDF), dan keluaran sekitar 280+ token per detik. Google menjadikannya model default di aplikasi Gemini dan AI Mode di Penelusuran pada hari peluncuran. Kami memperkirakan Gemini 3.5 Pro akan menyusul kapan saja.
Satu hal yang patut dicatat: 3.5 Flash kira-kira 3x harga per token dibanding pendahulunya, Gemini 3 Flash ($0,50/$3,00). Jadi, murah relatif terhadap model andalan, bukan relatif terhadap garis keturunannya sendiri. Dan karena token berpikir ditagih pada tarif keluaran, beban kerja yang berat pada penalaran di upaya tinggi bisa berbiaya lebih besar daripada yang disiratkan harga daftar. Ini sesuatu yang perlu Anda sadari.
Claude Fable 5 vs. Gemini 3.5 Flash: Perbandingan Langsung
Berikut ringkasan singkat sebelum kita masuk ke detailnya. Saya membuat dua tabel: satu untuk hasil tolok ukur dan satu lagi untuk pertimbangan praktis seputar harga, kecepatan, dan akses.
Hasil tolok ukur
| Tolok ukur | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| SWE-Bench Pro | 80,3% | 55,1% (Publik) |
| Terminal-Bench 2.1 | 88,0%* | 76,2% |
| Humanity's Last Exam (dengan tools) | 64,5% | Tertinggal dari Gemini 3.1 Pro (tidak langsung sebanding) |
| OSWorld-Verified | 85,0% | Tidak dipublikasikan |
| MCP Atlas (koordinasi multi-tool) | Tidak dipublikasikan | 83,6% |
Seperti terlihat, Claude Fable 5 menang di semua perbandingan tolok ukur langsung di mana data mudah tersedia untuk membandingkan keduanya.
Harga, kecepatan, dan akses
Saya sudah sebutkan sebelumnya: Harga jelas lebih baik (jauh lebih baik) untuk Gemini 3.5 Flash.
| Fitur | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| Harga input API (per 1M token) | $10 | $1,50 |
| Harga output API (per 1M token) | $50 | $9,00 |
| Harga input cache | — | $0,15 per 1M (diskon 90%) |
| Kecepatan output | Latensi standar model frontier | ~280+ token/detik, ~4x lebih cepat dari rekan frontier |
| Jendela konteks | Tugas agentik multi-juta token jangka panjang diklaim; tidak ada MRCR yang dipublikasikan pada 512K+ | 1M token (batas input 1.048.576) |
| Ketersediaan umum | Terbatas (kredit penggunaan diperlukan setelah 22 Juni) | Ya (aplikasi Gemini, AI Studio, Antigravity, API, AI Mode di Penelusuran) |
Kinerja pengkodean dan agentik
Kinerja pada pekerjaan pengkodean dan agentik layak dibahas secara terpisah karena di sinilah kesenjangan kemampuan paling besar.
Pada SWE-Bench Pro, seperti yang terlihat di tabel pertama, Fable 5 mencetak 80,3% versus 55,1% Gemini 3.5 Flash pada set publik. Itu selisih 25 poin. Untuk rekayasa tingkat repositori pada basis kode yang kompleks, ini perbedaan nyata. Kemungkinan besar, Fable 5 dapat secara otonom menyelesaikan isu GitHub nyata sebagian besar waktu, dan saya tidak yakin hal yang sama dapat dikatakan untuk Gemini 3.5 Flash.
Di mana Gemini 3.5 Flash memberikan perlawanan adalah dalam throughput agentik alih-alih kedalaman agentik. Flash secara eksplisit dioptimalkan untuk loop eksekusi paralel, penerapan sub-agen, dan iterasi cepat. Skornya 83,6% pada MCP Atlas — tolok ukur koordinasi multi-tool di mana ia mengalahkan 75,3% GPT-5.5 — menunjukkan model yang dibangun untuk mengorkestrasi banyak panggilan tool yang cepat daripada mempertahankan satu rantai penalaran yang panjang dan dalam. Google juga melaporkan peningkatan efisiensi token yang substansial dalam skenario agentik dunia nyata dibanding versi Flash sebelumnya.
Cara berpikir yang tepat: Jika agen Anda perlu berpikir keras tentang sejumlah kecil langkah sulit (refactor kompleks, perubahan arsitektur, debugging pelik), Fable 5 unggul. Jika agen Anda perlu mengeksekusi banyak langkah yang cepat dan tingkat kesulitannya sedang secara paralel (pipa scraping-dan-meringkas, orkestrasi multi-tool, triase volume tinggi), profil kecepatan dan biaya Flash sangat masuk akal.
Kecepatan dan latensi
Gemini 3.5 Flash menghasilkan keluaran sekitar 280+ token per detik — beberapa kali lebih cepat daripada produk andalan frontier tipikal.
Fable 5, di sisi lain, tidak diposisikan sebagai model cepat. Ia diposisikan sebagai model yang Anda gunakan ketika tugasnya cukup sulit sehingga Anda bersedia menunggu jawabannya.
Kinerja konteks panjang
Gemini 3.5 Flash mendukung sekitar 1 juta token konteks input, dan lini Gemini secara historis kuat dalam pengambilan konteks panjang. Namun, Flash dilaporkan tertinggal dari Gemini 3.1 Pro milik Google pada MRCR v2.
Anthropic mengklaim Fable 5 tetap fokus di sepanjang jutaan token dalam tugas jangka panjang dan meningkatkan keluaran menggunakan catatannya sendiri. Namun Anthropic belum memublikasikan skor bergaya MRCR pada rentang 512K–1M, sehingga tidak mungkin melakukan perbandingan setara.
Untuk telaah dokumen sejuta token, tidak ada model yang memiliki keunggulan publik yang tegas di sini. Jika keandalan konteks panjang adalah variabel terpenting Anda, MRCR v2 74,0% GPT-5.5 yang dipublikasikan pada 512K–1M patut diperhatikan.
Harga dan ketersediaan
Ada kesenjangan harga. Fable 5 berharga $10 per satu juta token input dan $50 per satu juta token output. Gemini 3.5 Flash berharga masing-masing $1,50 dan $9,00, dan juga memiliki input cache seharga $0,15 per juta, yaitu diskon 90%. Gemini 3.5 Flash kira-kira enam hingga tujuh kali lebih murah pada input dan lima hingga enam kali lebih murah pada output.
Namun cerita harga tidak pernah sesederhana itu: Pertama, ketahuilah bahwa Flash adalah model penalaran yang token berpikirnya ditagih pada tarif output, jadi beban kerja penalaran dengan upaya tinggi dapat mengonsumsi token output yang jauh lebih banyak daripada yang disiratkan prompt. Uji tolok beban kerja Anda sendiri sebelum menganggap Flash murah untuk kasus penggunaan Anda. Juga, ketika pengklasifikasi Fable 5 mengalihkan kueri, Anda ditagih pada tarif Opus 4.8 ($5/$25), bukan tarif Fable 5. Meski ini mungkin hanya faktor mitigasi kecil pada biaya.
Ketersediaan adalah asimetri lainnya. Gemini 3.5 Flash langsung tersedia umum sejak hari pertama di aplikasi Gemini, Google AI Studio, Antigravity, Gemini API, dan AI Mode di Penelusuran. Akses berlangganan Fable 5 memiliki tebing: pelanggan Pro, Max, Team, dan Enterprise hanya memiliki akses gratis hingga 22 Juni 2026, yang segera tiba, setelah itu kredit penggunaan diperlukan di atas langganan yang ada.
Kapan Memilih Claude Fable 5 vs Gemini 3.5 Flash
Keputusan bermuara pada dua variabel:
- apakah tugas Anda cukup sulit untuk membutuhkan batas kemampuan Fable 5
- apakah kecepatan dan biaya per panggilan mendominasi ekonomi Anda
| Kasus penggunaan | Rekomendasi | Alasan |
|---|---|---|
| Rekayasa perangkat lunak tingkat repositori pada basis kode kompleks | Claude Fable 5 | 80,3% vs 55,1% pada SWE-Bench Pro adalah selisih 25 poin yang mencerminkan perbedaan kemampuan nyata |
| Pipa agentik berkapasitas tinggi dan sensitif terhadap latensi | Gemini 3.5 Flash | ~280+ tok/det keluaran, eksekusi sub-agen paralel, dan biaya token 5–7x lebih rendah terakumulasi di ribuan panggilan |
| Produk konsumen interaktif dan UX chat | Gemini 3.5 Flash | Keunggulan kecepatan 4x adalah fitur produk; latensi dan harga Fable 5 tidak cocok untuk penggunaan konsumen berfrekuensi tinggi |
| Keuangan kompleks dan pekerjaan berbasis pengetahuan | Claude Fable 5 | Memimpin Hebbia's Finance Benchmark dan Humanity's Last Exam dengan tools (64,5%) |
| Orkestrasi multi-tool di banyak layanan | Gemini 3.5 Flash | 83,6% pada MCP Atlas adalah skor koordinasi multi-tool terkuat yang dipublikasikan di antara model frontier |
| Pipa multimodal (input video, audio, PDF) | Gemini 3.5 Flash | Input multimodal native mencakup teks, gambar, audio, video, dan PDF |
| Industri teregulasi yang memerlukan zero data retention | Gemini 3.5 Flash | Retensi wajib 30 hari Fable 5 adalah penghalang keras bagi sebagian perusahaan |
Pilih Claude Fable 5 jika...
- Kasus penggunaan utama Anda adalah rekayasa perangkat lunak tingkat repositori
- Anda memerlukan batas kemampuan tertinggi untuk pekerjaan analitis kompleks — keuangan, penalaran multidisipliner, tugas agentik berjangka panjang — dan latensi bukan prioritas utama.
- Pekerjaan Anda tidak berdekatan dengan keamanan siber, biologi, atau kimia, sehingga pengalihan oleh pengklasifikasi kecil kemungkinannya memengaruhi sesi Anda.
Pilih Gemini 3.5 Flash jika...
- Ekonomi Anda didorong oleh volume: ribuan panggilan per hari di mana perbedaan biaya terakumulasi menjadi pengeluaran beberapa ordo besaran.
- Kecepatan adalah persyaratan produk — UX interaktif, agen waktu nyata, atau pipa di mana waktu dinding di banyak panggilan tool lebih penting daripada kedalaman per langkah.
- Anda memerlukan input multimodal luas (video, audio, PDF) dalam satu model.
- Kebijakan data perusahaan Anda tidak dapat mengakomodasi retensi wajib 30 hari Fable 5, atau Anda memerlukan model yang tidak akan diam-diam berganti di tengah pipa.
Pemikiran Akhir
Ini sebenarnya bukan perbandingan apel dengan apel. Fable 5 dan Gemini 3.5 Flash menempati posisi berbeda di pasar: yang satu adalah batas kemampuan dengan sedikit friksi, yang lain adalah frontier efisiensi dengan batas yang lebih rendah.
Jika kemampuan mentah pada tugas sulit adalah satu-satunya variabel Anda, Fable 5 menang telak. Namun proposisi nilai Flash bukanlah "hampir sama bagusnya dengan harga lebih murah." Saya tidak ingin meremehkannya: Ini adalah kecerdasan nyaris-frontier yang disajikan cukup cepat dan cukup murah untuk digunakan di tempat-tempat di mana Fable 5 tidak pernah layak secara ekonomis.

Saya penulis dan editor data science dengan kontribusi pada artikel riset di jurnal ilmiah. Saya sangat tertarik pada aljabar linear, statistika, R, dan sejenisnya. Saya juga cukup sering bermain catur!
