Claude Fable 5 vs. Gemini 3.5 Flash: Tolok Ukur, Harga, dan Lainnya

Claude Fable 5 unggul dalam kemampuan mentah, tetapi Gemini 3.5 Flash menghadirkan kinerja nyaris-frontier dengan sebagian kecil biaya dan beberapa kali lipat kecepatan. Terus baca untuk mempelajari lebih lanjut.

Diperbarui 11 Jun 2026 · 9 mnt baca

Jelajahi dengan AI

Buka di ChatGPT Buka di Claude Buka di Perplexity

Jika Anda memilih antara Claude Fable 5 (yang, peringatan dini, baru diluncurkan dua hari lalu) dan Gemini 3.5 Flash, sebenarnya Anda sedang memilih antara dua filosofi berbeda tentang seperti apa model terdepan seharusnya.

Claude Fable 5 adalah batas kemampuan Anthropic: model terkuat yang tersedia publik pada sebagian besar tolok ukur, dihargai sesuai pada $10/$50 per satu juta token, dan dibalut dalam sistem pengklasifikasi yang dapat mengalihkan kueri sensitif ke model lain di tengah sesi.

Gemini 3.5 Flash adalah taruhan Google pada titik manis kecepatan-biaya-kecerdasan: model kelas "Flash" yang mengungguli Gemini 3.1 Pro milik Google yang lebih besar pada tolok ukur pengkodean dan agentik. Model ini berjalan kira-kira 4x lebih cepat daripada model frontier sebanding, dan biayanya $1,50/$9 per satu juta token — jadi, jauh lebih murah.

Dalam artikel ini, saya akan membandingkan kedua model dalam lima dimensi:

kinerja pengkodean dan agentik
kecepatan dan latensi
pekerjaan konteks panjang
harga

Jika Anda menimbang Fable 5 dibandingkan produk andalan OpenAI, ketahuilah bahwa kami memiliki artikel terpisah: Claude Fable 5 vs GPT-5.5.

Kami membuat pembaca tetap mengetahui kabar terbaru AI lewat The Median, buletin gratis setiap Jumat yang merangkum cerita-cerita kunci pekan ini. Jadi klik tautan di atas, berlangganan, dan tetap tajam hanya dalam beberapa menit setiap minggu.

Apa Itu Claude Fable 5?

Claude Fable 5 adalah model kelas Mythos pertama Anthropic yang tersedia untuk penggunaan umum. Fable 5 berbagi model dasar dengan Claude Mythos 5, tetapi hadir dengan pengklasifikasi keamanan aktif: sebuah probe memantau aktivasi internal di seluruh trafik, dan permintaan yang ditandai ditingkatkan ke pengklasifikasi LLM terlatih. Permintaan yang diblokir dialihkan ke Claude Opus 4.8.

Fable 5 adalah yang terdepan pada hampir semua tolok ukur yang diuji, dan benar-benar sangat kuat dalam rekayasa perangkat lunak, pekerjaan berbasis pengetahuan, visi, dan tugas agentik berjangka panjang. Lebih dari itu, semakin panjang dan kompleks tugasnya, semakin besar keunggulannya dibanding model Claude sebelumnya.

Apa Itu Gemini 3.5 Flash?

Gemini 3.5 Flash adalah rilis bulan Mei dari Google DeepMind, diumumkan di Google I/O 2026 sebagai model pertama dalam keluarga Gemini 3.5 yang baru. Terlepas dari merek "Flash", ini bukan model anggaran dalam arti tradisional: model ini mengungguli Gemini 3.1 Pro milik Google yang lebih besar pada rangkaian pengkodean dan agentik sambil berjalan sekitar 4x lebih cepat daripada model frontier sebanding.

Gemini 3.5 Flash adalah model penalaran dengan parameter upaya berpikir yang dapat dikonfigurasi (minimal, low, medium, high). (Bawaannya medium, kalau Anda penasaran.) Model ini mendukung jendela konteks 1 juta token, input multimodal (teks, gambar, audio, video, PDF), dan keluaran sekitar 280+ token per detik. Google menjadikannya model default di aplikasi Gemini dan AI Mode di Penelusuran pada hari peluncuran. Kami memperkirakan Gemini 3.5 Pro akan menyusul kapan saja.

Satu hal yang patut dicatat: 3.5 Flash kira-kira 3x harga per token dibanding pendahulunya, Gemini 3 Flash ($0,50/$3,00). Jadi, murah relatif terhadap model andalan, bukan relatif terhadap garis keturunannya sendiri. Dan karena token berpikir ditagih pada tarif keluaran, beban kerja yang berat pada penalaran di upaya tinggi bisa berbiaya lebih besar daripada yang disiratkan harga daftar. Ini sesuatu yang perlu Anda sadari.

Claude Fable 5 vs. Gemini 3.5 Flash: Perbandingan Langsung

Berikut ringkasan singkat sebelum kita masuk ke detailnya. Saya membuat dua tabel: satu untuk hasil tolok ukur dan satu lagi untuk pertimbangan praktis seputar harga, kecepatan, dan akses.

Hasil tolok ukur

Tolok ukur	Claude Fable 5	Gemini 3.5 Flash
SWE-Bench Pro	80,3%	55,1% (Publik)
Terminal-Bench 2.1	88,0%*	76,2%
Humanity's Last Exam (dengan tools)	64,5%	Tertinggal dari Gemini 3.1 Pro (tidak langsung sebanding)
OSWorld-Verified	85,0%	Tidak dipublikasikan
MCP Atlas (koordinasi multi-tool)	Tidak dipublikasikan	83,6%

Seperti terlihat, Claude Fable 5 menang di semua perbandingan tolok ukur langsung di mana data mudah tersedia untuk membandingkan keduanya.

Harga, kecepatan, dan akses

Saya sudah sebutkan sebelumnya: Harga jelas lebih baik (jauh lebih baik) untuk Gemini 3.5 Flash.

Fitur	Claude Fable 5	Gemini 3.5 Flash
Harga input API (per 1M token)	$10	$1,50
Harga output API (per 1M token)	$50	$9,00
Harga input cache	—	$0,15 per 1M (diskon 90%)
Kecepatan output	Latensi standar model frontier	~280+ token/detik, ~4x lebih cepat dari rekan frontier
Jendela konteks	Tugas agentik multi-juta token jangka panjang diklaim; tidak ada MRCR yang dipublikasikan pada 512K+	1M token (batas input 1.048.576)
Ketersediaan umum	Terbatas (kredit penggunaan diperlukan setelah 22 Juni)	Ya (aplikasi Gemini, AI Studio, Antigravity, API, AI Mode di Penelusuran)

Kinerja pengkodean dan agentik

Kinerja pada pekerjaan pengkodean dan agentik layak dibahas secara terpisah karena di sinilah kesenjangan kemampuan paling besar.

Pada SWE-Bench Pro, seperti yang terlihat di tabel pertama, Fable 5 mencetak 80,3% versus 55,1% Gemini 3.5 Flash pada set publik. Itu selisih 25 poin. Untuk rekayasa tingkat repositori pada basis kode yang kompleks, ini perbedaan nyata. Kemungkinan besar, Fable 5 dapat secara otonom menyelesaikan isu GitHub nyata sebagian besar waktu, dan saya tidak yakin hal yang sama dapat dikatakan untuk Gemini 3.5 Flash.

Di mana Gemini 3.5 Flash memberikan perlawanan adalah dalam throughput agentik alih-alih kedalaman agentik. Flash secara eksplisit dioptimalkan untuk loop eksekusi paralel, penerapan sub-agen, dan iterasi cepat. Skornya 83,6% pada MCP Atlas — tolok ukur koordinasi multi-tool di mana ia mengalahkan 75,3% GPT-5.5 — menunjukkan model yang dibangun untuk mengorkestrasi banyak panggilan tool yang cepat daripada mempertahankan satu rantai penalaran yang panjang dan dalam. Google juga melaporkan peningkatan efisiensi token yang substansial dalam skenario agentik dunia nyata dibanding versi Flash sebelumnya.

Cara berpikir yang tepat: Jika agen Anda perlu berpikir keras tentang sejumlah kecil langkah sulit (refactor kompleks, perubahan arsitektur, debugging pelik), Fable 5 unggul. Jika agen Anda perlu mengeksekusi banyak langkah yang cepat dan tingkat kesulitannya sedang secara paralel (pipa scraping-dan-meringkas, orkestrasi multi-tool, triase volume tinggi), profil kecepatan dan biaya Flash sangat masuk akal.

Kecepatan dan latensi

Gemini 3.5 Flash menghasilkan keluaran sekitar 280+ token per detik — beberapa kali lebih cepat daripada produk andalan frontier tipikal.

Fable 5, di sisi lain, tidak diposisikan sebagai model cepat. Ia diposisikan sebagai model yang Anda gunakan ketika tugasnya cukup sulit sehingga Anda bersedia menunggu jawabannya.

Kinerja konteks panjang

Gemini 3.5 Flash mendukung sekitar 1 juta token konteks input, dan lini Gemini secara historis kuat dalam pengambilan konteks panjang. Namun, Flash dilaporkan tertinggal dari Gemini 3.1 Pro milik Google pada MRCR v2.

Anthropic mengklaim Fable 5 tetap fokus di sepanjang jutaan token dalam tugas jangka panjang dan meningkatkan keluaran menggunakan catatannya sendiri. Namun Anthropic belum memublikasikan skor bergaya MRCR pada rentang 512K–1M, sehingga tidak mungkin melakukan perbandingan setara.

Untuk telaah dokumen sejuta token, tidak ada model yang memiliki keunggulan publik yang tegas di sini. Jika keandalan konteks panjang adalah variabel terpenting Anda, MRCR v2 74,0% GPT-5.5 yang dipublikasikan pada 512K–1M patut diperhatikan.

Harga dan ketersediaan

Ada kesenjangan harga. Fable 5 berharga $10 per satu juta token input dan $50 per satu juta token output. Gemini 3.5 Flash berharga masing-masing $1,50 dan $9,00, dan juga memiliki input cache seharga $0,15 per juta, yaitu diskon 90%. Gemini 3.5 Flash kira-kira enam hingga tujuh kali lebih murah pada input dan lima hingga enam kali lebih murah pada output.

Namun cerita harga tidak pernah sesederhana itu: Pertama, ketahuilah bahwa Flash adalah model penalaran yang token berpikirnya ditagih pada tarif output, jadi beban kerja penalaran dengan upaya tinggi dapat mengonsumsi token output yang jauh lebih banyak daripada yang disiratkan prompt. Uji tolok beban kerja Anda sendiri sebelum menganggap Flash murah untuk kasus penggunaan Anda. Juga, ketika pengklasifikasi Fable 5 mengalihkan kueri, Anda ditagih pada tarif Opus 4.8 ($5/$25), bukan tarif Fable 5. Meski ini mungkin hanya faktor mitigasi kecil pada biaya.

Ketersediaan adalah asimetri lainnya. Gemini 3.5 Flash langsung tersedia umum sejak hari pertama di aplikasi Gemini, Google AI Studio, Antigravity, Gemini API, dan AI Mode di Penelusuran. Akses berlangganan Fable 5 memiliki tebing: pelanggan Pro, Max, Team, dan Enterprise hanya memiliki akses gratis hingga 22 Juni 2026, yang segera tiba, setelah itu kredit penggunaan diperlukan di atas langganan yang ada.

Kapan Memilih Claude Fable 5 vs Gemini 3.5 Flash

Keputusan bermuara pada dua variabel:

apakah tugas Anda cukup sulit untuk membutuhkan batas kemampuan Fable 5
apakah kecepatan dan biaya per panggilan mendominasi ekonomi Anda

Kasus penggunaan	Rekomendasi	Alasan
Rekayasa perangkat lunak tingkat repositori pada basis kode kompleks	Claude Fable 5	80,3% vs 55,1% pada SWE-Bench Pro adalah selisih 25 poin yang mencerminkan perbedaan kemampuan nyata
Pipa agentik berkapasitas tinggi dan sensitif terhadap latensi	Gemini 3.5 Flash	~280+ tok/det keluaran, eksekusi sub-agen paralel, dan biaya token 5–7x lebih rendah terakumulasi di ribuan panggilan
Produk konsumen interaktif dan UX chat	Gemini 3.5 Flash	Keunggulan kecepatan 4x adalah fitur produk; latensi dan harga Fable 5 tidak cocok untuk penggunaan konsumen berfrekuensi tinggi
Keuangan kompleks dan pekerjaan berbasis pengetahuan	Claude Fable 5	Memimpin Hebbia's Finance Benchmark dan Humanity's Last Exam dengan tools (64,5%)
Orkestrasi multi-tool di banyak layanan	Gemini 3.5 Flash	83,6% pada MCP Atlas adalah skor koordinasi multi-tool terkuat yang dipublikasikan di antara model frontier
Pipa multimodal (input video, audio, PDF)	Gemini 3.5 Flash	Input multimodal native mencakup teks, gambar, audio, video, dan PDF
Industri teregulasi yang memerlukan zero data retention	Gemini 3.5 Flash	Retensi wajib 30 hari Fable 5 adalah penghalang keras bagi sebagian perusahaan

Pilih Claude Fable 5 jika...

Kasus penggunaan utama Anda adalah rekayasa perangkat lunak tingkat repositori
Anda memerlukan batas kemampuan tertinggi untuk pekerjaan analitis kompleks — keuangan, penalaran multidisipliner, tugas agentik berjangka panjang — dan latensi bukan prioritas utama.
Pekerjaan Anda tidak berdekatan dengan keamanan siber, biologi, atau kimia, sehingga pengalihan oleh pengklasifikasi kecil kemungkinannya memengaruhi sesi Anda.

Pilih Gemini 3.5 Flash jika...

Ekonomi Anda didorong oleh volume: ribuan panggilan per hari di mana perbedaan biaya terakumulasi menjadi pengeluaran beberapa ordo besaran.
Kecepatan adalah persyaratan produk — UX interaktif, agen waktu nyata, atau pipa di mana waktu dinding di banyak panggilan tool lebih penting daripada kedalaman per langkah.
Anda memerlukan input multimodal luas (video, audio, PDF) dalam satu model.
Kebijakan data perusahaan Anda tidak dapat mengakomodasi retensi wajib 30 hari Fable 5, atau Anda memerlukan model yang tidak akan diam-diam berganti di tengah pipa.

Pemikiran Akhir

Ini sebenarnya bukan perbandingan apel dengan apel. Fable 5 dan Gemini 3.5 Flash menempati posisi berbeda di pasar: yang satu adalah batas kemampuan dengan sedikit friksi, yang lain adalah frontier efisiensi dengan batas yang lebih rendah.

Jika kemampuan mentah pada tugas sulit adalah satu-satunya variabel Anda, Fable 5 menang telak. Namun proposisi nilai Flash bukanlah "hampir sama bagusnya dengan harga lebih murah." Saya tidak ingin meremehkannya: Ini adalah kecerdasan nyaris-frontier yang disajikan cukup cepat dan cukup murah untuk digunakan di tempat-tempat di mana Fable 5 tidak pernah layak secara ekonomis.

Author

Josef Waples

Topik

Kecerdasan Buatan

Belajar bersama DataCamp

Kursus

Konsep Large Language Models (LLM)

2 Hr

104K

Temukan potensi penuh dari LLMs melalui kursus konseptual kami yang mencakup aplikasi LLMs, metode pelatihan, pertimbangan etika, dan penelitian terbaru.

Lihat Detail

Mulai Kursus

Kursus

Pengantar Model Claude

3 Hr

12.5K

Pelajari cara bekerja dengan Claude menggunakan Anthropic API untuk menyelesaikan tugas dunia nyata dan membangun aplikasi berbasis AI.

Lihat Detail

Mulai Kursus

Kursus

AI Praktis dengan Google Gemini dan NotebookLM

2 Hr

8.1K

Gunakan Master Gemini dan NotebookLM untuk mengotomatisasi tugas, meningkatkan produktivitas, dan bekerja lebih cerdas di ekosistem AI Google.

Lihat Detail

Mulai Kursus

Lihat Lebih Banyak

Terkait

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.

Javier Canales Luna

14 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.

Hugo Bowne-Anderson

13 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.

Dario Radečić

15 mnt

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.

David Woods

13 mnt

Lihat Lebih Banyak Lihat Lebih Banyak

Apa Itu Claude Fable 5?

Apa Itu Gemini 3.5 Flash?

Claude Fable 5 vs. Gemini 3.5 Flash: Perbandingan Langsung

Hasil tolok ukur

Harga, kecepatan, dan akses

Kinerja pengkodean dan agentik

Kecepatan dan latensi

Kinerja konteks panjang

Harga dan ketersediaan

Kapan Memilih Claude Fable 5 vs Gemini 3.5 Flash

Pilih Claude Fable 5 jika...

Pilih Gemini 3.5 Flash jika...

Pemikiran Akhir

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Spaghetti Plot dan Jalur Badai

40 Pertanyaan Wawancara DBMS Teratas di 2026

Tutorial Korelasi di R

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Konsep Large Language Models (LLM)

Pengantar Model Claude

AI Praktis dengan Google Gemini dan NotebookLM

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Spaghetti Plot dan Jalur Badai

40 Pertanyaan Wawancara DBMS Teratas di 2026

Tutorial Korelasi di R

Konsep Large Language Models (LLM)