Lewati ke konten utama

Gemini 3.5 Flash: Model Agen Tercepat dari Google

Google meluncurkan Gemini 3.5 Flash di I/O 2026, sebuah model yang mengungguli Gemini 3.1 Pro pada benchmark agen dan pengkodean sekaligus berjalan empat kali lebih cepat dari para pesaing.
Diperbarui 19 Mei 2026  · 8 mnt baca

Google mengumumkan Gemini 3.5 Flash di I/O 2026 pada 19 Mei, sebuah model yang mengungguli Gemini 3.1 Pro pada benchmark agen dan pengkodean sekaligus berjalan empat kali lebih cepat dibanding model frontier lain di tingkat yang sama.

Rilis ini hadir saat fokus kompetitif industri AI beralih sepenuhnya ke performa agen. Agen pengkodean, otomasi alur kerja multi-langkah, dan eksekusi tugas berjangka panjang menjadi medan pertempuran utama, dan Google memosisikan 3.5 Flash sebagai jawabannya untuk momen tersebut.

Bagi berbagai profesional, termasuk data scientist, insinyur ML, dan developer, ini penting karena 3.5 Flash kini (atau akan segera) menjadi model default di aplikasi Gemini dan AI Mode di Search, dan tersedia hari ini melalui Gemini API. Dalam artikel ini, saya akan membahas apa yang diumumkan, hal-hal yang menonjol, angka benchmark, dan implikasinya bagi pekerjaan Anda.

Apa yang Baru di Gemini 3.5 Flash

Klaim utama untuk Gemii 3.5 Flash adalah kecepatan yang dipadukan dengan performa setara frontier. Google menyatakan 3.5 Flash empat kali lebih cepat dalam token keluaran per detik dibanding model frontier lainnya, sekaligus mengungguli Gemini 3.1 Pro pada benchmark yang paling penting untuk pekerjaan agen.

Di Terminal-Bench 2.1, skornya 76,2%. Di GDPval-AA, mencapai 1.656 Elo. Di MCP Atlas, menembus 83,6%. Untuk pemahaman multimodal, skornya 84,2% pada CharXiv Reasoning.

Singkatnya, angka-angka ini menunjukkan bahwa aturan lama ‘cepat, murah, atau cerdas; pilih dua’ di AI makin kurang relevan. Kita mendapatkan model ringan yang mampu menangani alur kerja agen multi-langkah yang kompleks tanpa latensi besar.

Google mengatakan model ini akan tersedia secara umum hari ini di Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform, dan Gemini Enterprise. Model ini juga menjadi model default baru di aplikasi Gemini dan AI Mode di Search secara global.

Google juga mengumumkan bahwa Gemini 3.5 Pro sedang dikembangkan, sudah digunakan secara internal, dan diperkirakan akan diluncurkan bulan depan. Rilis 3.5 Flash adalah langkah pembuka dalam apa yang disebut Google sebagai keluarga model baru yang dibangun untuk eksekusi agen.

Latar Belakang Gemini 3.5

Seri Gemini 3 meneguhkan posisi Google saat ini dalam perlombaan model frontier. Gemini 3.1 Pro, dirilis pada Februari 2026, memimpin Artificial Analysis Intelligence Index saat diluncurkan dan meraih 77,1% pada ARC-AGI-2, lebih dari dua kali lipat Gemini 3 Pro yang 31,1% pada benchmark tersebut.

Seperti yang kami bahas dalam perbandingan GPT-5.5 vs Gemini 3.1 Pro, kekuatan Gemini 3.1 Pro ada pada penalaran visual yang kompleks dan tugas multimodal.

Penamaan Flash dalam keluarga Gemini selalu menandakan model yang dioptimalkan untuk kecepatan. Yang berbeda pada 3.5 Flash adalah Google mengklaim kecerdasan setara frontier pada kecepatan Flash, bukan kompromi kualitas. Indeks Artificial Analysis menempatkan 3.5 Flash di kuadran kanan-atas (menurut Google), yang berarti kecerdasan tinggi dan kecepatan keluaran tinggi secara bersamaan.

Kerangka Antigravity, kerangka kerja Google untuk menerapkan subagen kolaboratif, menjadi pusat cara 3.5 Flash diposisikan. Ini bukan sekadar model mandiri, melainkan komponen dalam arsitektur multi-agen yang dibangun Google bersamaan dengan modelnya.

Fitur Utama Gemini 3.5

Berikut ringkasan informasi paling menarik dari pengumuman tersebut.

Performa benchmark

Klaim benchmark Google untuk 3.5 Flash spesifik dan layak ditelaah langsung. Model ini mengungguli Gemini 3.1 Pro pada hal-hal berikut:

  • Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro di-benchmark pada Terminal-Bench 2.0 dengan 68,5%, menurut liputan kami sebelumnya)
  • GDPval-AA: 1.656 Elo (Claude Opus 4.7 memimpin benchmark ini pada 1.753 Elo saat diluncurkan, menurut ulasan Claude Opus 4.7 vs Gemini 3.1 Pro kami)
  • MCP Atlas: 83,6% (Gemini 3.1 Pro meraih 73,9% pada MCP Atlas dalam pengujian kami sebelumnya)
  • CharXiv Reasoning: 84,2% untuk pemahaman multimodal

Klaim kecepatan juga menonjol: empat kali lebih cepat dalam token keluaran per detik dibanding model frontier lain. Google tidak merinci model pembanding dalam catatan risetnya, jadi anggap angka tersebut sebagai indikatif, bukan perbandingan langsung yang presisi.

Arsitektur agen dan Antigravity

3.5 Flash dirancang untuk bekerja dengan kerangka Antigravity, kerangka Google untuk menjalankan subagen kolaboratif. Dengan Antigravity, model dapat menerapkan banyak subagen secara paralel, mengeksekusi alur kerja multi-langkah, dan mempertahankan performa pada tugas berjangka panjang.

Contoh dari Google termasuk mensintesis makalah AlphaZero dan membuat gim yang sepenuhnya dapat dimainkan dalam enam jam menggunakan dua agen, serta mentransformasi basis kode lama ke Next.js. Ini bukan demo mainan. Ini mencerminkan jenis tugas developer multi-hari yang kini diminta untuk ditangani sistem agen.

Penerapan nyata di perusahaan

Beberapa perusahaan sudah menjalankan 3.5 Flash di produksi atau pilot. Kasus penggunaan spesifiknya patut dicatat karena menggambarkan di mana kekuatan agen model ini diterapkan:

  • Shopify: Menjalankan subagen secara paralel untuk menganalisis data kompleks dalam rentang waktu panjang guna memproyeksikan pertumbuhan merchant
  • Macquarie Bank: Uji coba onboarding pelanggan dengan menalar atas dokumen 100+ halaman dengan latensi rendah
  • Salesforce: Integrasi ke Agentforce untuk otomasi tugas perusahaan multi-subagen dengan pemanggilan alat multi-giliran
  • Xero: Menerapkan agen untuk mengelola alur kerja multi-minggu, termasuk penyiapan formulir pajak 1099 untuk usaha kecil
  • Databricks: Menggunakan alur kerja agen untuk memantau informasi real-time, mendiagnosis masalah, dan mengusulkan solusi di atas dataset besar
  • Ramp: Meningkatkan akurasi OCR pada faktur kompleks melalui pemahaman multimodal yang dipadukan dengan penalaran atas pola historis

Gemini Spark dan ketersediaan konsumen

3.5 Flash juga menjadi model yang mendukung Gemini Spark, agen AI personal baru dari Google yang berjalan 24/7 dan dapat bertindak atas nama pengguna. Google mulai meluncurkan Spark ke penguji tepercaya sekarang, dengan Beta yang direncanakan bagi pelanggan Google AI Ultra di AS pada pekan setelah pengumuman I/O.

Model ini tersedia hari ini bagi miliaran pengguna secara global melalui aplikasi Gemini dan AI Mode di Search, menjadikannya salah satu peluncuran konsumen dan developer paling luas yang pernah dilakukan Google untuk model Gemini.

Keamanan dan perlindungan

Google mengatakan 3.5 Flash dikembangkan di bawah Frontier Safety Framework, dengan penguatan perlindungan siber dan CBRN. Perusahaan menggunakan alat interpretabilitas yang memeriksa penalaran internal model sebelum merespons, yang dimaksudkan untuk mengurangi keluaran berbahaya dan penolakan keliru pada kueri yang aman.

Gemini 3.5 bagi Praktisi Data dan AI

Dampak praktis paling langsung adalah 3.5 Flash akan segera tersedia melalui Gemini API di Google AI Studio. Jika Anda membangun pipeline agen, kombinasi skor MCP Atlas (83,6%) dan kerangka multi-agen Antigravity menjadikannya layak diuji dibandingkan apa pun yang saat ini Anda gunakan.

Skor GDPval-AA sebesar 1.656 Elo berada di bawah 1.753 Elo milik Claude Opus 4.7 dari ulasan kami sebelumnya, tetapi keunggulan kecepatan 3.5 Flash bisa jadi lebih penting tergantung persyaratan latensi Anda.

Bagi tim yang menjalankan alur kerja berjangka panjang, penerapan Xero dan Shopify adalah sinyal paling informatif. Alur kerja multi-minggu yang dipadatkan menjadi proses agen otomatis adalah kasus penggunaan yang dioptimalkan Google, dan kerangka Antigravity adalah lapisan infrastruktur yang memungkinkannya. Jika Anda belum familier dengan pola orkestrasi multi-agen, ini saat yang tepat untuk mengejar ketertinggalan.

Satu hal yang perlu saya cermati: Google mengatakan 3.5 Flash berbiaya kurang dari setengah harga model frontier lain untuk tugas sebanding. Klaim itu sangat bergantung pada beban kerja spesifik Anda, tetapi jika terbukti di praktik, ini mengubah ekonomi pengoperasian sistem agen dalam skala besar. Model 3.5 Pro, yang diperkirakan bulan depan, akan menjadi titik perbandingan yang lebih menarik bagi tim yang melakukan pekerjaan penalaran terberat.

Pikiran Akhir

Gemini 3.5 Flash menunjukkan bahwa Google berniat bersaing pada kedua ujung kurva performa-kecepatan, bukan hanya di level flagship. Mengungguli Gemini 3.1 Pro pada benchmark agen sambil berjalan pada kecepatan Flash adalah pergeseran yang bermakna, dan penerapan perusahaan di Shopify, Macquarie, dan Salesforce menyiratkan model ini andal di luar benchmark terkontrol.

Gambaran lebih luasnya adalah Google bertaruh besar pada infrastruktur agen, dengan Antigravity, Gemini Spark, dan 3.5 Flash yang semuanya mengarah ke tujuan yang sama. Apakah taruhan itu berhasil bergantung pada bagaimana performa 3.5 Pro saat hadir bulan depan, dan bagaimana kerangka Antigravity dibandingkan kerangka multi-agen pesaing dalam alur kerja developer nyata.

Jika Anda ingin mempercepat pemahaman tentang konsep AI agen dan cara membangun dengan model seperti ini, saya sarankan melihat AI Agent Fundamentals skill track di DataCamp.


Matt Crabtree's photo
Author
Matt Crabtree
LinkedIn

Editor senior di bidang AI dan edtech. Berkomitmen mengeksplorasi tren data dan AI.  

Topik

Kursus Teratas di DataCamp

Program

Dasar-Dasar Agen Kecerdasan Buatan

6 Hr
Temukan bagaimana agen kecerdasan buatan (AI) dapat mengubah cara Anda bekerja dan memberikan nilai tambah bagi organisasi Anda!
Lihat DetailRight Arrow
Mulai Kursus
Lihat Lebih BanyakRight Arrow
Terkait

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.
Javier Canales Luna's photo

Javier Canales Luna

12 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.
Dario Radečić's photo

Dario Radečić

15 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.
Hugo Bowne-Anderson's photo

Hugo Bowne-Anderson

13 mnt

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.
David Woods's photo

David Woods

13 mnt

Lihat Lebih BanyakLihat Lebih Banyak