Lewati ke konten utama

Google I/O 2026: Awal Era Agentic Gemini

Dari Gemini 3.5 Flash dan Gemini Omni hingga Antigravity 2.0 dan Gemini Spark, berikut hal terpenting dari keynote Google I/O 2026 yang berfokus pada agen.
Diperbarui 20 Mei 2026  · 12 mnt baca

Benang merah dari hampir setiap pengumuman pada hari pertama konferensi Google I/O 2026 sama: agen. Bukan chatbot, bukan asisten, melainkan agen persisten yang mengeksekusi tugas di latar belakang dan terintegrasi di seluruh tumpukan produk Google. CEO Sundar Pichai secara eksplisit menyebutnya sebagai "era agentic Gemini," dan pengumuman yang ada mengukuhkan kerangka itu.

Google juga menanggapi langganan Claude Max dari Anthropic dan ChatGPT Pro dari OpenAI dengan memperkenalkan tingkat baru Google AI Ultra di I/O, yang memasang harga yang sama sebesar $100/bulan dan membatasi akses ke beberapa fitur agentic yang dibahas di bawah.

Dalam artikel ini, saya akan membahas pengumuman yang paling penting bagi praktisi AI dan pengembang. Saya fokus pada pembaruan yang sudah tersedia sekarang atau diperkirakan hadir segera. 

Gemini 3.5 Flash

Gemini 3.5 Flash adalah rilis model utama dari I/O 2026. Model ini melampaui Gemini 3.1 Pro pada tolok ukur agentic dan pengodean, sementara Google mengklaim model ini berjalan 4x lebih cepat pada token keluaran per detik dibandingkan model frontier lainnya. Meskipun kami belum dapat mengonfirmasi itu, ini jelas klaim yang berani.

Dari sisi tolok ukur, lonjakan kinerja terlihat jelas, terutama pada MCP Atlas, CharXiV Reasoning, dan Finance Agent v2, yang semuanya dipimpin oleh Gemini 3.5 Flash. Secara keseluruhan, 3.5 Flash tampaknya kompetitif dengan Claude Opus 4.7 dan GPT-5.5.

Tolok ukur

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Aspek biaya patut dicatat di sini. Google mengklaim bahwa perusahaan yang memproses sekitar 1 triliun token per hari dapat menghemat lebih dari $1 miliar per tahun dengan mengalihkan 80% beban kerja dari model frontier lain ke 3.5 Flash. Ini merupakan penawaran langsung bagi pelanggan enterprise OpenAI dan Anthropic. Gemini 3.5 Flash tersedia hari ini melalui Gemini API, Google AI Studio, dan aplikasi Gemini. Gemini 3.5 Pro sudah digunakan secara internal dan diperkirakan hadir bulan depan.

Untuk detail lebih lanjut, saya merekomendasikan membaca artikel Gemini 3.5 Flash kami, di mana kami membahas model baru ini lebih dalam.

Gemini Omni

Gemini Omni adalah model media generatif multimodal asli dari Google, mampu menerima kombinasi teks, gambar, audio, dan video sebagai masukan dan menghasilkan keluaran video. Model pertama di keluarga ini, Gemini Omni Flash, tersedia hari ini di aplikasi Gemini, Google Flow, dan YouTube Shorts.

Poin arsitektural kunci adalah bahwa Omni menggabungkan tumpukan yang sebelumnya terpisah (Veo untuk video, Imagen untuk gambar, sistem audio terpisah) menjadi satu model. Artinya, penyuntingan menjadi lebih koheren dan lebih sedikit artefak pipa saat bekerja lintas modalitas. Google belum memublikasikan tolok ukur numerik untuk Omni saat peluncuran, jadi evaluasi independen masih menunggu. Akses API untuk pengembang dan pelanggan enterprise akan hadir dalam beberapa minggu setelah I/O.

Kami sudah mengujinya dan menuliskannya secara lengkap dalam artikel Gemini Omni kami. Hasil generasi video pertama masih naik-turun (setidaknya mengingat standar tinggi yang ditetapkan alat seperti Seedance 2.0), tetapi Gemini Omni Pro yang lebih bertenaga diperkirakan segera hadir.

Antigravity 2.0

Antigravity adalah platform pengembangan yang mengedepankan agen dari Google, dan rilis 2.0 di I/O merupakan perluasan signifikan. Sebelumnya diposisikan sebagai lingkungan pengodean, kini menjadi platform lengkap untuk mengembangkan, menyebarkan, dan mengelola kohort agen AI otonom. Pusatnya adalah aplikasi desktop mandiri baru yang bertindak sebagai hub utama untuk orkestrasi agen, memungkinkan Anda menjalankan banyak agen secara paralel pada tugas berbeda secara simultan.

Ekosistemnya kini memiliki empat permukaan berbeda untuk pengembang:

  • Aplikasi desktop Antigravity 2.0: Mengorkestrasi banyak agen secara paralel dan mendukung tugas latar terjadwal. Terintegrasi dengan Google AI Studio, Android, dan Firebase.
  • Antigravity CLI: Permukaan berbasis terminal untuk membuat dan menjalankan agen tanpa GUI. Google meminta pengguna Gemini CLI bermigrasi ke ini.
  • Antigravity SDK: Akses programatik ke rangkaian agen yang sama yang mendukung produk Google sendiri, dengan dukungan perilaku agen kustom yang dihosting di infrastruktur Anda.
  • Antigravity di Gemini Enterprise Agent Platform: Menghubungkan Antigravity langsung ke proyek Google Cloud untuk beban kerja enterprise.

Ada beberapa fitur baru yang sangat berguna untuk agen inti. Yang terbesar: kini ia dapat memunculkan subagen modular secara dinamis, masing-masing berjalan paralel dengan isolasi ruang kerja dan mewarisi konfigurasi alat serta izin induknya. Operasi jangka panjang berjalan secara asinkron, sehingga tidak lagi memblokir loop agen.

Mirip dengan Claude Code Hooks, JSON Hooks memungkinkan pengguna melampirkan skrip shell kustom pada tahap eksekusi kunci (sebelum/sesudah pemanggilan alat, pemanggilan model, atau pada kondisi berhenti) untuk pencatatan, kustomisasi argumen, atau penyuntikan instruksi. Scheduled Tasks memungkinkan Anda menetapkan prompt berbasis cron untuk menjalankan agen secara berkala seperti ringkasan PR harian atau pemeriksaan deployment per jam, dengan hasil muncul di panel samping untuk alih tugas mulus ke interaksi human-in-the-loop.

Di sisi manajemen, Antigravity memperkenalkan "project" sebagai primitif organisasi yang membatasi pengaturan, sumber daya, dan izin per grup agen, alih-alih mengharuskan izin global terluas untuk semuanya. Panel samping yang diperbarui mendukung pengelompokan percakapan berdasarkan proyek, status, atau kekinian, dengan dukungan Git worktree native bawaan. Tata letak berbasis proyek ini sebanding dengan manajemen ruang kerja multi-jendela milik Cursor dan antrian tugas Codex, tetapi dengan pembatasan izin per proyek yang lebih ketat.

Git worktree native dapat dibuat dengan mudah saat memulai percakapan baru.

Masukan suara melalui model Gemini Audio dan perintah slash baru (/goal untuk run otonom, /grill-me untuk klarifikasi pra-tugas, /schedule untuk prompt cron, /browser untuk penggunaan peramban opsional) melengkapi UX.

Antigravity 2.0 tersedia untuk pengguna mulai hari ini. Paket Google AI Ultra ($100/bulan) mencakup batas penggunaan 5x lebih tinggi di Antigravity dibanding paket Google AI Pro.

Agen Terkelola di Gemini API

Bersamaan dengan Antigravity 2.0, Google mengumumkan Managed Agents di Gemini API, yang menghadirkan kapabilitas agentic langsung ke lapisan API bagi pengembang yang ingin membangun aplikasi berbasis agen tanpa mengelola infrastruktur orkestrasi sendiri. Ini adalah pelengkap di tingkat API untuk pengalaman desktop Antigravity.

Implikasi praktis bagi pengembang adalah Anda kini dapat mendefinisikan perilaku agen, integrasi alat, dan alur kerja multi-langkah melalui Gemini API dan membiarkan infrastruktur Google menangani eksekusinya. Ini berpotensi menjadi pengubah permainan sejati bagi tim yang membangun aplikasi produksi yang memerlukan eksekusi tugas jangka panjang tanpa menyiapkan dan mengelola rangkaian agen mereka sendiri. Akses tersedia melalui Google AI Studio, dan pelanggan enterprise dapat mengaksesnya melalui Gemini Enterprise Agent Platform.

Satu catatan jujur: umpan balik awal pengembang dari peliputan I/O mencatat bahwa dokumentasi untuk alur agen kompleks dan penanganan kesalahan masih minim. Batas laju dan manajemen kuota juga ditandai sebagai titik friksi. Keduanya kemungkinan akan menjadi kurang bermasalah seiring waktu, tetapi patut diketahui sebelum Anda berkomitmen membangun di tumpukan ini.

Gemini Spark

Gemini Spark (jangan disamakan dengan LLM terbaru Meta, Muse Spark) adalah agen AI personal baru dari Google, dan ini yang paling berorientasi konsumen di antara pengumuman agentic. Ia berjalan 24/7 pada mesin virtual khusus di Google Cloud, artinya tidak memerlukan laptop Anda tetap menyala untuk terus bekerja. Spark didukung oleh Gemini 3.5 dan rangkaian Antigravity, yang memberinya kemampuan menangani tugas jangka panjang di latar belakang.

Fitur saat peluncuran mencakup:

  • Integrasi dengan alat milik Google (Workspace, Gmail, Calendar) saat peluncuran, dengan dukungan alat pihak ketiga melalui MCP hadir dalam beberapa minggu berikutnya.
  • Interaksi melalui aplikasi Gemini, dan segera melalui email serta chat.
  • Operasi langsung di dalam Chrome sebagai lapisan peramban agentic, hadir akhir musim panas ini.
  • Progres tugas langsung terlihat melalui Android Halo, ruang UI baru di Android, hadir akhir tahun ini.

Perbandingan dengan ekosistem agen OpenAI dan kapabilitas penggunaan alat Anthropic patut dibuat secara langsung. Pembedanya Spark adalah eksekusi persisten 24/7 di infrastruktur Google Cloud, dikombinasikan dengan integrasi mendalam ke rangkaian produktivitas Google. Jika pekerjaan Anda sudah berada di Google Workspace, itu keunggulan yang bermakna. Jika tidak, proposisi nilainya kurang jelas.

Privasi adalah kekhawatiran yang sah di sini. Agen yang terus-menerus memantau kotak masuk, kalender, dan dokumen Anda menimbulkan pertanyaan nyata tentang lokasi data dan kepatuhan di industri yang teregulasi. Salah satu pertanyaan yang saya ajukan pada diri sendiri, misalnya, "Apa yang terjadi pada memori agen saat seorang karyawan keluar?" Google belum memberikan jawaban terperinci untuk pertanyaan-pertanyaan itu. Spark diluncurkan ke penguji tepercaya minggu ini, dengan Beta untuk pelanggan Google AI Ultra ($100/bulan) di AS pada minggu berikutnya.

Managed Agents vs Gemini Spark

Agen penelusuran dan Mode AI

Mode AI di Penelusuran diperkenalkan pada I/O sebelumnya. Satu tahun berlalu, dan kini melampaui satu miliar pengguna aktif bulanan. Sekarang, Google mendorong lebih jauh dengan dua kapabilitas agentic baru.

Yang pertama adalah agen informasi di Penelusuran: agen latar belakang yang dipersonalisasi yang Anda konfigurasikan untuk memantau topik dan menampilkan informasi relevan pada momen yang tepat. Ini diluncurkan musim panas ini, dimulai dengan pelanggan Google AI Pro dan Ultra.

Yang kedua adalah UI generatif di Penelusuran, didukung oleh Gemini 3.5 Flash dan Antigravity. Penelusuran kini akan membangun tata letak kustom, visual interaktif, bahkan dasbor persisten atau mini-aplikasi untuk kueri kompleks dan jangka panjang. Kapabilitas UI generatif akan hadir ke semua pengguna secara gratis musim panas ini. Fitur dasbor persisten dan aplikasi kustom akan tersedia terlebih dahulu bagi pelanggan Pro dan Ultra di AS.

Ini menjadi perhatian nyata bagi penerbit dan profesional SEO (sebagaimana pengenalan AI Overview dan Mode AI sebelumnya). Ketika jawaban yang dihasilkan AI sepenuhnya menyelesaikan kueri pengguna langsung di Penelusuran, tidak ada alasan untuk mengeklik ke situs sumber. Kita sudah melihat ini terjadi: baik AI Overviews maupun peluncuran awal Mode AI menyebabkan penurunan trafik signifikan di seluruh industri. Google masih belum memperkenalkan cara jelas untuk berbagi pendapatan atau menjamin trafik ke penerbit yang kontennya memberi makan jawaban tersebut.

Google Flow

Google Flow, yang memulai debutnya di I/O 2025 sebagai alat pembuatan film berbasis AI, telah melangkah maju secara signifikan dengan tiga pembaruan kunci:

  • Agen perencanaan yang lebih cerdas. Agen Flow yang diperbarui kini dapat merencanakan dan bernalar melalui proyek kreatif multi-langkah. Anda memberikan masukan (misalnya konsep, beberapa gambar referensi, skrip kasar) dan agen membantu Anda bergerak dari tahap brainstorming awal hingga pembuatan dan penyuntingan, semuanya dalam satu lingkungan. Agen baru ini tersedia untuk semua orang hari ini.
  • Video native melalui Gemini Omni. Flow kini menangani pembuatan dan penyuntingan video secara native melalui model Omni. Anda dapat menggambarkan perubahan pada klip dari galeri kamera dengan bahasa alami, dan melakukan iterasi secara percakapan. Konsistensi karakter juga meningkat, sehingga identitas dan suara terjaga lintas adegan. Ini sangat berguna jika Anda memproduksi film pendek atau kampanye iklan dengan karakter berulang.
  • Pemrograman Vibe untuk alat kustom. Alih-alih terbatas pada alat yang dibundel dengan Flow, kini Anda dapat membangun sendiri langsung di platform. Google mendemonstrasikan contoh seperti merancang efek video kustom, membuat alat animasi gambar tangan, dan membangun alur kerja pelapisan teks, semuanya tanpa meninggalkan Flow.

Secara keseluruhan, pembaruan ini memosisikan Flow lebih dari sekadar asisten kreatif. Ia menjadi platform untuk membangun alur kerja kreatif, dengan aplikasi seluler kini dalam beta di Android dan segera hadir di iOS.

Perluasan SynthID

SynthID, sistem watermarking AI tak terlihat dari Google, kini telah memberi watermark pada lebih dari 100 miliar gambar dan video serta aset audio setara 60.000 tahun sejak diluncurkan tiga tahun lalu. Pengumuman I/O yang paling penting di sini bukan skalanya, melainkan para mitra: OpenAI, Kakao, dan Eleven Labs mengadopsi SynthID bersama Nvidia, yang bergabung tahun lalu.

Adopsi lintas industri inilah yang membuatnya bermakna. Standar watermarking hanya berfungsi jika cukup tersebar luas sehingga "tanpa watermark" menjadi sinyal yang berguna. Google juga memperluas verifikasi Content Credentials (standar C2PA) ke Penelusuran dan Chrome, yang akan menunjukkan kepada pengguna apakah konten berasal dari AI atau kamera dan apakah disunting dengan alat generatif. Kombinasi SynthID dan C2PA memberi dua lapisan independen untuk asal-usul konten, yang merupakan pendekatan tepat mengingat betapa mudahnya salah satu dihilangkan secara individual.

Yang Patut Disebut

Beberapa pengumuman lain dari I/O patut dicatat singkat:

  • Docs Live: Fitur baru berbasis suara untuk Google Docs yang memungkinkan Anda menyampaikan ide secara lisan dan Gemini akan menyusunnya menjadi dokumen. Diluncurkan untuk pelanggan musim panas ini, dengan kapabilitas suara hadir ke Gmail dan Keep pada waktu yang sama.
  • Google Pics: Alat pembuatan dan penyuntingan gambar AI baru yang dibangun di atas model Nano Banana, memperlakukan setiap elemen sebagai objek individual alih-alih gambar datar. Tersedia untuk penguji tepercaya sekarang, diluncurkan ke pelanggan Google AI Pro dan Ultra akhir musim panas ini.
  • Android Halo: Ruang UI baru di Android untuk melihat pembaruan langsung dan progres tugas dari agen seperti Gemini Spark. Hadir akhir tahun ini.
  • Daily Brief: Agen siap pakai di aplikasi Gemini yang menyusun ringkasan pagi yang dipersonalisasi dari kotak masuk, kalender, dan tugas Anda, dengan langkah selanjutnya yang disarankan. Tidak ada harga terpisah yang diumumkan; diperkirakan menjadi bagian dari pengalaman aplikasi Gemini.
  • TPU 8t dan 8i: TPU generasi ke-8 Google mengambil pendekatan chip ganda, dengan 8t dioptimalkan untuk pretraining skala besar (hampir 3x komputasi mentah dari generasi sebelumnya, dapat diskalakan di lebih dari 1 juta TPU secara global) dan 8i dioptimalkan untuk inferensi. Keduanya memberikan hingga 2x kinerja per watt lebih baik daripada generasi sebelumnya.
  • Gemini for Science: Kumpulan alat AI yang menghubungkan Antigravity ke lebih dari 30 basis data ilmu hayati utama. Science Skills tersedia hari ini di GitHub dan langsung di Antigravity.

Pikiran Penutup

Google I/O 2026 bertaruh pada agen sebagai arah utama AI, dengan Gemini 3.5 Flash dan Antigravity 2.0 sebagai infrastruktur di bawah hampir semua yang diumumkan. Hal yang dapat Anda gunakan sekarang adalah Gemini 3.5 Flash (melalui Gemini API dan AI Studio), agen Flow baru, Gemini Omni Flash, dan aplikasi desktop Antigravity 2.0. Gemini Spark, agen Penelusuran, dan fitur UI generatif di Penelusuran akan diluncurkan sepanjang musim panas, sebagian besar dibatasi oleh tingkat AI Ultra $100/bulan (setidaknya pada awalnya).

Bagi saya, peningkatan Antigravity adalah rilis yang paling menarik, karena  beroperasi pada dua level sekaligus: sebagai aplikasi pengembang mandiri, ia bersaing langsung dengan Codex dan Claude Code; sebagai platform, ADK yang mendasarinya dan Managed Agents API menantang kerangka orkestrasi seperti LangChain, AutoGen, dan OpenAI's Agents SDK. Integrasi Gemini dan lapisan penyebaran Google Cloud adalah pembedanya (dan risiko penguncian) pada kedua front.

Google I/O 2026 FAQs

Bagaimana perbandingan Gemini 3.5 Flash dengan GPT-5.5 dan Claude Opus 4.7?

Gemini 3.5 Flash memimpin pada beberapa tolok ukur agentic seperti MCP Atlas (83,6%) dan Finance Agent v2 (57,9%), sementara GPT-5.5 sedikit unggul pada SWE-Bench Pro dan ARC-AGI-2. Claude Opus 4.7 tetap terkuat pada Humanity's Last Exam (46,9%). Intinya, model ini kompetitif dengan model frontier sekaligus berjalan lebih cepat dan jauh lebih murah pada skala besar, sebagaimana tersirat dari penamaannya. Varian Pro yang lebih bertenaga diperkirakan segera dirilis.

Apa perbedaan Google Antigravity dibandingkan Claude Code atau Codex?

Google Antigravity 2.0 adalah platform pengembangan yang mengedepankan agen yang memungkinkan Anda mengorkestrasi banyak agen AI secara paralel melalui aplikasi desktop, CLI, SDK, dan API enterprise. Tidak seperti Claude Code (agen pengodean berbasis terminal) atau Codex (sistem berbasis antrian tugas), Antigravity menawarkan pembatasan izin per proyek yang lebih ketat, pemunculan subagen, dan integrasi langsung dengan Google Cloud dan Firebase. Peran gandanya sebagai alat pengembang dan SDK platform membuatnya lebih sebanding dengan kerangka orkestrasi daripada asisten pengodean mandiri.

Apakah paket Google AI Ultra $100/bulan sepadan dibandingkan ChatGPT Pro atau Claude Max?

Ketiga paket dihargai $100/bulan, tetapi nilainya bergantung pada ekosistem Anda. Pembedanya Google AI Ultra adalah akses ke Gemini Spark (agen persisten 24/7), batas penggunaan Antigravity 5x lebih tinggi, dan integrasi mendalam dengan Google Workspace. Jika alur kerja Anda sudah berada di Gmail, Docs, dan Calendar, Ultra memiliki keunggulan alami. Jika Anda terutama membutuhkan bantuan pengodean atau fleksibilitas di tingkat API, ChatGPT Pro atau Claude Max mungkin lebih sesuai.

Apa itu Gemini Omni dan bagaimana cara menangani pembuatan video?

Gemini Omni adalah model multimodal asli Google yang menerima kombinasi teks, gambar, audio, dan video sebagai masukan serta menghasilkan keluaran video. Model ini menyatukan sistem yang sebelumnya terpisah (Veo untuk video, Imagen untuk gambar) menjadi satu model, yang seharusnya menghasilkan penyuntingan lintas modal yang lebih koheren. Versi pertama, Omni Flash, tersedia sekarang, dengan Omni Pro yang lebih mumpuni segera hadir. Tolok ukur independen belum dipublikasikan, jadi kualitas dunia nyata masih dievaluasi.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom adalah seorang ilmuwan data dan pendidik teknis. Ia menulis dan mengelola tutorial serta artikel blog ilmu data DataCamp. Sebelumnya, Tom bekerja di bidang ilmu data di Deutsche Telekom.

Topik

Pelajari Ekosistem AI Google!

Program

Google Workspace with Gemini

4 Hr
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Lihat DetailRight Arrow
Mulai Kursus
Lihat Lebih BanyakRight Arrow
Terkait

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.
Javier Canales Luna's photo

Javier Canales Luna

12 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.
Dario Radečić's photo

Dario Radečić

15 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.
Hugo Bowne-Anderson's photo

Hugo Bowne-Anderson

13 mnt

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.
David Woods's photo

David Woods

13 mnt

Lihat Lebih BanyakLihat Lebih Banyak