Program
Benang merah di hampir setiap pengumuman pada hari pertama konferensi Google I/O 2026 sama: agen. Bukan chatbot, bukan asisten, melainkan agen yang persisten dan mengeksekusi tugas, berjalan di latar belakang dan terintegrasi di seluruh tumpukan produk Google. CEO Sundar Pichai secara eksplisit menyebutnya sebagai "era agentic Gemini," dan rangkaian pengumuman tersebut menguatkan kerangka itu.
Google juga menanggapi langganan Claude Max dari Anthropic dan ChatGPT Pro dari OpenAI dengan menghadirkan level baru Google AI Ultra di I/O, berharga sama $100/bulan dan membatasi akses ke beberapa fitur agentic yang dibahas di bawah.
Dalam artikel ini, saya akan memandu Anda melalui pengumuman yang paling penting bagi praktisi dan pengembang AI. Saya akan berfokus pada pembaruan yang sudah tersedia sekarang atau segera hadir.
Gemini 3.5 Flash
Gemini 3.5 Flash adalah rilis model utama dari I/O 2026. Model ini melampaui Gemini 3.1 Pro pada tolok ukur agentic dan pengodean, sementara Google mengklaim model ini berjalan 4x lebih cepat dalam token keluaran per detik dibandingkan model frontier lainnya. Walau kami belum dapat mengonfirmasinya, ini jelas klaim yang berani.
Dari sisi tolok ukur, lonjakan kinerja terlihat, terutama pada MCP Atlas, CharXiV Reasoning, dan Finance Agent v2, yang semuanya dipimpin oleh Gemini 3.5 Flash. Secara keseluruhan, 3.5 Flash tampak kompetitif dengan Claude Opus 4.7 dan GPT-5.5.
|
Tolok ukur |
3.5 Flash |
3 Flash |
3.1 Pro |
Claude Sonnet 4.6 |
Opus 4.7 |
GPT-5.5 |
|
Terminal-bench 2.1 |
76.2% |
58.0% |
70.3% |
-- |
66.1% |
78.2% |
|
SWE-Bench Pro |
55.1% |
49.6% |
54.2% |
-- |
64.3% |
58.6% |
|
MCP Atlas |
83.6% |
62.0% |
78.2% |
69.5% |
79.1% |
75.3% |
|
OSWorld |
78.4% |
65.1% |
76.2% |
72.5% |
78.0% |
78.7% |
|
Finance Agent v2 |
57.9% |
42.6% |
43.0% |
51.0% |
51.5% |
51.8% |
|
CharXiv Reasoning |
84.2% |
80.3% |
83.3% |
72.4% |
82.1% |
84.1% |
|
Humanity's Last Exam |
40.2% |
33.7% |
44.4% |
33.2% |
46.9% |
41.4% |
|
ARC-AGI-2 |
72.1% |
33.6% |
77.1% |
58.3% |
75.8% |
84.6% |
Aspek biaya patut dicatat. Google mengklaim bahwa perusahaan yang memproses sekitar 1 triliun token per hari bisa menghemat lebih dari $1 miliar per tahun dengan mengalihkan 80% beban kerja dari model frontier lain ke 3.5 Flash. Ini merupakan tawaran langsung kepada pelanggan enterprise OpenAI dan Anthropic. Gemini 3.5 Flash tersedia hari ini melalui Gemini API, Google AI Studio, dan aplikasi Gemini. Gemini 3.5 Pro sudah digunakan secara internal dan diperkirakan hadir bulan depan.
Untuk detail lebih lanjut, saya sarankan membaca artikel Gemini 3.5 Flash kami, yang membahas model baru ini lebih mendalam.
Gemini Omni
Gemini Omni adalah model media generatif multimodal native baru dari Google, mampu menerima kombinasi teks, gambar, audio, dan video sebagai masukan dan menghasilkan keluaran video. Model pertama dalam keluarga ini, Gemini Omni Flash, tersedia hari ini di aplikasi Gemini, Google Flow, dan YouTube Shorts.
Poin arsitektural kunci adalah Omni melebur tumpukan yang sebelumnya terpisah (Veo untuk video, Imagen untuk gambar, sistem audio terpisah) ke dalam satu model. Ini berarti penyuntingan yang lebih koheren dan lebih sedikit artefak pipeline saat bekerja lintas modalitas. Google belum memublikasikan tolok ukur numerik untuk Omni saat peluncuran, jadi evaluasi independen masih ditunggu. Akses API untuk pengembang dan pelanggan enterprise akan hadir dalam beberapa minggu setelah I/O.
Kami telah mengujinya dan menuliskannya secara lengkap dalam artikel Gemini Omni kami. Hasil generasi video pertama masih naik-turun (setidaknya mengingat standar tinggi yang ditetapkan alat seperti Seedance 2.0), tetapi Gemini Omni Pro yang lebih bertenaga diperkirakan segera hadir.
Antigravity 2.0
Antigravity adalah platform pengembangan berfokus agen dari Google, dan rilis 2.0 di I/O merupakan perluasan signifikan. Sebelumnya diposisikan sebagai lingkungan pengodean, kini menjadi platform lengkap untuk mengembangkan, menerapkan, dan mengelola kohort agen AI otonom. Pusatnya adalah aplikasi desktop mandiri baru yang bertindak sebagai hub orkestrasi agen, memungkinkan Anda menjalankan banyak agen secara paralel pada berbagai tugas secara simultan.
Ekosistemnya kini memiliki empat permukaan berbeda untuk pengembang:
- Aplikasi desktop Antigravity 2.0: Mengorkestrasi banyak agen secara paralel dan mendukung tugas latar terjadwal. Terintegrasi dengan Google AI Studio, Android, dan Firebase.
- Antigravity CLI: Antarmuka terminal-native untuk membuat dan menjalankan agen tanpa GUI. Google meminta pengguna Gemini CLI untuk bermigrasi ke ini.
- Antigravity SDK: Akses programatik ke harness agen yang sama yang mendayai produk Google sendiri, dengan dukungan untuk perilaku agen kustom yang dihosting di infrastruktur Anda.
- Antigravity di Gemini Enterprise Agent Platform: Menghubungkan Antigravity langsung ke proyek Google Cloud untuk beban kerja enterprise.
Ada beberapa fitur baru yang sangat berguna untuk agen inti. Yang terbesar: kini dapat memunculkan subagen modular secara dinamis, masing-masing berjalan paralel dengan isolasi workspace dan mewarisi konfigurasi alat serta izin dari induknya. Operasi jangka panjang berjalan secara asinkron, sehingga tidak lagi memblokir loop agen.
Mirip dengan Claude Code Hooks, JSON Hooks memungkinkan pengguna melampirkan skrip shell kustom pada tahap-tahap eksekusi kunci (sebelum/sesudah pemanggilan alat, pemanggilan model, atau saat kondisi berhenti) untuk logging, kustomisasi argumen, atau menyisipkan instruksi. Tugas Terjadwal memungkinkan Anda menetapkan prompt berbasis cron untuk menjalankan agen secara berkala seperti ringkasan PR harian atau pemeriksaan deployment per jam, dengan hasil muncul di bilah samping untuk alih tugas tanpa hambatan kepada manusia di dalam loop.
Di sisi manajemen, Antigravity memperkenalkan "proyek" sebagai primitif organisasi yang menentukan cakupan pengaturan, sumber daya, dan izin per grup agen, alih-alih mengharuskan izin global paling luas untuk semuanya. Panel samping yang diperbarui mendukung pengelompokan percakapan berdasarkan proyek, status, atau kebaruan, dengan dukungan native Git worktree bawaan. Tata letak berbasis proyek ini sebanding dengan manajemen workspace multi-jendela Cursor dan antrian tugas Codex, namun dengan pembatasan izin per proyek yang lebih ketat.

Masukan suara melalui model Gemini Audio dan perintah garis miring baru (/goal untuk menjalankan otonom, /grill-me untuk klarifikasi pra-tugas, /schedule untuk prompt cron, /browser untuk penggunaan peramban opsional) melengkapi UX.
Antigravity 2.0 tersedia untuk pengguna mulai hari ini. Paket Google AI Ultra ($100/bulan) mencakup batas penggunaan 5x lebih tinggi di Antigravity dibandingkan paket Google AI Pro.
Agen Terkelola di Gemini API
Bersamaan dengan Antigravity 2.0, Google mengumumkan Managed Agents di Gemini API, yang menghadirkan kapabilitas agentic langsung ke lapisan API bagi pengembang yang ingin membangun aplikasi bertenaga agen tanpa mengelola infrastruktur orkestrasi sendiri. Ini adalah pelengkap tingkat API untuk pengalaman desktop Antigravity.
Implikasi praktis bagi pengembang adalah Anda kini dapat mendefinisikan perilaku agen, integrasi alat, dan alur kerja multi-langkah melalui Gemini API dan membiarkan infrastruktur Google menangani eksekusinya. Ini berpotensi menjadi pengubah permainan sejati bagi tim yang membangun aplikasi produksi yang membutuhkan eksekusi tugas berjangka panjang tanpa menyiapkan dan mengelola harness agen sendiri. Akses tersedia melalui Google AI Studio, dan pelanggan enterprise dapat mengaksesnya melalui Gemini Enterprise Agent Platform.
Ada satu catatan jujur: umpan balik pengembang awal dari peliputan I/O mencatat bahwa dokumentasi untuk alur agen kompleks dan penanganan galat masih minim. Batas laju dan manajemen kuota juga disebut sebagai titik gesekan. Keduanya kemungkinan akan semakin kurang bermasalah seiring waktu, tetapi layak diketahui sebelum Anda berkomitmen membangun di atas stack ini.
Gemini Spark
Gemini Spark (jangan disamakan dengan LLM terbaru Meta, Muse Spark) adalah agen AI personal baru dari Google, dan ini yang paling berorientasi konsumen dari pengumuman agentic. Ia berjalan 24/7 pada mesin virtual khusus di Google Cloud, artinya tidak memerlukan laptop Anda tetap terbuka untuk terus bekerja. Spark didayai oleh Gemini 3.5 dan harness Antigravity, yang memberinya kemampuan menangani tugas berjangka panjang di latar belakang.
Fitur saat peluncuran mencakup:
- Integrasi dengan alat Google sendiri (Workspace, Gmail, Calendar) saat peluncuran, dengan dukungan alat pihak ketiga melalui MCP hadir dalam beberapa minggu berikutnya.
- Interaksi melalui aplikasi Gemini, dan segera melalui email dan chat.
- Operasi langsung dalam Chrome sebagai lapisan peramban agentic, hadir akhir musim panas ini.
- Kemajuan tugas secara langsung terlihat melalui Android Halo, ruang UI baru di Android, hadir akhir tahun ini.
Perbandingan dengan ekosistem agen OpenAI dan kapabilitas penggunaan alat Anthropic patut dibuat secara langsung. Pembeda Spark adalah eksekusi persisten 24/7 di infrastruktur Google Cloud, dipadukan dengan integrasi mendalam ke rangka produktivitas Google sendiri. Jika pekerjaan Anda sudah berada di Google Workspace, itu keuntungan yang berarti. Jika tidak, proposisi nilainya kurang jelas.
Privasi merupakan kekhawatiran yang sah. Agen yang terus-menerus memantau kotak masuk, kalender, dan dokumen Anda menimbulkan pertanyaan nyata tentang residensi data dan kepatuhan di industri teregulasi. Satu pertanyaan yang saya tanyakan pada diri sendiri, misalnya, "Apa yang terjadi dengan memori agen saat seorang karyawan keluar?" Google belum memberikan jawaban terperinci atas pertanyaan-pertanyaan itu.
Spark diluncurkan ke penguji tepercaya minggu ini, dengan Beta untuk pelanggan Google AI Ultra ($100/bulan) di AS pada minggu berikutnya. Kami membahasnya lebih detail dalam artikel Gemini Spark kami.

Agen Penelusuran dan Mode AI
Mode AI di Penelusuran diperkenalkan pada I/O sebelumnya. Satu tahun berlalu, dan kini melampaui satu miliar pengguna aktif bulanan. Sekarang, Google mendorong lebih jauh dengan dua kapabilitas agentic baru.
Yang pertama adalah agen informasi di Penelusuran: agen latar belakang yang dipersonalisasi yang Anda konfigurasikan untuk memantau topik dan menampilkan informasi relevan pada momen yang tepat. Ini akan diluncurkan musim panas ini, dimulai dengan pelanggan Google AI Pro dan Ultra.
Yang kedua adalah UI generatif di Penelusuran, didayai oleh Gemini 3.5 Flash dan Antigravity. Penelusuran kini akan membangun tata letak kustom, visual interaktif, dan bahkan dasbor atau mini-aplikasi persisten untuk kueri yang kompleks dan berjalan lama. Kapabilitas UI generatif akan hadir untuk semua pengguna secara gratis musim panas ini. Fitur dasbor persisten dan aplikasi kustom akan tersedia terlebih dahulu untuk pelanggan Pro dan Ultra di AS.
Ini merupakan kekhawatiran nyata bagi penerbit dan profesional SEO (sebagaimana pengenalan AI Overview dan Mode AI sebelumnya). Ketika jawaban yang dihasilkan AI sepenuhnya menyelesaikan kueri pengguna langsung di Penelusuran, tidak ada alasan untuk mengeklik ke situs sumber. Kita sudah melihat dampaknya: baik AI Overviews maupun peluncuran awal Mode AI menyebabkan penurunan trafik yang signifikan di seluruh industri. Google masih belum memperkenalkan cara yang jelas untuk berbagi pendapatan atau menjamin trafik bagi penerbit yang kontennya memberi makan jawaban-jawaban ini.
Google Flow
Google Flow, yang debut di I/O 2025 sebagai alat pembuatan film berbasis AI, mengambil langkah besar ke depan dengan tiga pembaruan kunci:
- Agen perencanaan yang lebih cerdas. Agen Flow yang diperbarui kini dapat merencanakan dan bernalar melalui proyek kreatif multi-langkah. Anda memberikan masukan (misalnya konsep, beberapa gambar referensi, naskah kasar) dan agen membantu Anda bergerak dari tahap awal brainstorming hingga pembuatan dan pengeditan, semuanya dalam satu lingkungan. Agen baru ini tersedia untuk semua orang mulai hari ini.
- Video native melalui Gemini Omni. Flow kini menangani pembuatan dan pengeditan video secara native melalui model Omni. Anda dapat mendeskripsikan perubahan pada klip dari rol kamera dalam bahasa alami, dan beriterasi secara percakapan. Konsistensi karakter juga meningkat, sehingga identitas dan suara terjaga di berbagai adegan. Ini sangat berguna jika Anda memproduksi film pendek atau kampanye iklan dengan karakter berulang.
- Vibe coding untuk alat kustom. Alih-alih terbatas pada alat yang dibundel Flow, kini Anda dapat membangun sendiri langsung di platform. Google mendemonstrasikan contoh seperti merancang efek video kustom, membuat alat animasi gambar tangan, dan membangun alur kerja pelapisan teks, semuanya tanpa meninggalkan Flow.
Jika digabungkan, pembaruan ini memosisikan Flow lebih dari sekadar asisten kreatif. Flow menjadi platform untuk membangun alur kerja kreatif, dengan aplikasi seluler kini dalam beta di Android dan segera hadir di iOS.
Perluasan SynthID
SynthID, sistem watermark AI tak kasatmata dari Google, kini telah memberi watermark pada lebih dari 100 miliar gambar dan video serta aset audio selama 60.000 tahun sejak diluncurkan tiga tahun lalu. Pengumuman I/O yang paling penting di sini bukan skalanya, melainkan para mitra: OpenAI, Kakao, dan Eleven Labs mengadopsi SynthID bersama Nvidia, yang bergabung tahun lalu.
Adopsi lintas industri inilah yang membuatnya bermakna. Standar watermark hanya berfungsi jika cukup luas sehingga "tanpa watermark" menjadi sinyal yang berguna. Google juga memperluas verifikasi Content Credentials (standar C2PA) ke Penelusuran dan Chrome, yang akan menunjukkan kepada pengguna apakah konten berasal dari AI atau kamera dan apakah diedit dengan alat generatif. Kombinasi SynthID dan C2PA memberi dua lapis independen pada asal-usul konten, yang merupakan pendekatan tepat mengingat betapa mudahnya masing-masing dilucuti secara terpisah.
Honourable Mentions
Beberapa pengumuman lain dari I/O patut dicatat singkat:
- Docs Live: Fitur baru berbasis suara untuk Google Docs yang memungkinkan Anda mencurahkan ide secara lisan dan Gemini akan menyusunnya menjadi dokumen. Diluncurkan ke pelanggan musim panas ini, dengan kapabilitas suara hadir ke Gmail dan Keep pada waktu yang sama.
- Google Pics: Alat pembuatan dan pengeditan gambar AI baru yang dibangun di atas model Nano Banana, memperlakukan setiap elemen sebagai objek individual, bukan gambar datar. Tersedia untuk penguji tepercaya sekarang, diluncurkan ke pelanggan Google AI Pro dan Ultra akhir musim panas ini.
- Android Halo: Ruang UI baru di Android untuk melihat pembaruan langsung dan kemajuan tugas dari agen seperti Gemini Spark. Hadir akhir tahun ini.
- Daily Brief: Agen siap pakai di aplikasi Gemini yang menyusun ringkasan pagi yang dipersonalisasi dari kotak masuk, kalender, dan tugas Anda, dengan langkah berikutnya yang disarankan. Tidak ada harga terpisah yang diumumkan; diperkirakan menjadi bagian dari pengalaman aplikasi Gemini.
- TPU 8t dan 8i: TPU generasi ke-8 Google mengambil pendekatan chip ganda, dengan 8t dioptimalkan untuk pretraining skala besar (hampir 3x komputasi mentah dari generasi sebelumnya, dapat diskalakan di lebih dari 1 juta TPU secara global) dan 8i dioptimalkan untuk inferensi. Keduanya memberikan hingga 2x kinerja per watt lebih baik daripada generasi sebelumnya.
- Gemini for Science: Kumpulan alat AI yang menghubungkan Antigravity ke lebih dari 30 basis data ilmu hayati utama. Science Skills tersedia hari ini di GitHub dan langsung di Antigravity.
Pemikiran Akhir
Google I/O 2026 mempertaruhkan agen sebagai arah utama AI, dengan Gemini 3.5 Flash dan Antigravity 2.0 sebagai infrastruktur di bawah hampir semua hal yang diumumkan. Hal yang dapat Anda gunakan sekarang adalah Gemini 3.5 Flash (melalui Gemini API dan AI Studio), agen Flow baru, Gemini Omni Flash, dan aplikasi desktop Antigravity 2.0. Gemini Spark, agen Penelusuran, dan fitur UI generatif di Penelusuran akan diluncurkan sepanjang musim panas, sebagian besar dibatasi oleh level AI Ultra $100/bulan (setidaknya pada awalnya).
Bagi saya, peningkatan Antigravity adalah rilis paling menarik, karena beroperasi pada dua level secara simultan: sebagai aplikasi pengembang mandiri, ia bersaing langsung dengan Codex dan Claude Code; sebagai platform, ADK dan Managed Agents API-nya menantang kerangka orkestrasi seperti LangChain, AutoGen, dan Agents SDK dari OpenAI. Integrasi Gemini dan lapisan deployment Google Cloud adalah pembeda (dan risiko lock-in) di kedua sisi.
Google I/O 2026 FAQ
Bagaimana perbandingan Gemini 3.5 Flash dengan GPT-5.5 dan Claude Opus 4.7?
Gemini 3.5 Flash memimpin pada beberapa tolok ukur agentic seperti MCP Atlas (83,6%) dan Finance Agent v2 (57,9%), sementara GPT-5.5 sedikit unggul pada SWE-Bench Pro dan ARC-AGI-2. Claude Opus 4.7 tetap terkuat pada Humanity's Last Exam (46,9%). Intinya, model ini kompetitif dengan model frontier sambil berjalan lebih cepat dan jauh lebih murah pada skala besar, sebagaimana tercermin dari penamaannya. Varian Pro yang lebih bertenaga diperkirakan segera dirilis.
Apa perbedaan Google Antigravity dibandingkan Claude Code atau Codex?
Google Antigravity 2.0 adalah platform pengembangan berfokus agen yang memungkinkan Anda mengorkestrasi banyak agen AI secara paralel melalui aplikasi desktop, CLI, SDK, dan API enterprise. Berbeda dengan Claude Code (agen pengodean terminal-native) atau Codex (sistem berbasis antrian tugas), Antigravity menawarkan pembatasan izin per proyek yang lebih ketat, pemunculan subagen, dan integrasi langsung dengan Google Cloud dan Firebase. Perannya yang ganda sebagai alat pengembang dan platform SDK membuatnya lebih sebanding dengan kerangka orkestrasi daripada asisten pengodean mandiri.
Apakah paket Google AI Ultra $100/bulan sepadan dibandingkan ChatGPT Pro atau Claude Max?
Ketiga paket dihargai $100/bulan, tetapi nilainya bergantung pada ekosistem Anda. Pembeda Google AI Ultra adalah akses ke Gemini Spark (agen persisten 24/7), batas penggunaan Antigravity 5x lebih tinggi, dan integrasi mendalam dengan Google Workspace. Jika alur kerja Anda sudah berada di Gmail, Docs, dan Calendar, Ultra memiliki keunggulan alami. Jika Anda terutama membutuhkan bantuan pengodean atau fleksibilitas di tingkat API, ChatGPT Pro atau Claude Max mungkin lebih cocok.
Apa itu Gemini Omni dan bagaimana cara menangani pembuatan video?
Gemini Omni adalah model multimodal native Google yang menerima kombinasi teks, gambar, audio, dan video sebagai masukan dan menghasilkan keluaran video. Model ini menyatukan sistem yang sebelumnya terpisah (Veo untuk video, Imagen untuk gambar) ke satu model, yang seharusnya menghasilkan penyuntingan lintas modal yang lebih koheren. Versi pertama, Omni Flash, tersedia sekarang, dengan Omni Pro yang lebih andal diperkirakan segera hadir. Tolok ukur independen belum dipublikasikan, jadi kualitas dunia nyata masih dievaluasi.
Tom adalah seorang ilmuwan data dan pendidik teknis. Ia menulis dan mengelola tutorial serta artikel blog ilmu data DataCamp. Sebelumnya, Tom bekerja di bidang ilmu data di Deutsche Telekom.

