Google I/O 2026: începutul erei Gemini axate pe agenți

De la Gemini 3.5 Flash și Gemini Omni la Antigravity 2.0 și Gemini Spark, iată ce contează cel mai mult din keynote-ul Google I/O 2026 axat pe agenți.

Actualizat 20 mai 2026 · 12 min. citire

Firul roșu al aproape fiecărui anunț din prima zi a conferinței Google I/O 2026 a fost același: agenții. Nu chatboți, nu asistenți, ci agenți persistenți, orientați pe execuția de sarcini, care rulează în fundal și se integrează în întregul stack de produse Google. CEO-ul Sundar Pichai a formulat explicit asta drept „era Gemini axată pe agenți”, iar anunțurile au susținut pe deplin această viziune.

Google a răspuns și abonamentelor Claude Max de la Anthropic și ChatGPT Pro de la OpenAI, introducând un nou nivel Google AI Ultra la I/O, cu același preț de 100 $/lună, care condiționează accesul la unele dintre capabilitățile agentice prezentate mai jos.

În acest articol, te voi ghida prin anunțurile care contează cel mai mult pentru practicienii AI și dezvoltatori. Mă voi concentra pe actualizări disponibile acum sau așteptate în curând.

Gemini 3.5 Flash

Gemini 3.5 Flash este lansarea de model titulară de la I/O 2026. Depășește Gemini 3.1 Pro pe benchmark-uri legate de agenți și de programare, iar Google susține că rulează de 4x mai rapid la nivel de tokeni de ieșire pe secundă decât alte modele de vârf. Deși nu putem confirma încă, cu siguranță este o afirmație îndrăzneață.

La nivel de benchmark, saltul de performanță este vizibil, în special în MCP Atlas, CharXiV Reasoning și Finance Agent v2, pe toate acestea 3.5 Flash conducând. Per ansamblu, 3.5 Flash pare competitiv cu Claude Opus 4.7 și GPT-5.5.

Benchmark	3.5 Flash	3 Flash	3.1 Pro	Claude Sonnet 4.6	Opus 4.7	GPT-5.5
Terminal-bench 2.1	76,2%	58,0%	70,3%	--	66,1%	78,2%
SWE-Bench Pro	55,1%	49,6%	54,2%	--	64,3%	58,6%
MCP Atlas	83,6%	62,0%	78,2%	69,5%	79,1%	75,3%
OSWorld	78,4%	65,1%	76,2%	72,5%	78,0%	78,7%
Finance Agent v2	57,9%	42,6%	43,0%	51,0%	51,5%	51,8%
CharXiv Reasoning	84,2%	80,3%	83,3%	72,4%	82,1%	84,1%
Humanity's Last Exam	40,2%	33,7%	44,4%	33,2%	46,9%	41,4%
ARC-AGI-2	72,1%	33,6%	77,1%	58,3%	75,8%	84,6%

Merită menționată aici și latura de costuri. Google susține că întreprinderile care procesează aproximativ 1 trilion de tokeni pe zi ar putea economisi peste 1 miliard de dolari anual mutând 80% din sarcini de pe alte modele de vârf pe 3.5 Flash. Este o ofertă directă pentru clienții enterprise ai OpenAI și Anthropic. Gemini 3.5 Flash este disponibil astăzi în Gemini API, Google AI Studio și aplicația Gemini. Gemini 3.5 Pro este deja folosit intern și este așteptat luna viitoare.

Pentru mai multe detalii, îți recomand să citești articolul nostru despre Gemini 3.5 Flash, unde acoperim noul model mai în profunzime.

Gemini Omni

Gemini Omni este noul model generativ media, nativ multimodal, al Google, capabil să primească orice combinație de text, imagini, audio și video ca input și să producă ieșire video. Primul model din familie, Gemini Omni Flash, este disponibil astăzi în aplicația Gemini, Google Flow și YouTube Shorts.

Punctul arhitectural-cheie este că Omni unește ceea ce înainte era un stack împărțit (Veo pentru video, Imagen pentru imagini, sisteme audio separate) într-un singur model. Asta înseamnă editări mai coerente și mai puține artefacte de pipeline când lucrezi între modalități. Google nu a publicat benchmark-uri numerice pentru Omni odată cu lansarea, așa că evaluarea independentă este încă în așteptare. Accesul la API pentru dezvoltatori și clienți enterprise va sosi în săptămânile de după I/O.

L-am testat și am scris pe larg în articolul nostru despre Gemini Omni. Primele rezultate de generare video au fost inegale (cel puțin raportat la standardele ridicate stabilite de instrumente precum Seedance 2.0), dar un Gemini Omni Pro mai puternic este așteptat în curând.

Antigravity 2.0

Antigravity este platforma de dezvoltare „agent-first” a Google, iar versiunea 2.0 lansată la I/O reprezintă o extindere semnificativă. Anterior poziționată ca mediu de programare, acum este o platformă completă pentru dezvoltarea, implementarea și gestionarea cohortelor de agenți AI autonomi. Piesa centrală este o nouă aplicație desktop standalone care acționează ca un hub central pentru orchestrarea agenților, permițându-ți să rulezi mai mulți agenți în paralel pe sarcini diferite simultan.

Acum ecosistemul are patru suprafețe distincte pentru dezvoltatori:

Aplicația desktop Antigravity 2.0: Orchestrare pentru mai mulți agenți în paralel și suport pentru sarcini programate în fundal. Integrare cu Google AI Studio, Android și Firebase.
Antigravity CLI: O interfață nativă pentru terminal pentru a crea și rula agenți fără GUI. Google le cere utilizatorilor Gemini CLI să migreze aici.
Antigravity SDK: Acces programatic la același „ham” de agenți care alimentează produsele Google, cu suport pentru comportamente de agenți personalizați găzduiți pe infrastructura ta.
Antigravity în Gemini Enterprise Agent Platform: Conectează direct Antigravity la proiectele Google Cloud pentru sarcini enterprise.

Există și câteva funcții noi foarte utile pentru agentul de bază. Cea mai importantă: acum poate genera subagenți modulari din mers, fiecare rulând în paralel cu izolare de workspace și moștenind configurațiile de instrumente și permisiunile părintelui. Operațiunile de lungă durată rulează asincron, astfel încât nu mai blochează bucla agentului.

Similar cu Claude Code Hooks, JSON Hooks îți permit să atașezi scripturi shell personalizate în etape-cheie ale execuției (înainte/după apeluri de instrumente, apeluri de model sau la condiții de oprire) pentru logare, personalizarea argumentelor sau injectarea de instrucțiuni. Scheduled Tasks îți permit să setezi prompturi bazate pe cron pentru rulări periodice ale agentului, precum rezumate zilnice de PR-uri sau verificări orare de deployment, cu rezultatele afișate în bara laterală pentru o predare fără fricțiune către interacțiunea human-in-the-loop.

Pe partea de management, Antigravity introduce „proiectele” ca primitivă organizațională ce delimitează setările, resursele și permisiunile pe grup de agenți, în loc să necesite cele mai largi permisiuni globale pentru tot. Panoul lateral refăcut suportă gruparea conversațiilor după proiect, stare sau recență, cu suport nativ pentru Git worktree încorporat. Acest layout bazat pe proiecte este comparabil cu managementul multi-fereastră al workspace-urilor din Cursor și coada de taskuri din Codex, dar cu o delimitare mai strictă a permisiunilor pe proiect.

Input vocal prin modelele Gemini Audio și noi comenzi slash (/goal pentru rulări autonome, /grill-me pentru clarificări pre-task, /schedule pentru prompturi cron, /browser pentru utilizarea browserului la cerere) completează experiența de utilizare.

Antigravity 2.0 este disponibil pentru utilizatori începând de astăzi. Abonamentul Google AI Ultra (100 $/lună) include o limită de utilizare de 5x mai mare în Antigravity față de planul Google AI Pro.

Agenți gestionați în Gemini API

Alături de Antigravity 2.0, Google a anunțat Managed Agents în Gemini API, aducând capabilități agentice direct la nivelul API pentru dezvoltatorii care vor să construiască aplicații bazate pe agenți fără să gestioneze ei înșiși infrastructura de orchestrare. Acesta este complementul la nivel de API pentru experiența desktop Antigravity.

Implicația practică pentru dezvoltatori este că acum poți defini comportamente de agent, integrări de instrumente și fluxuri de lucru multi-pas prin Gemini API, iar infrastructura Google se ocupă de execuție. Acest lucru are potențialul de a fi un adevărat game-changer pentru echipele care construiesc aplicații de producție ce necesită execuție de sarcini pe orizont lung, fără să-și pună în picioare și să-și gestioneze propriul „ham” de agenți. Accesul este disponibil prin Google AI Studio, iar clienții enterprise îl pot accesa prin Gemini Enterprise Agent Platform.

Un avertisment onest: feedback-ul timpuriu al dezvoltatorilor din acoperirea I/O notează că documentația pentru fluxuri complexe de agenți și gestionarea erorilor este încă limitată. Limitele de rată și managementul cotelor sunt, de asemenea, semnalate ca puncte de fricțiune. Probabil aceste probleme se vor diminua în timp, dar merită știute înainte de a te angaja să construiești pe acest stack.

Gemini Spark

Gemini Spark (de neconfundat cu cel mai recent LLM al Meta, Muse Spark) este noul agent AI personal al Google și cel mai orientat către consumator dintre anunțurile agentice. Rulează non-stop pe mașini virtuale dedicate în Google Cloud, ceea ce înseamnă că nu are nevoie ca laptopul tău să fie deschis pentru a continua să lucreze. Spark este alimentat de Gemini 3.5 și de „hamul” Antigravity, ceea ce îi oferă capacitatea de a gestiona sarcini pe orizont lung în fundal.

Setul de funcții la lansare include:

Integrare cu instrumentele Google (Workspace, Gmail, Calendar) la lansare, cu suport pentru instrumente terțe prin MCP în săptămânile următoare.
Interacțiune prin aplicația Gemini, și în curând prin email și chat.
Funcționare direct în Chrome ca un strat de browser orientat pe agenți, în cursul acestei veri.
Progres de sarcini în timp real vizibil prin Android Halo, un nou spațiu de UI pe Android, mai târziu în acest an.

Merită făcută direct comparația cu ecosistemul de agenți al OpenAI și capabilitățile de folosire a instrumentelor la Anthropic. Diferențiatorul lui Spark este execuția persistentă 24/7 pe infrastructura Google Cloud, combinată cu integrarea profundă în suita de productivitate Google. Dacă munca ta trăiește deja în Google Workspace, este un avantaj semnificativ. Dacă nu, propoziția de valoare este mai puțin evidentă.

Confidențialitatea este îngrijorarea legitimă aici. Un agent care îți monitorizează continuu inboxul, calendarul și documentele ridică întrebări reale despre rezidența datelor și conformitate în industrii reglementate. O întrebare pe care mi-am pus-o, de exemplu, a fost: „Ce se întâmplă cu memoria agentului când un angajat pleacă?” Google nu a oferit încă răspunsuri detaliate la aceste întrebări.

Spark este lansat săptămâna aceasta către testeri de încredere, cu un Beta pentru abonații Google AI Ultra (100 $/lună) în SUA, săptămâna următoare. Îl acoperim pe larg în articolul nostru despre Gemini Spark.

Agenți pentru Căutare și Modul AI

Modul AI în Căutare a fost introdus la ultimul I/O. Un an mai târziu, a depășit un miliard de utilizatori activi lunar. Acum, Google merge mai departe cu două capabilități agentice noi.

Prima este agenți de informare în Căutare: agenți personali, în fundal, pe care îi configurezi pentru a monitoriza subiecte și a scoate în evidență informațiile relevante la momentul potrivit. Aceștia vor fi lansați în această vară, începând cu abonații Google AI Pro și Ultra.

A doua este UI generativă în Căutare, alimentată de Gemini 3.5 Flash și Antigravity. Căutarea va construi acum layouturi personalizate, vizuale interactive și chiar dashboarduri persistente sau mini-aplicații pentru interogări complexe, de durată. Capabilitățile de UI generativă vor ajunge gratuit la toți utilizatorii în această vară. Funcțiile de dashboard persistent și aplicații personalizate vor fi disponibile mai întâi pentru abonații Pro și Ultra din SUA.

Aceasta este o preocupare reală pentru publisheri și profesioniști SEO (așa cum au fost deja introducerile AI Overview și Modul AI). Când răspunsurile generate de AI rezolvă complet întrebarea utilizatorului direct în Căutare, nu mai există motiv să dai click pe site-ul sursă. Am văzut deja asta în practică: atât AI Overviews, cât și lansarea inițială a Modului AI au dus la scăderi semnificative de trafic în industrie. Google încă nu a introdus o modalitate clară de a împărți veniturile sau de a garanta trafic pentru publisherii ale căror conținuturi alimentează aceste răspunsuri.

Google Flow

Google Flow, care a debutat la I/O 2025 ca un instrument AI de realizare de filme, a făcut un pas major înainte cu trei actualizări-cheie:

Agent de planificare mai inteligent. Agentul Flow actualizat poate acum planifica și raționa prin proiecte creative multi-pas. Tu îi oferi inputurile (să zicem, un concept, câteva imagini de referință, un scenariu schițat), iar el te ajută să treci de la brainstorming timpuriu la creare și editare, totul într-un singur mediu. Noul agent este disponibil tuturor începând de astăzi.
Video nativ prin Gemini Omni. Flow gestionează acum nativ generarea și editarea de video prin modelul Omni. Poți descrie în limbaj natural schimbările pentru un clip din galeria telefonului și să iterezi conversațional. Coerența personajelor s-a îmbunătățit, astfel încât identitatea și vocea se păstrează între scene. Este util mai ales dacă produci un scurtmetraj sau o campanie publicitară cu personaje recurente.
„Vibe coding” pentru instrumente personalizate. În loc să fii limitat la instrumentele livrate cu Flow, acum îți poți construi propriile instrumente direct pe platformă. Google a demonstrat exemple precum proiectarea de efecte video personalizate, crearea de instrumente pentru animație desenată de mână și construirea de fluxuri de lucru pentru stratificarea textului, toate fără a părăsi Flow.

Luate împreună, aceste actualizări poziționează Flow drept mai mult decât un asistent creativ. Devine o platformă pentru construirea de fluxuri creative, cu o aplicație mobilă acum în beta pe Android și în curând pe iOS.

Extinderea SynthID

SynthID, sistemul invizibil de watermarking AI al Google, a aplicat watermark la peste 100 de miliarde de imagini și videoclipuri și la 60.000 de ani de conținut audio cumulat de la lansarea sa de acum trei ani. Anunțul de la I/O care contează cel mai mult aici nu este scara, ci partenerii: OpenAI, Kakao și Eleven Labs adoptă SynthID alături de Nvidia, care s-a alăturat anul trecut.

Aderența la nivel de industrie este ceea ce contează. Un standard de watermarking funcționează doar dacă este suficient de răspândit încât „fără watermark” să devină un semnal util. Google extinde, de asemenea, verificarea Content Credentials (standardul C2PA) la Căutare și Chrome, ceea ce va arăta utilizatorilor dacă un conținut provine de la AI sau de la o cameră și dacă a fost editat cu instrumente generative. Combinația dintre SynthID și C2PA oferă provenienței două straturi independente, ceea ce este abordarea corectă dat fiind cât de ușor poate fi îndepărtat fiecare în parte.

Mențiuni onorabile

Câteva alte anunțuri de la I/O merită o notă rapidă:

Docs Live: O nouă funcție „voice-first” pentru Google Docs care îți permite să îți verbalizezi ideile, iar Gemini le structurează într-un document. Se lansează pentru abonați în această vară, cu capabilități vocale care ajung simultan în Gmail și Keep.
Google Pics: Un nou instrument AI de creare și editare imagini, construit pe modelul Nano Banana, care tratează fiecare element ca obiect individual, nu ca imagine plată. Disponibil acum pentru testeri de încredere, urmând să ajungă la abonații Google AI Pro și Ultra mai târziu în această vară.
Android Halo: Un nou spațiu de UI pe Android pentru a vedea actualizări live și progresul sarcinilor de la agenți precum Gemini Spark. Vine mai târziu în acest an.
Daily Brief: Un agent gata de folosit în aplicația Gemini care compilează un rezumat personalizat de dimineață din inbox, calendar și sarcini, cu pași următori sugerați. Nu s-a anunțat un preț separat; se așteaptă să facă parte din experiența aplicației Gemini.
TPU 8t și 8i: TPU-urile de generația a 8-a ale Google adoptă o abordare cu două cipuri, cu 8t optimizat pentru pretraining la scară mare (aproape 3x puterea brută de calcul față de generația anterioară, scalabil pe peste 1 milion de TPU-uri la nivel global) și 8i optimizat pentru inferență. Ambele oferă până la 2x performanță-pe-watt față de generația anterioară.
Gemini for Science: O colecție de instrumente AI care conectează Antigravity la peste 30 de baze de date majore din științele vieții. Science Skills este disponibil astăzi pe GitHub și direct în Antigravity.

Gânduri finale

Google I/O 2026 a pariat pe agenți ca direcție principală pentru AI, cu Gemini 3.5 Flash și Antigravity 2.0 drept infrastructura de bază pentru aproape tot ce s-a anunțat. Lucrurile pe care le poți folosi chiar acum sunt Gemini 3.5 Flash (prin Gemini API și AI Studio), noul agent Flow, Gemini Omni Flash și aplicația desktop Antigravity 2.0. Gemini Spark, agenții pentru Căutare și capabilitățile de UI generativă în Căutare se lansează pe parcursul verii, în mare parte condiționate de noul nivel AI Ultra de 100 $/lună (cel puțin inițial).

Pentru mine, upgrade-ul Antigravity a fost lansarea cea mai interesantă, deoarece operează simultan pe două niveluri: ca aplicație standalone pentru dezvoltatori, concurează direct cu Codex și Claude Code; ca platformă, ADK-ul subiacent și Managed Agents API provoacă cadrele de orchestrare precum LangChain, AutoGen și SDK-ul pentru Agenți al OpenAI. Integrarea cu Gemini și stratul de implementare pe Google Cloud sunt diferențiatorii (și riscul de lock-in) pe ambele fronturi.

Cum se compară Gemini 3.5 Flash cu GPT-5.5 și Claude Opus 4.7?

Cu ce diferă Google Antigravity de Claude Code sau Codex?

Google Antigravity 2.0 este o platformă de dezvoltare axată pe agenți care îți permite să orchestrezi mai mulți agenți AI în paralel printr-o aplicație desktop, CLI, SDK și un API enterprise. Spre deosebire de Claude Code (un agent de programare nativ pentru terminal) sau Codex (un sistem bazat pe coadă de taskuri), Antigravity oferă delimitare mai strictă a permisiunilor pe proiect, generare de subagenți și integrare directă cu Google Cloud și Firebase. Rolul său dual, atât ca instrument pentru dezvoltatori, cât și ca SDK de platformă, îl face mai comparabil cu un framework de orchestrare decât cu un asistent de programare standalone.

Merită planul Google AI Ultra de 100 $/lună comparativ cu ChatGPT Pro sau Claude Max?

Toate cele trei planuri costă 100 $/lună, dar valoarea depinde de ecosistemul tău. Diferențiatorul Google AI Ultra este accesul la Gemini Spark (un agent persistent 24/7), limite de utilizare de 5x mai mari în Antigravity și integrarea profundă cu Google Workspace. Dacă fluxul tău de lucru trăiește deja în Gmail, Docs și Calendar, Ultra are un avantaj natural. Dacă ai nevoie în principal de asistență pentru programare sau flexibilitate la nivel de API, ChatGPT Pro sau Claude Max pot fi mai potrivite.

Ce este Gemini Omni și cum gestionează generarea video?

Gemini Omni este modelul nativ multimodal al Google care acceptă orice combinație de text, imagini, audio și video ca input și produce ieșire video. Unifică sisteme anterior separate (Veo pentru video, Imagen pentru imagini) într-un singur model, ceea ce ar trebui să ducă la editări cross-modal mai coerente. Prima versiune, Omni Flash, este disponibilă acum, iar un Omni Pro mai capabil este așteptat în curând. Benchmark-uri independente nu au fost încă publicate, astfel că evaluarea calității în lumea reală este în curs.

Subiecte

Inteligență artificială

AI Agents

Află despre ecosistemul AI al Google

track

Google Workspace cu Gemini

4 oră

Înveți despre funcțiile cheie ale Gemini și despre modul în care acestea pot fi folosite pentru a îmbunătăți productivitatea și eficiența în Google Workspace.

Vezi detalii

Începeți cursul

track