Sari la conținutul principal

Google I/O 2026: începutul erei Gemini cu agenți

De la Gemini 3.5 Flash și Gemini Omni la Antigravity 2.0 și Gemini Spark, iată ce contează cel mai mult din keynote-ul Google I/O 2026 axat pe agenți.
Actualizat 20 mai 2026  · 12 min. citire

Ideea centrală a aproape fiecărui anunț din prima zi a conferinței Google I/O 2026 a fost aceeași: agenții. Nu chatboturi, nu asistenți, ci agenți persistenți, care execută sarcini în fundal și se integrează în întregul stack de produse Google. CEO-ul Sundar Pichai a numit-o explicit „era Gemini cu agenți”, iar anunțurile au susținut pe deplin această viziune.

Google a răspuns, de asemenea, abonamentelor Claude Max de la Anthropic și ChatGPT Pro de la OpenAI prin introducerea unui nou nivel Google AI Ultra la I/O, la același preț de 100 $/lună, care condiționează accesul la unele dintre funcțiile axate pe agenți prezentate mai jos.

În acest articol, te voi ghida prin anunțurile care contează cel mai mult pentru practicienii AI și dezvoltatori. Mă voi concentra pe actualizări disponibile acum sau care sunt așteptate în curând. 

Gemini 3.5 Flash

Gemini 3.5 Flash este lansarea de model vedetă de la I/O 2026. Depășește Gemini 3.1 Pro pe benchmarkurile de tip agent și de programare, iar Google susține că rulează de 4 ori mai rapid la nivel de tokeni de ieșire pe secundă decât alte modele de vârf. Deși nu putem confirma încă, este cu siguranță o afirmație îndrăzneață.

La nivel de benchmark, saltul de performanță este vizibil, mai ales în MCP Atlas, CharXiV Reasoning și Finance Agent v2, unde Gemini 3.5 Flash conduce. Per total, 3.5 Flash pare competitiv cu Claude Opus 4.7 și GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76.2%

58.0%

70.3%

--

66.1%

78.2%

SWE-Bench Pro

55.1%

49.6%

54.2%

--

64.3%

58.6%

MCP Atlas

83.6%

62.0%

78.2%

69.5%

79.1%

75.3%

OSWorld

78.4%

65.1%

76.2%

72.5%

78.0%

78.7%

Finance Agent v2

57.9%

42.6%

43.0%

51.0%

51.5%

51.8%

CharXiv Reasoning

84.2%

80.3%

83.3%

72.4%

82.1%

84.1%

Humanity's Last Exam

40.2%

33.7%

44.4%

33.2%

46.9%

41.4%

ARC-AGI-2

72.1%

33.6%

77.1%

58.3%

75.8%

84.6%

Merită menționat și aspectul costurilor. Google susține că întreprinderile care procesează aproximativ 1 trilion de tokeni pe zi ar putea economisi peste 1 miliard de dolari anual trecând 80% din sarcini de la alte modele de vârf la 3.5 Flash. Este o adresare directă clienților enterprise ai OpenAI și Anthropic. Gemini 3.5 Flash este disponibil astăzi prin Gemini API, Google AI Studio și aplicația Gemini. Gemini 3.5 Pro este deja folosit intern și este așteptat luna viitoare.

Pentru mai multe detalii, îți recomand să citești articolul nostru despre Gemini 3.5 Flash, unde acoperim noul model mai în profunzime.

Gemini Omni

Gemini Omni este noul model generativ media nativ multimodal al Google, capabil să primească orice combinație de text, imagini, audio și video ca intrare și să producă ieșire video. Primul model din familie, Gemini Omni Flash, este disponibil astăzi în aplicația Gemini, Google Flow și YouTube Shorts.

Punctul arhitectural cheie este că Omni unifică ceea ce anterior era un stack separat (Veo pentru video, Imagen pentru imagini, sisteme audio separate) într-un singur model. Asta înseamnă editări mai coerente și mai puține artefacte de pipeline când lucrezi între modalități. Google nu a publicat benchmarkuri numerice pentru Omni la lansare, așa că evaluarea independentă este încă în așteptare. Accesul la API pentru dezvoltatori și clienți enterprise va veni în săptămânile de după I/O.

Le-am testat și am scris totul în articolul nostru despre Gemini Omni. Primele rezultate de generare video au fost inegale (cel puțin raportat la standardele ridicate impuse de instrumente precum Seedance 2.0), dar este așteptat în curând un Gemini Omni Pro mai puternic.

Antigravity 2.0

Antigravity este platforma de dezvoltare Google, cu prioritate pentru agenți, iar versiunea 2.0 lansată la I/O este o extindere semnificativă. Anterior poziționată ca un mediu de programare, acum este o platformă completă pentru dezvoltarea, implementarea și gestionarea cohortelor de agenți AI autonomi. Piesa centrală este o nouă aplicație desktop de sine stătătoare, care acționează ca un hub central pentru orhestrarea agenților, permițându-ți să rulezi mai mulți agenți în paralel pe sarcini diferite simultan.

Ecosistemul are acum patru interfețe distincte pentru dezvoltatori:

  • Aplicația desktop Antigravity 2.0: Orchestrarează mai mulți agenți în paralel și suportă sarcini programate în fundal. Se integrează cu Google AI Studio, Android și Firebase.
  • Antigravity CLI: O interfață nativă de terminal pentru crearea și rularea agenților fără GUI. Google le cere utilizatorilor Gemini CLI să migreze la aceasta.
  • Antigravity SDK: Acces programatic la același „ham” de agenți care alimentează produsele Google, cu suport pentru comportamente de agenți personalizate, găzduite pe propria infrastructură.
  • Antigravity în Gemini Enterprise Agent Platform: Conectează direct Antigravity la proiecte Google Cloud pentru sarcini enterprise.

Și nucleul agentului primește câteva funcții noi foarte utile. Cea mai mare: poate acum să creeze subagenți modulari din mers, fiecare rulând în paralel, cu izolare de workspace și moștenind configurațiile de unelte și permisiunile părintelui. Operațiunile de lungă durată rulează asincron, astfel încât nu mai blochează bucla agentului.

Similar cu Claude Code Hooks, JSON Hooks îți permit să atașezi scripturi shell personalizate în etape-cheie ale execuției (înainte/după apeluri de unelte, apeluri de model sau la condiții de oprire) pentru logare, personalizarea argumentelor sau injectarea de instrucțiuni. Sarcinile programate îți permit să setezi prompturi bazate pe cron pentru rulări periodice ale agenților, precum rezumate zilnice de PR sau verificări orare ale deployment-urilor, cu rezultate afișate în bara laterală pentru o predare lină către interacțiunea human-in-the-loop.

Pe partea de management, Antigravity introduce „proiectele” ca primitivă organizațională ce delimitează setările, resursele și permisiunile per grup de agenți, în loc să impună cele mai largi permisiuni globale pentru tot. Panoul lateral reproiectat permite gruparea conversațiilor după proiect, status sau recență, cu suport nativ pentru Git worktree încorporat. Acest layout bazat pe proiecte este comparabil cu managementul multi-fereastră al workspace-urilor din Cursor și coada de taskuri din Codex, dar cu o delimitare mai strictă a permisiunilor per proiect.

Worktree-urile Git native pot fi create ușor când începi o conversație nouă.

Intrare vocală prin modelele Gemini Audio și noi comenzi slash (/goal pentru rulări autonome, /grill-me pentru clarificări înainte de task, /schedule pentru prompturi cron, /browser pentru folosirea browserului cu opt-in) completează experiența de utilizare.

Antigravity 2.0 este disponibil pentru utilizatori începând de astăzi. Abonamentul Google AI Ultra (100 $/lună) include un plafon de utilizare de 5 ori mai mare în Antigravity comparativ cu planul Google AI Pro.

Agenți gestionați în Gemini API

Odată cu Antigravity 2.0, Google a anunțat Managed Agents în Gemini API, aducând capabilități de tip agent direct la nivelul API pentru dezvoltatorii care vor să construiască aplicații alimentate de agenți fără să gestioneze ei înșiși infrastructura de orchestrare. Acesta este complementul la nivel de API pentru experiența desktop Antigravity.

Implicația practică pentru dezvoltatori este că acum poți defini comportamente de agenți, integrări de unelte și fluxuri multi-pas prin Gemini API, iar infrastructura Google va gestiona execuția. Asta are potențialul de a schimba jocul pentru echipele care construiesc aplicații de producție ce necesită execuții pe orizont lung, fără să-și pornească și administreze propriul „ham” de agenți. Accesul este disponibil prin Google AI Studio, iar clienții enterprise îl pot accesa prin Gemini Enterprise Agent Platform.

Un avertisment onest: feedbackul timpuriu al dezvoltatorilor din acoperirea I/O remarcă faptul că documentația pentru fluxuri complexe de agenți și gestionarea erorilor este încă slabă. Limitările de rată și gestionarea cotelor sunt, de asemenea, semnalate ca puncte de frecare. Ambele sunt probleme care probabil se vor atenua în timp, dar merită știute înainte să te angajezi să construiești pe acest stack.

Gemini Spark

Gemini Spark (de neconfundat cu cel mai recent LLM al Meta, Muse Spark) este noul agent AI personal al Google și cel mai orientat spre consumatori dintre anunțurile despre agenți. Rulează non-stop pe mașini virtuale dedicate în Google Cloud, ceea ce înseamnă că nu are nevoie ca laptopul tău să fie deschis ca să continue să lucreze. Spark este alimentat de Gemini 3.5 și „hamul” Antigravity, ceea ce îi oferă capacitatea de a gestiona sarcini pe termen lung în fundal.

Setul de funcții la lansare include:

  • Integrare cu instrumentele Google (Workspace, Gmail, Calendar) la lansare, cu suport pentru unelte terțe prin MCP în săptămânile următoare.
  • Interacțiune prin aplicația Gemini, iar în curând și prin email și chat.
  • Operare direct în Chrome ca un strat de navigare de tip agent, în cursul acestei veri.
  • Progres live al sarcinilor vizibil prin Android Halo, un nou spațiu de UI pe Android, mai târziu în acest an.

Merită făcută direct comparația cu ecosistemul de agenți al OpenAI și capabilitățile de folosire a uneltelor de la Anthropic. Diferențiatorul lui Spark este execuția persistentă 24/7 pe infrastructura Google Cloud, combinată cu integrarea profundă în suita de productivitate Google. Dacă munca ta trăiește deja în Google Workspace, este un avantaj semnificativ. Dacă nu, propunerea de valoare e mai puțin evidentă.

Confidențialitatea este îngrijorarea legitimă aici. Un agent care îți monitorizează continuu inboxul, calendarul și documentele ridică întrebări reale despre rezidența datelor și conformitate în industrii reglementate. O întrebare pe care mi-am pus-o a fost, de exemplu: „Ce se întâmplă cu memoria agentului când un angajat pleacă?” Google nu a oferit încă răspunsuri detaliate la aceste întrebări. Spark este lansat către testeri de încredere săptămâna aceasta, cu un Beta pentru abonații Google AI Ultra (100 $/lună) în SUA, săptămâna următoare.

Managed Agents vs Gemini Spark

Agenți de căutare și modul AI

Modul AI în Căutare a fost introdus la ultimul I/O. La un an distanță, a depășit un miliard de utilizatori activi lunar. Acum, Google merge mai departe cu două capabilități noi axate pe agenți.

Prima este agenții de informare în Căutare: agenți personali în fundal pe care îi configurezi pentru a monitoriza subiecte și a scoate la suprafață informații relevante la momentul potrivit. Aceștia vor fi lansați în această vară, începând cu abonații Google AI Pro și Ultra.

A doua este UI-ul generativ în Căutare, alimentat de Gemini 3.5 Flash și Antigravity. Căutarea va construi acum layouturi personalizate, vizuale interactive și chiar dashboarduri persistente sau mini-aplicații pentru interogări complexe, de lungă durată. Capabilitățile de UI generativ vor ajunge la toți utilizatorii gratuit în această vară. Funcțiile de dashboard persistent și aplicații personalizate vor fi disponibile mai întâi pentru abonații Pro și Ultra din SUA.

Aceasta este o reală îngrijorare pentru publisheri și profesioniștii SEO (așa cum au fost deja introducerile AI Overview și Modul AI). Când răspunsurile generate de AI rezolvă pe deplin întrebarea utilizatorului direct în Căutare, nu mai există motiv să dai click pe siteul sursă. Am văzut deja acest lucru în practică: atât AI Overviews, cât și lansarea inițială a Modulului AI au dus la scăderi semnificative de trafic în industrie. Google încă nu a introdus o modalitate clară de a împărți veniturile sau de a garanta trafic către publisherii ale căror conținut alimentează aceste răspunsuri.

Google Flow

Google Flow, lansat la I/O 2025 ca un instrument de filmmaking AI, a făcut un mare pas înainte cu trei actualizări-cheie:

  • Agent de planificare mai inteligent. Agentul Flow actualizat poate acum planifica și raționa prin proiecte creative în mai mulți pași. Îi dai intrările (să zicem un concept, câteva imagini de referință, un scenariu aproximativ) și te ajută să treci de la brainstorming la creare și editare, totul într-un singur mediu. Noul agent este disponibil pentru toată lumea de astăzi.
  • Video nativ prin Gemini Omni. Flow gestionează acum nativ generarea și editarea video prin modelul Omni. Poți descrie în limbaj natural modificările unui clip din galeria telefonului și să iterezi conversațional. A crescut și consistența personajelor, astfel încât identitatea și vocea sunt păstrate între scene. Este util mai ales dacă produci un scurtmetraj sau o campanie publicitară cu personaje recurente.
  • Vibe coding pentru unelte personalizate. În loc să fii limitat la uneltele cu care vine Flow, îți poți construi acum propriile unelte direct pe platformă. Google a demonstrat exemple precum proiectarea de efecte video personalizate, crearea de unelte pentru animație desenată de mână și construirea de fluxuri pentru suprapuneri de text, toate fără să părăsești Flow.

Luate împreună, aceste actualizări poziționează Flow ca mai mult decât un asistent creativ. Devine o platformă pentru construirea de fluxuri creative, cu o aplicație mobilă acum în beta pe Android și în curând pe iOS.

Extinderea SynthID

SynthID, sistemul invizibil de watermarking AI al Google, a marcat peste 100 de miliarde de imagini și videoclipuri și 60.000 de ani de conținut audio de la lansarea sa de acum trei ani. Anunțul de la I/O care contează cel mai mult aici nu este scara, ci partenerii: OpenAI, Kakao și Eleven Labs adoptă SynthID alături de Nvidia, care s-a alăturat anul trecut.

Această adopție cross-industrie este ceea ce o face relevantă. Un standard de watermarking funcționează doar dacă este suficient de răspândit încât „fără watermark” să devină un semnal util. Google extinde, de asemenea, verificarea Content Credentials (standardul C2PA) în Căutare și Chrome, ceea ce le va arăta utilizatorilor dacă un conținut provine de la AI sau de la o cameră și dacă a fost editat cu unelte generative. Combinația dintre SynthID și C2PA oferă două straturi independente de proveniență, abordarea corectă având în vedere cât de ușor poate fi eliminat fiecare în parte.

Mentiuni onorabile

Mai multe alte anunțuri de la I/O merită menționate pe scurt:

  • Docs Live: O nouă funcție voice-first pentru Google Docs care îți permite să-ți „verși” verbal ideile, iar Gemini le structurează într-un document. Se lansează pentru abonați în această vară, cu capabilități vocale care ajung în Gmail și Keep în același timp.
  • Google Pics: Un nou instrument AI de creare și editare de imagini construit pe modelul Nano Banana, care tratează fiecare element ca un obiect individual, nu ca o imagine plată. Disponibil acum pentru testeri de încredere, în curs de lansare pentru abonații Google AI Pro și Ultra mai târziu în această vară.
  • Android Halo: Un nou spațiu de UI pe Android pentru a vedea actualizări live și progresul sarcinilor de la agenți precum Gemini Spark. Vine mai târziu în acest an.
  • Daily Brief: Un agent gata de folosit în aplicația Gemini care compilează un rezumat personalizat de dimineață din inboxul, calendarul și taskurile tale, cu următorii pași sugerați. Nu a fost anunțat un preț separat; se așteaptă să facă parte din experiența aplicației Gemini.
  • TPU 8t și 8i: TPU-urile de generația a 8-a de la Google adoptă o abordare dual-chip, cu 8t optimizat pentru pre-antrenare la scară mare (aproape de 3 ori mai multă putere de calcul brută decât generația anterioară, scalabilă pe peste 1 milion de TPU-uri la nivel global) și 8i optimizat pentru inferență. Ambele oferă până la 2x performanță-per-watt mai bună decât generația precedentă.
  • Gemini for Science: O colecție de unelte AI care conectează Antigravity la peste 30 de baze de date majore din științele vieții. Science Skills este disponibil azi pe GitHub și direct în Antigravity.

Gânduri finale

Google I/O 2026 a pariat pe agenți ca direcție principală pentru AI, cu Gemini 3.5 Flash și Antigravity 2.0 ca infrastructură de bază pentru aproape tot ce a fost anunțat. Lucrurile pe care le poți folosi chiar acum sunt Gemini 3.5 Flash (prin Gemini API și AI Studio), noul agent Flow, Gemini Omni Flash și aplicația desktop Antigravity 2.0. Gemini Spark, agenții din Căutare și funcțiile de UI generativ în Căutare vor fi lansate pe parcursul verii, în mare parte condiționate de noul nivel AI Ultra de 100 $/lună (cel puțin inițial).

Pentru mine, upgrade-ul Antigravity a fost cea mai interesantă lansare, pentru că operează pe două niveluri simultan: ca aplicație autonomă pentru dezvoltatori, concurează direct cu Codex și Claude Code; ca platformă, ADK-ul de bază și Managed Agents API provoacă frameworkuri de orchestrare precum LangChain, AutoGen și OpenAI's Agents SDK. Integrarea cu Gemini și stratul de deployment pe Google Cloud sunt diferențiatorii (și riscul de lock-in) pe ambele fronturi.

Google I/O 2026: întrebări frecvente

Cum se compară Gemini 3.5 Flash cu GPT-5.5 și Claude Opus 4.7?

Gemini 3.5 Flash conduce pe mai multe benchmarkuri axate pe agenți, precum MCP Atlas (83,6%) și Finance Agent v2 (57,9%), în timp ce GPT-5.5 are un ușor avans pe SWE-Bench Pro și ARC-AGI-2. Claude Opus 4.7 rămâne cel mai puternic la Humanity's Last Exam (46,9%). Concluzia principală este că este competitiv cu modelele de vârf, rulând mai rapid și semnificativ mai ieftin la scară, așa cum sugerează și numele. O variantă Pro mai puternică este așteptată în curând.

Cu ce diferă Google Antigravity de Claude Code sau Codex?

Google Antigravity 2.0 este o platformă de dezvoltare cu prioritate pentru agenți, care îți permite să orchestrezi mai mulți agenți AI în paralel printr-o aplicație desktop, CLI, SDK și un API enterprise. Spre deosebire de Claude Code (un agent de programare nativ pentru terminal) sau Codex (un sistem bazat pe coadă de taskuri), Antigravity oferă o delimitare mai strictă a permisiunilor per proiect, creare de subagenți și integrare directă cu Google Cloud și Firebase. Rolul său dual, atât ca instrument pentru dezvoltatori, cât și ca SDK de platformă, îl face mai apropiat de un framework de orchestrare decât de un simplu asistent de programare.

Merită planul Google AI Ultra de 100 $/lună comparativ cu ChatGPT Pro sau Claude Max?

Toate cele trei planuri costă 100 $/lună, dar valoarea depinde de ecosistemul tău. Diferențiatorul Google AI Ultra este accesul la Gemini Spark (un agent persistent 24/7), limite de utilizare de 5 ori mai mari în Antigravity și integrarea profundă cu Google Workspace. Dacă fluxul tău de lucru trăiește deja în Gmail, Docs și Calendar, Ultra are un avantaj natural. Dacă ai nevoie în principal de asistență la programare sau flexibilitate la nivel de API, ChatGPT Pro sau Claude Max ar putea să-ți fie mai potrivite.

Ce este Gemini Omni și cum gestionează generarea video?

Gemini Omni este modelul nativ multimodal al Google, care acceptă orice combinație de text, imagini, audio și video ca intrare și produce ieșire video. Unifică sisteme anterior separate (Veo pentru video, Imagen pentru imagini) într-un singur model, ceea ce ar trebui să ducă la editări cross-modale mai coerente. Prima versiune, Omni Flash, este disponibilă acum, iar un Omni Pro mai capabil este așteptat în curând. Benchmarkuri independente nu au fost încă publicate, astfel că evaluarea calității în lumea reală este în derulare.

Subiecte

Află despre ecosistemul AI al Google!

track

Google Workspace cu Gemini

4 oră
Înveți despre funcțiile cheie ale Gemini și despre modul în care acestea pot fi folosite pentru a îmbunătăți productivitatea și eficiența în Google Workspace.
Vezi detaliiRight Arrow
Începeți cursul
Vezi mai multRight Arrow