Gemini 3.5 Flash: cel mai rapid model agentic de la Google

Google a lansat Gemini 3.5 Flash la I/O 2026, un model care îl depășește pe Gemini 3.1 Pro la benchmark-uri pentru agenți și programare, rulând de patru ori mai rapid decât competitorii.

Actualizat 19 mai 2026 · 8 min. citire

Google a anunțat Gemini 3.5 Flash la I/O 2026 pe 19 mai, un model care depășește Gemini 3.1 Pro la benchmark-urile pentru agenți și programare, rulând în același timp de patru ori mai rapid decât alte modele de vârf din aceeași categorie.

Lansarea vine în contextul în care atenția competitivă a industriei AI s-a mutat clar către performanța agentică. Agenții pentru programare, automatizarea fluxurilor de lucru în mai mulți pași și execuția sarcinilor pe termen lung au devenit principalele zone de luptă, iar Google poziționează 3.5 Flash ca răspunsul său la acest moment.

Pentru tot felul de profesioniști, inclusiv data scientists, ingineri ML și dezvoltatori, asta contează pentru că 3.5 Flash este acum (sau va fi în scurt timp) modelul implicit în aplicația Gemini și în modul AI din Căutare, și este disponibil de azi prin Gemini API. În acest articol, voi acoperi ce s-a anunțat, ce iese în evidență, cifrele din benchmark-uri și ce înseamnă pentru munca ta.

Ce e nou la Gemini 3.5 Flash

Promisiunea principală cu Gemii 3.5 Flash este viteza combinată cu performanță la nivel de frontieră. Google spune că 3.5 Flash este de patru ori mai rapid la tokeni de ieșire pe secundă decât alte modele de frontieră, depășind în același timp Gemini 3.1 Pro la benchmark-urile care contează cel mai mult pentru munca agentică.

Pe Terminal-Bench 2.1, obține 76,2%. Pe GDPval-AA, ajunge la 1.656 Elo. Pe MCP Atlas, atinge 83,6%. Pentru înțelegere multimodală, are 84,2% la CharXiv Reasoning.

Pe scurt, aceste cifre înseamnă că vechea regulă „rapid, ieftin sau inteligent; alege două” în AI e tot mai puțin aplicabilă. Avem un model ușor, capabil să gestioneze fluxuri de lucru agentice complexe, în mai mulți pași, fără latența masivă.

Google spune că modelul va fi disponibil în general începând de azi în Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform și Gemini Enterprise. Este, de asemenea, noul model implicit în aplicația Gemini și în modul AI din Căutare, la nivel global.

Google a anunțat, de asemenea, că Gemini 3.5 Pro este în dezvoltare, deja folosit intern, și este așteptat să fie lansat luna viitoare. Lansarea 3.5 Flash este prima mutare într-o nouă familie de modele construită în jurul execuției agentice.

Contextul Gemini 3.5

Seria Gemini 3 a consolidat poziția actuală a Google în cursa modelelor de frontieră. Gemini 3.1 Pro, lansat în februarie 2026, a condus Artificial Analysis Intelligence Index la lansare și a obținut 77,1% pe ARC-AGI-2, mai mult decât dublând scorul de 31,1% al lui Gemini 3 Pro la acel benchmark.

După cum am acoperit în comparația GPT-5.5 vs Gemini 3.1 Pro, punctul forte al lui Gemini 3.1 Pro era raționamentul vizual complex și sarcinile multimodale.

Conveția de denumire Flash în familia Gemini a semnalat mereu modele optimizate pentru viteză. Ce e diferit la 3.5 Flash este că Google revendică inteligență la nivel de frontieră la viteze Flash, fără compromis de calitate. Indicele Artificial Analysis plasează 3.5 Flash în cadranul din dreapta sus (conform Google), adică inteligență ridicată și viteză mare de ieșire simultan.

Framework-ul Antigravity, cadrul Google pentru implementarea de subagenți colaborativi, este central pentru modul în care e poziționat 3.5 Flash. Nu este doar un model de sine stătător, ci o componentă într-o arhitectură multi-agent pe care Google a dezvoltat-o în paralel cu modelul.

Funcții-cheie ale lui Gemini 3.5

Iată o sinteză a informațiilor cele mai interesante din anunț.

Performanță în benchmark-uri

Afirmațiile Google privind benchmark-urile pentru 3.5 Flash sunt specifice și merită analizate direct. Modelul îl depășește pe Gemini 3.1 Pro la următoarele:

Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro a fost evaluat pe Terminal-Bench 2.0 la 68,5%, conform acoperirii noastre anterioare)
GDPval-AA: 1.656 Elo (Claude Opus 4.7 conducea acest benchmark la 1.753 Elo la lansare, conform recenziei noastre Claude Opus 4.7 vs Gemini 3.1 Pro)
MCP Atlas: 83,6% (Gemini 3.1 Pro a obținut 73,9% pe MCP Atlas în testările noastre anterioare)
CharXiv Reasoning: 84,2% pentru înțelegere multimodală

Afirmația privind viteza e de asemenea notabilă: de patru ori mai rapid la tokeni de ieșire pe secundă decât alte modele de frontieră. Google nu specifică împotriva căror modele compară în notele de cercetare, așa că tratează această cifră ca orientativă, nu ca un duel direct precis.

Arhitectură agentică și Antigravity

3.5 Flash este conceput să funcționeze cu cadrul Antigravity, framework-ul Google pentru rularea subagenților colaborativi. Cu Antigravity, modelul poate lansa mai mulți subagenți în paralel, executa fluxuri de lucru în mai mulți pași și menține performanța pe sarcini cu orizont lung.

Exemplele Google includ sintetizarea lucrării AlphaZero și programarea unui joc complet jucabil în șase ore folosind doi agenți, precum și transformarea unei baze de cod legacy la Next.js. Nu sunt demo-uri banale. Reflectă tipul de sarcini de dezvoltare pe parcursul mai multor zile pe care sistemele agentice sunt acum chemate să le gestioneze.

Implementări reale în enterprise

Mai multe companii rulează deja 3.5 Flash în producție sau pilot. Cazurile de utilizare specifice merită notate pentru că ilustrează unde sunt aplicate punctele forte agentice ale modelului:

Shopify: Rularea de subagenți în paralel pentru a analiza date complexe pe termen lung, pentru prognoze de creștere a comercianților
Macquarie Bank: Pilot pentru onboarding-ul clienților, prin raționare pe documente de peste 100 de pagini cu latență redusă
Salesforce: Integrare în Agentforce pentru automatizarea sarcinilor enterprise cu mai mulți subagenți și apelare de unelte în mai multe ture
Xero: Implementarea de agenți pentru a gestiona fluxuri de lucru de mai multe săptămâni, inclusiv pregătirea formularelor fiscale 1099 pentru micile afaceri
Databricks: Folosirea fluxurilor de lucru agentice pentru a monitoriza informații în timp real, a diagnostica probleme și a propune soluții pe seturi mari de date
Ramp: Îmbunătățirea acurateței OCR pe facturi complexe prin înțelegere multimodală combinată cu raționare pe tipare istorice

Gemini Spark și disponibilitate pentru consumatori

3.5 Flash este și modelul care alimentează Gemini Spark, noul agent personal AI al Google care rulează non-stop și acționează în numele utilizatorilor. Google lansează acum Spark către testeri de încredere, cu un Beta planificat pentru abonații Google AI Ultra din SUA în săptămâna de după anunțul de la I/O.

Modelul este disponibil azi pentru miliarde de utilizatori la nivel global prin aplicația Gemini și modul AI din Căutare, făcând din aceasta una dintre cele mai ample lansări simultane pentru consumatori și dezvoltatori pe care Google le-a făcut pentru un model Gemini.

Siguranță și măsuri de protecție

Google spune că 3.5 Flash a fost dezvoltat sub Frontier Safety Framework, cu măsuri consolidate pentru securitate cibernetică și CBRN. Compania folosește unelte de interpretabilitate care verifică raționamentul intern al modelului înainte de a răspunde, menite să reducă atât ieșirile dăunătoare, cât și refuzurile false la întrebări sigure.

Gemini 3.5 pentru practicienii Data și AI

Cea mai imediată implicație practică este că 3.5 Flash este disponibil iminent prin Gemini API în Google AI Studio. Dacă construiești pipeline-uri agentice, combinația dintre scorul MCP Atlas (83,6%) și cadrul multi-agent Antigravity merită testată în raport cu ce folosești în prezent.

Scorul GDPval-AA de 1.656 Elo este sub cei 1.753 Elo ai lui Claude Opus 4.7 din recenzia noastră anterioară, dar avantajul de viteză al lui 3.5 Flash poate conta mai mult în funcție de cerințele tale de latență.

Pentru echipele care rulează fluxuri de lucru pe termen lung, implementările Xero și Shopify sunt semnalele cele mai instructive. Fluxurile de lucru de mai multe săptămâni comprimate în runde automate de agenți sunt cazul de utilizare pentru care Google optimizează, iar cadrul Antigravity este stratul de infrastructură care face asta posibil. Dacă nu ești deja familiarizat cu tiparele de orchestrare multi-agent, acesta e un moment bun să te pui la punct.

Un lucru pe care l-aș urmări atent: Google spune că 3.5 Flash costă mai puțin de jumătate din prețul altor modele de frontieră pentru sarcini comparabile. Acea afirmație depinde mult de volumul tău specific de lucru, dar dacă se confirmă în practică, schimbă economia rulării sistemelor agentice la scară. Modelul 3.5 Pro, așteptat luna viitoare, va fi punctul de comparație mai interesant pentru echipele care fac muncă de raționare intensă.

Gânduri finale

Gemini 3.5 Flash arată că Google intenționează să concureze la ambele capete ale curbei performanță-viteză, nu doar la nivelul flagship. Faptul că îl depășește pe Gemini 3.1 Pro la benchmark-uri agentice în timp ce rulează la viteze Flash este o schimbare semnificativă, iar implementările enterprise la Shopify, Macquarie și Salesforce sugerează că modelul rezistă și în afara benchmark-urilor controlate.

Imaginea mai largă este că Google pariază puternic pe infrastructura agentică, cu Antigravity, Gemini Spark și 3.5 Flash mergând toate în aceeași direcție. Dacă acest pariu se materializează depinde de cum va performa 3.5 Pro când va sosi luna viitoare și de cum se compară cadrul Antigravity cu alte framework-uri multi-agent în fluxurile de lucru reale ale dezvoltatorilor.

Dacă vrei să te pui rapid la punct cu conceptele de AI agentic și cu modul de a construi cu astfel de modele, îți recomand să consulți parcursul de competențe AI Agent Fundamentals pe DataCamp.

Subiecte

Inteligență artificială

AI Agents