Gemini 3.5 Flash: najszybszy model agentowy Google

Google zaprezentowało Gemini 3.5 Flash na I/O 2026 — model, który przewyższa Gemini 3.1 Pro w benchmarkach agentowych i kodowania, a jednocześnie działa cztery razy szybciej niż konkurencja.

Zaktualizowano 19 maj 2026 · 8 min Czytać

Google ogłosiło Gemini 3.5 Flash podczas I/O 2026, 19 maja — model, który przewyższa Gemini 3.1 Pro w benchmarkach agentowych i kodowania, jednocześnie działając cztery razy szybciej niż inne modele czołowe w tej samej klasie.

Premiera następuje w momencie, gdy konkurencja w branży AI koncentruje się wprost na wydajności agentowej. Agenci do kodowania, automatyzacja wieloetapowych przepływów pracy i realizacja zadań o długim horyzoncie stały się głównymi polami rywalizacji, a Google pozycjonuje 3.5 Flash jako swoją odpowiedź na ten trend.

Dla specjalistów wszelkiej maści — w tym data scientistów, inżynierów ML i deweloperów — ma to znaczenie, bo 3.5 Flash jest już (albo wkrótce będzie) domyślnym modelem w aplikacji Gemini i w Trybie AI w Wyszukiwaniu, a dziś jest dostępny przez Gemini API. W tym artykule opiszę, co ogłoszono, co się wyróżnia, jakie są wyniki benchmarków i co to oznacza dla twojej pracy.

Co nowego w Gemini 3.5 Flash

Kluczowym hasłem przy Gemii 3.5 Flash jest szybkość połączona z wydajnością na poziomie modeli czołowych. Google twierdzi, że 3.5 Flash jest cztery razy szybszy pod względem liczby generowanych tokenów na sekundę niż inne modele czołowe, a jednocześnie przewyższa Gemini 3.1 Pro w benchmarkach najważniejszych dla pracy agentowej.

W Terminal-Bench 2.1 uzyskuje 76,2%. W GDPval-AA osiąga 1 656 Elo. W MCP Atlas notuje 83,6%. W zakresie rozumienia multimodalnego zdobywa 84,2% w CharXiv Reasoning.

Krótko mówiąc, te liczby oznaczają, że dawna reguła „szybki, tani lub mądry — wybierz dwa” w AI mniej się już sprawdza. Dostajemy lekki model zdolny obsłużyć złożone, wieloetapowe przepływy agentowe bez ogromnych opóźnień.

Google informuje, że model będzie od dziś powszechnie dostępny w Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform i Gemini Enterprise. Jest też nowym domyślnym modelem w aplikacji Gemini oraz w Trybie AI w Wyszukiwaniu na całym świecie.

Google ogłosiło również, że Gemini 3.5 Pro jest w trakcie prac, już wykorzystywany wewnętrznie, a jego udostępnienie spodziewane jest w przyszłym miesiącu. Wydanie 3.5 Flash to pierwszy krok w nowej rodzinie modeli zorientowanych na wykonanie zadań przez agentów.

Tło Gemini 3.5

Seria Gemini 3 ugruntowała obecną pozycję Google w wyścigu modeli czołowych. Gemini 3.1 Pro, wydany w lutym 2026, prowadził w Artificial Analysis Intelligence Index w momencie premiery i zdobył 77,1% w ARC-AGI-2, ponad dwukrotnie więcej niż 31,1% Gemini 3 Pro na tym benchmarku.

Jak opisaliśmy w naszym porównaniu GPT-5.5 vs Gemini 3.1 Pro, siłą Gemini 3.1 Pro było złożone rozumowanie wizualne i zadania multimodalne.

Nazewnictwo Flash w rodzinie Gemini zawsze sygnalizowało modele zoptymalizowane pod kątem szybkości. Różnica przy 3.5 Flash polega na tym, że Google deklaruje inteligencję na poziomie czołowym przy prędkościach Flash, bez kompromisu jakości. Według Google, indeks Artificial Analysis lokuje 3.5 Flash w prawym górnym kwadrancie, co oznacza jednocześnie wysoką inteligencję i dużą szybkość generowania.

Kluczowa dla pozycjonowania 3.5 Flash jest platforma Antigravity, framework Google do uruchamiania współpracujących subagentów. To nie tylko samodzielny model, ale element architektury multi-agent, którą Google rozwija równolegle z samym modelem.

Kluczowe funkcje Gemini 3.5

Oto najciekawsze informacje z ogłoszenia.

Wydajność w benchmarkach

Twierdzenia Google dotyczące 3.5 Flash są konkretne i warte bezpośredniej analizy. Model przewyższa Gemini 3.1 Pro w następujących obszarach:

Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro był testowany na Terminal-Bench 2.0 i uzyskał 68,5%, zgodnie z naszym wcześniejszym omówieniem)
GDPval-AA: 1 656 Elo (Claude Opus 4.7 prowadził w tym benchmarku z wynikiem 1 753 Elo w momencie premiery, zgodnie z naszym porównaniem Claude Opus 4.7 vs Gemini 3.1 Pro)
MCP Atlas: 83,6% (Gemini 3.1 Pro uzyskał 73,9% w MCP Atlas w naszych wcześniejszych testach)
CharXiv Reasoning: 84,2% w rozumieniu multimodalnym

Na uwagę zasługuje też deklaracja szybkości: czterokrotnie więcej tokenów wyjściowych na sekundę niż inne modele czołowe. Google nie precyzuje, z jakimi modelami się porównuje w materiałach badawczych, więc potraktuj tę wartość jako orientacyjną, a nie precyzyjne zestawienie jeden do jednego.

Architektura agentowa i Antigravity

3.5 Flash zaprojektowano do współpracy z platformą Antigravity, frameworkiem Google do uruchamiania współpracujących subagentów. Dzięki Antigravity model może uruchamiać wiele subagentów równolegle, wykonywać wieloetapowe przepływy oraz utrzymywać wydajność w zadaniach o długim horyzoncie.

W przykładach Google znalazły się synteza artykułu AlphaZero i zakodowanie w pełni grywalnej gry w sześć godzin przy użyciu dwóch agentów, a także transformacja starszej bazy kodu do Next.js. To nie są pokazowe zabawki. Odzwierciedlają wielodniowe zadania deweloperskie, które dziś powierza się systemom agentowym.

Wdrożenia w przedsiębiorstwach

Kilka firm już uruchamia 3.5 Flash w produkcji lub pilotażu. Warto przyjrzeć się konkretnym przypadkom użycia, bo pokazują, gdzie wykorzystywane są mocne strony modelu w pracy agentowej:

Shopify: Równoległe uruchamianie subagentów do analizy złożonych danych w długim horyzoncie na potrzeby prognoz wzrostu sprzedawców
Macquarie Bank: Pilotaż onboardingu klientów przez rozumowanie nad dokumentami 100+ stron przy niskiej latencji
Salesforce: Integracja z Agentforce do automatyzacji zadań korporacyjnych z wykorzystaniem wielu subagentów i wielokrotnych wywołań narzędzi
Xero: Wdrażanie agentów do obsługi wielotygodniowych przepływów, w tym przygotowywania formularzy podatkowych 1099 dla małych firm
Databricks: Wykorzystanie przepływów agentowych do monitorowania informacji w czasie rzeczywistym, diagnozowania problemów i proponowania rozwiązań na dużych zbiorach danych
Ramp: Poprawa dokładności OCR na złożonych fakturach dzięki rozumieniu multimodalnemu połączonemu z analizą wzorców historycznych

Gemini Spark i dostęp dla konsumentów

3.5 Flash zasila także Gemini Spark — nowego osobistego agenta AI Google, działającego 24/7 i podejmującego działania w imieniu użytkowników. Google udostępnia Spark zaufanym testerom, a Beta jest planowana dla subskrybentów Google AI Ultra w USA w tygodniu po ogłoszeniu na I/O.

Model jest dostępny już dziś dla miliardów użytkowników na całym świecie poprzez aplikację Gemini i Tryb AI w Wyszukiwaniu, co czyni to jednym z najszerszych jednoczesnych wydań konsumencko-deweloperskich modelu Gemini.

Bezpieczeństwo i zabezpieczenia

Google podaje, że 3.5 Flash powstał zgodnie z Frontier Safety Framework, ze wzmocnionymi zabezpieczeniami cyber i CBRN. Firma stosuje narzędzia interpretowalności sprawdzające wewnętrzne rozumowanie modelu przed odpowiedzią, co ma ograniczać szkodliwe wyjścia i fałszywe odmowy przy bezpiecznych zapytaniach.

Gemini 3.5 dla praktyków danych i AI

Najbardziej bezpośrednią konsekwencją praktyczną jest to, że 3.5 Flash jest niezwłocznie dostępny przez Gemini API w Google AI Studio. Jeśli budujesz potoki agentowe, połączenie wyniku MCP Atlas (83,6%) i wieloagentowej platformy Antigravity sprawia, że warto przetestować go względem tego, czego obecnie używasz.

Wynik GDPval-AA na poziomie 1 656 Elo ustępuje 1 753 Elo Claude Opus 4.7 z naszej wcześniejszej recenzji, ale przewaga 3.5 Flash w szybkości może mieć większe znaczenie w zależności od twoich wymagań dotyczących opóźnień.

Dla zespołów realizujących przepływy o długim horyzoncie, wdrożenia Xero i Shopify są najbardziej pouczającymi sygnałami. Kompresja wielotygodniowych przepływów do zautomatyzowanych przebiegów agentów to przypadek, pod który Google optymalizuje, a platforma Antigravity jest warstwą infrastruktury, która to umożliwia. Jeśli nie znasz jeszcze wzorców orkiestracji wieloagentowej, to dobry moment, by nadrobić temat.

Jedna rzecz, którą warto uważnie obserwować: Google twierdzi, że 3.5 Flash kosztuje mniej niż połowę ceny innych modeli czołowych przy porównywalnych zadaniach. To w dużej mierze zależy od twojego konkretnego obciążenia, ale jeśli potwierdzi się w praktyce, zmienia to ekonomię działania systemów agentowych na dużą skalę. Model 3.5 Pro, spodziewany w przyszłym miesiącu, będzie ciekawszym punktem odniesienia dla zespołów realizujących najcięższe zadania wnioskowania.

Wnioski końcowe

Gemini 3.5 Flash pokazuje, że Google zamierza konkurować na obu krańcach krzywej wydajność–szybkość, nie tylko na poziomie flagowców. Przewyższenie Gemini 3.1 Pro w benchmarkach agentowych przy prędkościach Flash to znacząca zmiana, a wdrożenia w Shopify, Macquarie i Salesforce sugerują, że model sprawdza się poza kontrolowanymi benchmarkami.

Szerszy obraz jest taki, że Google mocno stawia na infrastrukturę agentową, a Antigravity, Gemini Spark i 3.5 Flash wskazują w tym samym kierunku. Czy ten zakład się opłaci, zależy od tego, jak wypadnie 3.5 Pro po premierze w przyszłym miesiącu i jak platforma Antigravity wypadnie na tle konkurencyjnych frameworków multi-agent w realnych przepływach pracy deweloperów.

Jeśli chcesz szybko nadrobić koncepcje AI agentowej i nauczyć się budować z takimi modelami, polecam ścieżkę umiejętności AI Agent Fundamentals na DataCamp.

Tematy

Sztuczna inteligencja

Agenci AI