Gemini Spark: wyjaśnienie zawsze aktywnego agenta AI Google

Spark działa 24/7 w Google Cloud i łączy zadania w aplikacjach Workspace. Zobacz, co potrafi, jak wypada na tle Claude i ChatGPT oraz na co zwrócić uwagę.

Zaktualizowano 20 maj 2026 · 11 min Czytać

Podczas Google I/O 2026 Google ogłosiło Gemini Spark, osobistego agenta AI, który działa na infrastrukturze chmurowej Google nawet po zamknięciu laptopa lub zablokowaniu telefonu. Monitoruje Gmaila, zarządza Kalendarzem, przygotowuje dokumenty w Google Docs, a w niedalekiej przyszłości będzie także dokonywać zakupów w twoim imieniu.

Ogłoszenie pojawia się w trakcie zaciętej rywalizacji z OpenAI, Anthropic i Microsoftem o to, jak integrować agentów. Zakład Google w przypadku Spark różni się od Claude Cowork czy ChatGPT Agent: to trwałe wykonywanie w chmurze połączone z głęboką integracją z własnymi usługami konsumenckimi, od Gmaila po Google Slides.

W tym artykule omówię, co Gemini Spark faktycznie robi, kompromisy prywatności, na które sam Google zwraca uwagę, jak wypada na tle konkurencyjnych agentów oraz czy cena 100 USD/mies. za pakiet AI Ultra ma sens dla produktu w fazie beta. Możesz też przeczytać nasz materiał o Gemini 3.5 Flash, modelu napędzającym Spark, oraz wcześniejszy tekst o Gemini Personal Intelligence, by lepiej zrozumieć strategię personalizacji Google.

Czym jest Gemini Spark?

Gemini Spark to osobisty agent AI działający 24/7 na Gemini 3.5 Flash i harnessie Antigravity Google. W przeciwieństwie do czatu, który otwierasz i zamykasz, Spark działa na dedykowanych maszynach wirtualnych w Google Cloud i pracuje w tle nawet wtedy, gdy zamykasz laptopa lub blokujesz telefon.

Łączy się z Gmail, Docs, Slides i innymi narzędziami Workspace przez ustrukturyzowane integracje API, a nie przez odczyt ekranu, co czyni go bardziej przewidywalnym niż agenci poruszający się po pulpicie piksel po pikselu.

Zadania cykliczne i wyzwalacze

Spark potrafi obsługiwać zadania powtarzane według harmonogramu lub uruchamiane po spełnieniu warunku. Oto przykłady złożoności, do której mierzy:

Poproś Spark, aby pobrał twoje zarejestrowane godziny z Arkusza Google, wygenerował fakturę w Docs i wysłał ją do klienta pierwszego dnia każdego miesiąca
Niech analizuje wyciągi z kart kredytowych, aby automatycznie wyłapywać ukryte opłaty za subskrypcje

Umiejętności do nauczenia

Możesz uczyć Spark wielokrotnego użytku zachowań, opisując w języku naturalnym, czego chcesz. Jeśli na przykład często piszesz maile outreachowe, możesz poprosić Spark o przeanalizowanie ostatnich 50 wysłanych wiadomości, destylowanie twojego stylu pisania do umiejętności „ghostwriter” i stosowanie jej za każdym razem, gdy poprosisz o szkic. Umiejętności utrzymują się między sesjami, więc tworzysz je raz, a Spark wykorzystuje je w przyszłości.

Przepływy end-to-end

Spark potrafi łączyć wiele kroków w różnych aplikacjach. Jeśli jesteś liderem zespołu, który właśnie zakończył spotkanie planistyczne, możesz poprosić Spark o wyciągnięcie z czatu w Gmailu listy zadań, utworzenie trackera projektu w Arkuszach z właścicielami i terminami, przygotowanie maila startowego do zespołu i zaplanowanie przypomnienia w Kalendarzu — wszystko z jednego promptu.

CEO Google Sundar Pichai opisał go w keynote I/O jako agenta, który nigdy nie przestaje pracować, bo „nie musisz mieć otwartego laptopa, żeby mieć pewność, że działa”.

Integracje zewnętrzne przez MCP

Nowe połączenia MCP startują wraz ze Spark, a kolejni partnerzy są w trakcie integracji. Na starcie obsługiwane aplikacje zewnętrzne to:

Canva
OpenTable
Instacart

W nadchodzących tygodniach Spark wykorzysta te połączenia do wykonywania działań w aplikacjach zewnętrznych, nie tylko w usługach Google. Google ma też na roadmapie kilka kolejnych funkcji:

Możliwość wysyłania SMS-ów i maili bezpośrednio do Spark
Własne sub-agenty, które możesz tworzyć samodzielnie
Lokalna kontrola przeglądarki z aplikacji desktopowej

Gemini Spark na macOS

Google wprowadza Spark do desktopowej aplikacji Gemini na macOS tego lata, co pozwoli mu pomagać w zadaniach obejmujących pliki lokalne i automatyzować przepływy pracy na twoim pulpicie. Aplikacja dodaje także nowe funkcje głosowe, które zamieniają swobodną mowę w precyzyjne szkice, wykorzystując kontekst ekranu do uchwycenia intencji. Aplikację na macOS można pobrać już dziś, a Spark i funkcje głosowe będą wdrażane później tego lata.

Co warto wiedzieć o prywatności

Spark to stały agent połączony z twoim Gmailem, Kalendarzem, Docs i usługami zewnętrznymi jak OpenTable czy Instacart. Aby wykonywać swoją pracę, musi udostępniać tym usługom odpowiednie informacje. Jeśli poprosisz o rezerwację kolacji, przekaże twoje imię i preferencje. To nie jest ukryty koszt; tak działa produkt.

Google dość jasno o tym komunikuje. Oficjalna strona produktu Spark mówi użytkownikom, by „sprawdzali odpowiedzi” i „ściśle nadzorowali, przerywając w razie potrzeby”. Google dodaje też, że Spark „jest zaprojektowany tak, aby najpierw poprosić cię o zgodę przed działaniami wysokiego ryzyka, jak wydawanie pieniędzy czy wysyłanie e-maili”. Uprawnienia są domyślnie wyłączone; sam wybierasz, z jakimi aplikacjami się łączy, i możesz go całkowicie wyłączyć.

Szersza kwestia, o której warto pamiętać, to fakt, że agent chmurowy 24/7 z dostępem do skrzynki i kalendarza to inny model zaufania niż chatbot, którego otwierasz, zadajesz pytanie i zamykasz. Przyznajesz stały dostęp, a nie jednorazowe pozwolenie. To nie czyni go niebezpiecznym, ale sprawia, że wybory przy konfiguracji mają większe znaczenie niż zwykle.

Rozsądne podejście to zacząć od konserwatywnej białej listy. Połącz jedną lub dwie usługi, w których naprawdę chcesz, aby Spark działał, zobacz, jak się zachowuje, i rozszerzaj zakres. Nie ma powodu dawać dostępu do wszystkiego pierwszego dnia, a interfejs Google ułatwia selektywność.

Co jeszcze zmieniło się w aplikacji Gemini?

Aktualizacja I/O 2026 dotyka w aplikacji Gemini kilku obszarów poza Spark. Google dostarczyło też przeprojektowany interfejs o nazwie Neural Expressive, nowy model generowania wideo Gemini Omni i proaktywny poranny skrót Daily Brief. Oto, co każdy z nich robi.

Daily Brief: proaktywny poranny skrót

Daily Brief to osobny agent, który działa w nocy i dostarcza spersonalizowane poranne podsumowanie. Zbiera e-maile i wydarzenia z kalendarza, rozumuje o nich w kontekście twoich celów, a na koniec porządkuje je w zwięzły briefing z sugerowanymi kolejnymi krokami.

Powstał na bazie eksperymentu CC z Google Labs. Możesz nim sterować w czasie za pomocą łapki w górę lub w dół. Daily Brief jest wdrażany od dziś dla subskrybentów Google AI Plus, Pro i Ultra w USA.

Neural Expressive: przeprojektowany interfejs

Google przeprojektowało cały interfejs aplikacji Gemini w nowym języku projektowym Neural Expressive, z odświeżonymi animacjami, typografią i mikrofonem obsługującym dłuższą, nieprzerywaną mowę. Bardziej praktyczna zmiana polega na tym, że Gemini generuje teraz odpowiedzi w formacie mieszanym (np. osie czasu, interaktywne grafiki, narracje wideo), zamiast domyślnego czystego tekstu, co ułatwia skanowanie i działanie na podstawie odpowiedzi.

Neural Expressive jest wdrażany globalnie od dziś w sieci, na Androidzie i iOS.

Gemini Omni: generowanie wideo z dowolnego wejścia

Gemini Omni to nowy model przyjmujący dowolne kombinacje tekstu, obrazów i wideo jako wejście i produkujący wideo jako wyjście. Możesz stosować filmowe najazdy, podmieniać tła lub tworzyć własnego awatara AI poprzez konwersacyjne promptowanie. Szczegółowo opisaliśmy Omni w naszym artykule o Gemini Omni, w tym testy symulacji fizyki i transferu stylu.

Omni jest wdrażany od dziś dla subskrybentów Google AI Plus, Pro i Ultra na całym świecie.

Dlaczego to ma znaczenie?

Przesunięcie z „asystenta, który odpowiada na pytania” do „agenta, który wykonuje zadania” to kierunek, w którym zmierza dziś każda duża platforma AI. Agent ChatGPT OpenAI działa głównie przez przeglądarkę. Claude Cowork Anthropic działa bezpośrednio na pulpicie użytkownika. Copilot Cowork Microsoftu opiera się na danych z Office 365. Apple przygotowuje odświeżoną Siri na WWDC 2026, częściowo zasilaną modelami Gemini Google na mocy wieloletniej umowy.

Tym, co odróżnia Spark od konkurencyjnych agentów, jest to, że działa na serwerach Google przez całą dobę i łączy się bezpośrednio z aplikacjami Google. Ponieważ łączy się z Gmail, Docs i Kalendarzem przez właściwe API, a nie próbuje czytać zawartości ekranu, jest bardziej niezawodny, ale też bardziej ograniczony. Obecnie Spark może pracować tylko z usługami, z którymi został połączony, więc jest najprzydatniejszy, jeśli i tak używasz narzędzi Google w większości pracy.

Jeśli jesteś data scientistą lub inżynierem ML, sama infrastruktura stojąca za Spark zasługuje na osobną uwagę. Spark działa na harnessie Antigravity Google, który potrafi uruchamiać równolegle wiele sub-agentów i obsługiwać zadania wymagające długiego czasu wykonania. Spark to produkt konsumencki zbudowany na tym fundamencie, ale ta sama architektura jest dostępna przez Gemini API.

Jak mogę uzyskać dostęp do Gemini Spark?

Dostęp do Spark wymaga subskrypcji Google AI Ultra. Google przebudowało progi subskrypcji wraz z ogłoszeniem na I/O, więc obecnie wygląda to tak:

AI Ultra za 100 USD/mies.: limit użycia 5x wyższy niż w planie Pro, 20 TB przestrzeni w chmurze, YouTube Premium, priorytetowy dostęp do Antigravity i Gemini Spark (tylko USA, beta)
AI Ultra za 200 USD/mies.: limit użycia 20x wyższy niż w Pro, ten sam dostęp do Spark, plus Project Genie i pełen zestaw możliwości. Ten próg spadł z 250 USD/mies.
AI Plus i Pro: dostęp do Daily Brief i Gemini Omni, ale nie do Spark

Spark trafia w tym tygodniu do zaufanych testerów. Szerzej dostępna beta dla subskrybentów Google AI Ultra w USA jest planowana na kolejny tydzień. Nie ma samodzielnego sposobu na dołączenie do grupy zaufanych testerów; trzeba poczekać na wdrożenie bety.

Gdy uzyskasz dostęp, konfiguracja wygląda tak:

Otwórz aplikację Gemini i przejdź do ustawień Spark
Wybierz aplikacje, z którymi Spark może się łączyć (Gmail, Docs, Slides oraz nowi partnerzy MCP, w tym Canva, OpenTable i Instacart)
Ustaw preferencje, kiedy Spark ma pytać przed działaniem, a kiedy działać autonomicznie
Przydziel zadania, opisując je w języku naturalnym; Spark zajmie się realizacją w tle

Aplikację desktopową na macOS można pobrać już dziś na gemini.google/mac. Wsparcie Spark dla aplikacji desktopowej, wraz z nowymi funkcjami głosowymi zamieniającymi swobodną mowę w precyzyjne szkice, jest planowane na późne lato.

Czy warto płacić 100 USD/mies.?

Google, Anthropic i OpenAI oferują teraz próg za 100 USD/mies. Oto porównanie z naciskiem na możliwości agentowe:

	Google AI Ultra (100 USD/mies.)	Claude Max (100 USD/mies.)	ChatGPT Pro (100 USD/mies.)
Zawsze aktywny agent	Gemini Spark (24/7, w chmurze, działa przy wyłączonym urządzeniu)	Brak stałego agenta	Brak stałego agenta
Programowanie z agentem	Antigravity (priorytetowy dostęp, 5x użycia vs Pro)	Claude Code (oparty na terminalu, 5x użycia vs Pro)	Codex (piaskownica w chmurze, 5x użycia vs Plus)
Agent desktopowy	Spark na macOS (lato 2026)	Claude Cowork (świadomy ekranu, wieloetapowe zadania)	ChatGPT Agent (głębokie badania w przeglądarce)
Integracje zewnętrzne	MCP (Canva, OpenTable, Instacart na starcie)	MCP + kredyty Agent SDK dla agentów zewnętrznych	Ponad 1000 niestandardowych GPT i wtyczek
Dostęp do modeli	Gemini 3.5 Flash	Claude Opus 4.7, Sonnet 4.6	GPT-5.5 Pro, GPT-5.3-Codex
Limit użycia	5x Pro	5x Pro	5x Plus
Pamięć w chmurze	20 TB (Google One)	Brak	Brak
Dodatki	YouTube Premium w zestawie	Brak	Nielimitowane generowanie obrazów
Dostępność	Spark: tylko USA (beta)	Dostępny ogólnie	Dostępny ogólnie

Próg 100 USD Google jest jedynym z trwałym agentem w chmurze, co realnie odróżnia go od ofert Anthropic i OpenAI. Dodatkowo zawiera kilka benefitów specyficznych dla Google, jak 20 TB przestrzeni i YouTube Premium w pakiecie. Na papierze to najbardziej rozbudowany zestaw. Ale Spark jest betą tylko w USA z zastrzeżeniami eksperymentalnymi, podczas gdy Claude Max i ChatGPT Pro są dostępne ogólnie z dojrzałymi narzędziami agentowymi.

Jeśli jesteś mocno osadzony w ekosystemie Google (Gmail, Docs, Sheets to twoje codzienne narzędzia), próg 100 USD ma najsilniejsze uzasadnienie. Zawsze aktywna automatyzacja dla Workspace to coś, czego pozostała dwójka jeszcze nie oferuje, a 20 TB i YouTube Premium dodatkowo zachęcają.

Jeśli jesteś deweloperem zainteresowanym Antigravity i wyższymi limitami Gemini API, wartość leży w dostępie do infrastruktury, a nie w samym Spark.

Jeśli dziś przede wszystkim chcesz sprawnego agenta AI, Claude Max i ChatGPT Pro to bezpieczniejsze wybory. Są dostępne ogólnie, nie w becie, a ich narzędzia agentowe są dojrzalsze. Trwałe wykonywanie zadań w Spark to realny wyróżnik, ale trudno polecać płacenie 100 USD/mies. za funkcję, która wciąż jest eksperymentalna i tylko w USA.

Na koniec

Gemini Spark to jak dotąd najbardziej bezpośrednia odpowiedź Google na pytanie, co asystent AI powinien faktycznie robić. Model stałego działania w chmurze to prawdziwa różnica architektoniczna względem chatbotów, a głębokość integracji z Workspace trudno będzie konkurentom szybko skopiować.

Większe pytanie przy Spark nie dotyczy tak naprawdę samego Google, lecz tego, co oznacza danie dowolnemu agentowi AI stałego dostępu do twojej skrzynki, kalendarza, a w przyszłości także metod płatności. Wciąż jesteśmy na wczesnym etapie ustalania, jaką autonomię te narzędzia powinny mieć domyślnie, a jaką użytkownicy powinni aktywnie zarządzać. Podejście Google — domyślnie wyłączone uprawnienia i możliwość whitelistowania usług — to rozsądny punkt wyjścia, ale normy wokół zawsze aktywnych agentów dopiero kształtują się w czasie rzeczywistym w całej branży.

Jeśli chcesz sprawdzić, co da się zrobić z Gemini w aplikacjach Workspace Google, takich jak Gmail, Docs i Drive, polecam kurs Practical AI with Google Gemini and NotebookLM. Aby poznać koncepcje stojące za agentowym AI, zapisz się na naszą ścieżkę umiejętności AI Agent Fundamentals.