Google I/O 2026: Starten på den agentiska Gemini-eran

Från Gemini 3.5 Flash och Gemini Omni till Antigravity 2.0 och Gemini Spark – här är det viktigaste från Googles agentfokuserade keynote på I/O 2026.

Uppdaterad 20 maj 2026 · 12 min läsa

Den röda tråden i nästan varje tillkännagivande under första dagen av konferensen Google I/O 2026 var densamma: agenter. Inte chattbotar, inte assistenter, utan beständiga, uppgiftsutförande agenter som körs i bakgrunden och integreras över hela Googles produktstack. VD Sundar Pichai beskrev det uttryckligen som den "agentiska Gemini-eran", och tillkännagivandena stödde den inramningen.

Google svarade också på Anthropics Claude Max och OpenAIs ChatGPT Pro-abonnemang genom att introducera en ny Google AI Ultra-nivå på I/O, med samma pris på 100 $/månad och som begränsar tillgången till vissa av de agentiska funktionerna som beskrivs nedan.

I den här artikeln går jag igenom de viktigaste nyheterna för AI-praktiker och utvecklare. Jag fokuserar på uppdateringar som antingen finns tillgängliga nu eller förväntas inom kort.

Gemini 3.5 Flash

Gemini 3.5 Flash är den stora modellsläppet från I/O 2026. Den överträffar Gemini 3.1 Pro på agentiska och kodningsrelaterade benchmarktester, samtidigt som Google hävdar att den kör 4x snabbare på utmatningstoken per sekund än andra spetsmodeller. Vi kan inte bekräfta det än, men det är definitivt ett djärvt påstående.

På benchmark-sidan är prestandalyftet tydligt, särskilt i MCP Atlas, CharXiV Reasoning och Finance Agent v2, som alla leds av Gemini 3.5 Flash. Överlag verkar 3.5 Flash vara konkurrenskraftig med Claude Opus 4.7 och GPT-5.5.

Benchmark	3.5 Flash	3 Flash	3.1 Pro	Claude Sonnet 4.6	Opus 4.7	GPT-5.5
Terminal-bench 2.1	76.2%	58.0%	70.3%	--	66.1%	78.2%
SWE-Bench Pro	55.1%	49.6%	54.2%	--	64.3%	58.6%
MCP Atlas	83.6%	62.0%	78.2%	69.5%	79.1%	75.3%
OSWorld	78.4%	65.1%	76.2%	72.5%	78.0%	78.7%
Finance Agent v2	57.9%	42.6%	43.0%	51.0%	51.5%	51.8%
CharXiv Reasoning	84.2%	80.3%	83.3%	72.4%	82.1%	84.1%
Humanity's Last Exam	40.2%	33.7%	44.4%	33.2%	46.9%	41.4%
ARC-AGI-2	72.1%	33.6%	77.1%	58.3%	75.8%	84.6%

Kostnadsvinkeln är värd att notera här. Google hävdar att företag som bearbetar runt 1 biljon token per dag skulle kunna spara över 1 miljard dollar årligen genom att flytta 80% av arbetsbelastningen från andra spetsmodeller till 3.5 Flash. Det är en direkt riktad pitch mot OpenAI:s och Anthropics företagskunder. Gemini 3.5 Flash finns tillgänglig idag via Gemini API, Google AI Studio och Gemini-appen. Gemini 3.5 Pro används redan internt och förväntas nästa månad.

För mer detaljer rekommenderar jag att läsa vår artikel om Gemini 3.5 Flash, där vi går igenom den nya modellen mer på djupet.

Gemini Omni

Gemini Omni är Googles nya ursprungligt multimodala generativa mediemodell, som kan ta valfri kombination av text, bilder, ljud och video som indata och producera video som utdata. Den första modellen i familjen, Gemini Omni Flash, finns idag i Gemini-appen, Google Flow och YouTube Shorts.

Den viktiga arkitektoniska poängen är att Omni slår ihop det som tidigare var en uppdelad stack (Veo för video, Imagen för bilder, separata ljudsystem) till en enda modell. Det betyder mer sammanhängande redigeringar och färre pipeline-artefakter när du arbetar över modaliteter. Google har inte publicerat numeriska benchmarktester för Omni vid lanseringen, så oberoende utvärdering återstår. API-åtkomst för utvecklare och företagskunder kommer veckorna efter I/O.

Vi har testat den och skrivit en full genomgång i vår artikel om Gemini Omni. De första videogenereringsresultaten var blandade (åtminstone givet de höga standarder som verktyg som Seedance 2.0 har satt), men en kraftfullare Gemini Omni Pro förväntas snart.

Antigravity 2.0

Antigravity är Googles agentförsta utvecklingsplattform, och 2.0-släppet på I/O är en betydande utvidgning. Tidigare positionerad som en kodningsmiljö är den nu en fullständig plattform för att utveckla, distribuera och hantera kohorter av autonoma AI-agenter. Mittpunkten är en ny fristående skrivbordsapp som fungerar som ett centralt nav för agentorkestrering och låter dig köra flera agenter parallellt på olika uppgifter samtidigt.

Ekosystemet har nu fyra tydliga ytor för utvecklare:

Antigravity 2.0-skrivbordsapp: Orkestrerar flera agenter parallellt och stöder schemalagda bakgrundsuppgifter. Integreras med Google AI Studio, Android och Firebase.
Antigravity CLI: Ett terminalinriktat gränssnitt för att skapa och köra agenter utan GUI. Google ber användare av Gemini CLI att migrera till detta.
Antigravity SDK: Programmatisk åtkomst till samma agentharnesk som driver Googles egna produkter, med stöd för anpassade agentbeteenden som körs på din egen infrastruktur.
Antigravity i Gemini Enterprise Agent Platform: Kopplar Antigravity direkt till Google Cloud-projekt för företagsarbetsbelastningar.

Det finns också ett par mycket användbara nya funktioner för kärnagenten. Den största: den kan nu skapa modulära subagenter i farten, som var och en körs parallellt med isolerade arbetsytor och ärver förälderns verktygskonfigurationer och behörigheter. Långvariga operationer körs asynkront, så de blockerar inte längre agentloopen.

Liknande Claude Code Hooks låter JSON Hooks användare fästa egna shell-skript vid nyckelsteg i exekveringen (före/efter verktygsanrop, modellanrop eller vid stoppvillkor) för loggning, argumentanpassning eller injektion av instruktioner. Schemalagda uppgifter låter dig ställa in cron-baserade uppmaningar för periodiska agentkörningar som dagliga PR-sammanställningar eller timvisa driftsättningskontroller, där resultaten visas i sidofältet för smidig överlämning till människa-i-loopen-interaktion.

På hanteringssidan introducerar Antigravity "projekt" som en organisatorisk primitiv som avgränsar inställningar, resurser och behörigheter per agentgrupp, i stället för att kräva de bredaste globala behörigheterna för allt. Det omarbetade sidopanelet stöder gruppering av konversationer efter projekt, status eller aktualitet, med inbyggt stöd för Git worktree. Denna projektbaserade layout kan jämföras med Cursors hantering av arbetsytor i flera fönster och Codex uppgiftskö, men med stramare behörighetsavgränsning per projekt.

Röstinmatning via Gemini Audio-modeller och nya snedstreckskommandon (/goal för autonoma körningar, /grill-me för förtydliganden före uppgift, /schedule för cron-uppmaningar, /browser för frivillig webbläsaranvändning) rundar av UX:en.

Antigravity 2.0 finns tillgängligt för användare från och med idag. Google AI Ultra-planen (100 $/månad) inkluderar en 5x högre användningsgräns i Antigravity jämfört med Google AI Pro-planen.

Hanterade agenter i Gemini API

Parallellt med Antigravity 2.0 tillkännagav Google Managed Agents i Gemini API, vilket för med sig agentiska funktioner direkt till API-lagret för utvecklare som vill bygga agentdrivna applikationer utan att själva hantera orkestreringsinfrastrukturen. Detta är API-nivåns komplement till Antigravitys skrivbordsupplevelse.

Den praktiska innebörden för utvecklare är att du nu kan definiera agentbeteenden, verktygsintegrationer och flerstegade arbetsflöden genom Gemini API och låta Googles infrastruktur hantera exekveringen. Detta har potential att bli en verklig gamechanger för team som bygger produktionsapplikationer som behöver uppgifter med lång horisont utan att starta och hantera sitt eget agentharnesk. Åtkomst finns via Google AI Studio, och företagskunder kan nå det via Gemini Enterprise Agent Platform.

Ett ärligt förbehåll: tidig utvecklarfeedback från I/O-bevakningen noterar att dokumentationen för komplexa agentflöden och felhantering fortfarande är knapp. Hastighetsbegränsningar och kvothantering flaggas också som friktionspunkter. Det är båda frågor som sannolikt blir mindre problematiska med tiden, men de är värda att känna till innan du satsar på att bygga på denna stack.

Gemini Spark

Gemini Spark (inte att förväxla med Metas senaste LLM, Muse Spark) är Googles nya personliga AI-agent, och det mest konsumentinriktade av de agentiska tillkännagivandena. Den körs dygnet runt på dedikerade virtuella maskiner i Google Cloud, vilket innebär att din laptop inte behöver vara öppen för att den ska fortsätta arbeta. Spark drivs av Gemini 3.5 och Antigravity-harnesket, vilket ger den möjligheten att hantera långsiktiga uppgifter i bakgrunden.

Funktionsuppsättningen vid lansering inkluderar:

Integration med Googles egna verktyg (Workspace, Gmail, Calendar) vid lansering, med stöd för tredjepartsverktyg via MCP under de följande veckorna.
Interaktion via Gemini-appen, och snart via e-post och chatt.
Drift direkt i Chrome som ett agentiskt webbläsarlager, kommer senare i sommar.
Live uppgiftsstatus synlig via Android Halo, en ny yta i Android, kommer senare i år.

Jämförelsen med OpenAIs agentes ekosystem och Anthropics verktygsanvändningsförmåga är värd att göra direkt. Sparks differentiering är den dygnet runt-persistenta exekveringen på Google Clouds infrastruktur, kombinerat med djup integration i Googles egen produktivitetssvit. Om ditt arbete redan lever i Google Workspace är det en meningsfull fördel. Om inte är värdeerbjudandet mindre uppenbart.

Integritet är den berättigade oron här. En agent som kontinuerligt övervakar din inkorg, kalender och dina dokument väcker verkliga frågor om datahemvist och efterlevnad i reglerade branscher. En fråga jag ställde mig själv var till exempel: "Vad händer med agentminnet när en anställd slutar?" Google har ännu inte gett detaljerade svar på de frågorna.

Spark rullas ut till betrodda testare den här veckan, med en beta för Google AI Ultra-prenumeranter (100 $/månad) i USA veckan därpå. Vi täcker det mer i detalj i vår artikel om Gemini Spark.

Sökagenter och AI-läge

AI-läge i Sök introducerades på förra årets I/O. Ett år senare har det passerat en miljard månatligt aktiva användare. Nu går Google vidare med två nya agentiska funktioner.

Den första är informationsagenter i Sök: personanpassade bakgrundsagenter som du konfigurerar för att bevaka ämnen och lyfta fram relevant information vid rätt tillfälle. Dessa rullas ut i sommar, med start för prenumeranter på Google AI Pro och Ultra.

Den andra är generativt gränssnitt i Sök, drivet av Gemini 3.5 Flash och Antigravity. Sök kommer nu att bygga anpassade layouter, interaktiva visuella element och till och med beständiga instrumentpaneler eller miniappar för komplexa, långvariga frågor. De generativa UI-funktionerna kommer till alla användare gratis i sommar. De beständiga instrumentpanelerna och de anpassade appfunktionerna blir först tillgängliga för Pro- och Ultra-prenumeranter i USA.

Detta är en verklig oro för publicister och SEO-proffs (liksom introduktionerna av AI Overview och AI-läge redan var). När AI-genererade svar helt löser en användares fråga direkt i Sök finns det ingen anledning att klicka vidare till källsajten. Vi har redan sett detta spela ut: både AI Overviews och den initiala utrullningen av AI-läge ledde till betydande trafikfall i branschen. Google har fortfarande inte introducerat ett tydligt sätt att dela intäkter eller garantera trafik till de publicister vars innehåll matar dessa svar.

Google Flow

Google Flow, som debuterade på I/O 2025 som ett AI-verktyg för filmskapande, har tagit ett stort steg framåt med tre viktiga uppdateringar:

Smartare planeringsagent. Den uppdaterade Flow-agenten kan nu planera och resonera genom flerstegade kreativa projekt. Du ger den dina indata (låt säga ett koncept, några referensbilder, ett grovt manus) och den hjälper dig att gå från tidig idégenerering till skapande och redigering, allt i en och samma miljö. Den nya agenten finns tillgänglig för alla idag.
Inbyggd video via Gemini Omni. Flow hanterar nu videogenerering och redigering inbyggt via Omni-modellen. Du kan beskriva ändringar av ett klipp från din kamerarulle med vanlig text och iterera konverserande. Karaktärskonsekvensen har också förbättrats, så identitet och röst bevaras över scener. Detta är särskilt användbart om du producerar en kortfilm eller reklamkampanj med återkommande karaktärer.
Vibe-kodning för anpassade verktyg. I stället för att vara begränsad till de verktyg som följer med Flow kan du nu bygga egna direkt på plattformen. Google demonstrerade exempel som att designa anpassade videoeffekter, skapa handritade animationsverktyg och bygga arbetsflöden för textlager – allt utan att lämna Flow.

Tillsammans positionerar dessa uppdateringar Flow som mer än en kreativ assistent. Det håller på att bli en plattform för att bygga kreativa arbetsflöden, med en mobilapp som nu är i beta på Android och kommer snart till iOS.

Utökning av SynthID

SynthID, Googles osynliga vattenmärkningssystem för AI, har nu vattenmärkt över 100 miljarder bilder och videor och 60 000 år av ljudresurser sedan lanseringen för tre år sedan. Det viktigaste meddelandet på I/O här är inte skalan, utan partnerna: OpenAI, Kakao och Eleven Labs antar SynthID tillsammans med Nvidia, som anslöt sig förra året.

Det är antagandet över branscherna som gör detta meningsfullt. En vattenmärkningsstandard fungerar bara om den är tillräckligt utbredd för att "inte vattenmärkt" blir en användbar signal. Google utökar också verifiering av Content Credentials (C2PA-standarden) till Sök och Chrome, som visar användare om innehållet kommer från AI eller en kamera och om det redigerades med generativa verktyg. Kombinationen av SynthID och C2PA ger två oberoende lager av proveniens, vilket är rätt angreppssätt med tanke på hur lätt endera kan tas bort individuellt.

Hedervärda omnämnanden

Flera andra tillkännagivanden från I/O är värda en snabb notering:

Docs Live: En ny röstförst-funktion för Google Docs som låter dig verbalt hjärndumpa idéer och låta Gemini strukturera dem till ett dokument. Rullas ut till prenumeranter i sommar, med röstfunktioner som kommer till Gmail och Keep samtidigt.
Google Pics: Ett nytt AI-verktyg för bildskapande och redigering byggt på Nano Banana-modellen, som behandlar varje element som ett individuellt objekt snarare än en platt bild. Tillgängligt för betrodda testare nu, rullas ut till prenumeranter på Google AI Pro och Ultra senare i sommar.
Android Halo: En ny yta i Android för att visa liveuppdateringar och uppgiftsstatus från agenter som Gemini Spark. Kommer senare i år.
Daily Brief: En färdig agent i Gemini-appen som sammanställer en personanpassad morgonöversikt från din inkorg, kalender och dina uppgifter, med föreslagna nästa steg. Ingen separat prissättning tillkännagiven; förväntas vara en del av Gemini-appens upplevelse.
TPU 8t och 8i: Googles åttonde generations TPU:er tar ett tvåkipsangrepp, med 8t optimerad för storskalig förträning (nästan 3x den råa beräkningen från föregående generation, skalbar över mer än 1 miljon TPU:er globalt) och 8i optimerad för inferens. Båda levererar upp till 2x bättre prestanda per watt än föregående generation.
Gemini for Science: En samling AI-verktyg som kopplar Antigravity till över 30 stora databaser inom livsvetenskaper. Science Skills finns tillgängligt idag på GitHub och direkt i Antigravity.

Avslutande tankar

Google I/O 2026 var ett vad på agenter som den primära riktningen för AI, med Gemini 3.5 Flash och Antigravity 2.0 som infrastrukturen under nästan allt annat som tillkännagavs. Det du kan använda redan nu är Gemini 3.5 Flash (via Gemini API och AI Studio), den nya Flow-agenten, Gemini Omni Flash och skrivbordsappen Antigravity 2.0. Gemini Spark, sökagenter och de generativa UI-funktionerna i Sök rullas ut under sommaren, mestadels bakom den nya AI Ultra-nivån på 100 $/månad (åtminstone initialt).

För mig var uppgraderingen av Antigravity den mest intressanta lanseringen, eftersom den opererar på två nivåer samtidigt: som en fristående utvecklarapp konkurrerar den direkt med Codex och Claude Code; som plattform utmanar dess underliggande ADK och Managed Agents API orkestreringsramverk som LangChain, AutoGen och OpenAIs Agents SDK. Gemini-integrationen och lager för driftsättning på Google Cloud är differentierarna (och inlåsningrisken) på båda fronterna.

Hur står sig Gemini 3.5 Flash jämfört med GPT-5.5 och Claude Opus 4.7?

Hur skiljer sig Google Antigravity från Claude Code eller Codex?

Google Antigravity 2.0 är en agentförst utvecklingsplattform som låter dig orkestrera flera AI-agenter parallellt över en skrivbordsapp, CLI, SDK och företags-API. Till skillnad från Claude Code (en terminalinriktad kodningsagent) eller Codex (ett köbaserat uppdragssystem) erbjuder Antigravity stramare behörighetsavgränsning per projekt, skapande av subagenter och direkt integration med Google Cloud och Firebase. Dess dubbla roll som både utvecklarverktyg och plattforms-SDK gör den mer jämförbar med ett orkestreringsramverk än en fristående kodassistent.

Är Google AI Ultra-planen för 100 $/månad värd det jämfört med ChatGPT Pro eller Claude Max?

Vad är Gemini Omni och hur hanterar den videogenerering?

Gemini Omni är Googles ursprungligt multimodala modell som accepterar valfri kombination av text, bilder, ljud och video som indata och producerar video som utdata. Den förenar tidigare separata system (Veo för video, Imagen för bilder) i en enda modell, vilket bör ge mer sammanhängande korsmodala redigeringar. Den första versionen, Omni Flash, finns tillgänglig nu, med en mer kapabel Omni Pro som väntas snart. Oberoende benchmarktester har ännu inte publicerats, så kvaliteten i verkligheten utvärderas fortfarande.

Ämnen

Artificiell intelligens

AI-agenter