Hoppa till huvudinnehåll

Google I/O 2026: Starten på den agentiska Gemini-eran

Från Gemini 3.5 Flash och Gemini Omni till Antigravity 2.0 och Gemini Spark – här är det viktigaste från Googles agentfokuserade keynote på I/O 2026.
Uppdaterad 20 maj 2026  · 12 min läsa

Den röda tråden genom nästan varje tillkännagivande under första dagen av konferensen Google I/O 2026 var densamma: agenter. Inte chattbottar, inte assistenter, utan beständiga, uppgiftsutförande agenter som körs i bakgrunden och integreras i hela Googles produktstack. VD Sundar Pichai beskrev det uttryckligen som den "agentiska Gemini-eran", och nyheterna bekräftade den inramningen.

Google svarade också på Anthropics Claude Max- och OpenAIs ChatGPT Pro-prenumerationer genom att introducera en ny Google AI Ultra-nivå på I/O, med samma pris på 100 USD/månad och som begränsar åtkomst till vissa av de agentiska funktioner som täcks nedan.

I den här artikeln guidar jag dig genom de tillkännagivanden som är viktigast för AI-utövare och utvecklare. Jag fokuserar på uppdateringar som antingen finns tillgängliga nu eller förväntas snart. 

Gemini 3.5 Flash

Gemini 3.5 Flash är den stora modellsläppet från I/O 2026. Den överträffar Gemini 3.1 Pro på agentiska och kodningsrelaterade benchmarktester, samtidigt som Google hävdar att den genererar utdata upp till 4 gånger snabbare än andra frontmodeller räknat i utgående token per sekund. Även om vi ännu inte kan bekräfta det är det onekligen ett djärvt påstående.

Sett till benchmark är prestandalyftet tydligt, särskilt i MCP Atlas, CharXiV Reasoning och Finance Agent v2, där alla leds av Gemini 3.5 Flash. Sammantaget verkar 3.5 Flash vara konkurrenskraftig med Claude Opus 4.7 och GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Kostnadsvinkeln är värd att notera här. Google hävdar att företag som bearbetar runt 1 biljon token per dag skulle kunna spara över 1 miljard USD årligen genom att flytta 80% av arbetsbelastningarna från andra frontmodeller till 3.5 Flash. Det är en direkt invit till OpenAI:s och Anthropics företagskunder. Gemini 3.5 Flash är tillgänglig idag via Gemini API, Google AI Studio och Gemini-appen. Gemini 3.5 Pro används redan internt och förväntas nästa månad.

För mer detaljer rekommenderar jag att du läser vår artikel om Gemini 3.5 Flash, där vi går djupare in på den nya modellen.

Gemini Omni

Gemini Omni är Googles nya inbyggt multimodala generativa mediemodell som kan ta valfri kombination av text, bilder, ljud och video som indata och producera video som utdata. Den första modellen i familjen, Gemini Omni Flash, finns idag i Gemini-appen, Google Flow och YouTube Shorts.

Den viktiga arkitektoniska poängen är att Omni slår ihop det som tidigare var en uppdelad stack (Veo för video, Imagen för bilder, separata ljudsystem) till en enda modell. Det innebär mer sammanhängande redigeringar och färre pipeline-artefakter när man arbetar över modaliteter. Google har inte publicerat numeriska benchmark för Omni vid lanseringen, så oberoende utvärdering återstår. API-åtkomst för utvecklare och företagskunder kommer veckorna efter I/O.

Vi har testat den och skrivit en full genomgång i vår artikel om Gemini Omni. De första videogenereringsresultaten var ojämna (åtminstone givet de höga standarder som verktyg som Seedance 2.0 har satt), men en kraftfullare Gemini Omni Pro väntas snart.

Antigravity 2.0

Antigravity är Googles utvecklingsplattform med agenter i första rummet, och version 2.0 på I/O är en betydande utökning. Tidigare positionerad som en kodningsmiljö är den nu en komplett plattform för att utveckla, distribuera och hantera grupper av autonoma AI-agenter. Mittpunkten är en ny fristående skrivbordsapp som fungerar som ett nav för agentorkestrering och låter dig köra flera agenter parallellt på olika uppgifter samtidigt.

Ekosystemet har nu fyra tydliga ytor för utvecklare:

  • Antigravity 2.0-skrivbordsapp: Orkestrerar flera agenter parallellt och stöder schemalagda bakgrundsuppgifter. Integreras med Google AI Studio, Android och Firebase.
  • Antigravity CLI: Ett terminalnaturligt gränssnitt för att skapa och köra agenter utan GUI. Google ber användare av Gemini CLI att migrera till detta.
  • Antigravity SDK: Programmerbar åtkomst till samma agentramverk som driver Googles egna produkter, med stöd för anpassade agentbeteenden hostade i din egen infrastruktur.
  • Antigravity i Gemini Enterprise Agent Platform: Kopplar Antigravity direkt till Google Cloud-projekt för företagsarbetslaster.

Det finns också ett par mycket användbara nya funktioner för kärnagenten. Den största: den kan nu skapa modulära underagenter i farten, som var och en körs parallellt med isolerade arbetsytor och ärver förälderns verktygskonfigurationer och behörigheter. Långkörande operationer körs asynkront, så de blockerar inte längre agentloopen.

Liknande Claude Code Hooks låter JSON Hooks användare koppla egna shellscript till nyckelsteg i exekveringen (före/efter verktygsanrop, modellanrop eller vid stopptillstånd) för loggning, argumentanpassning eller för att injicera instruktioner. Schemalagda uppgifter låter dig sätta cron-baserade uppmaningar för periodiska agenktrigger som dagliga PR-sammanställningar eller timvisa distributionskontroller, med resultat som visas i sidofältet för smidig överlämning till människa-i-loopen-interaktion.

På hanteringssidan introducerar Antigravity "projekt" som en organisatorisk primitiv som avgränsar inställningar, resurser och behörigheter per agentgrupp, i stället för att kräva bredaste globala behörigheter för allt. Det omarbetade sidofältet stöder gruppering av konversationer efter projekt, status eller aktualitet, med inbyggt stöd för Git worktree. Denna projektbaserade layout kan jämföras med Cursors hantering av arbetsytor i flera fönster och Codex uppgiftskö, men med stramare behörighetsavgränsning per projekt.

Inbyggda Git worktrees kan skapas enkelt när du startar en ny konversation.

Röstinmatning via Gemini Audio-modeller och nya snedstreckskommandon (/goal för autonoma körningar, /grill-me för förtydliganden före uppgift, /schedule för cron-uppmaningar, /browser för valfri webbläsaranvändning) rundar av användarupplevelsen.

Antigravity 2.0 är tillgängligt för användare från och med idag. Google AI Ultra-planen (100 USD/månad) inkluderar 5 gånger högre användningsgräns i Antigravity jämfört med Google AI Pro-planen.

Hanterade agenter i Gemini API

Parallellt med Antigravity 2.0 tillkännagav Google Managed Agents i Gemini API, vilket för in agentiska möjligheter direkt i API-lagret för utvecklare som vill bygga agentdrivna applikationer utan att själva hantera orkestreringsinfrastrukturen. Detta är API-komplementet till Antigravitys skrivbordsupplevelse.

Den praktiska implikationen för utvecklare är att du nu kan definiera agentbeteenden, verktygsintegrationer och flerstegade arbetsflöden via Gemini API och låta Googles infrastruktur hantera exekveringen. Detta har potential att bli en verklig game changer för team som bygger produktionsapplikationer som behöver långsiktigt uppgiftsutförande utan att sätta upp och hantera ett eget agentramverk. Åtkomst finns via Google AI Studio, och företagskunder kan nå det via Gemini Enterprise Agent Platform.

Ett ärligt förbehåll: tidig utvecklarfeedback från I/O-bevakningen noterar att dokumentationen för komplexa agentflöden och felhantering fortfarande är knapphändig. Gränser för anropstakt och kvothantering lyfts också fram som friktionspunkter. Båda dessa frågor kommer sannolikt att bli mindre problematiska med tiden, men de är värda att känna till innan du åtar dig att bygga på denna stack.

Gemini Spark

Gemini Spark (inte att förväxla med Metas senaste LLM, Muse Spark) är Googles nya personliga AI-agent, och det mest konsumentinriktade av de agentiska tillkännagivandena. Den körs dygnet runt på dedikerade virtuella maskiner i Google Cloud, vilket innebär att din laptop inte behöver vara öppen för att den ska fortsätta jobba. Spark drivs av Gemini 3.5 och Antigravity-ramverket, vilket ger den förmågan att hantera långsiktiga uppgifter i bakgrunden.

Funktionsuppsättningen vid lansering inkluderar:

  • Integration med Googles egna verktyg (Workspace, Gmail, Calendar) vid lansering, med stöd för tredjepartsverktyg via MCP under de följande veckorna.
  • Interaktion via Gemini-appen, och snart via e-post och chatt.
  • Drift direkt i Chrome som ett agentiskt webbläsarlager, kommer senare i sommar.
  • Levande uppdatering av uppgiftsförlopp via Android Halo, ett nytt UI-utrymme på Android, kommer senare i år.

Jämförelsen med OpenAIs agentekosystem och Anthropics verktygsanvändningsförmågor är värd att göra direkt. Sparks differentierare är den dygnet runt beständiga exekveringen på Google Clouds infrastruktur, kombinerad med djup integration i Googles egen produktivitetssvit. Om ditt arbete redan lever i Google Workspace är det en påtaglig fördel. Om inte, är värdeerbjudandet mindre självklart.

Integriteten är den legitima oron här. En agent som kontinuerligt övervakar din inkorg, kalender och dina dokument väcker verkliga frågor om datalagring och efterlevnad i reglerade branscher. En fråga jag ställde mig var till exempel: "Vad händer med agentminnet när en anställd slutar?" Google har ännu inte gett detaljerade svar på de frågorna. Spark rullas ut till betrodda testare denna vecka, med en beta för Google AI Ultra-prenumeranter (100 USD/månad) i USA följande vecka.

Hanterade agenter vs Gemini Spark

Sökragenter och AI-läge

AI-läge i Sök introducerades på förra årets I/O. Ett år senare har det passerat en miljard månatliga aktiva användare. Nu går Google vidare med två nya agentiska funktioner.

Den första är informationsagenter i Sök: personliga bakgrundsagenter som du konfigurerar för att övervaka ämnen och lyfta fram relevant information vid rätt tillfälle. Dessa rullas ut i sommar, med start för Google AI Pro- och Ultra-prenumeranter.

Den andra är generativt UI i Sök, drivet av Gemini 3.5 Flash och Antigravity. Sök kommer nu att bygga anpassade layouter, interaktiva visuella element och till och med beständiga instrumentpaneler eller miniappar för komplexa, långvariga frågor. De generativa UI-funktionerna kommer till alla användare gratis i sommar. Funktionerna för beständig instrumentpanel och anpassade appar blir först tillgängliga för Pro- och Ultra-prenumeranter i USA.

Detta är ett verkligt bekymmer för utgivare och SEO-proffs (liksom introduktionerna av AI Overview och AI-läge redan var). När AI-genererade svar helt löser en användares fråga direkt i Sök finns det ingen anledning att klicka vidare till källsajten. Vi har redan sett detta spela ut: både AI Overviews och den initiala utrullningen av AI-läge ledde till betydande trafikfall i branschen. Google har fortfarande inte infört ett tydligt sätt att dela intäkter eller garantera trafik till de utgivare vars innehåll matar dessa svar.

Google Flow

Google Flow, som debuterade på I/O 2025 som ett AI-verktyg för filmskapande, har tagit ett stort steg framåt med tre viktiga uppdateringar:

  • Smartare planeringsagent. Den uppdaterade Flow-agenten kan nu planera och resonera genom flerstegade kreativa projekt. Du ger den dina indata (säg ett koncept, några referensbilder, ett grovt manus) och den hjälper dig att gå från tidig idégenerering till skapande och redigering, allt i en och samma miljö. Den nya agenten finns tillgänglig för alla idag.
  • Inbyggd video via Gemini Omni. Flow hanterar nu videogenerering och -redigering inbyggt via Omni-modellen. Du kan beskriva ändringar i ett klipp från din kamerarulle med vanlig språk och iterera konversationsmässigt. Karaktärskonsekvensen har också förbättrats, så identitet och röst bevaras över scener. Detta är särskilt användbart om du producerar en kortfilm eller reklamkampanj med återkommande karaktärer.
  • Vibe-kodning för anpassade verktyg. I stället för att vara begränsad till de verktyg som följer med Flow kan du nu bygga dina egna direkt på plattformen. Google demonstrerade exempel som att designa anpassade videoeffekter, skapa handritade animationsverktyg och bygga arbetsflöden för textlager, allt utan att lämna Flow.

Tillsammans positionerar dessa uppdateringar Flow som mer än en kreativ assistent. Det håller på att bli en plattform för att bygga kreativa arbetsflöden, med en mobilapp som nu är i beta på Android och kommer snart till iOS.

Utökning av SynthID

SynthID, Googles osynliga vattenmärkningssystem för AI, har nu vattenmärkt över 100 miljarder bilder och videor och 60 000 år av ljudmaterial sedan lanseringen för tre år sedan. Det mest betydelsefulla i I/O-tillkännagivandet här är inte skalan, utan partnerna: OpenAI, Kakao och Eleven Labs antar SynthID tillsammans med Nvidia, som anslöt sig förra året.

Det är branschöverskridande antagande som gör detta meningsfullt. En vattenmärkesstandard fungerar bara om den är så utbredd att "inte vattenmärkt" blir en användbar signal. Google utökar också verifiering av Content Credentials (C2PA-standarden) till Sök och Chrome, som visar användare om innehåll härrör från AI eller en kamera och om det redigerats med generativa verktyg. Kombinationen av SynthID och C2PA ger proveniens två oberoende lager, vilket är rätt angreppssätt med tanke på hur lätt vardera kan tas bort var för sig.

Hederomnämnanden

Flera andra tillkännagivanden från I/O förtjänar en snabb notering:

  • Docs Live: En ny röstförst-funktion för Google Docs som låter dig verbalt tömma idéer och låta Gemini strukturera dem till ett dokument. Rullas ut till prenumeranter i sommar, med röstfunktioner som kommer till Gmail och Keep samtidigt.
  • Google Pics: Ett nytt AI-verktyg för bildskapande och -redigering byggt på Nano Banana-modellen, som behandlar varje element som ett individuellt objekt snarare än en platt bild. Tillgängligt för betrodda testare nu, rullas ut till Google AI Pro- och Ultra-prenumeranter senare i sommar.
  • Android Halo: Ett nytt UI-utrymme på Android för att visa liveuppdateringar och uppgiftsförlopp från agenter som Gemini Spark. Kommer senare i år.
  • Daily Brief: En färdig agent i Gemini-appen som sammanställer en personlig morgonöversikt från din inkorg, kalender och dina uppgifter, med föreslagna nästa steg. Ingen separat prissättning annonserad; förväntas ingå i Gemini-appens upplevelse.
  • TPU 8t och 8i: Googles åttonde generations TPU:er tar ett dubbelkipsangrepp, där 8t är optimerad för storskalig förträning (nästan 3x den råa beräkningen jämfört med föregående generation, skalbar över mer än 1 miljon TPU:er globalt) och 8i är optimerad för inferens. Båda levererar upp till 2x bättre prestanda per watt än föregående generation.
  • Gemini for Science: En samling AI-verktyg som kopplar Antigravity till över 30 stora databaser inom livsvetenskap. Science Skills är tillgängligt idag på GitHub och direkt i Antigravity.

Avslutande tankar

Google I/O 2026 var ett vad på agenter som den primära riktningen för AI, med Gemini 3.5 Flash och Antigravity 2.0 som infrastrukturen under nästan allt annat som tillkännagavs. Det du kan använda redan nu är Gemini 3.5 Flash (via Gemini API och AI Studio), den nya Flow-agenten, Gemini Omni Flash och Antigravity 2.0-skrivbordsappen. Gemini Spark, sökagenter och de generativa UI-funktionerna i Sök rullas ut under sommaren, mestadels bakom den nya AI Ultra-nivån på 100 USD/månad (åtminstone inledningsvis).

För mig var Antigravity-uppgraderingen den mest intressanta lanseringen, eftersom den opererar på två nivåer samtidigt: som en fristående utvecklarapp konkurrerar den direkt med Codex och Claude Code; som plattform utmanar dess underliggande ADK och Managed Agents API orkestreringsramverk som LangChain, AutoGen och OpenAIs Agents SDK. Gemini-integrationen och Google Clouds distributionslager är differentierarna (och inlåsningrisken) på båda fronterna.

Google I/O 2026 – vanliga frågor

Hur står sig Gemini 3.5 Flash jämfört med GPT-5.5 och Claude Opus 4.7?

Gemini 3.5 Flash leder på flera agentiska benchmark som MCP Atlas (83,6%) och Finance Agent v2 (57,9%), medan GPT-5.5 ligger något före på SWE-Bench Pro och ARC-AGI-2. Claude Opus 4.7 är fortsatt starkast på Humanity's Last Exam (46,9%). Slutsatsen är att den är konkurrenskraftig med frontmodeller samtidigt som den kör snabbare och är betydligt billigare i skala, vilket namnet antyder. En kraftfullare Pro-variant förväntas släppas snart.

Hur skiljer sig Google Antigravity från Claude Code eller Codex?

Google Antigravity 2.0 är en utvecklingsplattform med agenter i första rummet som låter dig orkestrera flera AI-agenter parallellt via en skrivbordsapp, CLI, SDK och ett företags-API. Till skillnad från Claude Code (en terminalnaturlig kodningsagent) eller Codex (ett uppgiftsköbaserat system) erbjuder Antigravity stramare behörighetsavgränsning per projekt, underagentskapande och direkt integration med Google Cloud och Firebase. Dess dubbla roll som både utvecklarverktyg och plattforms-SDK gör den mer jämförbar med ett orkestreringsramverk än en fristående kodningsassistent.

Är Google AI Ultra-planen för 100 USD/månad värd det jämfört med ChatGPT Pro eller Claude Max?

Alla tre planerna kostar 100 USD/månad, men värdet beror på ditt ekosystem. Google AI Ultras differentierare är åtkomst till Gemini Spark (en beständig agent dygnet runt), 5x högre användningsgränser i Antigravity och djup integration med Google Workspace. Om ditt arbetsflöde redan lever i Gmail, Docs och Calendar har Ultra en naturlig fördel. Om du främst behöver kodningsstöd eller flexibilitet på API-nivå kan ChatGPT Pro eller Claude Max passa bättre.

Vad är Gemini Omni och hur hanterar den videogenerering?

Gemini Omni är Googles inbyggt multimodala modell som tar valfri kombination av text, bilder, ljud och video som indata och producerar video som utdata. Den förenar tidigare separata system (Veo för video, Imagen för bilder) i en enda modell, vilket bör resultera i mer sammanhängande korsmodala redigeringar. Den första versionen, Omni Flash, finns tillgänglig nu, med en mer kapabel Omni Pro väntas snart. Oberoende benchmark har ännu inte publicerats, så verklig kvalitet utvärderas fortfarande.

Ämnen

Lär dig mer om Googles AI-ekosystem!

track

Google Workspace med Gemini

4 timmar
Du lär dig om Geminis viktigaste funktioner och hur de kan användas för att förbättra produktiviteten och effektiviteten i Google Workspace.
Se detaljerRight Arrow
Starta kursen
Se merRight Arrow