Google I/O 2026: 에이전틱 Gemini 시대의 시작

Gemini 3.5 Flash와 Gemini Omni부터 Antigravity 2.0과 Gemini Spark까지, Google의 에이전트 중심 I/O 2026 키노트에서 핵심을 짚었습니다.

업데이트됨 2026년 5월 20일 · 12분 읽다

Google I/O 2026 첫날 발표의 공통된 키워드는 분명했습니다. 바로 에이전트입니다. 챗봇이나 어시스턴트가 아니라, 백그라운드에서 지속적으로 작업을 수행하고 Google의 전체 제품 스택 전반과 통합되는 에이전트 말이죠. 순다르 피차이 CEO는 이를 명확히 "에이전틱 Gemini 시대"라고 규정했고, 발표 내용도 그 프레이밍을 뒷받침했습니다.

Google은 또한 Anthropic의 Claude Max와 OpenAI의 ChatGPT Pro 구독에 대응해, 일부 에이전틱 기능에 대한 접근을 제공하는 새로운 Google AI Ultra 요금제를 I/O에서 선보였습니다. 가격은 월 100달러로 동일합니다.

이 글에서는 AI 실무자와 개발자에게 가장 중요한 발표를 정리합니다. 지금 바로 사용 가능하거나 곧 제공될 업데이트에 초점을 맞춥니다.

Gemini 3.5 Flash

Gemini 3.5 Flash는 I/O 2026의 핵심 모델 출시입니다. 에이전트 및 코딩 벤치마크에서 Gemini 3.1 Pro를 능가하며, 출력 토큰 처리 속도가 다른 프런티어 모델 대비 4배 빠르다고 Google은 주장합니다. 이는 아직 확인되진 않았지만, 상당히 대담한 주장입니다.

벤치마크를 보면 도약이 분명합니다. 특히 MCP Atlas, CharXiV Reasoning, Finance Agent v2에서 두드러지며, 모두 Gemini 3.5 Flash가 선도합니다. 전반적으로 3.5 Flash는 Claude Opus 4.7 및 GPT-5.5와 경쟁력 있는 성능을 보입니다.

벤치마크	3.5 Flash	3 Flash	3.1 Pro	Claude Sonnet 4.6	Opus 4.7	GPT-5.5
Terminal-bench 2.1	76.2%	58.0%	70.3%	--	66.1%	78.2%
SWE-Bench Pro	55.1%	49.6%	54.2%	--	64.3%	58.6%
MCP Atlas	83.6%	62.0%	78.2%	69.5%	79.1%	75.3%
OSWorld	78.4%	65.1%	76.2%	72.5%	78.0%	78.7%
Finance Agent v2	57.9%	42.6%	43.0%	51.0%	51.5%	51.8%
CharXiv Reasoning	84.2%	80.3%	83.3%	72.4%	82.1%	84.1%
Humanity's Last Exam	40.2%	33.7%	44.4%	33.2%	46.9%	41.4%
ARC-AGI-2	72.1%	33.6%	77.1%	58.3%	75.8%	84.6%

비용 측면도 주목할 만합니다. Google은 하루 약 1조 토큰을 처리하는 기업이 워크로드의 80%를 다른 프런티어 모델에서 3.5 Flash로 전환하면 연간 10억 달러 이상을 절감할 수 있다고 주장합니다. 이는 OpenAI와 Anthropic의 엔터프라이즈 고객을 겨냥한 직접적인 제안입니다. Gemini 3.5 Flash는 오늘부터 Gemini API, Google AI Studio, Gemini 앱에서 사용할 수 있습니다. Gemini 3.5 Pro는 이미 내부 사용 중이며 다음 달 공개가 예상됩니다.

자세한 내용은 Gemini 3.5 Flash 기사에서 더 심층적으로 다루었습니다.

Gemini Omni

Gemini Omni는 Google의 새로운 네이티브 멀티모달 생성 미디어 모델로, 텍스트, 이미지, 오디오, 비디오의 어떤 조합이든 입력으로 받아 비디오 출력을 생성합니다. 이 제품군의 첫 모델인 Gemini Omni Flash는 오늘부터 Gemini 앱, Google Flow, YouTube Shorts에서 사용할 수 있습니다.

핵심 아키텍처 포인트는 Omni가 이전의 분리된 스택(Veo는 비디오, Imagen은 이미지, 별도 오디오 시스템)을 단일 모델로 통합했다는 점입니다. 이는 모달리티 간 작업 시 더 일관된 편집과 파이프라인 아티팩트 감소를 의미합니다. Google은 출시와 함께 Omni에 대한 수치 벤치마크를 공개하지 않았기에, 독립적 평가는 대기 중입니다. 개발자와 엔터프라이즈 고객용 API 접근은 I/O 이후 몇 주 내 제공될 예정입니다.

저희는 테스트를 진행해 Gemini Omni 기사에 상세히 정리했습니다. 첫 비디오 생성 결과는 기대와 달리 들쭉날쭉했지만(특히 Seedance 2.0 같은 도구가 기준을 높인 상황에서), 더 강력한 Gemini Omni Pro가 곧 공개될 것으로 보입니다.

Antigravity 2.0

Antigravity는 Google의 에이전트 우선 개발 플랫폼으로, I/O에서 발표된 2.0은 대폭 확장된 릴리스입니다. 이전에는 코딩 환경으로 포지셔닝되었지만, 이제는 자율 AI 에이전트 집합을 개발, 배포, 관리하는 완전한 플랫폼입니다. 핵심은 에이전트 오케스트레이션의 중앙 허브 역할을 하는 새로운 독립형 데스크톱 앱으로, 서로 다른 작업을 병렬로 수행하는 다수의 에이전트를 동시에 실행할 수 있습니다.

이제 생태계는 개발자를 위한 네 가지 표면을 갖추었습니다.

Antigravity 2.0 데스크톱 앱: 여러 에이전트를 병렬로 오케스트레이션하고 예약된 백그라운드 작업을 지원합니다. Google AI Studio, Android, Firebase와 통합됩니다.
Antigravity CLI: GUI 없이 터미널에서 에이전트를 만들고 실행하는 인터페이스입니다. Google은 Gemini CLI 사용자의 마이그레이션을 권장하고 있습니다.
Antigravity SDK: Google 자체 제품을 구동하는 에이전트 하니스에 대한 프로그래매틱 접근을 제공하며, 자체 인프라에 호스팅되는 커스텀 에이전트 동작을 지원합니다.
Gemini Enterprise Agent Platform의 Antigravity: 엔터프라이즈 워크로드를 위해 Antigravity를 Google Cloud 프로젝트에 직접 연결합니다.

코어 에이전트에도 유용한 새로운 기능이 몇 가지 추가되었습니다. 가장 큰 변화는 즉석에서 모듈형 서브에이전트를 생성할 수 있게 된 점으로, 각 서브에이전트는 작업 공간이 분리된 상태로 병렬 실행되며 상위 에이전트의 도구 구성과 권한을 상속합니다. 장시간 실행 작업은 비동기로 처리되어 에이전트 루프를 더 이상 차단하지 않습니다.

Claude Code Hooks와 유사하게, JSON Hooks는 실행의 주요 단계(도구 호출 전/후, 모델 호출 전/후, 중지 조건)에 사용자 지정 셸 스크립트를 연결해 로깅, 인자 커스터마이즈, 지시문 주입 등을 할 수 있도록 합니다. 예약 작업은 cron 기반 프롬프트를 설정해, 매일 PR 다이제스트나 매시간 배포 점검처럼 주기적 에이전트 실행을 가능하게 하며 결과는 사이드바에 표시되어 인간 참여형 상호작용으로 자연스럽게 넘길 수 있습니다.

관리 측면에서는, Antigravity가 에이전트 그룹 단위로 설정, 리소스, 권한 범위를 지정하는 "프로젝트" 개념을 도입해 모든 것에 광범위한 전역 권한을 요구하던 방식을 대체합니다. 새로워진 사이드 패널은 대화를 프로젝트, 상태, 최신순으로 묶어 볼 수 있고, 네이티브 Git 워크트리 지원을 내장합니다. 이러한 프로젝트 기반 레이아웃은 Cursor의 다중 창 워크스페이스 관리와 Codex의 작업 큐와 유사하지만, 프로젝트별 권한 범위가 더 촘촘합니다.

음성 입력은 Gemini Audio 모델을 통해 제공되며, 새 슬래시 명령(자율 실행용 /goal, 작업 전 명확화용 /grill-me, cron 프롬프트용 /schedule, 브라우저 선택 사용용 /browser)이 UX를 보완합니다.

Antigravity 2.0은 오늘부터 사용자에게 제공됩니다. Google AI Ultra 플랜(월 100달러)은 Google AI Pro 대비 Antigravity 사용 한도가 5배 높습니다.

Gemini API의 Managed Agents

Antigravity 2.0과 함께, Google은 Gemini API에 Managed Agents를 발표했습니다. 이는 오케스트레이션 인프라를 직접 관리하지 않고도 에이전트 기반 애플리케이션을 구축하려는 개발자를 위해, 에이전틱 기능을 API 레이어에 직접 제공하는 것입니다. Antigravity 데스크톱 경험의 API 수준 보완이라고 볼 수 있습니다.

개발자에게 실질적으로 의미하는 바는, 이제 Gemini API를 통해 에이전트 동작, 도구 통합, 다단계 워크플로를 정의하면 Google의 인프라가 실행을 처리해 준다는 점입니다. 이는 장기 과제 실행이 필요한 프로덕션 애플리케이션을 자체 에이전트 하니스를 구축·운영하지 않고도 만들 수 있게 해 주기에, 진정한 게임 체인저가 될 잠재력이 있습니다. 접근은 Google AI Studio를 통해 제공되며, 엔터프라이즈 고객은 Gemini Enterprise Agent Platform을 통해 이용할 수 있습니다.

다만 정직한 단서도 있습니다. I/O 현장 보도에서 초기 개발자 피드백에 따르면, 복잡한 에이전트 플로우와 오류 처리에 대한 문서는 아직 부족합니다. 레이트 리밋과 쿼터 관리도 마찰 지점으로 지적됩니다. 시간이 지나며 완화될 가능성이 크지만, 이 스택에 올인하기 전에 알고 있어야 할 부분입니다.

Gemini Spark

Gemini Spark는(최근 Meta의 LLM Muse Spark와 혼동하지 마세요) Google의 새로운 개인용 AI 에이전트로, 에이전틱 발표 중 소비자 지향성이 가장 강합니다. Google Cloud의 전용 가상 머신에서 24/7로 실행되기 때문에, 노트북이 켜져 있지 않아도 계속 작동합니다. Spark는 Gemini 3.5와 Antigravity 하니스를 기반으로 하며, 백그라운드에서 장기 과제를 처리할 수 있습니다.

출시 시점의 기능은 다음과 같습니다.

출시와 함께 Google 자체 도구(Workspace, Gmail, Calendar)와 통합되며, MCP를 통한 서드파티 도구 지원은 향후 몇 주 내 제공됩니다.
Gemini 앱을 통한 상호작용이 가능하며, 곧 이메일과 채팅으로도 확장됩니다.
올여름 이후 Chrome 내에서 에이전틱 브라우저 레이어로 직접 작동합니다.
올해 말 제공 예정인 Android의 새로운 UI 공간인 Android Halo를 통해 라이브 작업 진행 상황을 확인할 수 있습니다.

OpenAI의 에이전트 생태계와 Anthropic의 도구 사용 기능과의 비교는 피할 수 없습니다. Spark의 차별점은 Google Cloud 인프라에서 24/7 지속 실행된다는 점과 Google 생산성 제품군과의 깊은 통합입니다. 업무가 이미 Google Workspace에 기반한다면 분명한 장점입니다. 그렇지 않다면 가치 제안은 덜 명확할 수 있습니다.

여기서 프라이버시는 타당한 우려입니다. 받은편지함, 캘린더, 문서를 지속적으로 모니터링하는 에이전트는 규제 산업에서 데이터 레지던시와 컴플라이언스에 대한 현실적인 질문을 제기합니다. 예를 들어 제가 스스로에게 던진 질문은 "직원이 퇴사하면 에이전트 메모리는 어떻게 되나?"였습니다. Google은 아직 이에 대한 상세한 답을 제시하지 않았습니다.

Spark는 이번 주 신뢰할 수 있는 테스터에게 제공을 시작하며, 다음 주에는 미국의 Google AI Ultra 구독자(월 100달러)를 대상으로 베타를 진행합니다. 자세한 내용은 Gemini Spark 기사에서 다룹니다.

검색 에이전트와 AI 모드

검색의 AI 모드는 지난 I/O에서 처음 소개되었습니다. 1년이 지난 지금, 월간 활성 사용자가 10억 명을 넘어섰습니다. 이제 Google은 두 가지 새로운 에이전틱 기능으로 더 나아가고 있습니다.

첫째는 검색 정보 에이전트입니다. 사용자가 구성해 주제를 모니터링하고 적절한 순간에 관련 정보를 표면화하는 개인화된 백그라운드 에이전트입니다. 올여름부터 Google AI Pro 및 Ultra 구독자에게 먼저 제공됩니다.

둘째는 Gemini 3.5 Flash와 Antigravity로 구동되는 검색의 생성형 UI입니다. 이제 검색은 복잡하고 장기적인 쿼리에 대해 맞춤 레이아웃, 인터랙티브 시각화, 심지어 지속형 대시보드나 미니 앱까지 구축합니다. 생성형 UI 기능은 올여름 모든 사용자에게 무료로 제공되며, 지속형 대시보드와 커스텀 앱 기능은 미국의 Pro 및 Ultra 구독자에게 먼저 제공됩니다.

이는 퍼블리셔와 SEO 전문가에게 실제로 우려되는 사안입니다(AI Overview와 AI 모드 도입 때도 마찬가지였습니다). AI 생성 답변이 검색 내에서 사용자의 쿼리를 완전히 해결해 버리면 출처 사이트를 클릭할 이유가 사라집니다. 이미 이러한 현상이 나타났고, AI Overview와 AI 모드 초기 롤아웃은 업계 전반의 트래픽 급감을 초래했습니다. Google은 여전히 이러한 답변을 제공하는 퍼블리셔에게 수익을 공유하거나 트래픽을 보장하는 명확한 방식을 제시하지 않았습니다.

Google Flow

I/O 2025에서 AI 영상 제작 도구로 데뷔한 Google Flow는 세 가지 핵심 업데이트로 큰 도약을 했습니다.

더 똑똑해진 기획 에이전트. 업데이트된 Flow 에이전트는 이제 다단계 크리에이티브 프로젝트를 기획하고 추론할 수 있습니다. 개념, 레퍼런스 이미지, 러프 스크립트 같은 입력을 주면, 초기 브레인스토밍부터 제작과 편집까지 한 환경에서 진행을 돕습니다. 새 에이전트는 오늘부터 모두에게 제공됩니다.
Gemini Omni 기반의 네이티브 비디오. Flow는 이제 Omni 모델을 통해 비디오 생성과 편집을 네이티브로 처리합니다. 카메라 롤의 클립에 대한 변경 사항을 자연어로 설명하고 대화형으로 반복할 수 있습니다. 캐릭터 일관성도 개선되어, 장면 전반에서 정체성과 보이스가 보존됩니다. 반복 등장 인물이 있는 단편 영화나 광고 제작에 특히 유용합니다.
커스텀 도구를 위한 Vibe 코딩. 기본 제공 도구에만 의존하지 않고 플랫폼에서 직접 자신만의 도구를 만들 수 있습니다. Google은 커스텀 비디오 효과 설계, 손그림 애니메이션 도구 제작, 텍스트 레이어링 워크플로 구축 등 예시를 시연했으며, 모두 Flow를 벗어나지 않고 구현했습니다.

종합하면, 이번 업데이트로 Flow는 단순한 크리에이티브 어시스턴트를 넘어, 크리에이티브 워크플로를 구축하는 플랫폼으로 자리매김하고 있습니다. 모바일 앱은 현재 Android 베타로 제공되며 곧 iOS에도 출시됩니다.

SynthID 확대

SynthID는 Google의 보이지 않는 AI 워터마킹 시스템으로, 출시 3년 만에 1천억 개 이상의 이미지·비디오와 6만 년 분량의 오디오 자산에 워터마크를 적용했습니다. 여기서 가장 중요한 I/O 발표는 규모가 아니라 파트너입니다. OpenAI, 카카오, Eleven Labs가 지난해 합류한 Nvidia와 함께 SynthID를 채택합니다.

의미를 만드는 것은 업계 전반의 채택입니다. 워터마킹 표준은 충분히 널리 쓰여야 "워터마크 없음"이 유의미한 신호가 됩니다. Google은 또한 콘텐츠 출처 증명 표준(C2PA)의 검증 기능인 Content Credentials를 검색과 Chrome으로 확대해, 콘텐츠가 AI 기원인지 카메라 기원인지, 생성형 도구로 편집되었는지를 사용자에게 보여줍니다. SynthID와 C2PA의 결합은 출처 증명에 두 개의 독립적인 층을 제공하며, 둘 중 하나만으로는 쉽게 제거될 수 있음을 고려하면 올바른 접근입니다.

주목할 만한 소식

I/O의 다른 발표 중에서도 짚고 넘어갈 만한 것들이 있습니다.

Docs Live: 음성 중심 Google Docs 기능으로, 아이디어를 말로 던지면 Gemini가 문서 구조를 잡아 줍니다. 올여름 구독자에게 제공되며, 같은 시기에 음성 기능이 Gmail과 Keep에도 도입됩니다.
Google Pics: Nano Banana 모델을 기반으로 한 새로운 AI 이미지 생성·편집 도구로, 이미지를 평면이 아닌 개별 객체의 집합으로 취급합니다. 현재 신뢰할 수 있는 테스터에게 제공 중이며, 올여름 후반 Google AI Pro 및 Ultra 구독자에게 확대될 예정입니다.
Android Halo: Gemini Spark 같은 에이전트의 라이브 업데이트와 작업 진행을 볼 수 있는 Android의 새로운 UI 공간입니다. 올해 말 제공됩니다.
Daily Brief: 받은편지함, 캘린더, 작업에서 개인화된 아침 브리핑을 컴파일하고 다음 단계를 제안하는 Gemini 앱 내 기본 제공 에이전트입니다. 별도 가격은 발표되지 않았으며, Gemini 앱 경험의 일부가 될 것으로 예상됩니다.
TPU 8t와 8i: Google의 8세대 TPU는 이중 칩 접근을 취합니다. 8t는 대규모 사전학습에 최적화되어(이전 세대 대비 원시 연산 성능 거의 3배, 전 세계 100만 개 이상의 TPU로 확장 가능), 8i는 추론에 최적화되어 있습니다. 두 모델 모두 이전 세대 대비 와트당 성능이 최대 2배 향상되었습니다.
Gemini for Science: Antigravity를 30개 이상의 주요 생명과학 데이터베이스에 연결하는 AI 도구 모음입니다. Science Skills는 오늘 GitHub와 Antigravity에서 바로 이용할 수 있습니다.

마무리 생각

Google I/O 2026은 AI의 주된 방향으로 에이전트를 선택했고, 그 기반 인프라로 Gemini 3.5 Flash와 Antigravity 2.0을 전면에 세웠습니다. 지금 당장 사용할 수 있는 것은 Gemini 3.5 Flash(Gemini API와 AI Studio 경유), 새 Flow 에이전트, Gemini Omni Flash, Antigravity 2.0 데스크톱 앱입니다. Gemini Spark, 검색 에이전트, 검색의 생성형 UI 기능은 올여름 롤아웃되며, 대부분 초기에 새 월 100달러 AI Ultra 티어 뒤에 게이트가 걸릴 예정입니다.

개인적으로 가장 흥미로웠던 발표는 Antigravity 업그레이드였습니다. 독립형 개발자 앱으로서는 Codex와 Claude Code와 정면으로 경쟁하고, 플랫폼으로서는 그 기반 ADK와 Managed Agents API로 LangChain, AutoGen, OpenAI의 Agents SDK 같은 오케스트레이션 프레임워크에 도전합니다. 두 측면 모두에서 Gemini 통합과 Google Cloud 배포 계층이 차별점(이자 락인 리스크)으로 작용합니다.

Gemini 3.5 Flash는 GPT-5.5와 Claude Opus 4.7에 비해 어떤가요?

Google Antigravity는 Claude Code나 Codex와 어떻게 다른가요?

Google Antigravity 2.0은 데스크톱 앱, CLI, SDK, 엔터프라이즈 API 전반에서 여러 AI 에이전트를 병렬로 오케스트레이션할 수 있는 에이전트 우선 개발 플랫폼입니다. 터미널 중심 코딩 에이전트인 Claude Code나 작업 큐 기반 시스템인 Codex와 달리, Antigravity는 프로젝트별 권한 범위 지정, 서브에이전트 스포닝, Google Cloud와 Firebase와의 직접 통합을 제공합니다. 개발자 도구이자 플랫폼 SDK라는 이중 역할로 인해, 단일 코딩 어시스턴트라기보다 오케스트레이션 프레임워크에 더 가깝습니다.

월 100달러짜리 Google AI Ultra 플랜은 ChatGPT Pro나 Claude Max 대비 가치가 있나요?

Gemini Omni란 무엇이며 비디오 생성은 어떻게 처리하나요?

Gemini Omni는 텍스트, 이미지, 오디오, 비디오의 조합을 입력으로 받아 비디오 출력을 생성하는 Google의 네이티브 멀티모달 모델입니다. 이전에 분리되어 있던 시스템(Veo는 비디오, Imagen은 이미지)을 단일 모델로 통합해, 모달리티 간 편집의 일관성이 향상될 것으로 기대됩니다. 첫 버전인 Omni Flash는 지금 이용 가능하며, 더 강력한 Omni Pro도 곧 공개될 예정입니다. 독립 벤치마크는 아직 발표되지 않아 실제 품질은 계속 평가 중입니다.

주제

인공지능

AI Agents