본문으로 바로가기

Google I/O 2026: 에이전틱 Gemini 시대의 시작

Gemini 3.5 Flash와 Gemini Omni부터 Antigravity 2.0과 Gemini Spark까지, Google의 에이전트 중심 I/O 2026 키노트의 핵심 내용을 정리했습니다.
업데이트됨 2026년 5월 20일  · 12분 읽다

Google I/O 2026 첫날의 거의 모든 발표에서 관통한 주제는 같았습니다. 바로 에이전트입니다. 챗봇도, 어시스턴트도 아닌, 백그라운드에서 지속적으로 실행되며 Google의 전체 제품 스택에 통합되는 작업 실행 에이전트 말이죠. CEO 순다르 피차이는 이를 명확히 "에이전틱 Gemini 시대"라고 규정했고, 발표 내용도 그 프레이밍을 뒷받침했습니다.

Google은 Anthropic의 Claude Max와 OpenAI의 ChatGPT Pro 구독에 대응해 I/O에서 새 구독인 Google AI Ultra 티어를 소개했습니다. 월 $100로 가격은 동일하며, 아래에서 다룰 일부 에이전트 기능은 이 티어에서만 접근할 수 있습니다.

이 글에서는 AI 실무자와 개발자에게 중요한 발표를 중심으로 정리합니다. 지금 사용 가능하거나 곧 제공될 업데이트에 초점을 맞추겠습니다. 

Gemini 3.5 Flash

Gemini 3.5 Flash는 I/O 2026의 핵심 모델 출시입니다. 에이전트 및 코딩 벤치마크에서 Gemini 3.1 Pro를 능가하며, 출력 토큰/초 기준으로 다른 프런티어 모델보다 4배 빠르다고 Google은 주장합니다. 아직 확인되지는 않았지만, 상당히 대담한 주장입니다.

벤치마크 측면에서는 특히 MCP Atlas, CharXiV Reasoning, Finance Agent v2에서 성능 도약이 눈에 띄며, 모두 3.5 Flash가 선두입니다. 전반적으로 3.5 Flash는 Claude Opus 4.7GPT-5.5와 경쟁 가능한 수준으로 보입니다.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76.2%

58.0%

70.3%

--

66.1%

78.2%

SWE-Bench Pro

55.1%

49.6%

54.2%

--

64.3%

58.6%

MCP Atlas

83.6%

62.0%

78.2%

69.5%

79.1%

75.3%

OSWorld

78.4%

65.1%

76.2%

72.5%

78.0%

78.7%

Finance Agent v2

57.9%

42.6%

43.0%

51.0%

51.5%

51.8%

CharXiv Reasoning

84.2%

80.3%

83.3%

72.4%

82.1%

84.1%

Humanity's Last Exam

40.2%

33.7%

44.4%

33.2%

46.9%

41.4%

ARC-AGI-2

72.1%

33.6%

77.1%

58.3%

75.8%

84.6%

비용 측면도 주목할 만합니다. Google은 하루 약 1조 토큰을 처리하는 엔터프라이즈가 다른 프런티어 모델의 80% 워크로드를 3.5 Flash로 전환하면 연간 10억 달러 이상 절감할 수 있다고 주장합니다. 이는 OpenAI와 Anthropic의 엔터프라이즈 고객을 직접 겨냥한 메시지입니다. Gemini 3.5 Flash는 오늘부터 Gemini API, Google AI Studio, Gemini 앱에서 사용할 수 있습니다. Gemini 3.5 Pro는 이미 내부에서 사용 중이며 다음 달 출시가 예상됩니다.

자세한 내용은 Gemini 3.5 Flash 기사를 참고하세요. 새로운 모델을 더 깊이 다룹니다.

Gemini Omni

Gemini Omni는 텍스트, 이미지, 오디오, 비디오를 어떤 조합으로든 입력받아 비디오로 출력하는 Google의 새로운 네이티브 멀티모달 생성 미디어 모델입니다. 이 제품군의 첫 모델인 Gemini Omni Flash는 오늘부터 Gemini 앱, Google Flow, YouTube Shorts에서 사용할 수 있습니다.

아키텍처의 핵심은 Omni가 이전에 분리돼 있던 스택(Veo는 비디오, Imagen은 이미지, 오디오는 별도)을 하나의 모델로 통합했다는 점입니다. 이로 인해 모달리티 간 작업 시 더 일관된 편집과 더 적은 파이프라인 아티팩트가 기대됩니다. Google은 출시와 함께 Omni의 수치 벤치마크를 공개하지 않았기 때문에 독립적인 평가는 아직 진행 중입니다. 개발자 및 엔터프라이즈 고객용 API 액세스는 I/O 이후 수주 내 제공될 예정입니다.

직접 테스트해 Gemini Omni 기사로 자세히 정리했습니다. 첫 비디오 생성 결과는 도구들이 높여 놓은 기준(Seedance 2.0 등)에 비추어 보면 편차가 있었지만, 더 강력한 Gemini Omni Pro가 곧 공개될 전망입니다.

Antigravity 2.0

Antigravity는 Google의 에이전트 우선 개발 플랫폼이며, I/O에서 공개된 2.0은 대폭 확장된 버전입니다. 이전에는 코딩 환경으로 포지셔닝되었지만, 이제는 자율 AI 에이전트 집단을 개발, 배포, 관리할 수 있는 완전한 플랫폼으로 자리매김했습니다. 핵심은 에이전트 오케스트레이션의 허브 역할을 하는 독립형 데스크톱 앱으로, 여러 에이전트를 병렬로 실행해 각기 다른 작업을 동시에 처리할 수 있습니다.

에코시스템은 이제 개발자를 위한 네 가지 표면을 갖추었습니다.

  • Antigravity 2.0 데스크톱 앱: 여러 에이전트를 병렬 오케스트레이션하고 예약된 백그라운드 작업을 지원합니다. Google AI Studio, Android, Firebase와 통합됩니다.
  • Antigravity CLI: GUI 없이 에이전트를 생성하고 실행하는 터미널 네이티브 표면입니다. Google은 Gemini CLI 사용자의 마이그레이션을 권장합니다.
  • Antigravity SDK: Google의 자체 제품을 구동하는 동일한 에이전트 하네스에 대한 프로그래밍적 접근으로, 자체 인프라에 호스팅되는 커스텀 에이전트 동작을 지원합니다.
  • Gemini Enterprise Agent Platform의 Antigravity: 엔터프라이즈 워크로드를 위해 Antigravity를 Google Cloud 프로젝트에 직접 연결합니다.

코어 에이전트에도 유용한 새 기능이 추가됐습니다. 가장 큰 변화는 모듈형 서브에이전트를 즉석에서 생성할 수 있게 된 점입니다. 각 서브에이전트는 워크스페이스가 분리된 상태로 병렬 실행되며 상위 에이전트의 도구 구성과 권한을 상속합니다. 장시간 실행 작업은 비동기로 처리되어 에이전트 루프를 더 이상 차단하지 않습니다.

Claude Code Hooks와 유사하게, JSON Hooks는 실행의 핵심 단계(도구 호출 전/후, 모델 호출 전/후, 중지 조건)에 커스텀 셸 스크립트를 연결해 로깅, 인자 커스터마이징, 지시문 주입을 가능하게 합니다. 예약 작업은 크론 기반 프롬프트로 일일 PR 요약이나 시간당 배포 점검 같은 주기적 에이전트 실행을 설정할 수 있게 해 주며, 결과는 사이드바에 표시되어 인간 검토와의 핸드오프가 매끄럽습니다.

관리 측면에서는, Antigravity가 조직 단위인 "프로젝트"를 도입해 설정, 리소스, 권한을 에이전트 그룹별로 범위 지정합니다. 모든 것에 대해 광범위한 전역 권한을 요구하던 방식에서 벗어난 것입니다. 새 사이드 패널은 대화를 프로젝트, 상태, 최신순으로 그룹화할 수 있고, 네이티브 Git 워크트리 지원이 내장되어 있습니다. 이러한 프로젝트 기반 레이아웃은 Cursor의 멀티 윈도우 워크스페이스 관리나 Codex의 태스크 큐와 유사하지만, 프로젝트별 권한 범위가 더 촘촘합니다.

새 대화를 시작할 때 네이티브 Git 워크트리를 손쉽게 생성할 수 있습니다.

음성 입력(Gemini Audio 모델)과 새 슬래시 명령(자율 실행용 /goal, 작업 전 명확화용 /grill-me, 크론 프롬프트용 /schedule, 선택적 브라우저 사용용 /browser)이 UX를 완성합니다.

Antigravity 2.0은 오늘부터 사용자에게 제공됩니다. Google AI Ultra 플랜(월 $100)은 Google AI Pro 플랜 대비 Antigravity 사용 한도가 5배 높습니다.

Gemini API의 관리형 에이전트

Antigravity 2.0과 함께 Google은 Gemini API에 관리형 에이전트를 발표했습니다. 이는 오케스트레이션 인프라를 직접 관리하지 않고도 에이전트 기반 애플리케이션을 구축하려는 개발자를 위해 에이전트 기능을 API 계층에 직접 제공합니다. Antigravity 데스크톱 경험의 API 측 보완재라고 볼 수 있습니다.

개발자에게 실질적으로 의미하는 바는 이제 Gemini API를 통해 에이전트 동작, 도구 통합, 다단계 워크플로를 정의하고 실행을 Google 인프라에 맡길 수 있다는 점입니다. 이는 장기 작업 실행이 필요한 프로덕션 애플리케이션을 자체 에이전트 하네스 없이 구축하려는 팀에 진정한 게임 체인저가 될 잠재력이 있습니다. 액세스는 Google AI Studio를 통해 가능하며, 엔터프라이즈 고객은 Gemini Enterprise Agent Platform을 통해 이용할 수 있습니다.

솔직한 단서 하나: I/O 보도를 통해 전해진 초기 개발자 피드백에 따르면, 복잡한 에이전트 흐름과 오류 처리에 대한 문서는 아직 부족합니다. 레이트 리밋과 쿼터 관리도 마찰 지점으로 지적됩니다. 시간이 지나면 덜 문제가 될 가능성이 크지만, 이 스택으로 빌드하기로 결정하기 전에 알아둘 가치가 있습니다.

Gemini Spark

Gemini Spark(메타의 최신 LLM인 Muse Spark와 혼동 금지)는 Google의 새로운 개인용 AI 에이전트로, 이번 에이전트 발표 중 가장 소비자 친화적인 제품입니다. Google Cloud의 전용 가상 머신에서 24/7로 실행되며, 작업을 계속하려고 노트북을 열어 둘 필요가 없습니다. Spark는 Gemini 3.5와 Antigravity 하네스로 구동되어 백그라운드에서 장기 작업을 처리할 수 있습니다.

출시 시점의 기능은 다음과 같습니다.

  • 출시와 함께 Google 자체 도구(Workspace, Gmail, Calendar)와 통합되며, MCP를 통한 서드파티 도구 지원은 앞으로 몇 주 내 제공됩니다.
  • Gemini 앱을 통해 상호작용하며, 곧 이메일과 채팅도 지원될 예정입니다.
  • 올여름 이후 Chrome 내에서 에이전틱 브라우저 레이어로 직접 동작합니다.
  • 연내 제공 예정인 Android Halo라는 새로운 Android UI 공간을 통해 실시간 작업 진행 상황을 확인할 수 있습니다.

OpenAI의 에이전트 생태계나 Anthropic의 도구 사용 기능과의 비교는 직접적으로 해볼 만합니다. Spark의 차별점은 Google Cloud 인프라에서 24/7 지속 실행된다는 점과 Google의 생산성 제품군과의 깊은 통합입니다. 이미 Google Workspace에서 일한다면 이는 분명한 이점입니다. 그렇지 않다면 가치 제안은 덜 분명합니다.

프라이버시는 타당한 우려입니다. 받은편지함, 캘린더, 문서를 지속적으로 모니터링하는 에이전트는 규제 산업에서 데이터 보관 위치와 컴플라이언스에 대한 현실적 질문을 제기합니다. 예를 들어, "직원이 퇴사하면 에이전트 메모리는 어떻게 되는가?"와 같은 질문 말이죠. Google은 이에 대한 구체적 답을 아직 내놓지 않았습니다. Spark는 이번 주 트러스티드 테스터에게 제공되며, 다음 주에는 미국에서 Google AI Ultra 구독자(월 $100)를 대상으로 베타가 시작됩니다.

관리형 에이전트 vs Gemini Spark

검색 에이전트와 AI 모드

검색의 AI 모드는 지난 I/O에서 소개되었습니다. 1년이 지난 지금, 월간 활성 사용자 10억 명을 넘어섰습니다. 이제 Google은 두 가지 새로운 에이전트 기능으로 더 나아가고 있습니다.

첫째는 검색의 정보 에이전트입니다. 사용자가 구성해 주제 모니터링과 적절한 시점의 정보 제공을 수행하는 개인화된 백그라운드 에이전트입니다. 올여름 Google AI Pro 및 Ultra 구독자부터 순차적으로 제공됩니다.

둘째는 Gemini 3.5 Flash와 Antigravity로 구동되는 검색의 생성형 UI입니다. 이제 검색은 복잡하고 장기적인 쿼리에 대해 맞춤형 레이아웃, 대화형 시각화, 나아가 지속형 대시보드나 미니 앱까지 구성합니다. 생성형 UI 기능은 올여름 전 사용자에게 무료로 제공됩니다. 지속형 대시보드와 커스텀 앱 기능은 미국의 Pro 및 Ultra 구독자에게 먼저 제공됩니다.

이는 퍼블리셔와 SEO 전문가에게 실제로 우려되는 부분입니다(AI Overview와 AI 모드 도입 때도 이미 그랬습니다). AI가 생성한 답변이 사용자의 질문을 검색 내에서 완전히 해결해 버리면, 소스 사이트를 클릭할 이유가 없습니다. 이미 이를 경험했습니다. AI Overview와 AI 모드의 초기 롤아웃은 업계 전반의 트래픽 급감을 야기했습니다. Google은 여전히 이러한 답변에 콘텐츠를 제공하는 퍼블리셔에게 수익을 공유하거나 트래픽을 보장하는 명확한 방식을 제시하지 않았습니다.

Google Flow

I/O 2025에서 AI 영화 제작 도구로 처음 공개된 Google Flow는 세 가지 핵심 업데이트로 큰 도약을 이뤘습니다.

  • 더 똑똑해진 기획 에이전트. 업데이트된 Flow 에이전트는 다단계 크리에이티브 프로젝트를 기획하고 추론할 수 있습니다. 개념, 레퍼런스 이미지, 러프 스크립트 같은 입력을 제공하면 초기 브레인스토밍부터 제작 및 편집까지 하나의 환경에서 도와줍니다. 새 에이전트는 오늘부터 모두에게 제공됩니다.
  • Gemini Omni 기반 네이티브 비디오. 이제 Flow는 Omni 모델을 통해 비디오 생성과 편집을 네이티브로 처리합니다. 카메라 롤의 클립에 대한 변경 사항을 자연어로 설명하고 대화형으로 반복할 수 있습니다. 캐릭터 일관성도 개선되어 장면 전반에 걸쳐 정체성과 보이스가 유지됩니다. 반복 등장 인물이 있는 단편 영화나 광고 캠페인 제작에 특히 유용합니다.
  • 맞춤 도구를 위한 Vibe 코딩. 기본 제공 도구에만 제한되지 않고, 이제 플랫폼 내에서 직접 자신만의 도구를 만들 수 있습니다. Google은 커스텀 비디오 효과 설계, 손그림 애니메이션 도구 제작, 텍스트 레이어링 워크플로 구축 등 예시를 시연했으며, 모두 Flow를 벗어나지 않고 가능합니다.

종합하면, 이번 업데이트는 Flow를 단순한 크리에이티브 어시스턴트를 넘어 크리에이티브 워크플로를 구축하는 플랫폼으로 자리매김시킵니다. Android에서 모바일 앱 베타가 시작되었고 곧 iOS에도 제공됩니다.

SynthID 확장

Google의 보이지 않는 AI 워터마킹 시스템 SynthID는 출시 3년 만에 1천억 장 이상의 이미지와 비디오, 6만 년 분량의 오디오 에셋에 워터마크를 적용했습니다. 여기서 가장 중요한 I/O 발표는 규모가 아니라 파트너입니다. OpenAI, 카카오, Eleven Labs가 지난해 합류한 Nvidia와 함께 SynthID를 도입합니다.

의미를 부여하는 것은 업계 전반의 채택입니다. 워터마킹 표준은 충분히 널리 쓰여야만 "워터마크가 없음"이 유의미한 신호가 됩니다. Google은 또한 콘텐츠 출처 인증(C2PA 표준)을 Search와 Chrome으로 확장해, 사용자가 콘텐츠가 AI에서 생성됐는지 카메라에서 촬영됐는지, 생성형 도구로 편집됐는지를 보여줄 예정입니다. SynthID와 C2PA의 결합은 출처 증명을 두 개의 독립 레이어로 제공하는데, 둘 중 하나만으로는 쉽게 제거될 수 있음을 고려하면 올바른 접근입니다.

주목할 만한 소식

I/O의 다른 발표 중 빠르게 짚고 넘어갈 만한 것들입니다.

  • Docs Live: Google Docs에서 음성으로 아이디어를 쏟아내면 Gemini가 문서 구조를 잡아주는 음성 중심 기능. 올여름 구독자에게 제공되며, 같은 시기에 Gmail과 Keep에도 음성 기능이 추가됩니다.
  • Google Pics: 이미지의 모든 요소를 평면이 아닌 개별 객체로 취급하는 Nano Banana 모델 기반의 새로운 AI 이미지 생성·편집 도구. 현재 트러스티드 테스터에게 제공 중이며, 올여름 후반 Google AI Pro 및 Ultra 구독자에게 확대됩니다.
  • Android Halo: Gemini Spark 같은 에이전트의 실시간 업데이트와 작업 진행 상황을 확인하는 새로운 Android UI 공간. 연내 제공 예정.
  • Daily Brief: 받은편지함, 캘린더, 작업에서 개인 맞춤 아침 브리핑을 컴파일하고 다음 단계를 제안하는 Gemini 앱 내 기본 제공 에이전트. 별도 가격 미정; Gemini 앱 경험의 일부로 예상.
  • TPU 8t 및 8i: Google의 8세대 TPU는 듀얼 칩 접근을 취합니다. 8t는 대규모 사전학습에 최적화(이전 세대 대비 원시 연산력 약 3배, 전 세계 100만 개 이상의 TPU로 확장 가능), 8i는 추론에 최적화. 두 칩 모두 이전 세대 대비 와트당 성능 최대 2배 개선.
  • Gemini for Science: Antigravity를 30개 이상의 주요 생명과학 데이터베이스에 연결하는 AI 도구 컬렉션. Science Skills는 오늘 GitHub와 Antigravity에서 바로 이용 가능합니다.

마무리 생각

Google I/O 2026은 AI의 주된 방향으로서 에이전트에 베팅한 행사였습니다. 그 기반 인프라로 Gemini 3.5 Flash와 Antigravity 2.0이 거의 모든 발표의 밑바탕에 놓여 있었습니다. 지금 당장 사용할 수 있는 것은 Gemini 3.5 Flash(Gemini API와 AI Studio), 새 Flow 에이전트, Gemini Omni Flash, Antigravity 2.0 데스크톱 앱입니다. Gemini Spark, 검색 에이전트, 검색의 생성형 UI는 올여름에 단계적으로 롤아웃되며, 대체로 새로운 월 $100 AI Ultra 티어에서 우선 제공됩니다(최소 초기에는).

개인적으로 가장 흥미로웠던 릴리스는 Antigravity 업그레이드였습니다. 왜냐하면 그것이 동시에 두 층위에서 작동하기 때문입니다. 독립형 개발자 앱으로서는 Codex와 Claude Code와 정면으로 경쟁하고, 플랫폼으로서는 그 기반 ADK와 관리형 에이전트 API가 LangChain, AutoGen, OpenAI의 Agents SDK 같은 오케스트레이션 프레임워크에 도전합니다. Gemini 통합과 Google Cloud 배포 레이어는 두 측면 모두에서 차별점(이자 락인 위험)입니다.

Google I/O 2026 FAQ

Gemini 3.5 Flash는 GPT-5.5와 Claude Opus 4.7에 비해 어떤가요?

Gemini 3.5 Flash는 MCP Atlas(83.6%)와 Finance Agent v2(57.9%) 같은 여러 에이전트 벤치마크에서 선두를 달리고, GPT-5.5는 SWE-Bench Pro와 ARC-AGI-2에서 근소하게 앞섭니다. Humanity's Last Exam에서는 Claude Opus 4.7이 여전히 가장 강합니다(46.9%). 핵심은 이름에서 드러나듯, 프런티어 모델과 경쟁하면서도 더 빠르고 대규모에서 훨씬 저렴하다는 점입니다. 더 강력한 Pro 변형은 곧 출시될 예정입니다.

Google Antigravity는 Claude Code나 Codex와 어떻게 다른가요?

Google Antigravity 2.0은 데스크톱 앱, CLI, SDK, 엔터프라이즈 API 전반에서 여러 AI 에이전트를 병렬 오케스트레이션할 수 있는 에이전트 우선 개발 플랫폼입니다. 터미널 네이티브 코딩 에이전트인 Claude Code나 태스크 큐 기반 시스템인 Codex와 달리, Antigravity는 프로젝트별 권한 범위 지정, 서브에이전트 스포닝, Google Cloud 및 Firebase와의 직접 통합을 제공합니다. 개발자 도구이자 플랫폼 SDK라는 이중적 역할 덕분에 단일 코딩 어시스턴트라기보다 오케스트레이션 프레임워크에 더 가깝습니다.

월 $100의 Google AI Ultra 플랜은 ChatGPT Pro나 Claude Max 대비 가치가 있나요?

세 플랜 모두 월 $100로 가격은 같지만, 가치는 사용하는 생태계에 따라 달라집니다. Google AI Ultra의 차별점은 Gemini Spark(24/7 지속 에이전트) 접근, Antigravity 사용 한도 5배 확대, Google Workspace와의 깊은 통합입니다. 워크플로가 Gmail, Docs, Calendar에 이미 얹혀 있다면 Ultra가 자연스러운 이점을 가집니다. 주로 코딩 보조나 API 수준의 유연성이 필요하다면 ChatGPT Pro나 Claude Max가 더 나을 수 있습니다.

Gemini Omni는 무엇이며 비디오 생성은 어떻게 처리하나요?

Gemini Omni는 텍스트, 이미지, 오디오, 비디오를 어떤 조합으로든 입력받아 비디오로 출력하는 Google의 네이티브 멀티모달 모델입니다. 이전에 분리돼 있던 시스템(Veo는 비디오, Imagen은 이미지)을 단일 모델로 통합해, 모달리티 간 편집의 일관성이 높아질 것으로 기대됩니다. 첫 버전인 Omni Flash는 지금 이용 가능하며, 더 강력한 Omni Pro가 곧 제공될 예정입니다. 독립 벤치마크는 아직 공개되지 않아 실제 품질 평가는 진행 중입니다.

주제

Google의 AI 생태계를 알아보세요!

tracks

Google Workspace with Gemini

4
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
자세히 보기Right Arrow
강좌 시작
더 보기Right Arrow