Pular para o conteúdo principal

Google I/O 2026: o início da era Gemini agentic

De Gemini 3.5 Flash e Gemini Omni a Antigravity 2.0 e Gemini Spark, veja o que mais importa do keynote do I/O 2026 focado em agentes do Google.
Atualizado 20 de mai. de 2026  · 12 min lido

O fio condutor de praticamente todos os anúncios do primeiro dia do Google I/O 2026 foi o mesmo: agentes. Não chatbots, não assistentes, mas agentes persistentes, que executam tarefas em segundo plano e se integram a todo o stack de produtos do Google. O CEO Sundar Pichai definiu explicitamente como a "era Gemini agentic", e os anúncios reforçaram essa narrativa.

O Google também respondeu às assinaturas Claude Max, da Anthropic, e ChatGPT Pro, da OpenAI, lançando no I/O um novo plano Google AI Ultra, com o mesmo preço de US$ 100/mês e que dá acesso a alguns dos recursos agentic mencionados abaixo.

Neste artigo, eu destaco os anúncios que mais importam para profissionais de IA e desenvolvedores. O foco está em novidades já disponíveis ou que chegam em breve. 

Gemini 3.5 Flash

O Gemini 3.5 Flash é o grande lançamento de modelo do I/O 2026. Ele supera o Gemini 3.1 Pro em benchmarks de agentes e de código, enquanto o Google afirma que roda 4x mais rápido em tokens de saída por segundo do que outros modelos de ponta. Ainda não dá para confirmar, mas é uma afirmação ousada.

Nos benchmarks, o salto de performance é visível, especialmente em MCP Atlas, CharXiV Reasoning e Finance Agent v2, todos liderados pelo Gemini 3.5 Flash. No geral, o 3.5 Flash parece competir com o Claude Opus 4.7 e o GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

O custo também chama atenção. O Google afirma que empresas que processam cerca de 1 trilhão de tokens por dia poderiam economizar mais de US$ 1 bilhão por ano ao migrar 80% das cargas de trabalho de outros modelos de ponta para o 3.5 Flash. É um recado direto aos clientes corporativos da OpenAI e da Anthropic. O Gemini 3.5 Flash está disponível hoje via Gemini API, Google AI Studio e app Gemini. O Gemini 3.5 Pro já está em uso interno e é esperado para o próximo mês.

Para mais detalhes, recomendo ler nosso artigo sobre o Gemini 3.5 Flash, onde cobrimos o novo modelo em profundidade.

Gemini Omni

O Gemini Omni é o novo modelo generativo de mídia nativamente multimodal do Google, capaz de receber qualquer combinação de texto, imagens, áudio e vídeo como entrada e produzir vídeo como saída. O primeiro modelo da família, o Gemini Omni Flash, está disponível hoje no app Gemini, no Google Flow e no YouTube Shorts.

O ponto arquitetural chave é que o Omni unifica o que antes era um stack dividido (Veo para vídeo, Imagen para imagens e sistemas de áudio separados) em um único modelo. Isso traz edições mais coerentes e menos artefatos de pipeline ao trabalhar entre modalidades. O Google não publicou benchmarks numéricos do Omni no lançamento, então avaliações independentes ainda estão pendentes. O acesso via API para desenvolvedores e clientes corporativos chega nas semanas após o I/O.

Nós testamos e contamos tudo no nosso artigo sobre o Gemini Omni. Os primeiros resultados de geração de vídeo foram irregulares (pelo menos considerando o patamar elevado de ferramentas como o Seedance 2.0), mas um Gemini Omni Pro mais potente deve chegar em breve.

Antigravity 2.0

Antigravity é a plataforma de desenvolvimento com foco em agentes do Google, e a versão 2.0 lançada no I/O é uma expansão significativa. Antes posicionada como um ambiente de codificação, agora é uma plataforma completa para desenvolver, implantar e gerenciar coortes de agentes de IA autônomos. A peça central é um novo aplicativo desktop independente que funciona como um hub para orquestração de agentes, permitindo executar vários agentes em paralelo em tarefas diferentes ao mesmo tempo.

O ecossistema agora tem quatro superfícies distintas para desenvolvedores:

  • Antigravity 2.0 desktop app: orquestra vários agentes em paralelo e suporta tarefas em segundo plano agendadas. Integra-se com Google AI Studio, Android e Firebase.
  • Antigravity CLI: uma interface nativa de terminal para criar e executar agentes sem GUI. O Google está pedindo para usuários do Gemini CLI migrarem para ela.
  • Antigravity SDK: acesso programático ao mesmo arcabouço de agentes que alimenta os próprios produtos do Google, com suporte a comportamentos personalizados hospedados na sua própria infraestrutura.
  • Antigravity no Gemini Enterprise Agent Platform: conecta o Antigravity diretamente a projetos no Google Cloud para workloads corporativos.

Há também alguns recursos novos bem úteis para o agente principal. O maior deles: agora ele pode criar subagentes modulares sob demanda, cada um rodando em paralelo com isolamento de workspace e herdando as configurações de ferramentas e permissões do agente pai. Operações de longa duração rodam de forma assíncrona, sem bloquear o loop do agente.

Semelhante aos Claude Code Hooks, os JSON Hooks permitem anexar scripts de shell personalizados em etapas-chave da execução (antes/depois de chamadas de ferramentas, chamadas de modelo ou em condições de parada) para logging, personalização de argumentos ou injeção de instruções. As tarefas agendadas permitem definir prompts com cron para execuções periódicas, como um digest diário de PRs ou checagens de deploy por hora, com resultados no painel lateral para repasse fluido no modo human-in-the-loop.

No lado da gestão, o Antigravity introduz "projetos" como unidade organizacional que delimita configurações, recursos e permissões por grupo de agentes, em vez de exigir permissões globais amplas para tudo. O painel lateral renovado suporta agrupar conversas por projeto, status ou recência, com suporte nativo a Git worktree integrado. Esse layout por projeto é comparável à gestão multi-janela do Cursor e à fila de tarefas do Codex, mas com escopo de permissão por projeto mais rígido.

Worktrees nativos do Git podem ser criados facilmente ao iniciar uma nova conversa.

Entrada por voz via modelos Gemini Audio e novos comandos de barra (/goal para execuções autônomas, /grill-me para esclarecimentos pré-tarefa, /schedule para prompts com cron, /browser para uso do navegador com opt-in) completam a experiência.

O Antigravity 2.0 está disponível a partir de hoje. O plano Google AI Ultra (US$ 100/mês) inclui um limite de uso 5x maior no Antigravity em comparação ao plano Google AI Pro.

Managed Agents na Gemini API

Junto com o Antigravity 2.0, o Google anunciou os Managed Agents na Gemini API, que levam capacidades agentic diretamente para a camada de API para desenvolvedores que querem criar apps com agentes sem gerenciar por conta própria a infraestrutura de orquestração. É o complemento em nível de API da experiência desktop do Antigravity.

Na prática, agora você pode definir comportamentos de agentes, integrações de ferramentas e fluxos multietapas pela Gemini API e deixar a infraestrutura do Google cuidar da execução. Isso tem potencial para ser um divisor de águas para equipes que constroem aplicações de produção que precisam de execução de tarefas de longo prazo sem montar e manter seu próprio arcabouço de agentes. O acesso está disponível via Google AI Studio, e clientes corporativos acessam pela Gemini Enterprise Agent Platform.

Um alerta honesto: feedback inicial de desenvolvedores que cobriram o I/O aponta que a documentação para fluxos complexos de agentes e tratamento de erros ainda é escassa. Limites de taxa e gestão de cotas também foram citados como pontos de atrito. É provável que isso melhore com o tempo, mas vale saber antes de decidir construir em cima desse stack.

Gemini Spark

O Gemini Spark (não confundir com o LLM mais recente da Meta, o Muse Spark) é o novo agente pessoal de IA do Google e o anúncio agentic mais voltado ao consumidor. Ele roda 24/7 em máquinas virtuais dedicadas no Google Cloud, ou seja, não precisa do seu laptop aberto para continuar trabalhando. O Spark é alimentado pelo Gemini 3.5 e pelo arcabouço do Antigravity, o que dá capacidade de lidar com tarefas de longo prazo em segundo plano.

Os recursos de lançamento incluem:

  • Integração com as ferramentas do Google (Workspace, Gmail, Calendar) já no lançamento, com suporte a ferramentas de terceiros via MCP chegando nas semanas seguintes.
  • Interação pelo app Gemini e, em breve, também por email e chat.
  • Operação diretamente no Chrome como uma camada agentic do navegador, chegando no fim do verão do hemisfério norte.
  • Progresso das tarefas em tempo real visível pelo Android Halo, um novo espaço de UI no Android, previsto para o final do ano.

A comparação com o ecossistema de agentes da OpenAI e com as capacidades de uso de ferramentas da Anthropic é inevitável. O diferencial do Spark é a execução persistente 24/7 na infraestrutura do Google Cloud, combinada à integração profunda com a suíte de produtividade do Google. Se seu trabalho já vive no Google Workspace, isso é uma vantagem real. Se não, a proposta de valor fica menos evidente.

Privacidade é a preocupação legítima aqui. Um agente que monitora continuamente sua caixa de entrada, calendário e documentos levanta questões reais sobre residência de dados e conformidade em setores regulados. Uma pergunta que me fiz foi, por exemplo, "O que acontece com a memória do agente quando um funcionário sai da empresa?" O Google ainda não trouxe respostas detalhadas para isso. O Spark está chegando a testadores confiáveis nesta semana, com Beta para assinantes do Google AI Ultra (US$ 100/mês) nos EUA na semana seguinte.

Managed Agents vs Gemini Spark

Agentes de busca e Modo IA

O Modo IA na Busca foi apresentado no último I/O. Um ano depois, já superou 1 bilhão de usuários ativos mensais. Agora, o Google avança com duas novas capacidades agentic.

A primeira são os agentes de informação na Busca: agentes personalizados em segundo plano que você configura para monitorar temas e trazer informações relevantes no momento certo. Começam a ser lançados neste verão, primeiro para assinantes do Google AI Pro e Ultra.

A segunda é a UI generativa na Busca, alimentada pelo Gemini 3.5 Flash e pelo Antigravity. A Busca agora vai construir layouts personalizados, visuais interativos e até dashboards persistentes ou miniapps para consultas complexas e de longa duração. As capacidades de UI generativa chegam gratuitamente a todos os usuários neste verão. Já os dashboards persistentes e apps personalizados estarão disponíveis primeiro para assinantes Pro e Ultra nos EUA.

Isso preocupa de verdade editores e profissionais de SEO (assim como já preocuparam as introduções de AI Overview e do Modo IA). Quando respostas geradas por IA resolvem completamente a dúvida do usuário direto na Busca, não há motivo para clicar na fonte. Já vimos isso acontecer: tanto os AI Overviews quanto o início do Modo IA causaram quedas relevantes de tráfego no setor. O Google ainda não apresentou uma forma clara de compartilhar receita ou garantir tráfego aos publishers cujo conteúdo alimenta essas respostas.

Google Flow

O Google Flow, que estreou no I/O 2025 como uma ferramenta de cinema com IA, deu um salto importante com três atualizações-chave:

  • Agente de planejamento mais inteligente. O agente do Flow agora consegue planejar e raciocinar por projetos criativos em múltiplas etapas. Você fornece os insumos (por exemplo, um conceito, imagens de referência, um roteiro rascunhado) e ele te ajuda a ir do brainstorm inicial à criação e à edição, tudo no mesmo ambiente. O novo agente está disponível para todos hoje.
  • Vídeo nativo via Gemini Omni. O Flow agora gera e edita vídeo nativamente por meio do modelo Omni. Você pode descrever em linguagem natural as mudanças em um clipe do seu rolo de câmera e iterar de forma conversacional. A consistência de personagens também melhorou, preservando identidade e voz entre cenas. Isso é especialmente útil ao produzir um curta ou campanha com personagens recorrentes.
  • Vibe coding para ferramentas personalizadas. Em vez de ficar limitado às ferramentas que vêm com o Flow, agora você pode criar as suas diretamente na plataforma. O Google demonstrou exemplos como projetar efeitos de vídeo, criar ferramentas de animação desenhada à mão e construir fluxos de sobreposição de texto, tudo sem sair do Flow.

Em conjunto, essas novidades posicionam o Flow para além de um assistente criativo. Ele está virando uma plataforma para construir fluxos criativos, com app móvel em beta no Android e chegando em breve ao iOS.

Expansão do SynthID

O SynthID, sistema invisível de marca d’água em IA do Google, já marcou mais de 100 bilhões de imagens e vídeos e 60 mil anos de ativos de áudio desde o lançamento há três anos. O anúncio do I/O que mais importa aqui não é a escala, e sim os parceiros: OpenAI, Kakao e Eleven Labs estão adotando o SynthID junto com a Nvidia, que entrou no ano passado.

É a adoção cruzada na indústria que dá peso a isso. Um padrão de marca d’água só funciona se for difundido o suficiente para que "sem marca d’água" vire um sinal útil. O Google também está expandindo a verificação de Content Credentials (o padrão C2PA) para a Busca e o Chrome, mostrando aos usuários se o conteúdo veio de IA ou de uma câmera e se foi editado com ferramentas generativas. A combinação de SynthID e C2PA dá duas camadas independentes de procedência, a abordagem certa já que qualquer uma delas pode ser removida facilmente de forma isolada.

Menções honrosas

Outros anúncios do I/O que valem nota rápida:

  • Docs Live: um novo recurso por voz no Google Docs que permite despejar ideias verbalmente e o Gemini estrutura em um documento. Chega aos assinantes neste verão, com recursos de voz também no Gmail e no Keep no mesmo período.
  • Google Pics: uma nova ferramenta de criação e edição de imagens com IA baseada no modelo Nano Banana, tratando cada elemento como um objeto individual, não uma imagem plana. Disponível para testadores confiáveis agora, chegando aos assinantes do Google AI Pro e Ultra mais para o fim do verão.
  • Android Halo: um novo espaço de UI no Android para ver atualizações em tempo real e o progresso de tarefas de agentes como o Gemini Spark. Chega no fim do ano.
  • Daily Brief: um agente pronto para uso no app Gemini que compila um resumo matinal personalizado a partir do seu inbox, calendário e tarefas, com próximos passos sugeridos. Sem preço separado anunciado; deve fazer parte da experiência do app Gemini.
  • TPU 8t e 8i: as TPUs de 8ª geração do Google adotam uma abordagem de chip duplo, com a 8t otimizada para pré-treino em larga escala (quase 3x o compute bruto da geração anterior, escalável para mais de 1 milhão de TPUs globalmente) e a 8i otimizada para inferência. As duas entregam até 2x melhor performance por watt que a geração anterior.
  • Gemini for Science: um conjunto de ferramentas de IA conectando o Antigravity a mais de 30 grandes bases de dados de ciências da vida. O Science Skills está disponível hoje no GitHub e diretamente no Antigravity.

Considerações finais

O Google I/O 2026 apostou em agentes como o principal rumo da IA, com o Gemini 3.5 Flash e o Antigravity 2.0 como infraestrutura por trás de quase tudo o que foi anunciado. O que você já pode usar agora: Gemini 3.5 Flash (via Gemini API e AI Studio), o novo agente do Flow, o Gemini Omni Flash e o app desktop Antigravity 2.0. O Gemini Spark, os agentes na Busca e os recursos de UI generativa na Busca chegam ao longo do verão, em geral liberados primeiro para o novo plano AI Ultra de US$ 100/mês (ao menos inicialmente).

Para mim, a atualização do Antigravity foi o lançamento mais interessante, porque ela atua em dois níveis ao mesmo tempo: como app independente para desenvolvedores, compete diretamente com o Codex e o Claude Code; como plataforma, seu ADK subjacente e a Managed Agents API desafiam frameworks de orquestração como LangChain, AutoGen e o Agents SDK da OpenAI. A integração com o Gemini e a camada de deployment no Google Cloud são os diferenciais (e o risco de lock-in) nos dois fronts.

Google I/O 2026: perguntas frequentes

Como o Gemini 3.5 Flash se compara ao GPT-5.5 e ao Claude Opus 4.7?

O Gemini 3.5 Flash lidera em vários benchmarks agentic como MCP Atlas (83,6%) e Finance Agent v2 (57,9%), enquanto o GPT-5.5 fica na frente no SWE-Bench Pro e no ARC-AGI-2. O Claude Opus 4.7 segue mais forte no Humanity's Last Exam (46,9%). O principal recado é que ele compete com os modelos de ponta, rodando mais rápido e significativamente mais barato em escala, como o próprio nome sugere. Uma variante Pro mais potente deve ser lançada em breve.

Como o Google Antigravity é diferente do Claude Code ou do Codex?

O Google Antigravity 2.0 é uma plataforma de desenvolvimento agent-first que permite orquestrar múltiplos agentes de IA em paralelo via app desktop, CLI, SDK e API corporativa. Diferente do Claude Code (um agente de codificação nativo de terminal) ou do Codex (um sistema baseado em fila de tarefas), o Antigravity oferece escopo de permissões mais rígido por projeto, criação de subagentes e integração direta com o Google Cloud e o Firebase. Seu papel duplo de ferramenta para dev e SDK de plataforma o torna mais comparável a um framework de orquestração do que a um assistente de código isolado.

Vale a pena o plano Google AI Ultra de US$ 100/mês em comparação ao ChatGPT Pro ou Claude Max?

Os três planos custam US$ 100/mês, mas o valor depende do seu ecossistema. O diferencial do Google AI Ultra é o acesso ao Gemini Spark (um agente persistente 24/7), limites de uso 5x maiores no Antigravity e integração profunda com o Google Workspace. Se seu fluxo já está no Gmail, Docs e Calendar, o Ultra leva vantagem natural. Se você precisa principalmente de ajuda com código ou flexibilidade em nível de API, o ChatGPT Pro ou o Claude Max podem te atender melhor.

O que é o Gemini Omni e como ele lida com geração de vídeo?

O Gemini Omni é o modelo nativamente multimodal do Google que aceita qualquer combinação de texto, imagens, áudio e vídeo como entrada e produz vídeo como saída. Ele unifica sistemas que antes eram separados (Veo para vídeo, Imagen para imagens) em um único modelo, o que deve resultar em edições cross-modal mais coerentes. A primeira versão, Omni Flash, já está disponível, e um Omni Pro mais capaz deve chegar em breve. Benchmarks independentes ainda não foram publicados, então a qualidade no mundo real segue em avaliação.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Editor de Ciência de Dados @ DataCamp | Fazer previsões e construir com APIs é a minha paixão.

Tópicos

Conheça o ecossistema de IA do Google!

Programa

Google Workspace with Gemini

4 h
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Ver detalhesRight Arrow
Iniciar curso
Ver maisRight Arrow
Relacionado

blog

Anthropic vs. OpenAI: Os Dois Gigantes da IA Comparados

Saiba como OpenAI e Anthropic lideram o desenvolvimento de IA com abordagens únicas. Explore produtos como o ChatGPT e os modelos inovadores que elas oferecem.
Khalid Abdelaty's photo

Khalid Abdelaty

15 min

blog

Os 7 melhores geradores de vídeo com IA para 2026, com vídeos de exemplo

Conheça os melhores geradores de vídeo com IA disponíveis hoje, incluindo RunwayML, Synthesia, Colossyan, Pictory, DeepBrain AI, Invideo e os super esperados Sora e Veo da DeepMind.
Dr Ana Rojo-Echeburúa's photo

Dr Ana Rojo-Echeburúa

9 min

blog

Tudo o que sabemos sobre o GPT-5

Saiba como o GPT-5 evoluirá para um sistema unificado com recursos avançados, visando um lançamento no verão de 2025, com base no mais recente roteiro da OpenAI e no histórico do GPT.
Josep Ferrer's photo

Josep Ferrer

8 min

blog

Metas para 2025: 60% dos brasileiros querem aprender sobre inteligência artificial neste ano

Buscas por cursos na área saltaram mais de 230% ao longo de 2024.
DataCamp Team's photo

DataCamp Team

6 min

blog

As 36 principais perguntas e respostas sobre IA generativa para entrevistas em 2026

Esse blog traz um conjunto completo de perguntas e respostas sobre IA generativa, desde conceitos básicos até assuntos mais avançados.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 min

blog

Como aprender IA do zero em 2026: Um guia completo feito por especialistas

Descubra tudo o que você precisa saber sobre aprender IA em 2026, desde dicas para começar, recursos úteis e insights de especialistas do setor.
Adel Nehme's photo

Adel Nehme

15 min

Ver maisVer mais