Programa
O fio condutor de praticamente todos os anúncios do primeiro dia do Google I/O 2026 foi o mesmo: agentes. Não chatbots, não assistentes, mas agentes persistentes, que executam tarefas em segundo plano e se integram a todo o stack de produtos da Google. O CEO Sundar Pichai definiu explicitamente como a "era Gemini com agentes", e os anúncios sustentaram essa narrativa.
A Google também respondeu às assinaturas Claude Max, da Anthropic, e ChatGPT Pro, da OpenAI, ao apresentar um novo plano Google AI Ultra no I/O, com o mesmo preço de US$ 100/mês e acesso a alguns dos recursos com agentes descritos abaixo.
Neste artigo, vou te guiar pelos anúncios que mais importam para profissionais de IA e desenvolvedores. O foco está em novidades já disponíveis ou previstas para breve.
Gemini 3.5 Flash
O Gemini 3.5 Flash é o principal lançamento de modelo do I/O 2026. Ele supera o Gemini 3.1 Pro em benchmarks de agentes e de código, enquanto a Google afirma que é 4x mais rápido em tokens de saída por segundo do que outros modelos de ponta. Ainda não dá para confirmar, mas é uma promessa ousada.
Nos benchmarks, o salto de desempenho aparece, especialmente em MCP Atlas, CharXiV Reasoning e Finance Agent v2, todos liderados pelo Gemini 3.5 Flash. No geral, o 3.5 Flash parece competitivo com o Claude Opus 4.7 e o GPT-5.5.
|
Benchmark |
3.5 Flash |
3 Flash |
3.1 Pro |
Claude Sonnet 4.6 |
Opus 4.7 |
GPT-5.5 |
|
Terminal-bench 2.1 |
76,2% |
58,0% |
70,3% |
-- |
66,1% |
78,2% |
|
SWE-Bench Pro |
55,1% |
49,6% |
54,2% |
-- |
64,3% |
58,6% |
|
MCP Atlas |
83,6% |
62,0% |
78,2% |
69,5% |
79,1% |
75,3% |
|
OSWorld |
78,4% |
65,1% |
76,2% |
72,5% |
78,0% |
78,7% |
|
Finance Agent v2 |
57,9% |
42,6% |
43,0% |
51,0% |
51,5% |
51,8% |
|
CharXiv Reasoning |
84,2% |
80,3% |
83,3% |
72,4% |
82,1% |
84,1% |
|
Humanity's Last Exam |
40,2% |
33,7% |
44,4% |
33,2% |
46,9% |
41,4% |
|
ARC-AGI-2 |
72,1% |
33,6% |
77,1% |
58,3% |
75,8% |
84,6% |
O ponto do custo merece atenção. A Google afirma que empresas que processam cerca de 1 trilhão de tokens por dia poderiam economizar mais de US$ 1 bilhão por ano ao migrar 80% das cargas de trabalho de outros modelos de ponta para o 3.5 Flash. É um recado direto aos clientes corporativos da OpenAI e da Anthropic. O Gemini 3.5 Flash está disponível hoje via Gemini API, Google AI Studio e app Gemini. O Gemini 3.5 Pro já está em uso interno e deve chegar no próximo mês.
Para mais detalhes, vale ler nosso artigo sobre o Gemini 3.5 Flash, onde abordamos o novo modelo em profundidade.
Gemini Omni
O Gemini Omni é o novo modelo generativo de mídia nativamente multimodal da Google, capaz de receber qualquer combinação de texto, imagens, áudio e vídeo como entrada e produzir vídeo como saída. O primeiro modelo da família, Gemini Omni Flash, está disponível hoje no app Gemini, no Google Flow e no YouTube Shorts.
O ponto arquitetural-chave é que o Omni unifica o que antes era um stack separado (Veo para vídeo, Imagen para imagens, sistemas de áudio à parte) em um único modelo. Isso traz edições mais coesas e menos artefatos de pipeline ao trabalhar entre modalidades. A Google não publicou benchmarks numéricos do Omni junto ao lançamento, então a avaliação independente ainda está pendente. O acesso via API para desenvolvedores e clientes corporativos chega nas semanas após o I/O.
Nós testamos e detalhamos tudo no nosso artigo sobre o Gemini Omni. Os primeiros resultados de geração de vídeo foram irregulares (principalmente considerando o nível que ferramentas como o Seedance 2.0 estabeleceram), mas um Gemini Omni Pro mais poderoso deve chegar em breve.
Antigravity 2.0
Antigravity é a plataforma de desenvolvimento "agent-first" da Google, e a versão 2.0 no I/O é uma expansão significativa. Antes posicionada como um ambiente de codificação, agora é uma plataforma completa para desenvolver, implantar e gerenciar coortes de agentes autônomos de IA. A peça central é um novo aplicativo desktop independente que funciona como um hub de orquestração de agentes, permitindo executar múltiplos agentes em paralelo em diferentes tarefas simultaneamente.
O ecossistema agora tem quatro superfícies distintas para desenvolvedores:
- App desktop Antigravity 2.0: orquestra vários agentes em paralelo e suporta tarefas em segundo plano agendadas. Integra-se com Google AI Studio, Android e Firebase.
- Antigravity CLI: uma interface nativa de terminal para criar e executar agentes sem GUI. A Google está pedindo que usuários do Gemini CLI migrem para ela.
- Antigravity SDK: acesso programático ao mesmo arcabouço de agentes que alimenta os próprios produtos da Google, com suporte a comportamentos personalizados hospedados na sua infraestrutura.
- Antigravity no Gemini Enterprise Agent Platform: conecta o Antigravity diretamente a projetos no Google Cloud para workloads corporativas.
Há também alguns recursos novos bem úteis para o agente principal. O maior deles: agora ele consegue gerar subagentes modulares sob demanda, cada um rodando em paralelo com isolamento de workspace e herdando as configurações de ferramentas e permissões do agente pai. Operações de longa duração rodam de forma assíncrona, sem bloquear o loop do agente.
Semelhante aos Claude Code Hooks, os JSON Hooks permitem anexar scripts de shell personalizados em etapas-chave da execução (antes/depois de chamadas de ferramentas, chamadas de modelo ou em condições de parada) para logging, customização de argumentos ou injeção de instruções. As tarefas agendadas permitem configurar prompts baseados em cron para execuções periódicas, como resumos diários de PRs ou verificações de deploy por hora, com resultados aparecendo na barra lateral para transferência fluida ao humano no loop.
No lado de gestão, o Antigravity introduz "projetos" como uma unidade organizacional que delimita configurações, recursos e permissões por grupo de agentes, em vez de exigir as permissões globais mais amplas para tudo. O painel lateral reformulado permite agrupar conversas por projeto, status ou recenticidade, com suporte nativo a Git worktree integrado. Esse layout por projetos é comparável ao gerenciamento multi-janela do Cursor e à fila de tarefas do Codex, mas com escopo de permissões por projeto mais rígido.

Entrada por voz via modelos Gemini Audio e novos comandos de barra (/goal para execuções autônomas, /grill-me para esclarecimentos antes da tarefa, /schedule para prompts com cron, /browser para uso do navegador sob demanda) completam a experiência.
O Antigravity 2.0 está disponível a partir de hoje. O plano Google AI Ultra (US$ 100/mês) inclui um limite de uso 5x maior no Antigravity em comparação com o plano Google AI Pro.
Agentes gerenciados na Gemini API
Junto com o Antigravity 2.0, a Google anunciou os Managed Agents na Gemini API, que levam capacidades de agentes diretamente para a camada de API para desenvolvedores que querem criar apps com agentes sem gerenciar a infraestrutura de orquestração. É o complemento em nível de API à experiência desktop do Antigravity.
Na prática, agora dá para definir comportamentos de agentes, integrações de ferramentas e fluxos multi-etapas pela Gemini API e deixar a infraestrutura da Google cuidar da execução. Isso tem potencial para ser um divisor de águas para times que constroem apps de produção que exigem execução de tarefas de longo prazo sem precisar montar e manter seu próprio arcabouço de agentes. O acesso está disponível via Google AI Studio, e clientes corporativos acessam pela Gemini Enterprise Agent Platform.
Um ponto honesto de atenção: feedback inicial de desenvolvedores na cobertura do I/O observa que a documentação para fluxos complexos de agentes e tratamento de erros ainda é escassa. Limites de taxa e gestão de cotas também foram apontados como pontos de atrito. São questões que tendem a diminuir com o tempo, mas valem ser consideradas antes de você apostar nesse stack.
Gemini Spark
O Gemini Spark (não confundir com o LLM mais recente da Meta, o Muse Spark) é o novo agente pessoal de IA da Google e o anúncio mais voltado ao consumidor entre os focados em agentes. Ele roda 24/7 em máquinas virtuais dedicadas no Google Cloud, ou seja, não precisa do seu laptop aberto para continuar trabalhando. O Spark é impulsionado pelo Gemini 3.5 e pelo arcabouço do Antigravity, o que dá a ele a capacidade de lidar com tarefas de longo prazo em segundo plano.
Os recursos no lançamento incluem:
- Integração com as ferramentas da própria Google (Workspace, Gmail, Calendar) no lançamento, com suporte a ferramentas de terceiros via MCP chegando nas semanas seguintes.
- Interação pelo app Gemini e, em breve, por e-mail e chat.
- Operação diretamente no Chrome como uma camada de navegação com agentes, chegando no fim do verão do hemisfério norte.
- Progresso de tarefas em tempo real visível pelo Android Halo, um novo espaço de UI no Android, previsto para o fim deste ano.
Vale a comparação direta com o ecossistema de agentes da OpenAI e as capacidades de uso de ferramentas da Anthropic. O diferencial do Spark é a execução persistente 24/7 na infraestrutura do Google Cloud, combinada com integração profunda ao pacote de produtividade da própria Google. Se o seu trabalho já está no Google Workspace, isso é uma vantagem real. Se não está, a proposta de valor fica menos evidente.
Privacidade é a preocupação legítima aqui. Um agente que monitora continuamente sua caixa de entrada, agenda e documentos levanta questões sérias sobre residência de dados e conformidade em setores regulados. Uma pergunta que me fiz, por exemplo, foi: "O que acontece com a memória do agente quando um funcionário sai da empresa?" A Google ainda não forneceu respostas detalhadas para essas questões.
O Spark começa a ser disponibilizado a testadores confiáveis nesta semana, com Beta para assinantes do Google AI Ultra (US$ 100/mês) nos EUA na semana seguinte. Estamos cobrindo tudo com mais detalhes no nosso artigo sobre o Gemini Spark.

Agentes de busca e modo de IA
O modo de IA na Busca foi apresentado no último I/O. Um ano depois, já superou 1 bilhão de usuários ativos por mês. Agora, a Google avança com duas novas capacidades com agentes.
A primeira são os agentes de informação na Busca: agentes personalizados em segundo plano que você configura para monitorar temas e trazer informações relevantes no momento certo. Começam a ser lançados neste verão, começando por assinantes dos planos Google AI Pro e Ultra.
A segunda é a UI generativa na Busca, alimentada pelo Gemini 3.5 Flash e pelo Antigravity. A Busca agora vai montar layouts customizados, visuais interativos e até painéis persistentes ou miniapps para consultas complexas e de longa duração. Os recursos de UI generativa chegam gratuitamente para todos os usuários neste verão. Os painéis persistentes e apps customizados estarão disponíveis primeiro para assinantes Pro e Ultra nos EUA.
Isto é um ponto real de preocupação para publishers e profissionais de SEO (assim como já foram as introduções de AI Overview e do modo de IA). Quando respostas geradas por IA resolvem totalmente a dúvida do usuário direto na Busca, não há motivo para clicar no site de origem. Já vimos isso acontecer: tanto os AI Overviews quanto o lançamento inicial do modo de IA levaram a quedas significativas de tráfego no setor. A Google ainda não apresentou uma forma clara de compartilhar receita ou garantir tráfego aos publishers cujo conteúdo alimenta essas respostas.
Google Flow
O Google Flow, que estreou no I/O 2025 como uma ferramenta de criação de filmes com IA, deu um passo importante com três atualizações-chave:
- Agente de planejamento mais inteligente. O agente do Flow foi atualizado para planejar e raciocinar por projetos criativos em múltiplas etapas. Você fornece os insumos (por exemplo, um conceito, imagens de referência, um roteiro preliminar) e ele ajuda a evoluir do brainstorm inicial até a criação e edição, tudo em um só ambiente. O novo agente está disponível hoje para todos.
- Vídeo nativo via Gemini Omni. O Flow agora faz geração e edição de vídeo nativamente pelo modelo Omni. Você descreve em linguagem natural as mudanças em um clipe do seu rolo da câmera e itera de forma conversacional. A consistência de personagens também melhorou, preservando identidade e voz entre cenas — útil especialmente em curtas ou campanhas com personagens recorrentes.
- Vibe coding para ferramentas personalizadas. Em vez de ficar limitado às ferramentas nativas do Flow, agora dá para construir as suas direto na plataforma. A Google demonstrou exemplos como efeitos de vídeo customizados, ferramentas de animação desenhadas à mão e fluxos de sobreposição de texto, tudo sem sair do Flow.
Em conjunto, essas novidades posicionam o Flow como mais do que um assistente criativo. Ele está virando uma plataforma para construir fluxos criativos, com app mobile em beta no Android e chegando em breve ao iOS.
Expansão do SynthID
O SynthID, sistema invisível de marca d'água de IA da Google, já marcou mais de 100 bilhões de imagens e vídeos e o equivalente a 60.000 anos de ativos de áudio desde seu lançamento há três anos. O anúncio mais relevante do I/O aqui não é a escala, são os parceiros: OpenAI, Kakao e Eleven Labs estão adotando o SynthID junto com a Nvidia, que aderiu no ano passado.
O que dá peso é a adoção entre players do setor. Um padrão de marca d'água só funciona se for tão difundido que "sem marca d'água" vire um sinal útil. A Google também está expandindo a verificação de Content Credentials (o padrão C2PA) para a Busca e o Chrome, mostrando ao usuário se o conteúdo veio de IA ou de câmera e se foi editado com ferramentas generativas. A combinação de SynthID e C2PA dá duas camadas independentes de proveniência — a abordagem certa, já que qualquer uma pode ser removida com facilidade se estiver sozinha.
Menções honrosas
Outros anúncios do I/O que merecem registro rápido:
- Docs Live: um novo recurso de voz primeiro no Google Docs que permite despejar ideias falando e o Gemini estrutura tudo em um documento. Chega aos assinantes neste verão, com recursos de voz também no Gmail e no Keep no mesmo período.
- Google Pics: nova ferramenta de criação e edição de imagens com IA baseada no modelo Nano Banana, tratando cada elemento como objeto individual e não como imagem plana. Disponível para testadores confiáveis agora e chegando aos assinantes Google AI Pro e Ultra no fim do verão.
- Android Halo: novo espaço de UI no Android para ver atualizações em tempo real e progresso de tarefas de agentes como o Gemini Spark. Chega no fim deste ano.
- Daily Brief: um agente pronto para uso no app Gemini que compila um resumo matinal personalizado do seu e-mail, agenda e tarefas, com próximos passos sugeridos. Sem preço separado anunciado; deve fazer parte da experiência do app Gemini.
- TPU 8t e 8i: a 8ª geração de TPUs da Google adota uma abordagem de chip duplo, com a 8t otimizada para pré-treinamento em larga escala (quase 3x o compute bruto da geração anterior, escalável para mais de 1 milhão de TPUs globalmente) e a 8i otimizada para inferência. Ambas entregam até 2x melhor desempenho por watt em relação à geração anterior.
- Gemini for Science: um conjunto de ferramentas de IA conectando o Antigravity a mais de 30 grandes bases de dados de ciências da vida. O Science Skills está disponível hoje no GitHub e diretamente no Antigravity.
Considerações finais
O Google I/O 2026 apostou nos agentes como principal direção da IA, com o Gemini 3.5 Flash e o Antigravity 2.0 servindo de infraestrutura por trás de quase tudo o que foi anunciado. O que você já pode usar agora: Gemini 3.5 Flash (via Gemini API e AI Studio), o novo agente do Flow, o Gemini Omni Flash e o app desktop Antigravity 2.0. Gemini Spark, agentes na Busca e os recursos de UI generativa na Busca serão lançados ao longo do verão, em sua maioria restritos inicialmente ao novo plano AI Ultra de US$ 100/mês.
Para mim, a atualização do Antigravity foi o lançamento mais interessante, porque ela atua em dois níveis ao mesmo tempo: como app independente para desenvolvedores, compete diretamente com o Codex e o Claude Code; como plataforma, seu ADK subjacente e a Managed Agents API desafiam frameworks de orquestração como LangChain, AutoGen e o Agents SDK da OpenAI. A integração com o Gemini e a camada de implantação no Google Cloud são os diferenciais (e também o risco de lock-in) em ambas as frentes.
Google I/O 2026: perguntas frequentes
Como o Gemini 3.5 Flash se compara ao GPT-5.5 e ao Claude Opus 4.7?
O Gemini 3.5 Flash lidera em vários benchmarks de agentes como MCP Atlas (83,6%) e Finance Agent v2 (57,9%), enquanto o GPT-5.5 leva vantagem no SWE-Bench Pro e no ARC-AGI-2. O Claude Opus 4.7 segue mais forte no Humanity's Last Exam (46,9%). A principal conclusão é que ele é competitivo com os modelos de ponta, rodando mais rápido e muito mais barato em escala, como o próprio nome sugere. Uma variante Pro mais potente deve ser lançada em breve.
Como o Google Antigravity difere do Claude Code ou do Codex?
O Google Antigravity 2.0 é uma plataforma de desenvolvimento "agent-first" que permite orquestrar múltiplos agentes de IA em paralelo por um app desktop, CLI, SDK e uma API corporativa. Diferente do Claude Code (um agente de código nativo de terminal) ou do Codex (um sistema baseado em fila de tarefas), o Antigravity oferece escopo de permissões por projeto mais rígido, geração de subagentes e integração direta com Google Cloud e Firebase. Seu papel duplo — ferramenta de desenvolvedor e SDK de plataforma — o torna mais comparável a um framework de orquestração do que a um assistente de código isolado.
Vale a pena o plano Google AI Ultra de US$ 100/mês em comparação ao ChatGPT Pro ou Claude Max?
Os três planos custam US$ 100/mês, mas o valor depende do seu ecossistema. O diferencial do Google AI Ultra é o acesso ao Gemini Spark (um agente persistente 24/7), limites de uso 5x maiores no Antigravity e integração profunda com o Google Workspace. Se seu fluxo já vive no Gmail, Docs e Calendar, o Ultra leva vantagem natural. Se você precisa principalmente de ajuda em código ou flexibilidade em nível de API, o ChatGPT Pro ou o Claude Max podem te atender melhor.
O que é o Gemini Omni e como ele lida com a geração de vídeo?
O Gemini Omni é o modelo nativamente multimodal da Google que aceita qualquer combinação de texto, imagens, áudio e vídeo como entrada e produz vídeo como saída. Ele unifica sistemas antes separados (Veo para vídeo, Imagen para imagens) em um único modelo, o que deve resultar em edições intermodais mais coesas. A primeira versão, Omni Flash, já está disponível, e um Omni Pro mais capaz deve chegar em breve. Benchmarks independentes ainda não foram publicados, então a qualidade no mundo real segue em avaliação.

Editor de Ciência de Dados @ DataCamp | Fazer previsões e construir com APIs é a minha paixão.
