Programa
O Google anunciou o Gemini 3.5 Flash no I/O 2026 em 19 de maio, um modelo que supera o Gemini 3.1 Pro em benchmarks de agentes e código, rodando quatro vezes mais rápido que outros modelos de ponta da mesma categoria.
O lançamento chega em um momento em que o foco competitivo da indústria de IA migrou de vez para desempenho agentic. Agentes de código, automação de workflows em várias etapas e execução de tarefas de longo prazo viraram o grande campo de disputa, e o Google está posicionando o 3.5 Flash como sua resposta para essa fase.
Para profissionais de todas as áreas, incluindo cientistas de dados, engenheiros de ML e desenvolvedores, isso importa porque o 3.5 Flash agora é (ou será em breve) o modelo padrão no app Gemini e no Modo de IA na Busca, e já está disponível via Gemini API. Neste artigo, eu mostro o que foi anunciado, os destaques, os números dos benchmarks e o que isso significa para o seu trabalho.
O que há de novo no Gemini 3.5 Flash
O principal destaque do Gemini 3.5 Flash é a velocidade combinada a um desempenho de nível frontier. O Google afirma que o 3.5 Flash é quatro vezes mais rápido em tokens de saída por segundo do que outros modelos de ponta, superando o Gemini 3.1 Pro nos benchmarks que mais importam para trabalho agentic.
No Terminal-Bench 2.1, ele marca 76,2%. No GDPval-AA, alcança 1.656 de Elo. No MCP Atlas, atinge 83,6%. Em entendimento multimodal, faz 84,2% no CharXiv Reasoning.
Em resumo, esses números mostram que a velha regra do “rápido, barato ou inteligente; escolha dois” está menos aplicável em IA. Estamos recebendo um modelo leve, capaz de lidar com workflows complexos de agentes em várias etapas sem latências enormes.
Segundo o Google, o modelo fica geralmente disponível hoje no Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform e Gemini Enterprise. Ele também é o novo modelo padrão no app Gemini e no Modo de IA na Busca globalmente.
O Google também anunciou que o Gemini 3.5 Pro está em desenvolvimento, já em uso interno, e deve chegar no próximo mês. O lançamento do 3.5 Flash é o primeiro passo de uma nova família de modelos centrada em execução agentic.
Contexto do Gemini 3.5
A série Gemini 3 consolidou a posição atual do Google na corrida dos modelos frontier. Lançado em fevereiro de 2026, o Gemini 3.1 Pro liderou o Artificial Analysis Intelligence Index na estreia e marcou 77,1% no ARC-AGI-2, mais que o dobro dos 31,1% do Gemini 3 Pro nesse benchmark.
Como mostramos na nossa comparação entre GPT-5.5 e Gemini 3.1 Pro, a força do Gemini 3.1 Pro estava no raciocínio visual complexo e em tarefas multimodais.
A denominação Flash na família Gemini sempre indicou modelos otimizados para velocidade. O que muda no 3.5 Flash é que o Google afirma inteligência de nível frontier em velocidade de Flash, sem abrir mão de qualidade. O índice Artificial Analysis coloca o 3.5 Flash no quadrante superior direito (segundo o Google), ou seja, alta inteligência e alta velocidade de saída ao mesmo tempo.
O Antigravity, o framework do Google para implantar subagentes colaborativos, é central no posicionamento do 3.5 Flash. Ele não é apenas um modelo isolado, mas um componente de uma arquitetura multiagente que o Google vem construindo em paralelo ao modelo.
Principais recursos do Gemini 3.5
Veja um resumo do que mais chamou atenção no anúncio.
Desempenho em benchmarks
As afirmações do Google sobre o 3.5 Flash são específicas e merecem ser vistas de perto. O modelo supera o Gemini 3.1 Pro nos seguintes pontos:
- Terminal-Bench 2.1: 76,2% (o Gemini 3.1 Pro foi medido no Terminal-Bench 2.0 com 68,5%, segundo nossa cobertura anterior)
- GDPval-AA: 1.656 de Elo (o Claude Opus 4.7 liderava esse benchmark com 1.753 de Elo no lançamento, conforme nossa análise Claude Opus 4.7 vs Gemini 3.1 Pro)
- MCP Atlas: 83,6% (o Gemini 3.1 Pro marcou 73,9% no MCP Atlas em nossos testes anteriores)
- CharXiv Reasoning: 84,2% em entendimento multimodal
A alegação de velocidade também chama atenção: quatro vezes mais rápido em tokens de saída por segundo do que outros modelos de ponta. O Google não especifica quais modelos compara nas notas técnicas, então trate esse número como direcional, e não como um confronto direto e preciso.
Arquitetura agentic e Antigravity
O 3.5 Flash foi projetado para trabalhar com o Antigravity, o framework do Google para executar subagentes colaborativos. Com o Antigravity, o modelo pode acionar múltiplos subagentes em paralelo, executar workflows em várias etapas e manter o desempenho em tarefas de longo prazo.
Os exemplos do Google incluem sintetizar o paper do AlphaZero e programar um jogo totalmente jogável em seis horas usando dois agentes, além de transformar um código legado para Next.js. Não são demos de laboratório: refletem tarefas de desenvolvimento que antes levavam dias e que sistemas agentic agora começam a assumir.
Implantações reais em empresas
Várias empresas já estão rodando o 3.5 Flash em produção ou piloto. Os casos merecem destaque porque mostram onde as capacidades agentic do modelo estão sendo aplicadas:
- Shopify: Execução de subagentes em paralelo para analisar dados complexos ao longo de um período extenso e projetar o crescimento de lojistas
- Macquarie Bank: Piloto de onboarding de clientes ao raciocinar sobre documentos com 100+ páginas com baixa latência
- Salesforce: Integração ao Agentforce para automação de tarefas corporativas com múltiplos subagentes e chamadas de ferramentas em várias interações
- Xero: Implantação de agentes para gerenciar workflows de múltiplas semanas, incluindo preparação de formulários fiscais 1099 para pequenos negócios
- Databricks: Uso de workflows agentic para monitorar informações em tempo real, diagnosticar problemas e propor soluções em grandes conjuntos de dados
- Ramp: Melhoria da acurácia de OCR em faturas complexas por meio de entendimento multimodal combinado com raciocínio sobre padrões históricos
Gemini Spark e disponibilidade para consumidores
O 3.5 Flash também é o modelo por trás do Gemini Spark, o novo agente pessoal de IA do Google que funciona 24/7 e executa ações em nome dos usuários. O Google está liberando o Spark para testadores confiáveis agora, com Beta previsto para assinantes do Google AI Ultra nos EUA na semana após o anúncio do I/O.
O modelo está disponível hoje para bilhões de usuários globalmente via app Gemini e Modo de IA na Busca, tornando este um dos lançamentos mais amplos, simultaneamente para consumidores e desenvolvedores, que o Google já fez para um modelo Gemini.
Segurança e salvaguardas
O Google afirma que o 3.5 Flash foi desenvolvido sob o Frontier Safety Framework, com reforços em cibersegurança e salvaguardas CBRN. A empresa usa ferramentas de interpretabilidade que verificam o raciocínio interno do modelo antes da resposta, com o objetivo de reduzir saídas nocivas e também recusas indevidas em consultas seguras.
Gemini 3.5 para profissionais de dados e IA
A implicação prática imediata é que o 3.5 Flash está disponível de forma iminente via Gemini API no Google AI Studio. Se você está construindo pipelines agentic, a combinação do score no MCP Atlas (83,6%) com o framework multiagente Antigravity vale um teste frente ao que você usa hoje.
O score de 1.656 de Elo no GDPval-AA fica atrás dos 1.753 do Claude Opus 4.7 do nosso review anterior, mas a vantagem de velocidade do 3.5 Flash pode pesar mais dependendo das suas exigências de latência.
Para times que rodam workflows de longo prazo, as implantações da Xero e da Shopify são sinais especialmente relevantes. Workflows de múltiplas semanas sendo comprimidos em execuções automatizadas de agentes é exatamente o caso de uso que o Google está otimizando — e o Antigravity é a camada de infraestrutura que viabiliza isso. Se você ainda não está familiarizado com padrões de orquestração multiagente, este é um bom momento para se atualizar.
Um ponto para acompanhar de perto: o Google diz que o 3.5 Flash custa menos da metade do preço de outros modelos de ponta para tarefas comparáveis. Essa afirmação depende bastante da sua carga de trabalho específica, mas, se se confirmar na prática, muda a economia de rodar sistemas agentic em escala. O 3.5 Pro, previsto para o mês que vem, será a comparação mais interessante para times que fazem o raciocínio mais pesado.
Considerações finais
O Gemini 3.5 Flash mostra que o Google pretende competir nas duas pontas da curva de desempenho e velocidade, não só no topo da linha. Superar o Gemini 3.1 Pro em benchmarks agentic rodando em velocidade de Flash é uma mudança relevante — e as implantações corporativas na Shopify, Macquarie e Salesforce sugerem que o modelo se sustenta fora de ambientes controlados.
No panorama geral, o Google está apostando forte em infraestrutura agentic: Antigravity, Gemini Spark e 3.5 Flash apontam todos na mesma direção. Se essa aposta vai se pagar depende do desempenho do 3.5 Pro quando chegar no próximo mês e de como o Antigravity se compara a frameworks multiagente concorrentes em workflows reais de desenvolvimento.
Se você quer se atualizar sobre conceitos de IA agentic e como construir com modelos como esses, recomendo conferir a trilha de aprendizado AI Agent Fundamentals na DataCamp.

Escritor e editor de conteúdo na área de edtech. Comprometido com a exploração de tendências de dados e entusiasmado com o aprendizado da ciência de dados.



