Pular para o conteúdo principal

Gemini 3.5 Flash: o modelo agentic mais rápido do Google

O Google lançou o Gemini 3.5 Flash no I/O 2026, um modelo que supera o Gemini 3.1 Pro em benchmarks de agentes e código e roda quatro vezes mais rápido que concorrentes.
Atualizado 19 de mai. de 2026  · 8 min lido

O Google anunciou o Gemini 3.5 Flash no I/O 2026 em 19 de maio, um modelo que supera o Gemini 3.1 Pro em benchmarks de agentes e código, rodando quatro vezes mais rápido que outros modelos de ponta da mesma categoria.

O lançamento chega em um momento em que o foco competitivo da indústria de IA migrou de vez para desempenho agentic. Agentes de código, automação de workflows em várias etapas e execução de tarefas de longo prazo viraram o grande campo de disputa, e o Google está posicionando o 3.5 Flash como sua resposta para essa fase.

Para profissionais de todas as áreas, incluindo cientistas de dados, engenheiros de ML e desenvolvedores, isso importa porque o 3.5 Flash agora é (ou será em breve) o modelo padrão no app Gemini e no Modo de IA na Busca, e já está disponível via Gemini API. Neste artigo, eu mostro o que foi anunciado, os destaques, os números dos benchmarks e o que isso significa para o seu trabalho.

O que há de novo no Gemini 3.5 Flash

O principal destaque do Gemini 3.5 Flash é a velocidade combinada a um desempenho de nível frontier. O Google afirma que o 3.5 Flash é quatro vezes mais rápido em tokens de saída por segundo do que outros modelos de ponta, superando o Gemini 3.1 Pro nos benchmarks que mais importam para trabalho agentic.

No Terminal-Bench 2.1, ele marca 76,2%. No GDPval-AA, alcança 1.656 de Elo. No MCP Atlas, atinge 83,6%. Em entendimento multimodal, faz 84,2% no CharXiv Reasoning.

Em resumo, esses números mostram que a velha regra do “rápido, barato ou inteligente; escolha dois” está menos aplicável em IA. Estamos recebendo um modelo leve, capaz de lidar com workflows complexos de agentes em várias etapas sem latências enormes.

Segundo o Google, o modelo fica geralmente disponível hoje no Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform e Gemini Enterprise. Ele também é o novo modelo padrão no app Gemini e no Modo de IA na Busca globalmente.

O Google também anunciou que o Gemini 3.5 Pro está em desenvolvimento, já em uso interno, e deve chegar no próximo mês. O lançamento do 3.5 Flash é o primeiro passo de uma nova família de modelos centrada em execução agentic.

Contexto do Gemini 3.5

A série Gemini 3 consolidou a posição atual do Google na corrida dos modelos frontier. Lançado em fevereiro de 2026, o Gemini 3.1 Pro liderou o Artificial Analysis Intelligence Index na estreia e marcou 77,1% no ARC-AGI-2, mais que o dobro dos 31,1% do Gemini 3 Pro nesse benchmark.

Como mostramos na nossa comparação entre GPT-5.5 e Gemini 3.1 Pro, a força do Gemini 3.1 Pro estava no raciocínio visual complexo e em tarefas multimodais.

A denominação Flash na família Gemini sempre indicou modelos otimizados para velocidade. O que muda no 3.5 Flash é que o Google afirma inteligência de nível frontier em velocidade de Flash, sem abrir mão de qualidade. O índice Artificial Analysis coloca o 3.5 Flash no quadrante superior direito (segundo o Google), ou seja, alta inteligência e alta velocidade de saída ao mesmo tempo.

O Antigravity, o framework do Google para implantar subagentes colaborativos, é central no posicionamento do 3.5 Flash. Ele não é apenas um modelo isolado, mas um componente de uma arquitetura multiagente que o Google vem construindo em paralelo ao modelo.

Principais recursos do Gemini 3.5

Veja um resumo do que mais chamou atenção no anúncio.

Desempenho em benchmarks

As afirmações do Google sobre o 3.5 Flash são específicas e merecem ser vistas de perto. O modelo supera o Gemini 3.1 Pro nos seguintes pontos:

  • Terminal-Bench 2.1: 76,2% (o Gemini 3.1 Pro foi medido no Terminal-Bench 2.0 com 68,5%, segundo nossa cobertura anterior)
  • GDPval-AA: 1.656 de Elo (o Claude Opus 4.7 liderava esse benchmark com 1.753 de Elo no lançamento, conforme nossa análise Claude Opus 4.7 vs Gemini 3.1 Pro)
  • MCP Atlas: 83,6% (o Gemini 3.1 Pro marcou 73,9% no MCP Atlas em nossos testes anteriores)
  • CharXiv Reasoning: 84,2% em entendimento multimodal

A alegação de velocidade também chama atenção: quatro vezes mais rápido em tokens de saída por segundo do que outros modelos de ponta. O Google não especifica quais modelos compara nas notas técnicas, então trate esse número como direcional, e não como um confronto direto e preciso.

Arquitetura agentic e Antigravity

O 3.5 Flash foi projetado para trabalhar com o Antigravity, o framework do Google para executar subagentes colaborativos. Com o Antigravity, o modelo pode acionar múltiplos subagentes em paralelo, executar workflows em várias etapas e manter o desempenho em tarefas de longo prazo.

Os exemplos do Google incluem sintetizar o paper do AlphaZero e programar um jogo totalmente jogável em seis horas usando dois agentes, além de transformar um código legado para Next.js. Não são demos de laboratório: refletem tarefas de desenvolvimento que antes levavam dias e que sistemas agentic agora começam a assumir.

Implantações reais em empresas

Várias empresas já estão rodando o 3.5 Flash em produção ou piloto. Os casos merecem destaque porque mostram onde as capacidades agentic do modelo estão sendo aplicadas:

  • Shopify: Execução de subagentes em paralelo para analisar dados complexos ao longo de um período extenso e projetar o crescimento de lojistas
  • Macquarie Bank: Piloto de onboarding de clientes ao raciocinar sobre documentos com 100+ páginas com baixa latência
  • Salesforce: Integração ao Agentforce para automação de tarefas corporativas com múltiplos subagentes e chamadas de ferramentas em várias interações
  • Xero: Implantação de agentes para gerenciar workflows de múltiplas semanas, incluindo preparação de formulários fiscais 1099 para pequenos negócios
  • Databricks: Uso de workflows agentic para monitorar informações em tempo real, diagnosticar problemas e propor soluções em grandes conjuntos de dados
  • Ramp: Melhoria da acurácia de OCR em faturas complexas por meio de entendimento multimodal combinado com raciocínio sobre padrões históricos

Gemini Spark e disponibilidade para consumidores

O 3.5 Flash também é o modelo por trás do Gemini Spark, o novo agente pessoal de IA do Google que funciona 24/7 e executa ações em nome dos usuários. O Google está liberando o Spark para testadores confiáveis agora, com Beta previsto para assinantes do Google AI Ultra nos EUA na semana após o anúncio do I/O.

O modelo está disponível hoje para bilhões de usuários globalmente via app Gemini e Modo de IA na Busca, tornando este um dos lançamentos mais amplos, simultaneamente para consumidores e desenvolvedores, que o Google já fez para um modelo Gemini.

Segurança e salvaguardas

O Google afirma que o 3.5 Flash foi desenvolvido sob o Frontier Safety Framework, com reforços em cibersegurança e salvaguardas CBRN. A empresa usa ferramentas de interpretabilidade que verificam o raciocínio interno do modelo antes da resposta, com o objetivo de reduzir saídas nocivas e também recusas indevidas em consultas seguras.

Gemini 3.5 para profissionais de dados e IA

A implicação prática imediata é que o 3.5 Flash está disponível de forma iminente via Gemini API no Google AI Studio. Se você está construindo pipelines agentic, a combinação do score no MCP Atlas (83,6%) com o framework multiagente Antigravity vale um teste frente ao que você usa hoje.

O score de 1.656 de Elo no GDPval-AA fica atrás dos 1.753 do Claude Opus 4.7 do nosso review anterior, mas a vantagem de velocidade do 3.5 Flash pode pesar mais dependendo das suas exigências de latência.

Para times que rodam workflows de longo prazo, as implantações da Xero e da Shopify são sinais especialmente relevantes. Workflows de múltiplas semanas sendo comprimidos em execuções automatizadas de agentes é exatamente o caso de uso que o Google está otimizando — e o Antigravity é a camada de infraestrutura que viabiliza isso. Se você ainda não está familiarizado com padrões de orquestração multiagente, este é um bom momento para se atualizar.

Um ponto para acompanhar de perto: o Google diz que o 3.5 Flash custa menos da metade do preço de outros modelos de ponta para tarefas comparáveis. Essa afirmação depende bastante da sua carga de trabalho específica, mas, se se confirmar na prática, muda a economia de rodar sistemas agentic em escala. O 3.5 Pro, previsto para o mês que vem, será a comparação mais interessante para times que fazem o raciocínio mais pesado.

Considerações finais

O Gemini 3.5 Flash mostra que o Google pretende competir nas duas pontas da curva de desempenho e velocidade, não só no topo da linha. Superar o Gemini 3.1 Pro em benchmarks agentic rodando em velocidade de Flash é uma mudança relevante — e as implantações corporativas na Shopify, Macquarie e Salesforce sugerem que o modelo se sustenta fora de ambientes controlados.

No panorama geral, o Google está apostando forte em infraestrutura agentic: Antigravity, Gemini Spark e 3.5 Flash apontam todos na mesma direção. Se essa aposta vai se pagar depende do desempenho do 3.5 Pro quando chegar no próximo mês e de como o Antigravity se compara a frameworks multiagente concorrentes em workflows reais de desenvolvimento.

Se você quer se atualizar sobre conceitos de IA agentic e como construir com modelos como esses, recomendo conferir a trilha de aprendizado AI Agent Fundamentals na DataCamp.


Matt Crabtree's photo
Author
Matt Crabtree
LinkedIn

Escritor e editor de conteúdo na área de edtech. Comprometido com a exploração de tendências de dados e entusiasmado com o aprendizado da ciência de dados.

Tópicos

Principais cursos da DataCamp

Programa

Fundamentos de agentes de IA

6 h
Descubra como os agentes de IA podem transformar sua forma de trabalhar e gerar valor para sua organização!
Ver detalhesRight Arrow
Iniciar curso
Ver maisRight Arrow
Relacionado

blog

A OpenAI anuncia o GPT-4 Turbo com visão: O que sabemos até o momento

Descubra a atualização mais recente da OpenAI, GPT-4 Turbo com visão, e seus principais recursos, incluindo o corte de conhecimento aprimorado, uma janela de contexto expandida, preço acessível e muito mais.
Richie Cotton's photo

Richie Cotton

7 min

An avian AI exits its cage

blog

12 Alternativas de código aberto ao GPT-4

GPT-4 alternativas de código aberto que podem oferecer desempenho semelhante e exigem menos recursos computacionais para serem executadas. Esses projetos vêm com instruções, fontes de código, pesos de modelos, conjuntos de dados e interface de usuário do chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

blog

Tudo o que sabemos sobre o GPT-5

Saiba como o GPT-5 evoluirá para um sistema unificado com recursos avançados, visando um lançamento no verão de 2025, com base no mais recente roteiro da OpenAI e no histórico do GPT.
Josep Ferrer's photo

Josep Ferrer

8 min

blog

Stability AI anuncia a difusão estável 3: Tudo o que sabemos até agora

Saiba mais sobre as novas atualizações do Stable Diffusion e descubra os recursos do modelo de texto para imagem da versão 3.
Richie Cotton's photo

Richie Cotton

Tutorial

Como fazer o ajuste fino do GPT 3.5: Liberando todo o potencial da IA

Explore o GPT-3.5 Turbo e descubra o potencial transformador do ajuste fino. Saiba como personalizar esse modelo de linguagem avançado para aplicativos de nicho, aprimorar seu desempenho e entender os custos associados, a segurança e as considerações de privacidade.
Moez Ali's photo

Moez Ali

Tutorial

DeepSeek-Coder-V2 Tutorial: Exemplos, instalação, padrões de referência

O DeepSeek-Coder-V2 é um modelo de linguagem de código de código aberto que rivaliza com o desempenho do GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B ou Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

Ver maisVer mais