Programa
O mercado de ferramentas de codificação com IA avançou rápido no início de 2026. A OpenAI lançou o GPT-5.3-Codex em fevereiro, anunciando resultados de ponta no SWE-bench Pro e um ganho de 25% em velocidade em relação ao antecessor.
No mesmo período, a Anthropic lançou o Claude Opus 4.6 e o Claude Sonnet 4.6, trazendo uma janela de contexto de 1 milhão de tokens em beta e um recurso multiagente chamado Agent Teams. Além disso, vários vazamentos apontam para um GPT‑5.4 interno com uma janela de contexto de 2 milhões de tokens, o que levaria a corrida do contexto muito além do que qualquer uma das ferramentas expõe publicamente hoje.
Pela primeira vez, ambas as ferramentas rodam em modelos lançados com poucas semanas de diferença, o que torna a comparação direta mais significativa do que antes. No SWE-bench Pro, as duas ficam em faixas muito próximas. No Terminal-Bench 2.0, o Codex mostra uma vantagem perceptível sobre o Claude Code em tarefas de estilo terminal. A diferença não está onde você talvez esperasse.
O que é o OpenAI Codex?
Se você já viu o nome "Codex" antes, vale esclarecer logo de cara: a ferramenta atual compartilha apenas o nome com sua antecessora de 2021. O Codex original era um modelo ajustado do GPT-3 que alimentou as primeiras versões do GitHub Copilot como serviço de autocompletar código. Foi descontinuado em março de 2023. Enquanto aquele modelo respondia com completações de código, a ferramenta atual recebe descrições de objetivos e trabalha de forma autônoma para atingi-los.
O Codex 2025 é uma ferramenta completa de engenharia de software que funciona sozinha. Foi lançado em maio de 2025, chegou ao GA em outubro de 2025 e, no início de 2026, é movido pelo GPT-5.3-Codex. Ele não autocompleta linhas. Ele planeja e executa tarefas completas: escreve features, corrige bugs, roda testes, propõe pull requests e faz revisão de código.
Primeiros passos com o Codex
O Codex opera em quatro superfícies: um agente web em nuvem em chatgpt.com/codex, um CLI open source feito em Rust e TypeScript, extensões de IDE para VS Code e Cursor, e um app para desktop no macOS lançado em fevereiro de 2026. Também integra com GitHub, Slack e Linear.
# Install the Codex CLI
npm install -g @openai/codex
# Run in interactive mode
codex "refactor the auth module to use async/await"
# Run in full auto mode
codex --full-auto "write tests for all API endpoints"
Quando você envia uma tarefa para o agente em nuvem, o Codex fornece um container isolado já carregado com seu repositório. A execução tem duas fases. Durante a fase de setup, o container tem acesso à rede para instalar dependências. Quando a fase de agente começa, a rede fica desativada por padrão. Isso impede que qualquer código gerado pelo agente acesse serviços externos ou baixe pacotes indesejados. O agente executa a tarefa e retorna um pull request ou diff para você revisar.

Workspace em nuvem do Codex executando tarefas. Imagem do autor.
O CLI do Codex oferece três níveis de participação do usuário. No modo Suggest, o agente lê seus arquivos e propõe mudanças, mas não faz nada sem sua confirmação. O modo Auto Edit permite que o agente escreva arquivos automaticamente, mas ainda solicite permissão antes de executar comandos no shell. O modo Full Auto roda todo o ciclo sem interrupções, limitado ao diretório atual.
A configuração é feita por meio de arquivos AGENTS.md, um padrão aberto suportado por dezenas de milhares de projetos open source e adotado por outras ferramentas como Cursor e Aider. Se seu time já usa essas ferramentas, o Codex lê essa configuração existente diretamente.
O que é o Claude Code?
Claude Code é o assistente de codificação da Anthropic feito para o terminal. Foi lançado como pesquisa limitada em fevereiro de 2025 e chegou ao GA em maio de 2025. É movido pelo Claude Opus 4.6 e Claude Sonnet 4.6, ambos lançados no início de 2026.
O ponto mais importante sobre o Claude Code é onde ele roda. Seu código fica na sua máquina. O Claude Code lê seu sistema de arquivos local, executa comandos no seu terminal de verdade, usa sua configuração local de git e chama a API da Anthropic apenas para processamento. Nada é enviado para um container em nuvem.
Primeiros passos com o Claude Code
O Claude Code funciona pelo terminal e também oferece suporte ao VS Code, IDEs JetBrains (atualmente em beta) e forks do VS Code como Cursor e Windsurf. Há ainda uma interface no navegador em claude.ai/code. A instalação é simples no macOS, Linux e Windows:
# macOS and Linux
curl -fsSL https://claude.ai/install.sh | bash
No Windows, há um instalador em PowerShell na página oficial de download. Homebrew e WinGet também são suportados. A instalação via npm foi descontinuada.
Depois de instalar, você interage com o Claude Code por linguagem natural no terminal:
# Start a session
claude
# Continue the most recent session
claude -c
# Pipe input directly from another tool
tail -f app.log | claude -p "alert me if you see anomalies"
Um arquivo CLAUDE.md na raiz do projeto dá ao Claude Code um contexto salvo: convenções de código, anotações de arquitetura e tudo o que ele deve saber antes de tocar no seu código.
Por padrão, o Claude Code pede sua aprovação antes de fazer qualquer alteração. Antes de rodar comandos no shell, escrever em arquivos ou criar commits, ele mostra exatamente o que planeja fazer e espera sua confirmação. Isso mantém você no controle, mas também significa que é preciso acompanhar ativamente a sessão.

Claude Code em uma sessão local no terminal. Imagem do autor.
Agent Teams e fluxos de trabalho multiagente
Um dos maiores acréscimos junto com o Claude Opus 4.6 é o Agent Teams, atualmente em pesquisa. Isso permite que várias sessões do Claude Code trabalhem em paralelo em um projeto compartilhado, coordenadas por uma sessão líder.
Diferente dos agentes paralelos do Codex, que rodam de forma independente, os Agent Teams do Claude Code compartilham uma lista de tarefas e se comunicam entre si. A sessão líder distribui subtarefas e acompanha o que cada agente altera. Ao migrar uma grande base React, por exemplo, a líder pode designar um agente para mapear dependências, outro para escrever substituições e um terceiro para rodar testes, todos atualizando a mesma lista de tarefas em tempo real. Isso evita que os agentes saiam do trilho em mudanças complexas entre vários arquivos.
Principais diferenças entre Codex e Claude Code

Codex vs. Claude Code em resumo
Agora que você entendeu como cada ferramenta funciona, vamos aos pontos práticos mais importantes entre elas.
|
Recurso |
OpenAI Codex |
Claude Code |
|
Modelo principal |
GPT-5.3-Codex |
Claude Opus 4.6 / Sonnet 4.6 |
|
Ambiente de execução |
Sandbox em nuvem + CLI local |
Terminal local (máquina do usuário) |
|
Estilo de interação |
Autônomo, tarefas em segundo plano |
Interativo, desenvolvedor no loop |
|
Janela de contexto |
400K (entrada + saída) |
200K padrão / 1M beta |
|
Suporte a multiagentes |
Agentes paralelos em sandbox na nuvem |
Agent Teams (prévia de pesquisa) |
|
Arquivo de configuração |
|
|
|
Eficiência de tokens |
Maior eficiência por tarefa |
Mais tokens por tarefa |
|
Ponto de entrada de preço |
ChatGPT Plus: US$ 20/mês |
Claude Pro: US$ 20/mês |
|
CLI open source |
Sim (Apache 2.0) |
Não |
|
App desktop |
Apenas macOS |
Terminal, extensões de IDE, navegador |
Como Codex e Claude Code executam tarefas de forma diferente
A maior diferença é onde o código roda.
Como vimos acima, o Codex executa tarefas em containers na nuvem gerenciados pela OpenAI, enquanto o Claude Code roda diretamente no seu terminal usando seus arquivos e ambiente reais. Ao usar o Codex, sua máquina local não é utilizada. Ao usar o Claude Code, por padrão nada sai da sua máquina.
Autônomo vs. interativo: como cada ferramenta funciona
O Codex foi feito para delegação. Você descreve a tarefa, ele trabalha em segundo plano (normalmente concluindo em alguns minutos até meia hora) e você revisa o resultado. Envie a tarefa, faça outra coisa e volte quando estiver pronto.
O Claude Code foi feito para colaboração. Como já mencionado, ele mostra o que pretende fazer e pede sua aprovação a cada etapa. Esse vai e vem pega erros cedo em tarefas complexas, mas exige foco durante toda a sessão. Em tarefas simples pode parecer lento; já em mudanças estruturais grandes com muitas dependências, tende a evitar problemas que uma ferramenta sem supervisão poderia agravar.
Consciência de contexto e entendimento da base de código
O Codex usa AGENTS.md para contexto salvo do projeto e carrega todo o repositório no container em nuvem a cada tarefa. Sua janela de contexto lida com sessões longas com uma abordagem baseada em diff, que mantém o modelo focado no que é relevante agora em vez de comprimir o histórico.
O Claude Code usa busca integrada para navegar sua base de código sem você apontar arquivos específicos. Ele lê o CLAUDE.md para instruções salvas. A janela de contexto padrão cobre projetos grandes, e uma janela muito maior está em pesquisa para o Opus 4.6, dando vantagem em bases de código enormes e sessões longas.
Configuração e personalização (AGENTS.md vs. CLAUDE.md)
Essa diferença gera atrito prático para times que usam ambas as ferramentas. O Codex lê o AGENTS.md, o padrão aberto usado por muitos projetos open source e suportado por ferramentas como Cursor e Aider. Se seu time já escreveu essa configuração, o Codex a herda.
O Claude Code usa CLAUDE.md, que permite um setup mais detalhado, incluindo configurações em camadas, políticas, hooks antes/depois de ações e integração com MCP. Porém, só funciona nas ferramentas da Anthropic e nada mais lê esse arquivo. Times que usam ambas precisam manter dois arquivos de configuração.
Comparativo de performance: Codex vs. Claude Code
Agora vamos ao que os números dizem de fato, e onde eles devem ou não ser levados ao pé da letra.
Panorama e limitações dos benchmarks
Antes de mergulhar nos números, um aviso rápido: a OpenAI afirmou no início de 2026 que o SWE-bench Verified está cada vez menos confiável como benchmark por risco de contaminação, e recomendou o SWE-bench Pro como opção mais segura. No topo do ranking, as diferenças entre os modelos líderes são pequenas, e a forma de executar a ferramenta pesa tanto quanto o próprio modelo. Trate os números abaixo como um guia geral, não como veredicto final.
|
Benchmark |
GPT-5.3-Codex |
Claude Opus 4.6 |
|
SWE-bench Verified |
~80% |
~79% (com Thinking) |
|
SWE-bench Pro |
~57% |
~57–59% (WarpGrep v2) |
|
Terminal-Bench 2.0 |
~77% |
~65% |
|
OSWorld-Verified |
inferior |
superior |
Os padrões do SWE-bench e do Terminal-Bench citados na introdução se mantêm quando você olha os números. O que a tabela acrescenta é o OSWorld-Verified: o Claude Opus 4.6 lidera lá, refletindo seu desempenho mais forte em tarefas que envolvem navegar interfaces e cenários mais amplos de uso de computador. Ou seja, nenhuma das ferramentas domina os três benchmarks.

Comparação de benchmarks em 2026 para Codex e Claude Code em SWE‑bench, Terminal‑Bench e OSWorld‑Verified. Imagem do autor.
Qualidade de geração de código
Em tarefas equivalentes, Claude Code e Codex produzem saídas que refletem como foram concebidos. O Claude Code gera resultados mais completos e bem documentados, priorizando legibilidade e aderência à estrutura original. O Codex gera implementações mais curtas, funcionais e com menos explicação.
Na mesma tarefa de clonar um frontend do comparativo da Composio, o Claude Code preservou com mais precisão o layout original. O Codex produziu um resultado funcional, visualmente diferente, mas usando bem menos tokens. Em uma tarefa de job scheduler, o Claude Code escreveu documentação abrangente junto com o código, enquanto o Codex entregou uma implementação funcional com comentários mínimos. Nenhum está errado; eles otimizam para resultados diferentes.
Velocidade e eficiência de tokens
O Codex usa substancialmente menos tokens por tarefa do que o Claude Code para trabalhos equivalentes. Essa diferença foi documentada em várias comparações independentes. O motivo vem do modo de operação do Claude Code: ele explica os passos enquanto avança, o que melhora a precisão em tarefas complexas, mas consome muito mais do limite de tokens.
Em uma comparação documentada, o Claude consumiu 6,2 milhões de tokens em uma tarefa ao estilo Figma versus 1,5 milhão do Codex, cerca de 4x a diferença para uma saída funcionalmente semelhante. Essa lacuna de eficiência impacta diretamente o preço, como detalho na seção de preços abaixo.
Codex vs. Claude Code: casos de uso e fluxos de trabalho
Entender como cada ferramenta é construída facilita enxergar onde cada uma se encaixa na prática.

Arquitetura de execução: Codex versus Claude Code. Imagem do autor.
Melhor para prototipagem rápida
O Codex costuma levar vantagem aqui. Sua execução em segundo plano e o uso eficiente de tokens o tornam uma boa opção para criar um protótipo funcional rapidamente. Como tarefas de prototipagem tendem a ser autônomas e não exigem profundo conhecimento de dependências locais, o isolamento em nuvem funciona bem. Você descreve os requisitos, o Codex constrói algo executável em segundo plano e você revisa quando estiver pronto.
O Claude Code costuma ser melhor quando o protótipo precisa seguir convenções locais específicas ou integrar com ferramentas já rodando na sua máquina, pois consegue inspecionar seu ambiente diretamente.
Melhor para grandes bases de código
A janela de contexto maior em pesquisa e a capacidade de manter sua base completa em memória tornam o Claude Code a escolha mais forte para navegar repositórios grandes. Quando uma mudança se propaga por muitos arquivos, os Agent Teams coordenam as edições acompanhando o grafo de dependências.
O Codex é competitivo em bases grandes quando a tarefa é bem definida. Ele introduziu compactação de contexto que permite trabalhar de forma autônoma por longos períodos em tarefas complexas. O Codex brilha quando o escopo é claro e você quer delegar sem supervisão.
Melhor para refatorações complexas
Para refatorações entre múltiplos arquivos, em que uma mudança impacta muitas outras, os Agent Teams do Claude Code estão entre as opções mais fortes hoje. A lista de tarefas compartilhada evita que agentes percam o fio das alterações entre arquivos interdependentes. O Claude Opus 4.6 tem sido muito elogiado por desenvolvedores em bases legadas com dependências intrincadas.
O Codex é competitivo quando a refatoração pode ser isolada. Sua força no Terminal-Bench também ajuda a capturar erros lógicos e casos de borda na etapa de revisão. Um fluxo comum em discussões de devs: usar o Claude Code para gerar o código refatorado e, depois, rodar o Codex como revisor antes do merge.
Melhor para integração com CI/CD
O Codex tem vantagem em integrações nativas. Desenvolvedores podem marcar @Codex direto em um pull request ou issue no GitHub para disparar revisões automáticas ou patches. As revisões contam no limite da assinatura e não exigem configuração extra de pipeline. Como tudo roda na nuvem, nada executa na sua infraestrutura.
O Claude Code integra via anthropics/claude-code-action@v1 no GitHub Actions. Marcar @claude em um PR ou issue dispara o workflow. O Claude Code também suporta AWS Bedrock e Google Vertex AI como backends de inferência para times que precisam de nuvens corporativas. Ambas as ferramentas suportam integração com GitLab CI/CD, que está em desenvolvimento ativo nas duas plataformas.

Fluxos de integração CI/CD do Codex e do Claude Code. Imagem do autor.
Preços e custos: Codex vs. Claude Code
Os preços nessa área mudam com frequência. Confira as páginas oficiais antes de decidir o orçamento. Os números abaixo refletem o início de 2026.

Camadas oficiais de preço para Codex e Claude Code no início de 2026. Imagem do autor.
A experiência no plano de entrada difere na prática, mesmo com valores parecidos. O plano Plus do Codex costuma ser generoso o suficiente para a maioria dos devs no dia a dia. O Claude Pro custa US$ 20/mês no mensal ou US$ 17/mês no anual. Em uso intenso, os limites podem estourar rapidamente, e muitos desenvolvedores acham o plano Max mais adequado para trabalho contínuo. Isso é consequência direta do raciocínio do Claude Code, que é intensivo em tokens.
No uso de API, o custo efetivo depende de quantos tokens cada ferramenta consome por tarefa, não só da tarifa por token. Como o Codex tende a usar menos tokens por tarefa, a diferença prática de custo pode ser maior do que as tabelas sugerem. Times que usam muito o Claude Code via API tipicamente usam o Sonnet 4.6 para execução e reservam o Opus 4.6 para planejamento e decisões de arquitetura, equilibrando qualidade e custo melhor do que rodar o Opus para tudo.
Prós e contras de Codex vs. Claude Code
Ambas as ferramentas têm pontos fortes reais, mas também trade-offs claros dependendo do seu modo de trabalho. Eis o que vale saber antes de escolher.
Vantagens do Codex
- Execução de tarefas em segundo plano: envie a tarefa, faça outra coisa e volte para o resultado
- Forte eficiência de tokens por tarefa em relação ao Claude Code
- Limites de uso generosos no plano de entrada
- Desempenho superior em benchmarks de debugging via terminal (Terminal-Bench 2.0)
- Code review nativo com integração direta ao GitHub
- Execução em sandbox na nuvem: nada toca sua máquina local
Limitações do Codex
- Tarefas em nuvem não são instantâneas: levam de minutos a meia hora
- App desktop disponível apenas para macOS no início de 2026 (Windows planejado)
- Capacidade multiagente ainda experimental
- Precisa de prompts claros e específicos para resultados confiáveis
Vantagens do Claude Code
- Modelo de pair programming interativo: o desenvolvedor mantém o controle o tempo todo
- Janela de contexto estendida em pesquisa para o Opus 4.6 lida com bases de código enormes
- Agent Teams (prévia de pesquisa) permite vários agentes em paralelo com lista de tarefas compartilhada
- Execução local por padrão: o código fica na sua máquina
- Ampla personalização via
CLAUDE.md, hooks, integrações MCP e comandos com slash - Suporte multiplataforma: macOS, Linux e Windows
- Edição forte entre múltiplos arquivos e raciocínio em nível de projeto
Limitações do Claude Code
- Usa significativamente mais tokens por tarefa que o Codex, o que faz o plano Pro de US$ 20/mês estourar rápido em uso intenso
- Não lê
AGENTS.md: times que usam várias ferramentas precisam manter dois configs - Sem plano gratuito
Qual é melhor: Codex ou Claude Code?
Depois de usar ambas, não há uma resposta única. O que importa é como você trabalha, não quem marca mais pontos.
Escolha o Codex se você:
- Quer delegar tarefas e revisar resultados no seu tempo
- Trabalha principalmente com automações de CI/CD e pipelines de code review
- Precisa de alta capacidade de uso no plano de US$ 20/mês
- Está criando protótipos rápidos ou rodando debugging pesado no terminal
Escolha o Claude Code se você:
- Trabalha em bases grandes e complexas que exigem contexto profundo
- Prefere trabalhar lado a lado com a ferramenta em vez de delegar totalmente
- Precisa de execução local por padrão por motivos de privacidade ou compliance
- Faz planejamento estrutural, refatorações complexas ou trabalho multiagente paralelo
- Quer personalização extensa com hooks, integrações MCP e comandos com slash
Use ambos quando você:
- Quer a profundidade do Claude para planejamento e a eficiência do Codex na execução
- Pode orçar ambos no nível de assinatura ou API
Um padrão recorrente é usar o Claude Code para planejamento e decisões estruturais, passar as tarefas de execução bem definidas para o Codex e, por fim, usar a revisão do Codex como checagem final antes do merge.
Conclusão
Codex e Claude Code representam duas abordagens distintas para desenvolvimento assistido por IA. O Codex é feito para quem quer delegar e revisar resultados. O Claude Code é feito para quem quer enfrentar problemas complexos em conjunto com a ferramenta.
À medida que os benchmarks convergem e as duas evoluem rapidamente, as diferenças que mais importam são práticas: ambiente de execução, estilo de interação, gestão de contexto e custo em escala. A melhor escolha é a que combina com seu jeito de trabalhar, não a que tem a maior pontuação no benchmark.
Para colocar a mão na massa, confira nosso tutorial do OpenAI Codex CLI para uma introdução prática ao Codex no seu terminal. Para o Claude Code, nosso Guia do Claude Code mostra a configuração e um exemplo real do zero. Se você quer explorar o ecossistema mais amplo de codificação com IA, nosso curso Working with the OpenAI API é uma base sólida para avançar.
Sou engenheiro de dados e criador de comunidades que trabalha com pipelines de dados, nuvem e ferramentas de IA, além de escrever tutoriais práticos e de alto impacto para o DataCamp e desenvolvedores iniciantes.
FAQs
O Codex atual é o mesmo de 2021?
Nada disso. A versão de 2021 era um modelo de autocompletar código que alimentou o início do GitHub Copilot, e a OpenAI a desligou em março de 2023. O Codex atual é um agente de engenharia completo: você define um objetivo, ele descobre os passos, roda o código e volta com um pull request. Mesmo nome, produto totalmente diferente.
Posso usar as duas ferramentas no mesmo projeto?
Sim, e muitos desenvolvedores fazem isso. Um setup comum é: Claude Code para planejamento e mudanças difíceis entre vários arquivos, Codex para execução e, depois, a revisão do Codex como checagem final antes do merge. O principal atrito é manter dois arquivos de config, AGENTS.md para o Codex e CLAUDE.md para o Claude Code, já que um não lê o do outro.
Qual vale mais a pena no plano de US$ 20/mês?
Codex, se você pretende usar intensamente. O plano Pro do Claude Code pode esgotar em poucos dias de trabalho pesado porque ele explica cada passo, o que consome tokens rapidamente. O Codex é mais eficiente por tarefa, então o plano de US$ 20 costuma durar o mês inteiro. Para uso intenso do Claude Code, o plano Max geralmente é mais adequado.
O Claude Code faz upload do meu código para algum lugar?
Seu código fica na sua máquina. O Claude Code envia apenas a conversa para a API da Anthropic, não seus arquivos. O Codex é diferente: a versão em nuvem clona seu repositório em um container gerenciado pela OpenAI para rodar a tarefa. Se sua empresa tem regras rígidas sobre onde o código pode ir, o Claude Code é a escolha mais segura por padrão.
Elas funcionam com minha linguagem de programação?
Quase certamente sim. As duas ferramentas funcionam com qualquer comando e compilador disponíveis no ambiente, sem se limitar a linguagens específicas. A pergunta mais relevante é se suas ferramentas de build estão disponíveis. No Codex, seu script de setup roda primeiro para instalar dependências. No Claude Code, ele usa o que já está instalado na sua máquina.


