Programma
Gli strumenti di coding con AI si sono mossi rapidamente all’inizio del 2026. OpenAI ha rilasciato GPT-5.3-Codex a febbraio, dichiarando risultati all’avanguardia su SWE-bench Pro e un miglioramento di velocità del 25% rispetto al predecessore.
Nello stesso periodo, Anthropic ha pubblicato Claude Opus 4.6 e Claude Sonnet 4.6, introducendo in beta una finestra di contesto da 1 milione di token e una nuova funzione multi‑agent chiamata Agent Teams. In più, diverse indiscrezioni indicano un modello interno GPT‑5.4 con una finestra di contesto presunta da 2 milioni di token, che spingerebbe la corsa al contesto ben oltre quanto entrambi gli strumenti mostrano pubblicamente oggi.
Per la prima volta, entrambi gli strumenti girano su modelli rilasciati a poche settimane di distanza, rendendo il confronto diretto più significativo che in passato. Su SWE-bench Pro, i due strumenti si collocano in un intervallo molto simile. Su Terminal-Bench 2.0, Codex mostra un vantaggio evidente su Claude Code nei task in stile terminale. Il divario non è dove potresti aspettartelo.
Che cos’è OpenAI Codex?
Se hai già sentito il nome "Codex", vale la pena chiarire subito: lo strumento attuale condivide solo il nome con il suo predecessore del 2021. L’originale Codex era un modello GPT-3 fine-tuned che alimentava le prime versioni di GitHub Copilot come servizio di completamento del codice. È stato dismesso a marzo 2023. Se quel modello rispondeva ai prompt con completamenti, lo strumento attuale riceve descrizioni di obiettivi e ci lavora in autonomia.
Il Codex del 2025 è un vero strumento di ingegneria software che lavora da solo. È stato lanciato a maggio 2025, è arrivato alla disponibilità generale a ottobre 2025 e, all’inizio del 2026, è alimentato da GPT-5.3-Codex. Non completa singole righe. Pianifica ed esegue task completi: sviluppa funzionalità, corregge bug, esegue test, propone pull request e fa code review.
Primi passi con Codex
Codex opera su quattro superfici: un agente web cloud su chatgpt.com/codex, una CLI open-source scritta in Rust e TypeScript, estensioni IDE per VS Code e Cursor, e un’app desktop per macOS lanciata a febbraio 2026. Si integra anche con GitHub, Slack e Linear.
# Install the Codex CLI
npm install -g @openai/codex
# Run in interactive mode
codex "refactor the auth module to use async/await"
# Run in full auto mode
codex --full-auto "write tests for all API endpoints"
Quando invii un task all’agente cloud, Codex fornisce un container isolato con il tuo repository pre-caricato. Il runtime ha due fasi. Durante la fase di setup, il container ha accesso alla rete per installare le dipendenze. Quando inizia la fase dell’agente, la rete è disabilitata per impostazione predefinita. Questo evita che qualunque codice generato dall’agente raggiunga servizi esterni o scarichi pacchetti indesiderati. L’agente porta a termine il task e restituisce una pull request o un diff da rivedere.

Workspace cloud di Codex che esegue task. Immagine dell’autore.
La CLI di Codex offre tre livelli di coinvolgimento dell’utente. In modalità Suggest, l’agente legge i tuoi file e propone modifiche, ma non apporta nulla senza la tua conferma. La modalità Auto Edit consente all’agente di scrivere file automaticamente, chiedendo comunque il permesso prima di eseguire comandi shell. La modalità Full Auto esegue l’intero ciclo senza interruzioni, limitandosi alla directory corrente.
La configurazione è gestita tramite file AGENTS.md, uno standard aperto supportato da decine di migliaia di progetti open-source e adottato da altri strumenti come Cursor e Aider. Se il tuo team già usa questi strumenti, Codex legge direttamente quella configurazione esistente.
Che cos’è Claude Code?
Claude Code è l’assistente di coding di Anthropic pensato per il terminale. È stato lanciato come anteprima di ricerca limitata a febbraio 2025 ed è arrivato alla disponibilità generale a maggio 2025. È alimentato da Claude Opus 4.6 e Claude Sonnet 4.6, entrambi rilasciati all’inizio del 2026.
La cosa più importante da capire su Claude Code è dove gira. Il tuo codice resta sulla tua macchina. Claude Code legge il filesystem locale, esegue comandi nel tuo terminale reale, usa la tua configurazione git locale e chiama l’API di Anthropic solo per l’elaborazione. Niente viene inviato a un container cloud.
Primi passi con Claude Code
Claude Code funziona tramite il terminale e supporta anche VS Code, le IDE JetBrains (attualmente in beta) e i fork di VS Code come Cursor e Windsurf. Esiste anche un’interfaccia via browser su claude.ai/code. L’installazione è semplice su macOS, Linux e Windows:
# macOS and Linux
curl -fsSL https://claude.ai/install.sh | bash
Per Windows è disponibile un programma di installazione PowerShell nella pagina di download ufficiale. Sono supportati anche Homebrew e WinGet. Il percorso di installazione tramite npm è stato deprecato.
Una volta installato, interagisci con Claude Code in linguaggio naturale direttamente dal terminale:
# Start a session
claude
# Continue the most recent session
claude -c
# Pipe input directly from another tool
tail -f app.log | claude -p "alert me if you see anomalies"
Un file CLAUDE.md posizionato nella root del progetto fornisce a Claude Code un contesto salvato: convenzioni di codice, note di architettura e tutto ciò che dovrebbe sapere prima di toccare il tuo codice.
Per impostazione predefinita, Claude Code chiede la tua approvazione prima di apportare modifiche. Prima di eseguire comandi shell, scrivere file o effettuare commit, ti mostra esattamente cosa intende fare e attende la tua conferma. Questo ti mantiene al comando, ma significa anche che devi restare attivo durante l’intera sessione.

Claude Code in una sessione terminale locale. Immagine dell’autore.
Agent Teams e workflow multi‑agent
Una delle aggiunte più importanti insieme a Claude Opus 4.6 è Agent Teams, attualmente in anteprima di ricerca. Permette a più sessioni di Claude Code di lavorare in parallelo su un progetto condiviso, coordinate da una sessione principale.
A differenza degli agenti paralleli di Codex che girano indipendentemente, le Agent Teams di Claude Code condividono una lista di task e comunicano tra loro. Il leader assegna i sotto-task e tiene traccia di ciò che ciascun agente modifica. Per esempio, durante la migrazione di una grande codebase React, il leader può assegnare a un agente la mappatura delle dipendenze, a un altro la scrittura delle sostituzioni e a un terzo l’esecuzione dei test, tutti aggiornando la stessa lista di task in tempo reale. Questo evita che gli agenti deraglino durante modifiche complesse e multi‑file.
Differenze chiave tra Codex e Claude Code

Codex vs Claude Code in sintesi
Ora che sai come funziona ciascuno strumento, vediamo le differenze pratiche più importanti.
|
Funzionalità |
OpenAI Codex |
Claude Code |
|
Modello principale |
GPT-5.3-Codex |
Claude Opus 4.6 / Sonnet 4.6 |
|
Ambiente di esecuzione |
Sandbox cloud + CLI locale |
Terminale locale (macchina dell’utente) |
|
Stile di interazione |
Autonomo, task in background |
Interattivo, developer-in-the-loop |
|
Finestra di contesto |
400K (input + output) |
200K standard / 1M beta |
|
Supporto multi‑agent |
Agenti sandbox cloud in parallelo |
Agent Teams (anteprima di ricerca) |
|
File di configurazione |
|
|
|
Efficienza dei token |
Efficienza più alta per task |
Più token usati per task |
|
Punto di ingresso prezzo |
ChatGPT Plus: $20/mese |
Claude Pro: $20/mese |
|
CLI open-source |
Sì (Apache 2.0) |
No |
|
App desktop |
Solo macOS |
Terminale, estensioni IDE, browser |
Come Codex e Claude Code eseguono i task in modo diverso
La differenza più grande è dove gira il codice.
Come visto sopra, Codex esegue i task in container cloud gestiti da OpenAI, mentre Claude Code gira direttamente nel tuo terminale usando i tuoi file e il tuo ambiente. La tua macchina locale non è coinvolta quando usi Codex. Di default, con Claude Code nulla lascia la tua macchina.
Autonomo vs interattivo: come lavora ciascuno strumento
Codex è pensato per la delega. Descrivi il task, lui ci lavora in background (in genere da pochi minuti a mezz’ora) e tu ne rivedi il risultato. Invia il task, passa ad altro, torna quando ha finito.
Claude Code è pensato per la collaborazione. Come detto, ti mostra cosa intende fare e chiede l’approvazione a ogni passaggio. Questo ping‑pong intercetta presto gli errori nei task complessi, ma richiede che tu resti concentrato per tutta la sessione. Sui task semplici può sembrare lento, ma su grandi modifiche strutturali con molte dipendenze tende a cogliere problemi che uno strumento non supervisionato peggiorerebbe.
Consapevolezza del contesto e comprensione della codebase
Codex usa AGENTS.md per il contesto del progetto e carica l’intero repository nel container cloud per ciascun task. La sua finestra di contesto gestisce sessioni lunghe con un approccio basato sui diff che mantiene il modello focalizzato su ciò che è rilevante al momento invece di comprimere la cronologia.
Claude Code usa una ricerca integrata per navigare nella codebase senza che tu indichi file specifici. Legge CLAUDE.md per le istruzioni salvate. La finestra di contesto standard copre progetti grandi e una finestra molto più ampia è in anteprima di ricerca per Opus 4.6, dandogli un vantaggio su codebase molto estese e sessioni lunghe.
Configurazione e personalizzazione (AGENTS.md vs CLAUDE.md)
Questa differenza crea attrito pratico per i team che usano entrambi gli strumenti. Codex legge AGENTS.md, lo standard aperto usato da molti progetti open-source e supportato da strumenti come Cursor e Aider. Se il tuo team ha già scritto questa configurazione, Codex la eredita.
Claude Code usa CLAUDE.md, che supporta un setup più dettagliato con impostazioni stratificate, enforcement di policy, hook pre/post azione e integrazione MCP. Tuttavia funziona solo all’interno degli strumenti Anthropic e nient’altro lo legge. I team che usano entrambi devono mantenere due file di configurazione separati.
Confronto delle prestazioni tra Codex e Claude Code
Vediamo ora cosa dicono i numeri e dove vanno presi con le pinze.
Panorama dei benchmark e limitazioni
Prima di entrare nei numeri, una nota veloce: OpenAI ha dichiarato all’inizio del 2026 che SWE-bench Verified è sempre meno affidabile come benchmark per problemi di contaminazione, e ha raccomandato SWE-bench Pro come opzione più attendibile. Al livello più alto, i divari di punteggio tra i modelli leader sono ridotti, e il setup usato per eseguire lo strumento conta quanto il modello stesso. Considera le cifre qui sotto come una guida generale, non una sentenza definitiva.
|
Benchmark |
GPT-5.3-Codex |
Claude Opus 4.6 |
|
SWE-bench Verified |
~80% |
~79% (con Thinking) |
|
SWE-bench Pro |
~57% |
~57–59% (WarpGrep v2) |
|
Terminal-Bench 2.0 |
~77% |
~65% |
|
OSWorld-Verified |
inferiore |
superiore |
Gli andamenti di SWE-bench e Terminal-Bench citati nell’introduzione si confermano guardando i numeri. La tabella aggiunge OSWorld-Verified: Claude Opus 4.6 è in testa lì, a riflesso delle sue prestazioni più forti in task che implicano la navigazione di interfacce e scenari d’uso del computer più ampi. Quindi nessuno dei due domina in tutti e tre i benchmark.

Confronto benchmark 2026 per Codex e Claude Code su SWE‑bench, Terminal‑Bench e OSWorld‑Verified. Immagine dell’autore.
Qualità della generazione di codice
In task equivalenti, Claude Code e Codex producono output coerenti con il loro design. Claude Code genera output più completi e ben documentati, che privilegiano la leggibilità e l’aderenza alla struttura originale. Codex genera implementazioni più brevi e funzionanti con meno spiegazioni.
Sullo stesso task di clonazione frontend dal confronto Composio, Claude Code ha preservato il layout originale con maggiore precisione. Codex ha prodotto un risultato funzionante ma visivamente diverso, usando però molti meno token. Su un task di job scheduler, Claude Code ha scritto documentazione esaustiva insieme al codice, mentre Codex ha fornito un’implementazione funzionante con commenti minimi. Nessuno dei due è “sbagliato”; ottimizzano per esiti diversi.
Velocità ed efficienza dei token
Codex utilizza sensibilmente meno token per task rispetto a Claude Code per lavori equivalenti. Questo divario è stato documentato in più confronti indipendenti. La differenza nasce dal modo in cui lavora Claude Code: spiega i passaggi mentre procede, il che migliora l’accuratezza nei task complessi ma consuma molta più capacità di token.
In un confronto documentato, Claude ha consumato 6,2 milioni di token su un task in stile Figma contro 1,5 milioni di Codex, circa 4 volte di più per un output funzionalmente simile. Questo divario di efficienza ha implicazioni dirette sui prezzi, che tratto nella sezione successiva.
Codex vs Claude Code: casi d’uso e workflow
Capire come è costruito ciascun strumento aiuta a vedere dove si inserisce meglio nella pratica.

Architettura di esecuzione: Codex vs Claude Code. Immagine dell’autore.
Il migliore per il rapid prototyping
Qui Codex spesso ha un vantaggio. La sua esecuzione in background e l’uso efficiente dei token lo rendono adatto a costruire rapidamente un prototipo funzionante. Poiché i task di prototipazione sono in genere autocontenuti e non richiedono una profonda conoscenza delle dipendenze locali, l’isolamento cloud funziona bene. Tu descrivi i requisiti, Codex costruisce qualcosa di eseguibile in background e tu ne rivedi il risultato quando è pronto.
Claude Code tende a essere più adatto quando il prototipo deve rispettare convenzioni locali specifiche o integrarsi con strumenti già in esecuzione sulla tua macchina, dato che può ispezionare direttamente il tuo ambiente.
Il migliore per codebase grandi
La finestra di contesto più ampia in anteprima di ricerca e la capacità di mantenere l’intera codebase in memoria rendono Claude Code la scelta più solida per navigare repository di grandi dimensioni. Quando una modifica si propaga su molti file, le Agent Teams di Claude Code possono coordinare le modifiche tenendo traccia dell’intero grafo di dipendenze.
Codex è competitivo sulle grandi codebase quando il task è ben definito. Ha introdotto una compattazione del contesto che gli consente di lavorare in autonomia per periodi prolungati su task complessi. Eccelle quando l’ambito è chiaro e vuoi delegare senza supervisione.
Il migliore per refactoring complessi
Per refactoring multi‑file in cui una modifica si ripercuote su molte altre, le Agent Teams di Claude Code sono tra le opzioni più forti oggi disponibili. La lista di task condivisa impedisce agli agenti di perdere il filo tra file interdipendenti. Claude Opus 4.6 è stato ampiamente elogiato dagli sviluppatori per le prestazioni su codebase legacy con dipendenze intricate.
Codex è competitivo per refactoring isolabili. La sua forza su Terminal-Bench lo rende anche efficace nell’intercettare errori logici e edge case in fase di review. Un workflow spesso citato: usare Claude Code per generare il refactoring, poi eseguire Codex come reviewer prima del merge.
Il migliore per l’integrazione CI/CD
Codex ha un vantaggio di integrazione nativa. Gli sviluppatori possono taggare @Codex direttamente in una pull request o issue su GitHub per attivare review o patch automatiche. Le code review rientrano nei limiti dell’abbonamento e non richiedono ulteriore configurazione della pipeline. Il modello cloud significa che nulla gira sulla tua infrastruttura.
Claude Code si integra tramite anthropics/claude-code-action@v1 in GitHub Actions. Taggare @claude in una PR o issue attiva il workflow. Claude Code supporta anche AWS Bedrock e Google Vertex AI come backend di inference per team che necessitano di infrastruttura cloud enterprise. Entrambi supportano l’integrazione con GitLab CI/CD, attualmente in sviluppo attivo su entrambe le piattaforme.

Flussi di integrazione CI/CD per Codex e Claude Code. Immagine dell’autore.
Prezzi e costi: Codex vs Claude Code
I prezzi in questo settore cambiano spesso. Verifica le tariffe aggiornate sulle pagine ufficiali prima di prendere decisioni di budget. Le cifre seguenti riflettono l’inizio del 2026.

Fasce di prezzo ufficiali per Codex e Claude Code a inizio 2026. Immagine dell’autore.
L’esperienza nel tier d’ingresso differisce nella pratica anche quando il prezzo è simile. Il tier Plus di Codex tende a essere abbastanza generoso per la maggior parte degli sviluppatori che lo usano quotidianamente. Claude Pro costa $20/mese su base mensile, o $17/mese con fatturazione annuale. In ogni caso, con uso intenso si raggiungono i limiti piuttosto in fretta e molti sviluppatori trovano il tier Max più adatto per lavoro continuativo. È una conseguenza diretta di quanto sia intensivo in token il ragionamento di Claude Code.
Per l’uso via API, il costo effettivo dipende da quanti token ciascuno strumento consuma per task, non solo dalla tariffa per token. Poiché Codex tende a usare meno token per task, la differenza pratica di costo può essere più ampia di quanto suggeriscano le tariffe elencate. I team che usano intensamente Claude Code via API in genere impiegano Sonnet 4.6 per l’esecuzione e riservano Opus 4.6 per pianificazione e ragionamento architetturale, bilanciando qualità e costo meglio che eseguire sempre Opus.
Pro e contro di Codex vs Claude Code
Entrambi gli strumenti hanno punti di forza reali, ma anche compromessi chiari in base al tuo modo di lavorare. Ecco cosa vale la pena sapere prima di scegliere.
Vantaggi di Codex
- Esecuzione di task in background: invii un task, passi ad altro, torni al risultato
- Forte efficienza di token per task rispetto a Claude Code
- Limiti d’uso generosi nel tier di abbonamento iniziale
- Prestazioni chiaramente migliori sui benchmark di debug da terminale (Terminal-Bench 2.0)
- Code review integrata con integrazione nativa GitHub
- Esecuzione in sandbox cloud: nulla tocca la tua macchina locale
Limitazioni di Codex
- I task in cloud non sono istantanei: il tempo di completamento varia da minuti a mezz’ora
- L’app desktop è solo per macOS a inizio 2026 (Windows in programma)
- Le capacità multi‑agent sono ancora sperimentali
- Richiede prompt chiari e specifici per output affidabili
Vantaggi di Claude Code
- Modello di pair programming interattivo: lo sviluppatore resta al comando
- Finestra di contesto estesa in anteprima di ricerca per Opus 4.6: gestisce codebase molto grandi
- Agent Teams (anteprima di ricerca) per far lavorare più agenti in parallelo con una lista di task condivisa
- Esecuzione locale per impostazione predefinita: il codice resta sulla tua macchina
- Ampia personalizzazione tramite
CLAUDE.md, hook, integrazioni MCP e slash command - Supporto multipiattaforma: macOS, Linux e Windows
- Forte editing multi‑file e ragionamento a livello di progetto
Limitazioni di Claude Code
- Usa molti più token per task rispetto a Codex, quindi il piano Pro da $20/mese si esaurisce rapidamente con uso intenso
- Non legge
AGENTS.md: i team che usano più strumenti devono mantenere due file di configurazione - Nessun piano gratuito
Qual è meglio: Codex o Claude Code?
Dopo aver usato entrambi, posso dirti che non esiste una risposta unica. Conta come lavori tu, non quale strumento ha il punteggio più alto.
Scegli Codex se:
- Vuoi delegare i task e rivedere i risultati quando vuoi
- Lavori soprattutto in automazioni CI/CD e pipeline di code review
- Ti serve alta capacità d’uso al tier da $20/mese
- Stai costruendo prototipi rapidi o eseguendo task di debug pesanti da terminale
Scegli Claude Code se:
- Lavori su codebase grandi e complesse che richiedono molto contesto
- Preferisci lavorare insieme allo strumento, non delegare completamente
- Hai bisogno di esecuzione locale per impostazione predefinita per motivi di privacy o compliance
- Fai pianificazione strutturale, refactoring complessi o lavoro multi‑agent in parallelo
- Vuoi ampia personalizzazione tramite hook, integrazioni MCP e slash command
Usali entrambi quando:
- Vuoi la profondità di Claude per la pianificazione e l’efficienza di Codex per l’esecuzione
- Puoi budgettare per entrambi a livello di abbonamento o API
Un pattern ricorrente nei workflow degli sviluppatori è usare Claude Code per pianificazione e decisioni strutturali, passare i task esecutivi ben definiti a Codex e poi usare la funzione di review di Codex come controllo finale prima del merge.
Conclusione
Codex e Claude Code adottano due approcci distinti allo sviluppo assistito dall’AI. Codex è pensato per chi vuole delegare i task e rivedere i risultati. Claude Code è pensato per chi vuole affrontare problemi complessi insieme allo strumento.
Man mano che i benchmark convergono e gli strumenti migliorano rapidamente, le differenze che contano di più sono pratiche: ambiente di esecuzione, stile di interazione, gestione del contesto e costo su larga scala. La scelta migliore è quella che si adatta a come lavori davvero, non quella con il punteggio più alto.
Per provare questi strumenti, dai un’occhiata al nostro tutorial sulla CLI di OpenAI Codex per un’introduzione pratica a Codex nel terminale. Per Claude Code, la nostra Guida a Claude Code accompagna l’utente nel setup e in un esempio reale da zero. Se ti interessa l’ecosistema più ampio del coding con AI, il nostro corso Working with the OpenAI API è un’ottima base su cui costruire.
Sono un data engineer e community builder: lavoro su pipeline dati, cloud e strumenti di AI, e scrivo tutorial pratici e ad alto impatto per DataCamp e per sviluppatori alle prime armi.
FAQs
L’attuale Codex è lo stesso del Codex del 2021?
Assolutamente no. La versione 2021 era un modello di completamento del codice che alimentava le prime versioni di GitHub Copilot, e OpenAI l’ha chiusa a marzo 2023. L’attuale Codex è un agente di engineering completo: gli dai un obiettivo, capisce i passi, esegue il codice e torna con una pull request. Stesso nome, prodotto completamente diverso.
Posso usare entrambi gli strumenti sullo stesso progetto?
Sì, e molti sviluppatori lo fanno. Un setup comune è: Claude Code per pianificazione e modifiche multi‑file complesse, Codex per l’esecuzione, poi la funzione di review di Codex come controllo finale prima del merge. L’attrito principale è mantenere due file di configurazione, AGENTS.md per Codex e CLAUDE.md per Claude Code, dato che nessuno dei due legge quello dell’altro.
Quale conviene al tier da $20/mese?
Codex, se prevedi di usarlo intensamente. Il piano Pro di Claude Code può esaurirsi in pochi giorni di lavoro serio perché spiega ogni passaggio, consumando token velocemente. Codex è più efficiente per task, quindi il tier da $20 tende a durare tutto il mese. Per uso intensivo di Claude Code, spesso il tier Max è più adatto.
Claude Code carica il mio codice da qualche parte?
Il tuo codice resta sulla tua macchina. Claude Code invia all’API di Anthropic solo la conversazione, non i file reali. Codex è diverso: la versione cloud clona il tuo repository in un container gestito da OpenAI per eseguire il task. Quindi, se il tuo team ha regole rigide su dove può andare il codice, Claude Code è l’impostazione predefinita più sicura.
Funzionano con il mio linguaggio di programmazione?
Quasi certamente sì. Entrambi gli strumenti funzionano con i comandi e i compilatori disponibili nell’ambiente, quindi non sono limitati a linguaggi specifici. La domanda più rilevante è se i tuoi strumenti di build sono disponibili. Per Codex, lo script di setup gira per primo per installare le dipendenze. Per Claude Code, usa semplicemente ciò che è già sulla tua macchina.


