Categoria
Tecnologie
Articoli sui LLM
Resta aggiornato sulle tecniche, sugli strumenti e sulla ricerca più recenti sui Large Language Models. Nel nostro blog parliamo di data science, casi d’uso e pratiche di IA responsabile.
Altre tecnologie:
Vuoi formare 2 o più persone?Prova DataCamp for Business
Claude Fable 5 vs GPT-5.5: benchmark, prezzi e come scegliere
Claude Fable 5 è in testa sui benchmark di capacità pura, ma GPT-5.5 vince per accesso, prezzi e meno interruzioni dai classificatori. Ecco come scegliere.
Tom Farnschläder
10 giugno 2026
Claude Opus 4.8 vs Gemini 3.5 Flash: benchmark e casi d’uso a confronto
Confronta Claude Opus 4.8 e Gemini 3.5 Flash su MCP Atlas, SWE-bench Pro e GDPval, oltre a prezzi e velocità, per trovare il modello giusto per il tuo lavoro.
Derrick Mwiti
9 giugno 2026
Claude Opus 4.8 vs GPT-5.5: benchmark, test e quale scegliere
Un confronto diretto tra Claude Opus 4.8 di Anthropic e GPT-5.5 di OpenAI in ambito coding, reasoning, attività agentiche e prezzi.
Tom Farnschläder
1 giugno 2026
Codex vs Cursor: delegare o collaborare?
Codex esegue agenti "imposta e dimentica" in sandbox cloud; Cursor ti dà controllo in tempo reale in un IDE basato su VS Code. Confronta agenti, modelli, prezzi e workflow.
Srujana Maddula
1 giugno 2026
Gemini 3.5 Flash vs GPT-5.5: il coltellino svizzero e il maglio
Un modello è pensato per chiamare tool in modo versatile su larga scala; l’altro forza i problemi di ragionamento più difficili. Confronta Gemini 3.5 Flash di Google e GPT-5.5 di OpenAI su coding, workflow agentici, compiti multimodali e prezzi.
Tom Farnschläder
26 maggio 2026
Gemini 3.5 Flash vs Claude Opus 4.7: lo sprinter e il chirurgo
Il modello Flash ottimizzato per la velocità di Google sfida l’ammiraglia di Anthropic per il deep coding su workflow agentici, ragionamento, compiti multimodali e prezzi.
Tom Farnschläder
25 maggio 2026
Composer 2.5: benchmark, prezzi e confronti
L’ultimo modello proprietario di Cursor, Composer 2.5, aggiunge feedback RL mirati, più task sintetici di training e prezzi per token inferiori rispetto ai modelli di frontiera.
Khalid Abdelaty
22 maggio 2026
Modelli di interazione: cosa fa bene TML-Interaction-Small
Il Thinking Machines Lab di Mira Murati ha costruito un modello che ascolta e parla allo stesso tempo. Analizziamo le funzionalità e lo confrontiamo con GPT-Realtime-2.
Tom Farnschläder
13 maggio 2026
Roadmap per imparare l’AI 2026: le migliori risorse per principianti
Una roadmap strutturata per imparare l’AI da zero, con i migliori corsi e risorse: dalle basi di Python ai LLM e all’AI agentica.
Matt Crabtree
13 maggio 2026
SubQ AI spiegato: quanto è valido l’LLM con finestra di contesto da 12M?
Il modello SubQ di Subquadratic dichiara una finestra da 12M token, efficienza 52× e prestazioni da frontier. Ecco come funziona l’architettura SSA e cosa dicono davvero i benchmark.
Srujana Maddula
12 maggio 2026
Claude Sonnet 4.5: test, funzionalità, accesso, benchmark e altro ancora
Scopri Claude Sonnet 4.5, il “miglior modello di coding al mondo”. Esplora nuove funzionalità, casi d’uso, benchmark e risultati dei test, oltre a uno sguardo al Claude Agents SDK e a Claude Imagine.
Matt Crabtree
12 maggio 2026
GPT-5.5 vs Gemini 3.1 Pro: quale modello frontier dovresti usare?
Confronta GPT-5.5 di OpenAI e Gemini 3.1 Pro di Google su coding, reasoning, benchmark agentici, prezzi e limiti di contesto per aiutarti a scegliere il modello giusto.
Derrick Mwiti
11 maggio 2026