Vai al contenuto principale
Categoria
Tecnologie

Articoli sui LLM

Resta aggiornato sulle tecniche, sugli strumenti e sulla ricerca più recenti sui Large Language Models. Nel nostro blog parliamo di data science, casi d’uso e pratiche di IA responsabile.
Altre tecnologie:
GroupVuoi formare 2 o più persone?Prova DataCamp for Business

Claude Fable 5 vs GPT-5.5: benchmark, prezzi e come scegliere

Claude Fable 5 è in testa sui benchmark di capacità pura, ma GPT-5.5 vince per accesso, prezzi e meno interruzioni dai classificatori. Ecco come scegliere.
Tom Farnschläder's photo

Tom Farnschläder

10 giugno 2026

Claude Opus 4.8 vs Gemini 3.5 Flash: benchmark e casi d’uso a confronto

Confronta Claude Opus 4.8 e Gemini 3.5 Flash su MCP Atlas, SWE-bench Pro e GDPval, oltre a prezzi e velocità, per trovare il modello giusto per il tuo lavoro.
Derrick Mwiti's photo

Derrick Mwiti

9 giugno 2026

Claude Opus 4.8 vs GPT-5.5: benchmark, test e quale scegliere

Un confronto diretto tra Claude Opus 4.8 di Anthropic e GPT-5.5 di OpenAI in ambito coding, reasoning, attività agentiche e prezzi.
Tom Farnschläder's photo

Tom Farnschläder

1 giugno 2026

Codex vs Cursor: delegare o collaborare?

Codex esegue agenti "imposta e dimentica" in sandbox cloud; Cursor ti dà controllo in tempo reale in un IDE basato su VS Code. Confronta agenti, modelli, prezzi e workflow.
Srujana Maddula's photo

Srujana Maddula

1 giugno 2026

Gemini 3.5 Flash vs GPT-5.5: il coltellino svizzero e il maglio

Un modello è pensato per chiamare tool in modo versatile su larga scala; l’altro forza i problemi di ragionamento più difficili. Confronta Gemini 3.5 Flash di Google e GPT-5.5 di OpenAI su coding, workflow agentici, compiti multimodali e prezzi.
Tom Farnschläder's photo

Tom Farnschläder

26 maggio 2026

Gemini 3.5 Flash vs Claude Opus 4.7: lo sprinter e il chirurgo

Il modello Flash ottimizzato per la velocità di Google sfida l’ammiraglia di Anthropic per il deep coding su workflow agentici, ragionamento, compiti multimodali e prezzi.
Tom Farnschläder's photo

Tom Farnschläder

25 maggio 2026

Composer 2.5: benchmark, prezzi e confronti

L’ultimo modello proprietario di Cursor, Composer 2.5, aggiunge feedback RL mirati, più task sintetici di training e prezzi per token inferiori rispetto ai modelli di frontiera.
Khalid Abdelaty's photo

Khalid Abdelaty

22 maggio 2026

Modelli di interazione: cosa fa bene TML-Interaction-Small

Il Thinking Machines Lab di Mira Murati ha costruito un modello che ascolta e parla allo stesso tempo. Analizziamo le funzionalità e lo confrontiamo con GPT-Realtime-2.
Tom Farnschläder's photo

Tom Farnschläder

13 maggio 2026

Roadmap per imparare l’AI 2026: le migliori risorse per principianti

Una roadmap strutturata per imparare l’AI da zero, con i migliori corsi e risorse: dalle basi di Python ai LLM e all’AI agentica.
Matt Crabtree's photo

Matt Crabtree

13 maggio 2026

SubQ AI spiegato: quanto è valido l’LLM con finestra di contesto da 12M?

Il modello SubQ di Subquadratic dichiara una finestra da 12M token, efficienza 52× e prestazioni da frontier. Ecco come funziona l’architettura SSA e cosa dicono davvero i benchmark.
Srujana Maddula's photo

Srujana Maddula

12 maggio 2026

Claude Sonnet 4.5: test, funzionalità, accesso, benchmark e altro ancora

Scopri Claude Sonnet 4.5, il “miglior modello di coding al mondo”. Esplora nuove funzionalità, casi d’uso, benchmark e risultati dei test, oltre a uno sguardo al Claude Agents SDK e a Claude Imagine.
Matt Crabtree's photo

Matt Crabtree

12 maggio 2026

GPT-5.5 vs Gemini 3.1 Pro: quale modello frontier dovresti usare?

Confronta GPT-5.5 di OpenAI e Gemini 3.1 Pro di Google su coding, reasoning, benchmark agentici, prezzi e limiti di contesto per aiutarti a scegliere il modello giusto.
Derrick Mwiti's photo

Derrick Mwiti

11 maggio 2026