Corso
Python è uno dei linguaggi di programmazione più importanti da imparare per diventare data scientist. Tuttavia, per padroneggiare davvero Python, imparare facendo è essenziale. È qui che entrano in gioco i progetti Python.
Realizzare progetti Python ti aiuterà a prendere fiducia nelle competenze che stai acquisendo, a creare un portfolio che ti faccia spiccare nella ricerca di lavoro e a divertirti lungo il percorso. In questo articolo, presenteremo oltre 60 idee di progetti Python per accelerare il tuo apprendimento, tra livelli di abilità e domini diversi.
Prima di iniziare con i progetti Python
Se conosci già Python, puoi metterti subito al lavoro con questi progetti. Se invece vuoi costruire le competenze di base necessarie per iniziare, dai un’occhiata all’elenco di DataCamp di oltre 140 corsi Python. Tutti i nostri corsi sono interattivi e pensati per aiutarti a superare la barriera del codice e sviluppare le tue skill in Python.
Quando sei pronto per lavorare ai progetti, scopri DataLab e inizia a lavorare e pubblicare i tuoi progetti nel taccuino dati completamente configurato di DataCamp, direttamente nel browser.
Progetti Python per principianti
All’inizio, dovresti sfruttare i progetti Python per fissare ciò che hai imparato e acquisire nuove competenze. Questo set di progetti ruota soprattutto attorno a compiti di analisi esplorativa dei dati, assieme a semplici attività di modellazione e forecasting su dataset reali pertinenti.
1. Analisi dei prezzi dei diamanti
I diamanti sono divisi in cinque tipi di impurità in base alla struttura dei loro atomi di carbonio. Il dataset Diamonds di Kaggle ti fornisce ancora più informazioni — taglio, purezza, colore e prezzo. Sviluppa le tue capacità di visualizzazione dei dati con un po’ di analisi esplorativa.
2. Analisi dell’età delle conchiglie di abalone
Questo è un dataset unico dalla zoologia. Le conchiglie di abalone sono meraviglie della natura e puoi determinarne l’età contando gli anelli all’interno. Riesci a stabilire l’età delle conchiglie di abalone con le tue skill di analisi dati in Python?
3. Analisi dei dati della Premier League
Un dataset di calcio in cui puoi esplorare, analizzare e visualizzare gli eventi della stagione 2018-2019 della Premier League inglese. Il dataset Soccer Data è un ottimo progetto Python per principianti in ambito data analysis. Con un ricco set di feature che vanno dai dettagli di base delle partite a statistiche più complesse, il dataset offre ampie opportunità per esplorazione, visualizzazione e analisi statistiche. Il progetto include un chiaro data dictionary e sfide guidate, rendendolo accessibile a chi inizia. Inoltre, propone scenari reali che non solo rendono il progetto più coinvolgente, ma fungono anche da esercizio completo da includere nel portfolio. È un progetto bilanciato che unisce apprendimento guidato ed esplorazione aperta, ideale per sviluppare competenze.

Dati da un progetto Python per principianti che analizza le tendenze nel calcio
4. Previsione del churn nel settore telecom
Il churn dei clienti è uno dei problemi fondamentali del machine learning. In questo dataset clienti, potrai prevedere il churn per un operatore telefonico in base ai dati d’uso dei loro clienti. Il dataset include una varietà di feature, come errori di chiamata, durata dell’abbonamento e valore del cliente, offrendo una base ricca per analisi approfondite. Il progetto per principianti include sfide guidate incentrate su esplorazione dati, visualizzazione e analisi statistiche, fornendo un percorso di apprendimento strutturato. Lo scenario reale aggiunge uno strato extra di complessità e rilevanza, chiedendoti di prevedere il churn in presenza di un nuovo concorrente sul mercato.
5. Analisi e previsione dei prezzi azionari
Vuoi scoprire il motivo dietro l’aumento del 100% delle azioni Tesla due anni fa? Se sì, il dataset dei titoli tech 2010–2021 è il primo posto da cui iniziare.
6. Dati di tiro NBA
A quale distanza i giocatori di basket hanno maggiori probabilità di segnare? In questo dataset di tiri NBA raccolto dai playoff 2021, potrai rispondere proprio a questa domanda.
7. Prevedi le vendite e-commerce
Usando questo dataset e-commerce di un rivenditore online, sfrutta tecniche di visualizzazione e forecasting per prevedere le vendite future. Il dataset è ricco, copre ordini da più paesi per un anno e include diverse variabili come numeri di fattura, codici prodotto, quantità e prezzi unitari. Ciò consente un’analisi su più fronti che può includere trend temporali, segmentazione clienti e categorizzazione prodotti. Le sfide proposte ti incoraggiano a esplorare anomalie come quantità d’ordine negative, visualizzare i profitti in periodi diversi e confrontare le dimensioni degli ordini tra paesi. Questi compiti non solo ti aiutano a esercitare le skill essenziali di data science, ma simulano anche domande di business reali. Lo scenario aggiunge un ulteriore livello di complessità, chiedendoti di categorizzare oltre 4000 prodotti unici in base a varie caratteristiche, un compito molto rilevante nel settore e-commerce.

Un altro progetto Python per principianti sui dati eCommerce
8. Analizza gli annunci su Airbnb
Questo è un ottimo dataset per capire le dinamiche degli annunci in affitto su Airbnb. Con analisi esplorativa e visualizzazione, potrai capire quali quartieri hanno gli annunci più popolari, il rapporto tra prezzo e tipo di stanza e altro ancora.
9. Analizza i dati del PIL
Il prodotto interno lordo è uno degli indicatori più forti della salute economica di una regione o nazione. In questo dataset, analizza come il PIL è evoluto nei paesi negli ultimi 50 anni.
10. Analisi dei dati delle Olimpiadi
Qual è il paese più vincente nel judo? In che modo l’altezza degli atleti influisce sul successo in uno sport? Con l’analisi esplorativa del dataset delle Olimpiadi, potrai rispondere a queste domande e a molte altre.

Un esempio dei risultati del progetto sulle Olimpiadi
Progetti Python intermedi
Andando oltre i compiti e i dataset per principianti, questo set di progetti Python ti metterà alla prova lavorando con set di dati non tabulari (ad es. immagini, audio) e mettendo alla prova le tue capacità di machine learning su vari problemi.
1. Classificare i generi delle canzoni dai dati audio
Sei un vero appassionato di musica? Allora ti piacerà prevedere i generi musicali con il machine learning su un dataset musicale in questo progetto di riconoscimento audio. Questo progetto intermedio in Python copre l’intera pipeline di data science, dall’esplorazione e feature engineering all’implementazione e valutazione di più algoritmi di machine learning. Il progetto affronta anche temi avanzati come la gestione di dati sbilanciati e tecniche di valutazione del modello come la cross-validation. Questo progetto multi-step, ricco di librerie, è un’ottima esperienza di apprendimento e un pezzo da portfolio per chi vuole avanzare di livello.
2. Analizzare e visualizzare i pick-up Uber a New York
I dataset con geolocalizzazioni sono sempre divertenti da analizzare e visualizzare su una mappa. Questo dataset di pick-up Uber con oltre 20 milioni di corse a New York City non fa eccezione.
3. Riconoscimento di caratteri scritti a mano
Il riconoscimento delle cifre MNIST è un ottimo punto di partenza per esercitarsi con il deep learning. Tuttavia, questo dataset aggiunge un ulteriore livello di difficoltà perché devi prevedere lettere inglesi scritte a mano.
4. Rilevamento di frodi con carta di credito
Le frodi con carta di credito sono sempre una sfida — soprattutto perché i dati presentano un forte sbilanciamento tra classi. Vedi se riesci ad aggirare il problema in questo dataset sulle frodi con carta di credito. Il progetto è adatto a utenti Python di livello intermedio-avanzato interessati ad applicazioni di data science e machine learning nei settori finance e sicurezza. Il progetto prevede un’analisi completa delle transazioni con carta di credito per identificare attività fraudolente. Copre un ampio ventaglio di competenze, dall’analisi esplorativa dei dati, inclusa la rappresentazione geospaziale, alla modellazione predittiva. Il progetto pone anche sfide reali, come la gestione di classi sbilanciate e le considerazioni etiche sui falsi positivi nel rilevamento delle frodi. Ciò lo rende un’esperienza formativa multifaccettata che non solo migliora le skill tecniche, ma incoraggia anche a riflettere criticamente sulle implicazioni dei modelli di machine learning in ambiti sensibili come la sicurezza finanziaria.

Un esempio di mappatura geospaziale da questo progetto Python intermedio
5. Previsione del genere usando il suono
In questo progetto su dati audio, userai il pacchetto fuzzy per categorizzare il genere dei nomi in base ai fonemi e a come suonano.
6. Tassi di cancellazione delle prenotazioni alberghiere
Se ti interessa il real estate, questo è un ottimo dataset con cui giocare per capire i tassi di cancellazione delle prenotazioni alberghiere. Con semplici tecniche di machine learning, puoi provare a prevedere la probabilità di cancellazione in base ai dati storici.
7. Rilevamento dei volti nelle immagini
Ti sei mai chiesto come il tuo iPhone disegna i riquadri intorno al viso? È perché esegue il face detection dietro le quinte. Puoi creare una funzionalità simile usando questo piccolo dataset di immagini annotate con volti.
8. Prevedere la specie delle api dalle immagini
Un algoritmo di machine learning può rilevare la specie di api a partire da un’immagine? In questo progetto di riconoscimento immagini, farai proprio questo.
9. Analizzare e prevedere la domanda di bike sharing
Questo dataset di bike sharing contiene una ricchezza di informazioni sulle corse per una startup del settore. Questo progetto intermedio prevede l’uso di Python per analizzare un dataset che include vari fattori come condizioni meteo, ora del giorno e festività per prevedere la domanda di noleggio biciclette a Seoul. Offre un’esperienza formativa completa, dalle skill di analisi esplorativa alla modellazione predittiva. Le sfide includono il confronto dei pattern di noleggio in momenti e stagioni diverse, la visualizzazione dell’impatto della temperatura sui noleggi e l’identificazione delle variabili più influenti per la domanda. È quindi un ottimo progetto per affinare competenze in manipolazione dati, visualizzazione e machine learning, comprendendo al contempo le sfide operative affrontate da una startup in crescita.

Un esempio dal progetto Python sui noleggi di biciclette
10. Costruire un classificatore di Tweet
Personalità diverse hanno stili di tweet distinti. In questo progetto di analisi dei social media, userai machine learning e elaborazione del linguaggio naturale per classificare se i tweet sono scritti da Donald Trump o Justin Trudeau.
Progetti Python avanzati
Questi progetti avanzati vanno oltre i dataset complessi e ti sfidano ad applicare soluzioni creative a problemi interessanti. Che si tratti di creare sistemi di raccomandazione per film, analizzare le reti tra personaggi nei libri o interpretare la lingua dei segni con il machine learning, questi progetti ti offriranno abbastanza complessità per imparare nuove skill sul campo.
1. Costruire un sistema di raccomandazione di film
Le piattaforme di streaming forniscono raccomandazioni granulari in base a come tu e altri come te interagite con i contenuti. In questo progetto sui sistemi di raccomandazione, imparerai a costruire un sistema di raccomandazione di film.
2. Riconoscimento della lingua dei segni americana
L’American Sign Language è la lingua principale usata da molte persone sorde in Nord America. In questo progetto di riconoscimento immagini, userai il Deep learning per riconoscere le lettere ASL.
3. Riconoscimento in tempo reale delle targhe
Un progetto fantastico per riconoscere i numeri di targa in tempo reale usando il deep learning su dataset video. Dai un’occhiata al progetto GitHub che contiene dataset e codice.

Un progetto Python avanzato sul rilevamento delle targhe - fonte
4. Analisi del sentiment nei titoli delle notizie finanziarie
Il sentiment degli investitori è un indicatore estremamente importante quando si cercano indizi sulla performance futura di un titolo. Con l’elaborazione del linguaggio naturale e il machine learning, puoi estrarre automaticamente il sentiment dai titoli delle notizie in questo progetto di NLP.
5. Rilevamento dello spam negli SMS
Il rilevamento dello spam è un caposaldo della data science e richiede una combinazione di tecniche di NLP e machine learning. Crea uno strumento anti-spam con questo dataset di SMS.
6. Analisi di rete di Game of Thrones
Anche se ormai un po’ datato, Game of Thrones ha catturato l’immaginazione del mondo come pochi altri show. Con un insieme così vasto di personaggi e lore, qual era il più importante di tutti? In questo progetto di Network Analysis, risponderai proprio a questa domanda.
7. Ridurre la mortalità stradale con il machine learning
In questo progetto sulla mortalità stradale, analizzerai i dati storici sulla mortalità per incidenti negli USA per stato e applicherai il machine learning per trovare somiglianze e differenze tra stati e fornire raccomandazioni di policy puntuali. Puoi consultare anche gli altri progetti di machine learning in un articolo a parte.
8. Similarità tra film nei riassunti della trama
Con così tanti film disponibili, è facile pensare a titoli simili tra loro. E se potessi usare NLP e machine learning per categorizzare i film in base ai riassunti della trama? Con questo dataset sulla similarità dei film, farai esattamente questo. Questo progetto avanzato in Python offre sfide di analisi esplorativa, text mining e analisi di trend. Il compito più avanzato prevede la costruzione di un grafo per analizzare le relazioni professionali tra membri del cast e registi, richiedendo competenze di manipolazione dati complessa e teoria dei grafi. Il progetto fornisce una solida piattaforma per applicare tecniche avanzate di data science a dati reali.

Un progetto Python avanzato su dati cinematografici
9. Classificazione dei generi cinematografici con output multi-etichetta
Un film può combinare più generi. Con questo dataset di film Netflix, puoi applicare la classificazione multi-etichetta per prevedere i molti generi che un film può avere in base alla sua descrizione, al rating e altro.
10. Costruire e distribuire una pipeline di machine learning
Anche se non è un progetto specifico, distribuire e mantenere gli altri progetti in questo elenco è una skill estremamente utile da mostrare ai datori di lavoro. In questo tutorial, imparerai proprio come fare.
Progetti Python divertenti per migliorare le tue skill
Pur non essendo i più complessi, questi progetti offrono dataset interessanti e coinvolgenti da esplorare per dare slancio al tuo percorso di apprendimento di Python.
1. Identificazione dell’autore di racconti gotici
Classifica le opere di scrittori del mistero. Scopri se un brano appartiene a Edgar Allen Poe, HP Lovecraft o Mary Shelley.
2. Previsione delle vendite di videogiochi
Stai aspettando un gioco in arrivo da Activision o EA? Prova a prevedere quanto venderà usando i dati di oltre 16mila videogiochi del passato.
3. Previsione del tipo di personalità Myers-Briggs (MBTI)
Secondo l’indicatore MBTI esistono 16 tipi di personalità. Invece di cercarlo su Google, prova a prevedere il tuo tipo con questo dataset sui tipi di personalità.
4.Explora i dati sul prezzo del Bitcoin
I prezzi delle criptovalute hanno affascinato il mondo per la loro estrema volatilità. In questo progetto, applicherai analisi di serie temporali e tecniche di visualizzazione ai prezzi del Bitcoin.
5. Previsione della popolarità delle canzoni
In questo ottimo dataset di canzoni dagli anni ’50, puoi prevedere la popolarità di un brano in base a diversi attributi.
6. Analizzare i dati dei fitness tracker
Con la diffusione dei fitness tracker arriva un’abbondanza di dati da analizzare. In questo progetto di analisi dati, analizzerai e visualizzerai i dati del fitness tracker Runkeeper.
7. Sfatare miti con i dati
Uno studio del 1991 ha rilevato che i mancini muoiono in media nove anni prima dei destrimani. È davvero così? Scoprilo in questo progetto di analisi statistica.
8. Analizzare i dati dell’etilometro
Usando i dati raccolti dagli etilometri nello stato dell’Iowa, potrai visualizzare e analizzare l’ubriachezza in Iowa e trovare pattern che possano portare a decisioni politiche migliori.
9. Scalare le classifiche musicali
Con questo dataset di Spotify di ~600 canzoni dal 2010 al 2019, potrai esplorare e analizzare come i generi popolari si sono evoluti nell’ultimo decennio, prevedere il genere di una canzone in base ad attributi chiave e altro ancora.
10. Analizzare un database Lego
Anche se questo progetto richiede alcune competenze SQL, questo database Lego ti permette di esaminare migliaia di vendite Lego durante l’anno e capire quali set generano più vendite.
Altri progetti Python guidati e non per fare pratica
In tutto l’articolo, abbiamo linkato molti progetti e dataset di DataCamp. DataCamp offre una serie di progetti guidati e non guidati a seconda del livello di difficoltà a cui punti. Ecco un elenco di progetti aggiuntivi per esercitarti
Progetti Python guidati per esercitarti
1. Prevedere l’approvazione delle carte di credito
Le approvazioni automatiche delle carte di credito sono un grande caso d’uso del machine learning nel banking. In questo progetto sulle approvazioni, imparerai a prevedere se una richiesta di carta viene accettata o rifiutata dalle banche.
2. Scoprire gli argomenti di tendenza nella ricerca sul ML
Usando questo dataset sugli argomenti di tendenza, applicherai il machine learning per scoprire il futuro delle tendenze nella ricerca sul machine learning analizzando gli articoli della conferenza Neural Information Processing Systems dell’ultimo decennio.
3. Classificazione dei donatori di sangue
Le donazioni di sangue salvano vite. In questo progetto sui donatori, analizza i pattern nelle donazioni e prevedi se una persona donerà di nuovo in futuro.
4. Confrontare cosmetici per ingredienti
Scegliere un cosmetico che non comprometta la salute della pelle è difficile. In questo progetto guidato, impari a elaborare gli ingredienti dei cosmetici per prendere decisioni più informate su un nuovo prodotto adatto a te.
5. Una storia visiva dei vincitori del Nobel
Quasi tutti nella ricerca sognano di vincere un Nobel almeno una volta nella vita. Ma età, razza e genere influiscono sulle possibilità? Scoprilo analizzando i dati sui vincitori dal 1901.
6. La storia di Scala su GitHub
Scala è al 34º posto tra i linguaggi più popolari secondo l’indice TIOBE. Scopri come ci è arrivato analizzando la storia del suo repository GitHub in questo progetto guidato.
7. Esplorare l’evoluzione di Linux
I sistemi di controllo versione come Git conservano informazioni ricche sull’evoluzione di un progetto software. In questo progetto sull’evoluzione di Linux, analizzerai e trasformerai il repository Git reale del kernel Linux e capirai come oltre 700mila commit hanno creato uno dei sistemi operativi più usati al mondo.
8. Ricreare la Ghost Map di John Snow
Il dottor John Snow (non il personaggio di Game of Thrones) mappò a mano i casi di colera e dedusse le origini dei focolai nella sua zona, dando origine all’epidemiologia moderna. In questo progetto storico, ricreerai il suo lavoro e la sua famosa mappa.
9. Una nuova era di analisi dei dati nel baseball
Moneyball ha inaugurato l’era dell’analisi sportiva. In questo progetto, analizzerai i dati MLB Statcast per confrontare diversi giocatori di baseball e capire cosa determina gli home run.
10. Generare keyword per Google Ads
Generare keyword per gli annunci di ricerca è un processo incredibilmente meticoloso e gravoso. E se potessi automatizzare questo compito con Python? In questo progetto sulle keyword di Google Ads, imparerai proprio a farlo.
11. A/B test nei giochi mobile
L’A/B testing alimenta il successo di tantissimi prodotti e servizi digitali, e i giochi mobile ne sono una grande testimonianza. In questo progetto, capirai l’impatto di un esperimento condotto nel popolare gioco Cookie Cats sulla retention degli utenti.
12. Dare priorità al recupero crediti con il machine learning
L’insolvenza è un grosso problema per banche e istituzioni finanziarie. In questo progetto, userai machine learning e regressioni per capire come dare priorità al recupero crediti per una banca.
13. Sistema di raccomandazione di libri da Charles Darwin
Charles Darwin era un lettore vorace e aveva una vasta bibliografia. In questo progetto, userai i libri preferiti di Charles Darwin per creare un sistema di raccomandazione che suggerisca libri basati sui suoi gusti.
Progetti Python non guidati per esercitarti
1. Indagare sui film Netflix e sulle guest star in The Office
In questo progetto su The Office, manipolerai e visualizzerai la performance dei film su Netflix e delle guest star della serie cult “The Office”.
2. Esplorare la storia di Lego
Circa 1140 pezzi Lego vengono prodotti ogni secondo. Scopri come il brand di giocattoli più popolare al mondo è diventato così dominante analizzando i suoi dati storici di vendita.
3. La scoperta dell’igiene delle mani
Lavarsi le mani è naturale per tutti noi, ma non è sempre stato così. Infatti, il medico ungherese Ignaz Semmelweis scoprì i benefici del lavaggio delle mani analizzando i dati di mortalità dei pazienti in ospedale. Ricrea la sua analisi usando questo dataset.
4. Il mercato delle app Android su Google Play
Il mercato delle app Android è vasto e competitivo. Analizza e visualizza questo dataset estratto dal Google Play Store per scoprire cosa rende un’app eccellente.
5. Frequenza delle parole nei romanzi classici
In questo progetto, estrarrai un romanzo dal sito Project Gutenberg e poi analizzerai la distribuzione delle parole in un ampio corpus di libri.
6. Password deboli e linee guida NIST
Quasi ogni sito richiede una password, quindi come fai a sapere se stai usando la migliore? In questo progetto, creerai un sistema che verifica automaticamente se la tua password è conforme al National Institute of Standards and Technology.
7. Confrontare l’interesse di ricerca con Google Trends
Google espone la sua API di Trends in Python così che gli utenti possano scoprire l’interesse di ricerca per qualsiasi keyword. È un’ottima fonte di dati di serie temporali con record che risalgono al 2004. In questo progetto, esplorerai l’interesse di ricerca mondiale per cinque principali browser internet.
8. Esplorare il mercato Airbnb di NYC
Sfrutta pulizia e manipolazione dei dati per scoprire insight nel mercato Airbnb di New York City.
Come scegliere quali progetti Python aggiungere al tuo curriculum
Con questo lungo elenco di progetti Python, come scegliere cosa aggiungere al tuo curriculum? Secondo Nick Singh, autore del best seller "Ace the Data Science Interview", ecco quattro principi chiave da tenere a mente quando affronti progetti in Python.
1. I progetti dovrebbero nascere da un interesse genuino
Lavorare su un argomento che ti sta a cuore renderà l’intero processo più coinvolgente e aumenterà le probabilità di completarlo. Inoltre, questo entusiasmo emergerà quando parlerai del progetto con un hiring manager.
2. La semplicità batte la complessità
Oggi è facile lasciarsi distrarre da strumenti appariscenti e tecniche all’avanguardia. Tuttavia, la data science nel mondo reale richiede un approccio semplice e pragmatico alla costruzione di soluzioni. Uno degli obiettivi di un progetto è dimostrare la tua capacità di sviluppare soluzioni utili di data science con tecniche relativamente semplici.
3. Completa sempre il tuo progetto
È facile incappare nello scope creep quando si lavora a un progetto. Come regola generale, definisci sempre un progetto che sai di poter completare dall’inizio alla fine — anche se si tratta solo di un semplice esercizio di analisi dei dati.
4. Il progetto dovrebbe avere un impatto quantificabile
Una volta completato, assicurati di condividere il tuo lavoro e ottenere feedback dalla community in modo quantificabile. Che si tratti di stelle su GitHub, condivisioni su LinkedIn o menzioni su Reddit, condividere il tuo lavoro è il modo migliore per mostrare l’impatto misurabile del progetto ai potenziali hiring manager.
Porta il tuo apprendimento di Python al livello successivo
Speriamo che questo elenco di progetti Python ti sia piaciuto e che possa accelerare il tuo percorso di apprendimento. Se vuoi iniziare e ti serve prima un ripasso di Python, assicurati di consultare il curriculum Python di DataCamp e le risorse aggiuntive qui sotto.

