Programma
In questo articolo presenteremo diverse idee per progetti SQL pronti per il portfolio. Che tu sia alle prime armi con SQL o un utente più avanzato, troverai vari argomenti interessanti da esplorare.
Sono sicuro che questi progetti SQL ti saranno utili in almeno tre modi:
- Mettere in pratica le competenze SQL che già possiedi
- Sviluppare nuove competenze
- Costruire il tuo portfolio per mostrare le tue abilità SQL ai potenziali datori di lavoro.
Progetti SQL per principianti
Se conosci già i concetti base di SQL, sei pronto per il tuo primo progetto SQL. Assicurati di avere le seguenti competenze:
- Eseguire operazioni matematiche
- Aggregare e descrivere i dati (minimo, massimo, media, conteggio e somma)
- Filtrare i dati in base a una o più condizioni
- Raggruppare i dati
- Ordinare i dati
- Limitare i dati in output
- Join semplici tra record (inner join)
- Assegnare alias a colonne o tabelle
Per un ripasso veloce, dai un'occhiata alla nostra SQL Basics Cheat Sheet.
All'inizio, va benissimo portare a termine progetti semplici e focalizzati su un singolo compito di manipolazione dei dati. Potrai sempre migliorare ed espandere questi progetti in seguito, quando avrai più conoscenze SQL e nuove abilità.
1. Analisi delle emissioni di carbonio per settore
Nel progetto Analyzing Industry Carbon Emissions userai il dataset disponibile sulle emissioni di carbonio dei prodotti (che rappresentano oltre il 75% delle emissioni globali e costituiscono un serio problema ecologico) per esplorare l'impronta di carbonio dei vari settori nell'anno più recente e individuare i settori più inquinanti.
Anche se è un progetto introduttivo su un singolo compito, potresti dover rivedere le lezioni del corso Intermediate SQL: Riepilogare i sottoinsiemi e Filtrare i dati raggruppati.
2. Analisi della salute mentale degli studenti in SQL

Nel progetto Analyzing Students' Mental Health in SQL utilizzerai le tue competenze in PostgreSQL per analizzare i dati degli studenti di un'università internazionale giapponese e individuare uno dei fattori più influenti che impattano sulla salute mentale degli studenti internazionali.
Il sondaggio condotto dall'università ha mostrato che le principali sfide per gli studenti internazionali sono la connessione sociale e lo stress associato all'inserimento in una nuova cultura. Il tuo compito specifico per questo progetto per principianti sarà concentrarti su un fattore particolare—la durata della permanenza e il suo impatto sui punteggi diagnostici medi degli studenti internazionali.
3. Quando è stata l'età d'oro dei videogiochi?
Nel progetto SQL When Was the Golden Age of Video Games? analizzerai i 400 videogiochi più venduti pubblicati dal 1977 per capire se il mercato del gaming sia migliorato nel tempo e quando abbia vissuto la sua epoca più fiorente. A questo scopo lavorerai con gli anni di uscita dei giochi, i punteggi di critici e utenti e i dati sulle vendite. Cercherai i seguenti insight:
- I 10 videogiochi più venduti di sempre e il periodo di uscita
- I 10 anni con i punteggi medi più alti dei critici e con molti successi prodotti
- I 10 anni con i punteggi medi più alti degli utenti e con molti successi prodotti
- Gli anni con i punteggi medi più alti sia dei critici sia dei giocatori e con molti successi prodotti
- Il numero di giochi venduti in quegli anni
Per svolgere i compiti sopra elencati in questo progetto SQL, dovrai usare vari tipi di join e operatori insiemistici; assicurati quindi di ripassare queste abilità con la SQL Joins Cheat Sheet.
4. Analisi delle tendenze dei nomi dei neonati americani
Nel progetto Analyzing American Baby Name Trends studierai i dati forniti dalla U.S. Social Security Administration contenenti i nomi propri assegnati a oltre 5.000 neonati americani ogni anno per un periodo di 101 anni. L'obiettivo principale è capire come sono cambiati i gusti nei nomi indagando le tendenze di popolarità. In particolare, andrai a scoprire:
- Nomi classici americani da oltre 100 anni
- Il tipo di popolarità per ciascun nome: intramontabile vs. di tendenza
- I 10 nomi femminili più diffusi
- Il nome femminile che termina con "a" più popolare dal 2015
- I nomi maschili più popolari per anno
- Il nome maschile più popolare per il maggior numero di anni
Per questo progetto avanzato, potrebbe esserti utile il corso Data Manipulation in SQL.
Progetti SQL intermedi
Creare brevi progetti SQL su singolo compito è un buon inizio, ma a un certo punto del tuo percorso di apprendimento vorrai realizzare qualcosa di più stimolante ed esplorare i dati da più angolazioni. La buona notizia è che, per questi progetti multi-task, sono comunque sufficienti le stesse competenze SQL essenziali elencate all'inizio del capitolo precedente.
5. Quali e dove sono le aziende più antiche del mondo?
Nel progetto SQL What and Where are the World's Oldest Businesses esaminerai i dati di BusinessFinancing.co.uk per scoprire le aziende più antiche del mondo—quelle che hanno superato secoli di cambiamenti di mercato e sono ancora operative. Otterrai molte scoperte curiose:
- L'intervallo degli anni di fondazione delle aziende più antiche del mondo
- L'azienda più antica del mondo e il settore a cui appartiene
- Quante e quali aziende sono state fondate prima dell'anno 1000 d.C.
- I settori più comuni a cui appartengono le aziende più antiche
- Le aziende più antiche per continente
- I settori più comuni per le aziende più antiche in ciascun continente
Poiché i dati per questo progetto SQL intermedio sono contenuti in diverse tabelle del database, per molti compiti dovrai utilizzare tecniche di join per unire i dati necessari. Puoi fare riferimento al corso Joining Data with SQL per imparare come farlo.
6. Analisi dei punteggi dei test delle scuole pubbliche di NYC

Nel progetto Analyzing NYC Public School Test Result Scores lavorerai con un database SQL contenente i punteggi SAT (Scholastic Aptitude Test) delle scuole pubbliche di New York City per valutare le performance dei test nelle varie scuole. Esaminerai i seguenti aspetti:
- Quante scuole non riportano le informazioni
- Quali (o quante) scuole sono le migliori/peggiori in ciascuna delle tre componenti del SAT—lettura, matematica e scrittura
- I punteggi migliori/peggiori per le diverse componenti del SAT
- Le 10 scuole con i punteggi SAT medi totali più alti
- Come variano le performance dei test per borough
- Le 5 scuole migliori per punteggio SAT medio sulle tre componenti (o per una certa componente) per un borough selezionato
Ogni volta che hai dubbi su quale comando usare (e come usarlo) in ciascun caso specifico per questo progetto SQL intermedio, consulta questa guida completa—SQL Commands for Data Scientists.
7. Analisi e formattazione di dati di vendita in PostgreSQL
Nel progetto Analyzing and Formatting PostgreSQL Sales Data affronterai uno scenario fin troppo comune nel mondo professionale: i dati non sono ancora pronti per l'analisi. Lavorerai con un database "superstore" in cui i record presentano formattazioni incoerenti, tipi di dato errati e valori mancanti che mettono a rischio l'accuratezza dei report.
Il tuo obiettivo è pulire il dataset usando tecniche PostgreSQL per rispondere a domande quotidiane di business retail. In particolare, dovrai:
- Identificare le colonne con tipi di dato errati (ad es. numeri salvati come testo) e convertirle per i calcoli.
- Individuare i record incompleti e applicare strategie per imputare i valori mancanti delle quantità dei prodotti.
- Filtrare e aggregare i dati ora puliti per identificare i prodotti con le migliori performance.
- Analizzare le tendenze di ricavo che prima erano nascoste dagli errori nei dati.
Poiché questo progetto colma il divario tra dati grezzi e insight azionabili, è un ottimo modo per fare pratica con le competenze di Data Cleaning in SQL che i recruiter considerano prioritarie.
Progetti SQL per livello avanzato
Per affrontare progetti SQL più avanzati che possano davvero aiutarti a distinguerti, dovresti essere a tuo agio con tecniche più evolute oltre a quelle essenziali elencate nella prima sezione. Verifica di sapere come fare le seguenti cose in SQL:
- Usare tutti i tipi di join (inclusi i self join)
- Individuare ed estrarre pattern
- Gestire la logica if/then/else in SQL
- Creare viste
- Scrivere query annidate complesse
- Usare le common table expression
- Applicare le funzioni finestra di SQL
- Troncare i dati
- Etichettare i dati
- Applicare operatori insiemistici
- Lavorare con date e orari
8. Analisi delle vendite di ricambi per moto
Nel progetto SQL Analyzing Motorcycle Part Sales approfondirai i dati di un'azienda che vende ricambi per moto per ottenere insight sulle vendite all'ingrosso nel tempo su tre magazzini e aiutarli a capire i flussi di ricavo. Più precisamente, determinerai quante entrate nette l'azienda genera per linea di prodotto, per mese e per magazzino.
Per questo progetto ti serviranno anche solide capacità di reporting, oltre alle tue competenze SQL. Il corso Data-Driven Decision Making in SQL può aiutarti a migliorare in quest'area.
9. Analisi delle aziende “unicorno”

Nel progetto Analyzing Unicorn Companies il tuo compito sarà capire quante aziende hanno raggiunto una valutazione superiore a 1 miliardo di dollari nei diversi settori in un dato periodo di tempo.
In particolare, dovrai identificare i tre settori con le performance migliori in base al numero di nuove aziende ad alta crescita create in quel periodo, trovare il numero di unicorni emersi in questi settori per anno, l'anno in cui ciascuna di queste aziende è diventata unicorno e la loro valutazione media in miliardi di dollari. E potrai ottenere tutte queste informazioni con una sola query!
Per questo progetto utilizzerai un database PostgreSQL contenente diverse tabelle. Per un ripasso di alcune competenze chiave, puoi consultare questi corsi: Functions for Manipulating Data in PostgreSQL e Cleaning Data in PostgreSQL Databases.
10. Valutare un processo di produzione
Nel progetto Evaluate a Manufacturing Process entrerai nel ruolo di Manufacturing Data Analyst. Sebbene la coerenza sia fondamentale in produzione, gli operatori spesso apportano modifiche ai macchinari per migliorare l'efficienza. Il tuo compito è analizzare i dati per determinare se una recente modifica al processo abbia migliorato la qualità o, in realtà, l'abbia peggiorata.
Questo progetto va oltre i semplici "group by" e richiede di osservare l'andamento dei dati nel tempo. Scoprirai insight critici come:
- Come oscillano le metriche di qualità tra i diversi lotti di produzione.
- Se specifiche regolazioni dei macchinari correlano con un aumento dei prodotti difettosi.
- La media mobile delle dimensioni dei prodotti usando funzioni finestra avanzate.
- Deviazione standard e varianza nel processo produttivo per rilevare instabilità.
Per completare con successo questo progetto, dovrai avere dimestichezza con Window Functions, Partitioning e la generazione di Summary Statistics. Si tratta di concetti avanzati spesso testati nei colloqui tecnici per ruoli di medio-alto livello.
Ulteriori idee per progetti SQL
Se stai ancora cercando altre idee per progetti SQL, considera qualcosa da questo elenco. Penso che tutte queste idee siano praticamente realizzabili in SQL, ma il livello di fattibilità dipenderà dal dataset disponibile.
- Analisi della fidelizzazione dei clienti: Analizza i tassi di retention e individua i fattori chiave che influenzano la lealtà dei clienti esplorando le storie delle transazioni.
- Previsione dell'abbandono dei dipendenti: Crea un progetto che analizzi i dati dei dipendenti per trovare pattern e prevedere l'attrito. Potresti considerare fattori come la soddisfazione lavorativa e l'anzianità in azienda.
- Ottimizzazione dell'inventario e-commerce: Usa i dati storici delle vendite per aiutare a ottimizzare i livelli di stock prevedendo la domanda.
- Analisi del sentiment sui social media: Esegui analisi del sentiment su post o recensioni per individuare le tendenze dell'opinione pubblica su un brand o un argomento specifico.
- Analisi del mercato immobiliare: Analizza i dati immobiliari per determinare i quartieri con le performance migliori in base alle tendenze dei valori delle proprietà e ai canoni di affitto.
- Analisi delle valutazioni dei film: Esplora i dati di un database di film per trovare tendenze nei punteggi e nei generi nel tempo, identificando pattern nelle preferenze del pubblico.
- Analisi dell'impatto delle promozioni retail: Esamina come promozioni o sconti specifici influenzano i volumi di vendita.
- Analisi dei tassi di riammissione ospedaliera: Analizza i dati sanitari per individuare tendenze nei tassi di riammissione dei pazienti.
- Tendenze di utilizzo del trasporto pubblico: Indaga i pattern di utilizzo del trasporto pubblico per identificare gli orari di punta e le linee sottoutilizzate.
- Rilevamento di frodi finanziarie: Sviluppa un progetto che identifichi potenziali transazioni finanziarie fraudolente in base a fattori come importo e frequenza delle transazioni.
Considerazioni finali
In questo articolo abbiamo presentato diverse idee per progetti SQL per tutti i livelli di competenza. Inoltre, abbiamo passato in rassegna le abilità necessarie per ciascun progetto e le risorse di apprendimento per acquisirle e perfezionarle.
Ora sei pienamente pronto per iniziare a costruire questi progetti SQL e far crescere il tuo portfolio professionale. Non è mai troppo presto né troppo tardi per iniziare a padroneggiare e mostrare le tue competenze!
Una volta che il tuo portfolio di progetti SQL è pronto, ti conviene anche ripassare le domande di colloquio SQL più richieste per fare un'ottima impressione ai potenziali datori di lavoro in fase di selezione.

Data Scientist certificato IBM (2020), in precedenza geologo/geonumerico petrolifero con esperienza in campi oil & gas a livello mondiale e oltre 12 anni di lavoro internazionale. Competente in Python, R e SQL. Aree di competenza: data cleaning, manipolazione dei dati, visualizzazione dei dati, analisi dei dati, modellazione dei dati, statistica, storytelling, machine learning. Ampia esperienza nella gestione di community di data science e nella scrittura/revisione di articoli e tutorial su data science e temi di carriera.

