Program
Artikel ini akan membahas beberapa ide proyek SQL yang siap dimasukkan ke portofolio. Baik Anda pemula SQL maupun praktisi yang lebih mahir, Anda akan menemukan beragam topik menarik untuk dieksplorasi.
Saya yakin proyek-proyek SQL ini akan bermanfaat setidaknya dalam tiga hal:
- Melatih keterampilan SQL Anda saat ini
- Mengembangkan keterampilan baru
- Membangun portofolio data untuk menampilkan keterampilan SQL Anda kepada calon pemberi kerja.
Proyek SQL untuk Pemula
Jika Anda sudah familiar dengan konsep dasar SQL, Anda siap untuk proyek SQL pertama Anda. Pastikan Anda memiliki keterampilan berikut:
- Melakukan operasi matematika
- Mengagregasi dan mendeskripsikan data (minimum, maksimum, rata-rata, jumlah, dan penjumlahan)
- Menyaring data berdasarkan satu atau beberapa kondisi
- Mengelompokkan data
- Mengurutkan data
- Membatasi data keluaran
- Menggabungkan rekaman sederhana (inner join)
- Memberi alias pada kolom atau tabel
Untuk penyegaran cepat, lihat SQL Basics Cheat Sheet kami.
Pada tahap awal, tidak masalah menyelesaikan proyek manipulasi data sederhana dengan satu tugas. Anda selalu bisa memperbaiki dan memperluas proyek semacam itu nanti saat Anda memperoleh lebih banyak pengetahuan SQL dan keterampilan baru.
1. Menganalisis emisi karbon industri
Dalam proyek Analyzing Industry Carbon Emissions, Anda akan menggunakan dataset yang tersedia tentang emisi karbon produk (yang menyumbang lebih dari 75% emisi global dan merupakan masalah ekologis serius) untuk mengeksplorasi jejak karbon berbagai industri dari tahun terbaru dan menentukan industri dengan emisi tertinggi.
Meskipun ini adalah proyek pengantar dengan satu tugas, Anda mungkin perlu melalui pelajaran pada kursus Intermediate SQL: Merangkum subset dan Menyaring data yang dikelompokkan.
2. Menganalisis kesehatan mental mahasiswa di SQL

Dalam proyek Analyzing Students' Mental Health in SQL, Anda akan menggunakan keterampilan PostgreSQL untuk menganalisis data mahasiswa dari sebuah universitas internasional di Jepang dan menemukan salah satu faktor paling berpengaruh yang memengaruhi kesehatan mental mahasiswa internasional.
Survei yang dilakukan oleh universitas menunjukkan bahwa tantangan utama bagi mahasiswa internasional adalah keterhubungan sosial dan stres terkait beradaptasi dengan budaya baru. Tugas khusus Anda untuk proyek SQL pemula ini adalah berfokus pada satu faktor penyumbang tertentu—lama tinggal—dan bagaimana hal itu berdampak pada skor diagnostik rata-rata mahasiswa internasional.
3. Kapan era keemasan video game?
Dalam proyek SQL When Was the Golden Age of Video Games?, Anda akan menganalisis 400 video game terlaris yang dirilis sejak 1977 untuk mengidentifikasi apakah pasar game meningkat seiring waktu dan kapan masa kejayaannya. Untuk itu, Anda akan bekerja dengan tahun rilis game, skor kritikus dan pengguna, serta data penjualan. Anda akan mencari wawasan berikut:
- 10 video game terlaris sepanjang masa dan periode rilisnya
- 10 tahun teratas dengan skor rata-rata kritikus tertinggi dan banyak hit yang diproduksi
- 10 tahun teratas dengan skor rata-rata pengguna tertinggi dan banyak hit yang diproduksi
- Tahun-tahun dengan skor rata-rata tertinggi dari kritikus maupun pemain dan banyak hit yang diproduksi
- Jumlah game yang terjual pada tahun-tahun tersebut
Untuk menjalankan tugas-tugas di atas pada proyek SQL ini, Anda perlu menggunakan berbagai jenis join dan operator himpunan, jadi pastikan Anda menyegarkan keterampilan ini dengan SQL Joins Cheat Sheet.
4. Menganalisis tren nama bayi Amerika
Dalam proyek Analyzing American Baby Name Trends, Anda akan mempelajari data dari U.S. Social Security Administration yang berisi nama depan yang diberikan kepada lebih dari 5.000 bayi Amerika setiap tahun selama 101 tahun. Tujuan utamanya adalah memahami bagaimana selera nama bayi Amerika berubah dengan menyelidiki tren popularitas. Secara khusus, Anda akan menemukan:
- Nama-nama klasik Amerika selama lebih dari 100 tahun
- Jenis popularitas setiap nama: abadi vs. tren sesaat
- 10 nama perempuan teratas
- Nama perempuan paling populer yang berakhiran "a" sejak 2015
- Nama laki-laki paling populer per tahun
- Nama laki-laki paling populer untuk jumlah tahun terbanyak
Untuk proyek tingkat lanjut ini, Anda mungkin akan terbantu dengan kursus Data Manipulation in SQL.
Proyek SQL Tingkat Menengah
Membangun proyek SQL singkat dengan satu tugas adalah awal yang baik, namun pada suatu titik dalam perjalanan belajar Anda, Anda akan ingin membuat sesuatu yang lebih menarik dan mengeksplorasi data dari banyak sudut. Kabar baiknya, untuk proyek multi-tugas seperti itu, memiliki keterampilan SQL esensial yang sama seperti yang tercantum di awal bab sebelumnya masih cukup.
5. Apa dan di mana bisnis tertua di dunia?
Dalam proyek SQL What and Where are the World's Oldest Businesses, Anda akan menelaah data dari BusinessFinancing.co.uk untuk menemukan bisnis tertua di dunia—yang bertahan menghadapi perubahan kondisi pasar selama ratusan tahun dan masih beroperasi. Anda akan memperoleh banyak temuan menarik:
- Rentang tahun berdirinya perusahaan-perusahaan tertua di dunia
- Perusahaan tertua di dunia dan industrinya
- Berapa banyak—dan yang mana saja—perusahaan yang didirikan sebelum tahun 1000 M
- Industri yang paling umum untuk perusahaan-perusahaan tertua
- Perusahaan tertua per benua
- Industri paling umum untuk perusahaan tertua di setiap benua
Karena data untuk proyek SQL tingkat menengah ini terdapat pada beberapa tabel basis data berbeda, untuk banyak tugas Anda perlu menggunakan teknik join untuk menggabungkan data yang diperlukan. Anda dapat merujuk ke kursus Joining Data with SQL untuk mempelajarinya.
6. Menganalisis skor hasil ujian sekolah negeri NYC

Dalam proyek Analyzing NYC Public School Test Result Scores, Anda akan bekerja dengan basis data SQL yang berisi skor SAT (Scholastic Aptitude Test) dari sekolah-sekolah negeri di New York City untuk menentukan performa ujian di sekolah-sekolah tersebut. Anda akan melihat aspek-aspek berikut:
- Berapa banyak sekolah yang tidak melaporkan informasi
- Sekolah mana (atau berapa banyak) yang terbaik/terburuk pada masing-masing dari tiga komponen SAT—membaca, matematika, dan menulis
- Skor terbaik/terburuk untuk berbagai komponen SAT
- 10 sekolah teratas berdasarkan skor total SAT rata-rata
- Bagaimana performa ujian bervariasi menurut borough
- 5 sekolah teratas berdasarkan skor SAT rata-rata di ketiga komponen (atau untuk komponen tertentu) untuk suatu borough yang dipilih
Kapan pun Anda ragu tentang perintah mana yang digunakan (dan bagaimana menggunakannya) dalam tiap kasus untuk proyek SQL tingkat menengah ini, silakan cek tutorial komprehensif ini—SQL Commands for Data Scientists.
7. Menganalisis dan memformat Data Penjualan PostgreSQL
Dalam proyek Analyzing and Formatting PostgreSQL Sales Data, Anda akan menghadapi skenario yang sangat umum di dunia profesional: data belum siap untuk dianalisis. Anda akan bekerja dengan basis data "superstore" di mana catatan memiliki format yang tidak konsisten, tipe data yang salah, dan nilai hilang yang mengancam akurasi pelaporan Anda.
Tujuan Anda adalah membersihkan dataset menggunakan teknik PostgreSQL untuk menjawab pertanyaan bisnis ritel sehari-hari. Secara khusus, Anda akan:
- Mengidentifikasi kolom dengan tipe data yang salah (misalnya, angka disimpan sebagai teks) dan mengonversinya untuk perhitungan.
- Mendeteksi catatan yang tidak lengkap dan menerapkan strategi untuk mengimputasi nilai yang hilang pada kuantitas produk.
- Menyaring dan mengagregasi data yang kini sudah bersih untuk mengidentifikasi produk dengan kinerja terbaik.
- Menganalisis tren pendapatan yang sebelumnya tersembunyi oleh kesalahan data.
Karena proyek ini menjembatani kesenjangan antara data mentah dan wawasan yang dapat ditindaklanjuti, ini adalah cara yang sangat baik untuk melatih keterampilan Pembersihan Data di SQL yang diprioritaskan oleh perekrut.
Proyek SQL Tingkat Lanjut
Untuk melanjutkan ke proyek SQL yang lebih lanjut dan dapat membantu Anda benar-benar menonjol, Anda harus nyaman dengan teknik yang lebih canggih selain teknik esensial yang tercantum di bagian pertama. Pastikan Anda tahu cara melakukan hal-hal berikut di SQL:
- Menggunakan semua jenis join (termasuk self join)
- Mencocokkan dan mengekstrak pola
- Menangani logika if/then/else di SQL
- Membuat view
- Membuat kueri bersarang yang kompleks
- Menggunakan common table expression
- Menerapkan fungsi jendela (window function) SQL
- Memangkas (truncating) data
- Memberi label pada data
- Menerapkan operator himpunan
- Bekerja dengan tanggal dan waktu
8. Menganalisis penjualan suku cadang motor
Dalam proyek SQL Analyzing Motorcycle Part Sales, Anda akan menelusuri data dari perusahaan yang menjual suku cadang motor untuk mendapatkan wawasan tentang penjualan grosir mereka dari waktu ke waktu di tiga lokasi gudang dan membantu mereka memahami aliran pendapatan. Lebih tepatnya, Anda akan menentukan berapa banyak pendapatan bersih yang dihasilkan perusahaan di seluruh lini produknya menurut bulan dan gudang.
Untuk proyek ini, selain keterampilan SQL, Anda juga memerlukan keterampilan pelaporan yang mumpuni. Kursus Data-Driven Decision Making in SQL dapat membantu Anda meningkatkan kemampuan di area ini.
9. Menganalisis perusahaan unicorn

Dalam proyek Analyzing Unicorn Companies, tugas Anda adalah mencari tahu berapa banyak perusahaan yang mencapai valuasi lebih dari 1 miliar dolar di berbagai industri dalam periode waktu tertentu.
Secara khusus, Anda perlu mengidentifikasi tiga industri dengan kinerja terbaik berdasarkan jumlah perusahaan bertumbuhan tinggi baru yang tercipta pada periode tersebut, menemukan jumlah unicorn yang muncul dalam industri ini per tahun, tahun saat masing-masing perusahaan menjadi unicorn, dan valuasi rata-rata mereka dalam miliar dolar. Dan semua informasi ini bisa Anda peroleh hanya dalam satu kueri!
Untuk proyek ini, Anda akan menggunakan basis data PostgreSQL yang berisi beberapa tabel. Untuk menyegarkan beberapa keterampilan kunci, Anda dapat melihat kursus berikut: Functions for Manipulating Data in PostgreSQL dan Cleaning Data in PostgreSQL Databases.
10. Mengevaluasi proses manufaktur
Dalam proyek Evaluate a Manufacturing Process, Anda akan berperan sebagai Analis Data Manufaktur. Meskipun konsistensi adalah kunci dalam produksi, operator sering menyesuaikan mesin untuk meningkatkan efisiensi. Tugas Anda adalah menganalisis data untuk menentukan apakah perubahan terbaru pada proses meningkatkan kualitas atau justru memperburuknya.
Proyek ini melampaui pernyataan "group by" sederhana dan mengharuskan Anda melihat tren data dari waktu ke waktu. Anda akan mengungkap wawasan penting seperti:
- Bagaimana metrik kualitas berfluktuasi di berbagai batch produksi.
- Apakah penyesuaian mesin tertentu berkorelasi dengan peningkatan produk cacat.
- Rata-rata bergulir dimensi produk menggunakan window function tingkat lanjut.
- Simpangan baku dan varians dalam proses manufaktur untuk mendeteksi ketidakstabilan.
Untuk berhasil menyelesaikan proyek ini, Anda perlu nyaman dengan Window Function, Partisi, dan pembuatan Statistik Ringkasan. Ini adalah konsep tingkat lanjut yang sering diuji dalam wawancara teknis untuk peran menengah hingga senior.
Ide Proyek SQL Tambahan
Jika Anda masih mencari ide proyek SQL tambahan, pertimbangkan sesuatu dari daftar ini. Saya pikir semua ide proyek ini secara praktis dapat dilakukan di SQL, namun tingkat kelayakannya akan bergantung pada dataset yang tersedia.
- Analisis Retensi Pelanggan: Analisis tingkat retensi pelanggan dan identifikasi faktor kunci yang memengaruhi loyalitas dengan menelusuri riwayat transaksi.
- Prediksi Attrisi Karyawan: Bangun proyek yang menganalisis data karyawan untuk menemukan pola dan memprediksi attrisi. Anda dapat mempertimbangkan faktor seperti kepuasan kerja dan lama bekerja di perusahaan.
- Optimasi Inventaris E-commerce: Gunakan data penjualan historis untuk membantu mengoptimalkan tingkat stok bagi bisnis dengan memprakirakan permintaan.
- Analisis Sentimen Media Sosial: Lakukan analisis sentimen pada unggahan media sosial atau ulasan untuk mengidentifikasi tren opini publik untuk merek atau topik tertentu.
- Analisis Pasar Real Estat: Analisis data real estat untuk menentukan kawasan dengan kinerja terbaik berdasarkan tren nilai properti dan tarif sewa.
- Analisis Rating Film: Eksplorasi data dari basis data film untuk menemukan tren dalam rating dan genre dari waktu ke waktu, mengidentifikasi pola preferensi audiens.
- Analisis Dampak Promosi Ritel: Tinjau bagaimana promosi atau diskon tertentu memengaruhi volume penjualan.
- Analisis Tingkat Rawat Inap Ulang Rumah Sakit: Analisis data kesehatan untuk mengidentifikasi tren tingkat rawat inap ulang pasien.
- Tren Penggunaan Transportasi Umum: Selidiki pola penggunaan transportasi umum untuk mengidentifikasi jam sibuk dan rute yang kurang dimanfaatkan.
- Deteksi Penipuan Keuangan: Kembangkan proyek yang mengidentifikasi transaksi keuangan yang berpotensi curang berdasarkan faktor seperti jumlah dan frekuensi transaksi.
Penutup
Dalam artikel ini, kami menguraikan berbagai ide proyek SQL untuk semua tingkat kompetensi SQL. Selain itu, kami meninjau keterampilan yang Anda perlukan untuk setiap proyek serta sumber belajar untuk memperolehnya dan mengasahnya.
Sekarang Anda sepenuhnya siap untuk mulai membangun proyek SQL ini dan menumbuhkan portofolio profesional Anda. Tidak pernah terlalu dini atau terlalu terlambat untuk mulai menguasai dan menampilkan keterampilan Anda!
Setelah portofolio proyek SQL Anda siap, Anda juga perlu menyegarkan pertanyaan wawancara SQL teratas agar dapat mengesankan calon pemberi kerja pada tahap wawancara.

IBM Certified Data Scientist (2020), sebelumnya Ahli Geologi/Geomodeler Perminyakan untuk ladang minyak dan gas di seluruh dunia dengan pengalaman kerja internasional lebih dari 12 tahun. Mahir dalam Python, R, dan SQL. Bidang keahlian: pembersihan data, manipulasi data, visualisasi data, analisis data, pemodelan data, statistik, storytelling, machine learning. Berpengalaman luas dalam mengelola komunitas data science serta menulis/meninjau artikel dan tutorial tentang data science dan topik karier.
