Kursus
Dalam tutorial ini, Anda akan mempelajari cara membersihkan data di Excel dan menyiapkannya untuk analisis. Kita akan membahas teknik penting seperti menghapus duplikat, menangani nilai yang hilang, dan menstandarkan pemformatan. Di akhir, Anda akan dibekali keterampilan praktis untuk memastikan dataset Anda akurat dan siap untuk analisis yang lebih mendalam.
Untuk pembahasan yang lebih mendalam, pertimbangkan mengikuti kursus pendamping Data Preparation in Excel yang komprehensif, yang mengulas teknik lanjutan dan praktik terbaik untuk mengoptimalkan alur kerja pembersihan data Anda.
Komponen Data yang Bersih Itu Apa Saja?
Menjaga kualitas data yang tinggi melibatkan beberapa komponen kunci, termasuk akurasi, kelengkapan, konsistensi, keseragaman, dan validitas. Komponen-komponen ini penting untuk analisis dan pengambilan keputusan yang andal. Mari kita lihat satu per satu.
- Akurasi: Akurasi berarti data Anda menampilkan nilai dunia nyata yang benar-benar diwakilinya. Ini memastikan informasi yang ditampilkan tepat dan bebas kesalahan, mencerminkan keadaan data yang sesungguhnya. Misalnya, jika data Anda akurat, data tersebut akan memiliki: Informasi yang Tepat dan Bebas Kesalahan, Nilai Numerik yang Benar, Teks Bebas Salah Ketik, dan Tanggal yang Tepat.
- Kelengkapan: Data yang lengkap memuat semua informasi yang diperlukan untuk analisis. Jika data Anda tidak lengkap dan rincian penting hilang, hasil bisa menjadi bias. Pastikan untuk mengisi kekosongan atau memperhitungkan nilai yang hilang dalam analisis Anda. Untuk menangani data yang hilang, pastikan untuk Menginput Nilai Berdasarkan Pengamatan Lain, Mengganti Nilai yang Hilang dengan Placeholder, dan Menghapus Rekaman yang Tidak Lengkap.
- Konsistensi: Konsistensi berarti data tetap seragam di berbagai dataset dan periode. Data yang bersih akan menggunakan format dan satuan pengukuran yang sama sepanjang dataset.
- Keseragaman: Keseragaman atau standardisasi berarti semua data ditampilkan dalam satu format dan struktur yang koheren—sebaiknya berupa satu tipe data atau satu kategori. Ini mencakup penggunaan satuan ukur yang sama atau pemformatan tanggal dan pelabelan dalam kategori.
- Validitas: Validitas berarti nilai data berada dalam rentang yang dapat diterima dan sesuai dengan pola yang diharapkan. Misalnya, jika entri usia yang valid harus antara 0 dan 120 tahun, aturan dan pemeriksaan validasi akan diterapkan untuk memastikan data memenuhi kriteria tersebut. Ini mencegah pencilan dan entri yang keliru memengaruhi hasil.
Cara Membersihkan Data di Excel
Membersihkan data di Excel berarti memoles data mentah. Berbeda dengan validasi data, yang merupakan fitur spesifik di toolbar Excel, pembersihan data adalah istilah umum yang mencakup beragam alat dan teknik. Pada bagian berikut, kita akan membahas setiap gagasan berikut:
- Pembersihan Dasar: Pembersihan dasar mencakup penanganan masalah umum seperti spasi berlebih, sel kosong, dan kesalahan ejaan untuk memastikan dataset bersih dan konsisten.
- Penanganan Kesalahan dan Validasi: Penanganan kesalahan dan validasi berfokus pada identifikasi dan koreksi kesalahan serta menjaga integritas data Anda dengan menghapus duplikat.
- Operasi Teks: Operasi teks mencakup manipulasi dan pemformatan data teks agar sesuai dengan kebutuhan Anda, termasuk penggabungan (concatenation) dan mengubah kapitalisasi.
- Transformasi Data: Teknik transformasi data digunakan untuk mengatur ulang dan membentuk ulang data Anda agar analisis lebih baik, termasuk mem-parsing teks dan menggunakan alat seperti Flash Fill.
- Perbaikan Numerik dan Tanggal: Perbaikan numerik dan tanggal mencakup koreksi dan standarisasi data numerik dan tanggal agar akurat dan diformat secara konsisten.
- Manajemen Data Lanjutan: Manajemen data lanjutan mencakup merekonsiliasi dan menggabungkan dataset untuk membuat dataset yang menyeluruh dan kohesif untuk analisis.
Pembersihan Data Dasar di Excel
Mari kita lihat pembersihan dasar, yang mencakup penanganan masalah umum seperti menghapus spasi berlebih.
Hilangkan spasi berlebih
Spasi putih di akhir dapat mengganggu atau menimbulkan masalah karena dapat menyebabkan inkonsistensi dalam analisis data dan masalah pemformatan.
Ada dua cara utama untuk menghilangkan spasi berlebih di Excel. Mari kita bahas keduanya.
Hilangkan spasi berlebih menggunakan Find and Replace
Berikut langkah-langkah untuk menghilangkan spasi berlebih.
Pilih rentang sel tempat Anda ingin menghapus spasi berlebih.
Gunakan pintasan Ctrl + H untuk membuka kotak dialog Find and Replace.
Di kolom Find what, tekan spasi dua kali untuk memasukkan dua spasi.
Di kolom Replace with, tekan spasi sekali untuk memasukkan satu spasi.
Klik Replace All.
Ulangi proses hingga tidak ada lagi spasi ganda yang ditemukan.
Kotak dialog find and replace. Sumber: Gambar oleh Penulis
Hilangkan spasi berlebih menggunakan TRIM
Buat kolom baru untuk data yang telah dibersihkan.
Masukkan rumus
=TRIM(cell_with_extra_spaces)di sel pertama kolom baru.Klik ganda sudut kanan bawah sel untuk menerapkan rumus ke baris lainnya.
Salin data yang telah dibersihkan dan tempel sebagai nilai untuk menghapus rumusnya.
Pilih dan tangani semua sel kosong
Sel kosong dapat menyebabkan masalah dengan memutus rumus, menimbulkan kesalahan perhitungan, dan menghasilkan analisis yang tidak akurat. Berikut cara menanganinya.
Sorot rentang sel tempat Anda ingin menemukan dan menangani sel kosong.
Tekan Ctrl + G untuk membuka kotak dialog Go To.
Klik tombol “Special…”. Ini akan membuka kotak dialog Go To Special.
Pilih opsi Blanks dan klik OK. Kini Anda akan melihat semua sel kosong dalam rentang yang dipilih tersorot.
Sekarang Anda dapat memasukkan nilai atau rumus. Tekan Ctrl + Enter.
Pilih dan tangani sel kosong. Sumber: Gambar oleh Penulis
Pemeriksaan ejaan
Kata yang salah eja dapat membuat data terlihat tidak profesional dan sulit dipahami, jadi penting untuk memperbaikinya.
Periksa seluruh lembar kerja atau rentang tertentu.
Buka tab Review pada Ribbon.
Klik tombol Spelling di grup Proofing.
Kotak dialog Spelling akan terbuka, menampilkan kata salah eja pertama yang terdeteksi beserta saran perbaikannya.
Tinjau dan perbaiki kata yang salah eja sesuai kebutuhan.
Pemeriksaan ejaan. Sumber: Gambar oleh Penulis
Penanganan Kesalahan dan Validasi di Excel
Mari kita lihat penanganan kesalahan, yang mencakup penanganan masalah umum seperti menyorot kesalahan atau menghapus duplikat.
Sorot kesalahan
Kesalahan dalam data dapat menghasilkan hasil yang tidak tepat dan keputusan yang buruk, sehingga penting untuk mengidentifikasi dan menanganinya. Mari kita lihat cara mengatasinya.
Pilih rentang sel yang ingin Anda periksa kesalahannya.
Buka tab Home pada Ribbon.
Di grup Styles, klik Conditional Formatting.
Pilih New Rule dari menu tarik-turun.
Pilih Use a formula untuk menentukan sel yang akan diformat.
Masukkan rumus
=ISERROR(cell)pada kolom Format values where this formula is true.Klik tombol Format… untuk memilih opsi pemformatan yang diinginkan.
Klik OK setelah memilih opsi pemformatan Anda.
Klik OK lagi pada kotak dialog New Formatting Rule untuk menerapkan aturan.
Menggunakan conditional formatting. Sumber: Gambar oleh Penulis
Hapus duplikat
Entri duplikat dapat mendistorsi analisis dan wawasan, sehingga menghapusnya memastikan keakuratan data.
Pilih lembar kerja atau rentang sel tempat Anda ingin menghapus duplikat.
Buka tab Data pada Ribbon.
Klik Remove Duplicates di grup Data Tools.
Pada kotak dialog Remove Duplicates, tentukan kolom mana yang akan diperiksa duplikatnya.
Klik OK. Excel akan menampilkan pesan jumlah nilai duplikat yang dihapus.
Hapus baris duplikat
Baris duplikat dapat membuat data berantakan dan memengaruhi keandalan analisis Anda. Berikut cara menanganinya.
Pilih rentang dari mana Anda ingin menghapus baris duplikat.
Buka tab Data pada Ribbon dan klik Advanced di grup Sort & Filter.
Pada kotak dialog Advanced Filter, pilih Copy to another location.
Atur List range ke rentang yang Anda pilih.
Atur kolom Copy to ke sel tempat Anda ingin menyalin baris unik.
Centang kotak Unique Records Only lalu klik OK.
Operasi Teks di Excel
Mari kita lihat operasi teks seperti menggabungkan string.
Concatenate
Menggabungkan beberapa string teks ke dalam satu sel dapat membantu menciptakan data yang lebih bermakna dan teratur dengan menggabungkan informasi dari berbagai sumber ke dalam satu format yang kohesif.
- Pilih sel tempat Anda ingin hasil penggabungan ditampilkan.
- Ketik
=CONCATENATE(). - Pilih sel yang ingin Anda gabungkan, dipisahkan dengan koma atau operator &.
- Tekan Enter untuk melihat hasilnya.
Menggabungkan sel. Sumber: Gambar oleh Penulis
Mengubah kapitalisasi teks
Keseragaman kapitalisasi teks dapat meningkatkan keterbacaan dan menjaga konsistensi data Anda. Mari kita atur.
Buat kolom baru untuk teks yang telah dikonversi.
Masukkan rumus di sebuah sel:
=UPPER()atau=LOWER()atau=PROPER()- Tekan Enter untuk menerapkan rumus.
Seret fill handle untuk menerapkan rumus ke sel lain jika diperlukan.
Mengubah kapitalisasi teks. Sumber: Gambar oleh Penulis
Menghapus karakter noncetak dari teks
Karakter noncetak seperti tab, jeda baris, dan karakter khusus dapat menimbulkan masalah karena mengganggu pemrosesan data, sehingga sulit untuk menganalisis atau memvisualisasikan data dengan benar.
Identifikasi karakter noncetak yang perlu Anda hapus.
Pilih sel yang berisi teks dengan karakter noncetak.
Pada sel baru, gunakan fungsi berikut:
=CLEAN(text).Untuk menghapus spasi berlebih dan karakter noncetak, gunakan:
=TRIM(CLEAN(text)).Salin dan tempel teks yang telah dibersihkan untuk menggantikan teks asli.
Menggunakan fungsi CLEAN di Excel. Sumber: Gambar oleh Penulis
Transformasi Data di Excel
Teknik transformasi data digunakan untuk mengatur ulang dan membentuk ulang data Anda agar analisis lebih baik, termasuk mem-parsing teks dan menggunakan alat seperti Flash Fill.
Parsing data dari teks ke kolom
Memisahkan data teks ke kolom-kolom individual memudahkan analisis komponen tertentu dan memastikan setiap potongan informasi dikategorikan secara jelas. Ini kebalikan dari penggabungan (concatenation) dan berguna untuk memecah data kompleks menjadi bagian yang lebih mudah dikelola. Berikut langkah-langkahnya.
Pilih data yang ingin Anda bagi.
Buka tab Data dan klik Text to Columns.
Pilih Delimited atau Fixed Width lalu klik Next.
Untuk Delimited, centang delimiter yang digunakan data Anda lalu klik Next.
Untuk Fixed Width, atur pemisah kolom di jendela Data Preview lalu klik Next.
Pilih format data untuk setiap kolom.
Klik Finish.
Menggunakan text to columns untuk parsing data. Sumber: Gambar oleh Penulis
Flash fill
Flash Fill secara otomatis mengisi nilai berdasarkan pola yang terdeteksi dalam data Anda. Berikut cara menggunakan Flash Fill di Excel:
Masukkan data mengikuti pola pada sel di sebelah data yang sudah ada.
Berikan contoh lain di sel berikutnya untuk membantu Excel mendeteksi polanya.
Pilih sel yang berisi contoh.
Buka tab Data pada Ribbon.
Klik Flash Fill di grup Data Tools.
Excel akan otomatis mengisi sisa sel berdasarkan pola yang terdeteksi.
Menggabungkan dan membagi kolom
Menggabungkan dan membagi kolom membantu mengatur data agar paling sesuai dengan kebutuhan analisis Anda. Ikuti langkah berikut untuk menggabungkan sel:
- Buka tab Home, lalu klik menu tarik-turun Merge & Center di grup Alignment .
- Pilih opsi penggabungan yang Anda inginkan.
Ikuti langkah berikut untuk membagi kolom:
- Buka tab Data dan klik Text to Columns di grup Data Tools .
- Pilih delimited atau fixed width sesuai kebutuhan data Anda.
- Pilih tujuan hasil pemisahan data dan klik Finish.
Mentransformasi dan menata ulang kolom dan baris
Menata ulang data dapat membantu menyajikannya dalam format yang lebih logis dan mudah diakses. Untuk mentransformasi baris ke baris dan kolom ke kolom:
Sorot data yang ingin Anda transformasi (termasuk header bila perlu).
Klik kanan pilihan lalu pilih Copyatau tekan Ctrl+C.
Pilih sel tempat data hasil transformasi akan ditempatkan.
Klik kanan sel tujuan, pilih Paste Special lalu pilih Transpose.
Anda juga dapat menggunakan Ctrl+Alt+V untuk membuka kotak dialog Paste Special, lalu centang opsi Transpose dan klik OK.
Untuk menata ulang kolom/baris:
Klik header kolom untuk memilih seluruh kolom yang ingin Anda pindahkan.
Klik kanan dan pilih Cutatau tekan Ctrl+X.
Pilih kolom tujuan, klik kanan header kolom tersebut, lalu pilih Insert Cut Cells.
Demikian pula untuk baris, pilih dan potong baris yang ingin dipindahkan ke baris lain lalu tempel di sana.
Perbaikan Numerik dan Tanggal di Excel
Perbaikan numerik dan tanggal mencakup koreksi dan standarisasi data numerik serta tanggal agar akurat dan diformat secara konsisten.
Memperbaiki angka dan tanda angka
Format angka yang salah dapat menyebabkan masalah berupa salah tafsir dan kesalahan perhitungan, serta masalah pengurutan dan perbandingan data.
- Pilih sel yang berisi angka yang perlu diperbaiki.
- Buka tab Home, klik menu tarik-turun Number di grup Number , lalu pilih format angka yang sesuai (misalnya, General, Number, Currency).
Memperbaiki tanggal dan waktu
Tanggal yang diformat dengan benar sangat penting untuk analisis dan pelaporan berbasis waktu yang akurat.
Sorot sel yang berisi tanggal.
Buka tab Home.
Klik menu tarik-turun Number Format dan pilih Short Date atau Long Date.
Manajemen Data Lanjutan di Excel
Manajemen data lanjutan mencakup merekonsiliasi dan menggabungkan dataset untuk membuat dataset yang komprehensif dan kohesif untuk analisis.
Merekonsiliasi data tabel dengan join atau pencocokan
Menggabungkan atau mencocokkan data dari tabel yang berbeda memastikan analisis yang menyeluruh dan kohesif.
Menggunakan VLOOKUP untuk mencocokkan data:
-
Pastikan kedua tabel dapat diakses pada lembar kerja yang sama.
-
Pilih sel tempat Anda ingin menampilkan data yang cocok.
-
Gunakan fungsi berikut:
=VLOOKUP(lookup_value, table_array, col_index_num, FALSE) -
Seret fill handle untuk menyalin rumus ke sel lain sesuai kebutuhan.
Menggunakan INDEX dan MATCH untuk fleksibilitas lebih
-
Pilih sel tempat Anda ingin menampilkan data yang cocok.
-
Gunakan kombinasi fungsi berikut:
=INDEX(array, MATCH(lookup_value, lookup_array, 0)) -
Seret fill handle untuk menyalin rumus ke sel lain sesuai kebutuhan.
Penutup
Ada banyak fungsi pembersihan data di Excel yang memungkinkan Anda membersihkan dan memvalidasi data agar memenuhi standar yang ditetapkan. Ini dapat membantu mengurangi kesalahan dan meningkatkan kualitas dataset Anda. Untuk menggali lebih dalam kemampuan Excel, pertimbangkan untuk mendaftar ke kursus Introduction to Excel kami.
Di luar itu, baik Anda membersihkan data untuk menghapus field duplikat atau menstandarkan format entri data, Excel memiliki semua alat yang Anda butuhkan untuk mempermudah proses ini. Jika Anda ingin meningkatkan keterampilan persiapan data, kursus Data Preparation in Excel kami menawarkan pembahasan komprehensif mengenai topik ini.
Untuk lebih meningkatkan keterampilan analitis Anda, Anda mungkin akan menemukan kursus Data Analysis in Excel sangat berguna. Kursus ini membahas seluk-beluk menganalisis data setelah pembersihan. Selain itu, jika Anda tertarik pada bagaimana data yang bersih mendukung peramalan keuangan, kursus Financial Modeling in Excel mungkin sangat menarik.
Jika Anda ingin memperluas keterampilan pembersihan data, pertimbangkan Power Query, yang merupakan alat fleksibel dan efektif bawaan Excel dan Power BI yang memungkinkan Anda mengimpor dan mentransformasi data dengan mulus. Pertimbangkan juga untuk menjelajahi Data Cleaning in Python atau Cleaning Data in R. Kursus-kursus ini menawarkan teknik yang tangguh dan praktik terbaik untuk pembersihan data menggunakan bahasa pemrograman populer.
Saya seorang ahli strategi konten yang senang menyederhanakan topik kompleks. Saya telah membantu perusahaan seperti Splunk, Hackernoon, dan Tiiny Host membuat konten yang menarik dan informatif untuk audiens mereka.
Pertanyaan yang Sering Diajukan
Apa lima langkah dalam proses pembersihan data?
Lima langkah tersebut adalah menghapus duplikat, menangani data yang hilang, memperbaiki kesalahan struktural, memfilter pencilan, dan memvalidasi data.
Apa perbedaan antara pembersihan data dan transformasi data?
Membersihkan data mencakup mengidentifikasi dan memperbaiki kesalahan serta ketidakakuratan dalam dataset untuk memastikan keandalannya. Dalam transformasi data, Anda mengonversi data dari satu format atau struktur ke format lain agar sesuai untuk analisis. Jadi pembersihan data memastikan dataset akurat, sedangkan transformasi mengonversi data yang sudah dibersihkan ke format yang diperlukan untuk analisis atau pelaporan.

