Program
Sebagai seorang profesional data science, Anda sering kali harus menganalisis, menguji, dan menetapkan hubungan antarvariabel dalam suatu dataset untuk menarik kesimpulan yang bermakna. Konsep yang disebut pengujian hipotesis, bersama dengan beberapa uji seperti uji t dan uji z, adalah beberapa alat yang umum digunakan dalam analitik untuk menetapkan hubungan antar titik data.
Tutorial ini akan mengajarkan perbedaan antara uji t dan uji Z dengan contoh nyata. Saya juga akan menyediakan sumber belajar tambahan untuk pendalaman.
Ringkasan Singkat: uji t vs. uji Z
Memilih antara uji t dan uji Z dapat diringkas dengan panduan berikut:
- Gunakan uji t: Ketika ukuran sampel kecil (n < 30) dan/atau varians populasi tidak diketahui.
- Gunakan uji Z: Ketika ukuran sampel besar (n ≥ 30) dan varians populasi diketahui.
Pada kedua kasus, kita mengharapkan data berdistribusi normal. Teruskan membaca untuk mempelajari setiap uji dan perbedaannya secara detail. Pertama, kita mulai dengan pengantar singkat tentang pengujian hipotesis.
Pengantar Pengujian Hipotesis
Pengujian hipotesis adalah metode statistik fundamental untuk menyimpulkan parameter populasi berdasarkan data sampel. Ini memberikan pendekatan terstruktur untuk mengevaluasi klaim atau asumsi tentang suatu populasi menggunakan bukti empiris.
Inti dari pengujian hipotesis adalah dua pernyataan yang saling melengkapi:
- Hipotesis nol (H₀) adalah pernyataan tidak adanya efek, perbedaan, atau hubungan. Ini merepresentasikan status quo atau pemahaman saat ini.
- Hipotesis alternatif (H₁) adalah pernyataan yang bertentangan dengan hipotesis nol. Ini mewakili klaim atau pemahaman baru yang ingin dibuktikan peneliti.
Sebagai contoh, misalkan Anda ingin menentukan apakah metode pengajaran baru meningkatkan nilai ujian siswa. Anda mungkin menyusun hipotesis berikut:
- Hipotesis nol (H₀): Metode pengajaran baru tidak berpengaruh pada nilai ujian siswa.
- Hipotesis alternatif (H₁): Metode pengajaran baru meningkatkan nilai ujian siswa.
Pengujian hipotesis melibatkan pengumpulan data sampel, menghitung statistik uji, dan menentukan probabilitas mengamati hasil tersebut jika hipotesis nol benar. Berdasarkan probabilitas ini, kita dapat memutuskan apakah akan menolak hipotesis nol demi hipotesis alternatif atau gagal menolaknya.
Bergantung pada tipe data dan pertanyaan riset yang diuji, tersedia beberapa uji statistik untuk pengujian hipotesis. Dalam tutorial ini, kita akan berfokus pada uji t dan uji Z.
Apa itu uji t?
Uji t adalah uji statistik yang digunakan untuk menentukan apakah ada perbedaan yang signifikan antara rata-rata dua kelompok atau antara rata-rata sampel dan nilai yang diketahui. Uji ini sangat berguna ketika berhadapan dengan ukuran sampel kecil atau ketika simpangan baku populasi tidak diketahui.
Statistik uji t untuk uji t satu sampel dihitung menggunakan rumus:

Persamaan uji t. Gambar oleh Penulis.
dengan:
- Xˉ adalah rata-rata sampel
- μ adalah rata-rata populasi (atau rata-rata kelompok pembanding)
- s adalah simpangan baku sampel, dan
- n adalah ukuran sampel.
Jenis-jenis uji t
Ada tiga jenis utama uji t. Masing-masing membandingkan rata-rata dalam kondisi yang berbeda:
- Uji t satu sampel: Uji ini membandingkan rata-rata satu sampel dengan nilai yang diketahui atau rata-rata populasi. Uji ini menentukan apakah rata-rata sampel menyimpang secara signifikan dari tolok ukur tertentu. Misalnya, kita dapat menggunakan uji t satu sampel untuk mengevaluasi apakah nilai rata-rata sebuah kelas kecil berbeda dari rata-rata nasional.
- Uji t dua sampel independen: Uji ini membandingkan rata-rata dua kelompok independen untuk menentukan apakah ada perbedaan yang signifikan secara statistik di antara keduanya. Ini umum digunakan dalam eksperimen di mana dua kelompok menjalani perlakuan atau kondisi yang berbeda. Misalnya, kita dapat menggunakan uji t dua sampel independen untuk membandingkan nilai ujian antara siswa yang diajar dengan dua metode pengajaran berbeda untuk melihat apakah salah satunya lebih efektif.
- Uji t berpasangan: Uji ini membandingkan rata-rata dari kelompok yang sama pada waktu berbeda atau di bawah kondisi berbeda. Uji ini mengevaluasi apakah ada perubahan signifikan dalam kelompok yang sama setelah intervensi atau dari waktu ke waktu. Contohnya adalah mengukur kinerja siswa sebelum dan sesudah menerapkan strategi pengajaran baru untuk menilai dampaknya.
Asumsi-asumsi uji t
Uji t bergantung pada asumsi tertentu untuk memberikan hasil yang valid:
- Kenormalan data: Uji t mengasumsikan bahwa data pada tiap kelompok berdistribusi mendekati normal. Ini sangat penting ketika berhadapan dengan ukuran sampel kecil. Jika data tidak berdistribusi normal, hasil uji t dapat menjadi tidak andal.
- Keseragaman varians: Untuk uji t dua sampel independen, varians dari dua kelompok yang dibandingkan diasumsikan sama. Asumsi ini memastikan uji t memperhitungkan variabilitas dalam masing-masing kelompok dengan benar. Jika varians tidak sama, hal ini dapat memengaruhi akurasi uji.
- Independensi pengamatan: Pengamatan dalam tiap kelompok harus independen. Artinya, nilai satu pengamatan tidak boleh memengaruhi atau terkait dengan nilai pengamatan lainnya. Pelanggaran asumsi ini dapat menyebabkan kesimpulan yang keliru.
Penting untuk memeriksa asumsi-asumsi ini sebelum menerapkan uji t dalam analisis apa pun demi memastikan keabsahan hasil. Baca Tutorial Uji t di R atau Pengantar Uji t di Python kami untuk mempelajari cara melakukan uji t di R atau Python.
Apa itu uji Z?
Uji Z adalah uji statistik yang digunakan untuk menentukan apakah terdapat perbedaan yang signifikan antara rata-rata sampel dan rata-rata populasi atau antara rata-rata dua kelompok ketika varians populasi diketahui dan ukuran sampel besar.
Uji ini terutama digunakan ketika ukuran sampel melebihi 30, sehingga memungkinkan penggunaan distribusi normal untuk mendekati distribusi statistik uji.
Statistik uji Z untuk uji Z satu sampel dihitung menggunakan rumus:

Persamaan uji Z. Gambar oleh Penulis.
dengan:
- Xˉ adalah rata-rata sampel,
- μ adalah rata-rata populasi,
- σ adalah simpangan baku populasi, dan
- n adalah ukuran sampel.
Jenis-jenis uji Z
Ada tiga jenis utama uji Z:
- Uji Z satu sampel: Uji ini membandingkan rata-rata satu sampel dengan rata-rata populasi yang diketahui. Uji ini digunakan ketika Anda ingin menilai apakah rata-rata sampel menyimpang secara signifikan dari rata-rata populasi, dengan asumsi varians populasi diketahui. Misalnya, uji Z satu sampel dapat digunakan untuk menentukan apakah tinggi rata-rata sekelompok orang yang berjumlah lebih dari 30 berbeda dari tinggi rata-rata nasional yang diketahui.
- Uji Z dua sampel: Uji ini membandingkan rata-rata dua sampel independen untuk menentukan apakah ada perbedaan signifikan di antara keduanya. Uji ini digunakan ketika kedua sampel besar dan varians populasi diketahui. Contohnya adalah membandingkan nilai ujian rata-rata siswa dari dua sekolah berbeda untuk melihat apakah ada perbedaan kinerja yang signifikan di antara keduanya.
- Uji Z proporsi: Uji ini membandingkan proporsi suatu karakteristik tertentu dalam sebuah sampel dengan proporsi populasi yang diketahui atau antara dua proporsi sampel. Uji ini digunakan untuk mengevaluasi apakah proporsi yang diamati dalam sampel berbeda secara signifikan dari yang diharapkan berdasarkan proporsi populasi. Misalnya, uji Z proporsi dapat digunakan untuk membandingkan proporsi pemilih yang mendukung kandidat tertentu dalam sampel dengan proporsi yang diamati pada pemilihan sebelumnya.
Ada variasi tambahan dari uji ini, seperti uji Z berpasangan, uji Z untuk koefisien regresi, dan uji Z untuk perbedaan rata-rata.
Asumsi-asumsi uji Z
Uji Z bergantung pada asumsi tertentu untuk memberikan hasil yang valid:
- Varians populasi diketahui: Uji Z mengasumsikan varians populasi diketahui. Ini merupakan pembedaan utama dari uji t, di mana varians populasi biasanya tidak diketahui. Varians yang diketahui memungkinkan penggunaan distribusi z untuk menilai signifikansi statistik uji.
- Ukuran sampel besar: Uji Z mengasumsikan ukuran sampel besar, umumnya lebih dari 30. Dengan sampel yang lebih besar, distribusi penarikan ulang rata-rata sampel mendekati distribusi normal, meskipun data asli tidak berdistribusi normal, sesuai Teorema Limit Pusat.
- Distribusi normal populasi: Data diasumsikan diambil dari populasi yang berdistribusi normal. Asumsi ini kurang kritis untuk sampel besar tetapi tetap penting ketika ukuran sampel sedang.
Perbedaan Utama antara uji t dan uji Z
Uji t dan uji Z digunakan untuk membandingkan statistik sampel dengan parameter populasi, tetapi keduanya berbeda dalam asumsi dasar, penerapan, dan kondisi di mana masing-masing paling tepat digunakan. Mari kita analisis dan pahami perbedaan antara kedua uji tersebut:
Pertimbangan ukuran sampel
- Uji t: Uji t biasanya digunakan ketika ukuran sampel kecil, umumnya kurang dari 30. Uji ini dirancang untuk tetap andal ketika ukuran sampel tidak memenuhi ambang yang diperlukan untuk menerapkan Teorema Limit Pusat.
- Uji Z: Uji Z digunakan ketika ukuran sampel besar, biasanya lebih dari 30. Pada sampel besar, distribusi penarikan ulang rata-rata mendekati normal, yang membenarkan penggunaan uji Z.
Pengetahuan varians populasi
- Uji t: Uji t digunakan ketika varians populasi tidak diketahui. Sebagai pengganti varians populasi, varians sampel digunakan untuk menghitung statistik uji. Distribusi t, yang memiliki ekor lebih tebal daripada distribusi normal, memperhitungkan ketidakpastian tambahan karena memperkirakan varians populasi.
- Uji Z: Uji Z mensyaratkan varians populasi diketahui. Ini adalah asumsi kunci karena memungkinkan penggunaan distribusi normal baku untuk menghitung statistik uji. Ketika varians populasi diketahui, uji Z memberikan estimasi yang lebih presisi.
Asumsi distribusi
- Uji t: Uji t mengasumsikan bahwa data dalam tiap kelompok berdistribusi mendekati normal. Ini terutama penting saat berhadapan dengan ukuran sampel kecil. Statistik uji pada uji t mengikuti distribusi t, yang memiliki ekor lebih lebar dibanding distribusi normal. Ini memperhitungkan variabilitas dan ketidakpastian tambahan saat memperkirakan simpangan baku populasi dari sampel kecil.
- Uji Z: Uji Z mengasumsikan data berdistribusi normal atau ukuran sampel cukup besar untuk menerapkan Teorema Limit Pusat. Teorema Limit Pusat memastikan bahwa, untuk sampel besar, distribusi penarikan ulang rata-rata mendekati normal, bahkan jika data dasarnya tidak sepenuhnya normal.
Aplikasi praktis dan kasus penggunaan
- Uji t: Uji t lazim digunakan dalam studi bersampel kecil, seperti studi perintis, ketika varians populasi tidak diketahui. Contohnya termasuk membandingkan efektivitas dua perlakuan pada kelompok kecil atau menilai perubahan dalam kelompok yang sama dari waktu ke waktu.
- Uji Z: Uji Z digunakan dalam studi bersampel besar atau saat berhadapan dengan populasi yang sudah mapan di mana varians diketahui. Uji ini sering diterapkan dalam pengendalian mutu, analisis survei, dan studi eksperimental skala besar.
Berikut adalah tabel dengan perbedaan utama:
Perbedaan utama antara uji t dan uji Z. Gambar oleh Penulis.
Kesimpulan
Tutorial ini memperkenalkan Anda pada pengujian hipotesis dan dua uji yang umum digunakan—uji t dan uji z. Kita juga mempelajari definisi, jenis-jenis, dan asumsi masing-masing uji serta memahami perbedaan utamanya. Kita menyimpulkan uji mana yang paling tepat digunakan pada skenario tertentu, sehingga memungkinkan Anda menetapkan hubungan antarvariabel dengan yakin melalui pengujian hipotesis.
Setelah memantapkan konsep statistik di balik pengujian hipotesis dengan kursus Introduction to Statistics kami, saya mendorong Anda untuk mengimplementasikan konsep-konsep ini melalui teknologi populer mana pun menggunakan sumber berikut:
- Kursus Hypothesis Testing in Python
- Kursus Hypothesis Testing in R
- Tutorial Hypothesis Testing (uji chi-square) di Excel
Selamat belajar!
Sebagai senior data scientist, saya merancang, mengembangkan, dan menerapkan solusi machine learning berskala besar untuk membantu bisnis membuat keputusan yang lebih baik berbasis data. Sebagai penulis di bidang data science, saya berbagi pembelajaran, saran karier, dan tutorial praktis yang mendalam.
Pertanyaan yang Sering Diajukan
Apa perbedaan utama antara uji t dan uji Z?
Perbedaan utama adalah uji t digunakan untuk ukuran sampel kecil (n <30) atau ketika varians populasi tidak diketahui dan menggunakan distribusi t. Uji Z digunakan untuk ukuran sampel besar ( n>30) dengan varians populasi yang diketahui dan bergantung pada distribusi normal.
Kapan saya harus menggunakan uji t satu sampel dibanding uji Z?
Gunakan uji t satu sampel saat Anda membandingkan rata-rata satu sampel dengan rata-rata populasi yang diketahui dan varians populasi tidak diketahui. Jika ukuran sampel besar dan varians populasi diketahui, Anda sebaiknya menggunakan uji Z satu sampel.
Apa peran distribusi t dalam uji t?
Distribusi t digunakan dalam uji t untuk memperhitungkan variabilitas dan ketidakpastian tambahan pada statistik uji ketika ukuran sampel kecil dan varians populasi tidak diketahui.
Dapatkah saya menggunakan uji Z jika saya tidak mengetahui varians populasi?
Tidak, uji Z mensyaratkan varians populasi diketahui. Jika varians populasi tidak diketahui, Anda harus menggunakan uji t, yang memperkirakan varians dari data sampel.
Bagaimana cara menentukan apakah harus menggunakan uji t berpasangan atau uji t dua sampel independen?
Gunakan uji t berpasangan saat Anda membandingkan rata-rata dari kelompok yang sama pada waktu berbeda atau di bawah kondisi berbeda (misalnya, sebelum dan sesudah intervensi). Gunakan uji t dua sampel independen saat membandingkan rata-rata dari dua kelompok berbeda yang tidak saling terkait (misalnya, membandingkan nilai dari dua kelas atau perlakuan yang berbeda).

