
Pendahuluan
Misalkan Anda memiliki dua grup tim penjualan dan ingin memeriksa apakah rata-rata jumlah ponsel yang terjual dalam seminggu oleh kedua tim sama atau tidak. Bagaimana Anda akan membandingkan kinerjanya?
Anda akan mengambil rata-rata jumlah ponsel yang terjual ke 200 pelanggan acak oleh masing-masing tim dan menentukan perbedaannya. Tim pemasaran pertama, rata-rata, menjual 120 ponsel, sedangkan tim kedua menjual 80.
Jadi, jelas bahwa tim pertama tampil lebih baik dalam penjualan daripada tim kedua. Benarkah? Kita tidak bisa yakin; dataset dikumpulkan dari pelanggan acak dan tidak mewakili semua orang yang membeli ponsel pada minggu tersebut.
Lalu bagaimana kita menentukan tim mana yang tampil lebih baik? Kita akan menggunakan t-test untuk memahami apakah perbedaan antara dua rata-rata tersebut nyata atau hanya kebetulan semata.
T-test adalah uji hipotesis statistik yang mengambil sampel dari kedua grup untuk menentukan apakah ada perbedaan signifikan antara rata-rata kedua grup. Bagaimana cara kerjanya? Uji ini membandingkan rata-rata sampel dan simpangan baku sambil mempertimbangkan ukuran sampel dan tingkat variasi data.
Dalam tutorial ini, kita akan mempelajari klasifikasi t-test (satu sampel, dua sampel, dan t-test berpasangan) dengan contoh kode R dan cara menafsirkan hasilnya.
Catatan: jika Anda baru mengenal R, ikuti kursus mini Introduction to R Programming untuk memahami dasar-dasarnya.
Fungsi t.test() di R
Bahasa R menyediakan fungsi bawaan t.test yang sederhana untuk t-test Satu Sampel, Dua Sampel, dan Berpasangan.
Ada dua cara menggunakan fungsi t.test: metode default dan formula.
Metode default
Anda memberikan sampel numerik dari grup x dan grup y, menentukan hipotesis alternative, mean yang dihipotesiskan mu, dan tingkat kepercayaan interval. Selain itu, Anda dapat melakukan t-test Berpasangan dengan mengaktifkan argumen paired dan t-test Dua Sampel dengan varians sama dengan mengubah argumen var.equal.
t.test(x, y,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, ...)
Metode formula
Dalam metode ini, Anda memberikan formula x~y, di mana x adalah vektor numerik atau kolom dari data, dan y adalah kolom biner yang berisi jenis grup.
t.test(formula, data, subset, na.action, ...)
Cara Melakukan t-test Satu Sampel di R
T-test satu sampel adalah uji hipotesis statistik untuk menguji apakah ada perbedaan signifikan antara rata-rata sampel dan rata-rata populasi yang dihipotesiskan atau diasumsikan. Uji ini membandingkan rata-rata sampel dengan rata-rata hipotesis, sambil mempertimbangkan keragaman dalam data.

- x̄1 = Rata-rata sampel
- μ = Rata-rata populasi yang dihipotesiskan
- s = Simpangan baku sampel
- n = Ukuran sampel
Dalam tutorial ini, kita akan menggunakan dataset R Carbon Dioxide Uptake in Grass Plants untuk contoh kode t-test. Dataset ini memiliki 84 baris dan 5 kolom, dan dikumpulkan dari eksperimen untuk menguji toleransi dingin spesies rumput Echinochloa crus-galli. Kita akan terutama mempertimbangkan kolom uptake, Treatment, dan Type untuk pengujian kita.
head(CO2)

Pada contoh ini, kita akan menggunakan kolom conc (konsentrasi karbon dioksida) dari dataset.
Kita dapat mengamati rata-rata, distribusi, dan pencilan menggunakan boxplot.
boxplot(CO2$conc)

Untuk t-test satu sampel, kita akan menggunakan `t.test(x,mu=0)`. Di mana x adalah variabel, mu ditetapkan oleh hipotesis nol. Dalam kasus kita, nilainya 550.
t.test(CO2$conc, mu = 550)
Hasil:
Konsentrasi karbon dioksida tidak sama dengan 550 dan secara signifikan lebih rendah daripada rata-rata populasi yang dihipotesiskan.
One Sample t-test
data: CO2$conc
t = -3.5617, df = 83, p-value = 0.0006134
alternative hypothesis: true mean is not equal to 550
95 percent confidence interval:
370.7805 499.2195
sample estimates:
mean of x
435
Cara Melakukan t-test Dua Sampel di R
Dalam t-test Dua Sampel, kita akan membandingkan laju penyerapan karbon dioksida dari dua jenis perlakuan: non-chilled dan chilled.
Kita dapat memvisualisasikan distribusi dua grup menggunakan boxplot.
plot(uptake ~ Treatment, data=CO2)
Welch Two Sample t-test
Ini adalah uji hipotesis statistik yang menyelidiki apakah ada perbedaan signifikan antara rata-rata dua grup independen yang mungkin memiliki varians tidak sama. Uji ini membandingkan rata-rata kedua grup sambil mempertimbangkan keragaman dalam masing-masing grup.

- x̄1 = Rata-rata sampel grup pertama
- x̄2 = Rata-rata sampel grup kedua
- n1 = Ukuran sampel grup pertama
- n2 = Ukuran sampel grup kedua
- s12 = Varians sampel grup pertama
- s22 = Varians sampel grup kedua
Secara default, fungsi t.test() mengasumsikan bahwa varians dua grup tidak sama (var.equal=FALSE). Jadi, kita tidak perlu melakukan perubahan apa pun.
Kita menggunakan metode formula untuk memperoleh hasil t-test, di mana uptake adalah vektor numerik dan Treatment adalah kolom kategori biner dari dataset CO2.
t.test(uptake ~ Treatment, data = CO2)
Hasil:
Ada perbedaan signifikan pada rata-rata kedua grup, dan grup nonchilled memiliki penyerapan lebih tinggi daripada grup chilled.
Welch Two Sample t-test
data: uptake by Treatment
t = 3.0485, df = 80.945, p-value = 0.003107
alternative hypothesis: true difference in means between group nonchilled and group chilled is not equal to 0
95 percent confidence interval:
2.382366 11.336682
sample estimates:
mean in group nonchilled mean in group chilled
30.64286 23.78333
T-test Dua Sampel dengan Varians Sama
T-test Dua Sampel adalah uji hipotesis statistik untuk menentukan apakah ada perbedaan signifikan antara rata-rata dua grup independen dengan asumsi bahwa varians kedua grup sama. Uji ini membandingkan rata-rata kedua grup sambil mempertimbangkan keragaman dalam masing-masing grup.

- x̄1 = Rata-rata sampel grup pertama
- x̄2 = Rata-rata sampel grup kedua
- n1 = Ukuran sampel grup pertama
- n2 = Ukuran sampel grup kedua
- sp = Simpangan baku gabungan
Untuk melakukan t-test Dua Sampel dengan varians sama, kita harus menetapkan var.equal TRUE dan menjalankan uji lagi dengan formula dan dataset yang sama.
t.test(uptake ~ Treatment, data = CO2, var.equal = TRUE)
Hasil:
Seperti yang terlihat, kita mendapatkan hasil yang hampir serupa bahwa ada perbedaan rata-rata yang signifikan antara kedua grup.
Two Sample t-test
data: uptake by Treatment
t = 3.0485, df = 82, p-value = 0.003096
alternative hypothesis: true difference in means between group nonchilled and group chilled is not equal to 0
95 percent confidence interval:
2.38324 11.33581
sample estimates:
mean in group nonchilled mean in group chilled
30.64286 23.78333
Cara Melakukan t-test Berpasangan di R
T-test berpasangan adalah uji hipotesis statistik yang digunakan untuk menentukan apakah ada perbedaan signifikan antara rata-rata dua sampel yang berhubungan atau berpasangan. Uji ini menghitung nilai t-test dengan membandingkan perbedaan antara observasi berpasangan sambil mempertimbangkan keragaman dalam perbedaannya.

- dࠡ = perbedaan rata-rata pada observasi berpasangan
- sd = simpangan baku dari perbedaan sampel
- n = jumlah pasangan
Untuk melakukan t-test Berpasangan di R, kita harus menetapkan paired argument TRUE dan menjalankan uji lagi dengan formula dan dataset yang sama.
t.test(uptake ~ Treatment, paired = TRUE, data = CO2)
Hasil:
Ada perbedaan yang signifikan secara statistik antara rata-rata kedua grup dengan mempertimbangkan nilai t dan p.
Paired t-test
data: uptake by Treatment
t = 7.939, df = 41, p-value = 8.051e-10
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
5.114589 8.604458
sample estimates:
mean difference
6.859524
Pada contoh kedua, kita akan melihat laju penyerapan untuk dua tipe tanaman yang sama. Satunya berasal dari Quebec, dan yang lain dari Mississippi.
plot(uptake ~ Type, data=CO2)

Mari periksa hasil t-test berpasangan dengan mengganti Treatment dengan Type dalam formula.
t.test(uptake ~ Type, paired = TRUE, data = CO2)
Hasil:
Sekali lagi, ada perbedaan signifikan antara rata-rata grup Quebec dan grup Mississippi.
Paired t-test
data: uptake by Type
t = 11.374, df = 41, p-value = 2.937e-14
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
10.41177 14.90727
sample estimates:
mean difference
12.65952
Coba t-test di R DataLab Workbook. Paket ini dilengkapi dengan sumber kode dan hasil. Anda juga dapat menduplikasi workbook dan mulai berlatih pada berbagai contoh.
Catatan: Landasan statistik yang kuat akan sangat berguna, apa pun industri Anda. Statistik adalah tulang punggung AI modern, dan Anda sebaiknya memulai perjalanan Anda dengan mengikuti jalur keterampilan Statistics Fundamentals with R.
Cara Menafsirkan Hasil t-test di R
Kita menghasilkan hasil, tetapi apa arti df, p-value, alternative hypothesis, atau sample estimates? Pada bagian ini, kita akan mempelajari cara menafsirkan hasil t-test di R.
Mari mulai dengan membuat dua grup menggunakan fungsi rnorm dan menjalankan t-test Dua Sampel.
set.seed(125)
group1 <- c(rnorm(100, mean = 24, sd = 3))
group2 <- c(rnorm(100, mean = 43, sd = 2.4))
t.test(group1, group2)
Keluaran:
Welch Two Sample t-test
data: group1 and group2
t = -47.765, df = 179.99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-19.51569 -17.96722
sample estimates:
mean of x mean of y
24.30063 43.04208
- data: data yang digunakan dalam t-test Dua Sampel (group1 dan group2)
- t: statistik uji t. Nilai t negatif -47,765 menunjukkan bahwa rata-rata sampel group1 secara signifikan lebih kecil daripada group2.
- df: derajat kebebasan yang terkait dengan nilai t-test.
- p-value: menunjukkan signifikansi statistik dari hasil. P-value adalah 2,2e-16 yang lebih rendah daripada alpha (0,005), menunjukkan bahwa probabilitas memperoleh perbedaan sebesar itu antara dua grup karena kebetulan sangat kecil.
- alternative hypothesis: kita dapat menetapkan hipotesis alternatif. Dalam kasus kita, ditetapkan untuk memeriksa apakah perbedaan rata-rata sebenarnya tidak sama dengan nol.
- 95 percent confidence interval: yakin 95% bahwa perbedaan rata-rata populasi sebenarnya antara kedua grup berada dalam rentang -19,51569 hingga -17,96722.
- sample estimates: memberi tahu kita rata-rata sampel masing-masing grup, di mana group1 dan group2 adalah 24,30063 dan 43,04208. Artinya, rata-rata, group2 memiliki nilai lebih tinggi daripada group1.
Ada dua hipotesis untuk t-test:
- H0: µ1 = µ2: rata-rata dua populasi adalah sama.
- HA: µ1 ≠µ2: rata-rata dua populasi tidak sama.
Kesimpulannya, hasil Welch Two Sample t-test menunjukkan bahwa ada bukti kuat adanya perbedaan yang signifikan secara statistik antara group1 dan group2.
Kesimpulan
Dalam tutorial ini, kita telah mempelajari tentang t-test Satu Sampel, Dua Sampel, dan Berpasangan dengan contoh pemrograman R serta cara menafsirkan hasilnya.
T-test adalah salah satu dari banyak alat statistik yang digunakan dalam pengujian hipotesis, dan jika Anda ingin mempelajari semuanya tentang pengujian hipotesis, ikuti kursus interaktif Hypothesis Testing in R. Kursus ini membahas t-test, ANOVA, uji proporsi, dan uji chi-square.
Anda juga dapat melangkah lebih jauh dan mendaftar di jalur karier Statistician with R kami untuk menguasai keterampilan penting dan mendapatkan pekerjaan sebagai ahli statistik.

