Lewati ke konten utama

Tutorial t-test di R: Pelajari Cara Melakukan T-Test

Tentukan apakah ada perbedaan signifikan antara rata-rata dua grup menggunakan t.test() di R.
Diperbarui 5 Jun 2026  · 10 mnt baca

gambar sampul tutorial t-test di R

Pendahuluan

Misalkan Anda memiliki dua grup tim penjualan dan ingin memeriksa apakah rata-rata jumlah ponsel yang terjual dalam seminggu oleh kedua tim sama atau tidak. Bagaimana Anda akan membandingkan kinerjanya?

Anda akan mengambil rata-rata jumlah ponsel yang terjual ke 200 pelanggan acak oleh masing-masing tim dan menentukan perbedaannya. Tim pemasaran pertama, rata-rata, menjual 120 ponsel, sedangkan tim kedua menjual 80.

Jadi, jelas bahwa tim pertama tampil lebih baik dalam penjualan daripada tim kedua. Benarkah? Kita tidak bisa yakin; dataset dikumpulkan dari pelanggan acak dan tidak mewakili semua orang yang membeli ponsel pada minggu tersebut.

Lalu bagaimana kita menentukan tim mana yang tampil lebih baik? Kita akan menggunakan t-test untuk memahami apakah perbedaan antara dua rata-rata tersebut nyata atau hanya kebetulan semata.

T-test adalah uji hipotesis statistik yang mengambil sampel dari kedua grup untuk menentukan apakah ada perbedaan signifikan antara rata-rata kedua grup. Bagaimana cara kerjanya? Uji ini membandingkan rata-rata sampel dan simpangan baku sambil mempertimbangkan ukuran sampel dan tingkat variasi data.

Dalam tutorial ini, kita akan mempelajari klasifikasi t-test (satu sampel, dua sampel, dan t-test berpasangan) dengan contoh kode R dan cara menafsirkan hasilnya.

Catatan: jika Anda baru mengenal R, ikuti kursus mini Introduction to R Programming untuk memahami dasar-dasarnya.

Fungsi t.test() di R

Bahasa R menyediakan fungsi bawaan t.test yang sederhana untuk t-test Satu Sampel, Dua Sampel, dan Berpasangan. 

Ada dua cara menggunakan fungsi t.test: metode default dan formula. 

Metode default 

Anda memberikan sampel numerik dari grup x dan grup y, menentukan hipotesis alternative, mean yang dihipotesiskan mu, dan tingkat kepercayaan interval. Selain itu, Anda dapat melakukan t-test Berpasangan dengan mengaktifkan argumen paired dan t-test Dua Sampel dengan varians sama dengan mengubah argumen var.equal

t.test(x, y,
      alternative = c("two.sided", "less", "greater"),
      mu = 0, paired = FALSE, var.equal = FALSE,
      conf.level = 0.95, ...)

Metode formula

Dalam metode ini, Anda memberikan formula x~y, di mana x adalah vektor numerik atau kolom dari data, dan y adalah kolom biner yang berisi jenis grup.     

t.test(formula, data, subset, na.action, ...)

Cara Melakukan t-test Satu Sampel di R

T-test satu sampel adalah uji hipotesis statistik untuk menguji apakah ada perbedaan signifikan antara rata-rata sampel dan rata-rata populasi yang dihipotesiskan atau diasumsikan. Uji ini membandingkan rata-rata sampel dengan rata-rata hipotesis, sambil mempertimbangkan keragaman dalam data. 

One Sample t-test

  • 1 = Rata-rata sampel
  • μ = Rata-rata populasi yang dihipotesiskan
  • s = Simpangan baku sampel
  • n = Ukuran sampel

Dalam tutorial ini, kita akan menggunakan dataset R Carbon Dioxide Uptake in Grass Plants untuk contoh kode t-test. Dataset ini memiliki 84 baris dan 5 kolom, dan dikumpulkan dari eksperimen untuk menguji toleransi dingin spesies rumput Echinochloa crus-galli. Kita akan terutama mempertimbangkan kolom uptake, Treatment, dan Type untuk pengujian kita. 

head(CO2)

Carbon Dioxide Uptake in Grass Plants

Pada contoh ini, kita akan menggunakan kolom conc (konsentrasi karbon dioksida) dari dataset. 

Kita dapat mengamati rata-rata, distribusi, dan pencilan menggunakan boxplot. 

boxplot(CO2$conc)

boxplot 1

Untuk t-test satu sampel, kita akan menggunakan `t.test(x,mu=0)`. Di mana x adalah variabel, mu ditetapkan oleh hipotesis nol. Dalam kasus kita, nilainya 550. 

t.test(CO2$conc, mu = 550)

Hasil:

Konsentrasi karbon dioksida tidak sama dengan 550 dan secara signifikan lebih rendah daripada rata-rata populasi yang dihipotesiskan. 

One Sample t-test

data:  CO2$conc
t = -3.5617, df = 83, p-value = 0.0006134
alternative hypothesis: true mean is not equal to 550
95 percent confidence interval:
370.7805 499.2195
sample estimates:
mean of x
      435 

Cara Melakukan t-test Dua Sampel di R

Dalam t-test Dua Sampel, kita akan membandingkan laju penyerapan karbon dioksida dari dua jenis perlakuan: non-chilled dan chilled. 

Kita dapat memvisualisasikan distribusi dua grup menggunakan boxplot.  

plot(uptake ~ Treatment, data=CO2)

distribution of two groups

Welch Two Sample t-test

Ini adalah uji hipotesis statistik yang menyelidiki apakah ada perbedaan signifikan antara rata-rata dua grup independen yang mungkin memiliki varians tidak sama. Uji ini membandingkan rata-rata kedua grup sambil mempertimbangkan keragaman dalam masing-masing grup.  

Welch Two Sample t-test

  • 1 = Rata-rata sampel grup pertama
  • 2 = Rata-rata sampel grup kedua
  • n1 = Ukuran sampel grup pertama
  • n2 = Ukuran sampel grup kedua
  • s12 = Varians sampel grup pertama
  • s22 = Varians sampel grup kedua

Secara default, fungsi t.test() mengasumsikan bahwa varians dua grup tidak sama (var.equal=FALSE). Jadi, kita tidak perlu melakukan perubahan apa pun. 

Kita menggunakan metode formula untuk memperoleh hasil t-test, di mana uptake adalah vektor numerik dan Treatment adalah kolom kategori biner dari dataset CO2

t.test(uptake ~ Treatment, data = CO2)

Hasil:

Ada perbedaan signifikan pada rata-rata kedua grup, dan grup nonchilled memiliki penyerapan lebih tinggi daripada grup chilled. 

 Welch Two Sample t-test

data:  uptake by Treatment
t = 3.0485, df = 80.945, p-value = 0.003107
alternative hypothesis: true difference in means between group nonchilled and group chilled is not equal to 0
95 percent confidence interval:
  2.382366 11.336682
sample estimates:
mean in group nonchilled    mean in group chilled
                30.64286                 23.78333  

T-test Dua Sampel dengan Varians Sama

T-test Dua Sampel adalah uji hipotesis statistik untuk menentukan apakah ada perbedaan signifikan antara rata-rata dua grup independen dengan asumsi bahwa varians kedua grup sama. Uji ini membandingkan rata-rata kedua grup sambil mempertimbangkan keragaman dalam masing-masing grup. 

Two Sample t-test with Equal Variance

  • 1 = Rata-rata sampel grup pertama
  • 2 = Rata-rata sampel grup kedua
  • n1 = Ukuran sampel grup pertama
  • n2 = Ukuran sampel grup kedua
  • sp = Simpangan baku gabungan

Untuk melakukan t-test Dua Sampel dengan varians sama, kita harus menetapkan var.equal TRUE dan menjalankan uji lagi dengan formula dan dataset yang sama.

t.test(uptake ~ Treatment, data = CO2, var.equal = TRUE)

Hasil:

Seperti yang terlihat, kita mendapatkan hasil yang hampir serupa bahwa ada perbedaan rata-rata yang signifikan antara kedua grup.

Two Sample t-test

data:  uptake by Treatment
t = 3.0485, df = 82, p-value = 0.003096
alternative hypothesis: true difference in means between group nonchilled and group chilled is not equal to 0
95 percent confidence interval:
  2.38324 11.33581
sample estimates:
mean in group nonchilled    mean in group chilled
                30.64286                 23.78333

Cara Melakukan t-test Berpasangan di R

T-test berpasangan adalah uji hipotesis statistik yang digunakan untuk menentukan apakah ada perbedaan signifikan antara rata-rata dua sampel yang berhubungan atau berpasangan. Uji ini menghitung nilai t-test dengan membandingkan perbedaan antara observasi berpasangan sambil mempertimbangkan keragaman dalam perbedaannya. 

Paired t-test in R

  • dࠡ = perbedaan rata-rata pada observasi berpasangan
  • sd = simpangan baku dari perbedaan sampel
  • n = jumlah pasangan

Untuk melakukan t-test Berpasangan di R, kita harus menetapkan paired argument TRUE dan menjalankan uji lagi dengan formula dan dataset yang sama.

t.test(uptake ~ Treatment, paired = TRUE, data = CO2)

Hasil:

Ada perbedaan yang signifikan secara statistik antara rata-rata kedua grup dengan mempertimbangkan nilai t dan p. 

Paired t-test

data:  uptake by Treatment
t = 7.939, df = 41, p-value = 8.051e-10
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
5.114589 8.604458
sample estimates:
mean difference
      6.859524 

Pada contoh kedua, kita akan melihat laju penyerapan untuk dua tipe tanaman yang sama. Satunya berasal dari Quebec, dan yang lain dari Mississippi.

plot(uptake ~ Type, data=CO2)

rate of uptake

Mari periksa hasil t-test berpasangan dengan mengganti Treatment dengan Type dalam formula. 

t.test(uptake ~ Type, paired = TRUE, data = CO2)

Hasil:

Sekali lagi, ada perbedaan signifikan antara rata-rata grup Quebec dan grup Mississippi. 

 Paired t-test

data:  uptake by Type
t = 11.374, df = 41, p-value = 2.937e-14
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
10.41177 14.90727
sample estimates:
mean difference
      12.65952  

Coba t-test di R DataLab Workbook. Paket ini dilengkapi dengan sumber kode dan hasil. Anda juga dapat menduplikasi workbook dan mulai berlatih pada berbagai contoh. 

Catatan: Landasan statistik yang kuat akan sangat berguna, apa pun industri Anda. Statistik adalah tulang punggung AI modern, dan Anda sebaiknya memulai perjalanan Anda dengan mengikuti jalur keterampilan Statistics Fundamentals with R.

Cara Menafsirkan Hasil t-test di R

Kita menghasilkan hasil, tetapi apa arti df, p-value, alternative hypothesis, atau sample estimates? Pada bagian ini, kita akan mempelajari cara menafsirkan hasil t-test di R. 

Mari mulai dengan membuat dua grup menggunakan fungsi rnorm dan menjalankan t-test Dua Sampel. 

set.seed(125)

group1 <- c(rnorm(100, mean = 24, sd = 3))
group2 <- c(rnorm(100, mean = 43, sd = 2.4))

t.test(group1, group2)

Keluaran:

 Welch Two Sample t-test

data:  group1 and group2
t = -47.765, df = 179.99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-19.51569 -17.96722
sample estimates:
mean of x mean of y
24.30063  43.04208 
  • data: data yang digunakan dalam t-test Dua Sampel (group1 dan group2) 
  • t: statistik uji t. Nilai t negatif -47,765 menunjukkan bahwa rata-rata sampel group1 secara signifikan lebih kecil daripada group2.
  • df: derajat kebebasan yang terkait dengan nilai t-test.
  • p-value: menunjukkan signifikansi statistik dari hasil. P-value adalah 2,2e-16 yang lebih rendah daripada alpha (0,005), menunjukkan bahwa probabilitas memperoleh perbedaan sebesar itu antara dua grup karena kebetulan sangat kecil.
  • alternative hypothesis: kita dapat menetapkan hipotesis alternatif. Dalam kasus kita, ditetapkan untuk memeriksa apakah perbedaan rata-rata sebenarnya tidak sama dengan nol.
  • 95 percent confidence interval: yakin 95% bahwa perbedaan rata-rata populasi sebenarnya antara kedua grup berada dalam rentang -19,51569 hingga -17,96722.
  • sample estimates: memberi tahu kita rata-rata sampel masing-masing grup, di mana group1 dan group2 adalah 24,30063 dan 43,04208. Artinya, rata-rata, group2 memiliki nilai lebih tinggi daripada group1. 

Ada dua hipotesis untuk t-test:

  1. H0: µ1 = µ2: rata-rata dua populasi adalah sama.
  2. HA: µ1 ≠µ2: rata-rata dua populasi tidak sama.

Kesimpulannya, hasil Welch Two Sample t-test menunjukkan bahwa ada bukti kuat adanya perbedaan yang signifikan secara statistik antara group1 dan group2. 

Kesimpulan 

Dalam tutorial ini, kita telah mempelajari tentang t-test Satu Sampel, Dua Sampel, dan Berpasangan dengan contoh pemrograman R serta cara menafsirkan hasilnya. 

T-test adalah salah satu dari banyak alat statistik yang digunakan dalam pengujian hipotesis, dan jika Anda ingin mempelajari semuanya tentang pengujian hipotesis, ikuti kursus interaktif Hypothesis Testing in R. Kursus ini membahas t-test, ANOVA, uji proporsi, dan uji chi-square.

Anda juga dapat melangkah lebih jauh dan mendaftar di jalur karier Statistician with R kami untuk menguasai keterampilan penting dan mendapatkan pekerjaan sebagai ahli statistik.

Topik
Terkait

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.
David Woods's photo

David Woods

13 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.
Hugo Bowne-Anderson's photo

Hugo Bowne-Anderson

13 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.
Dario Radečić's photo

Dario Radečić

15 mnt

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.
Javier Canales Luna's photo

Javier Canales Luna

14 mnt

Lihat Lebih BanyakLihat Lebih Banyak