Ana içeriğe atla

R'de t-testleri Eğitimi: T-Testleri Nasıl Uygulanır?

R'de t.test() kullanarak iki grubun ortalamalarının arasında anlamlı bir fark olup olmadığını belirleyin.
Güncel 22 Nis 2026  · 10 dk. oku

R'de t-testi eğitimi kapak görseli

Giriş

Diyelim ki iki satış ekibiniz var ve her iki ekibin bir haftada sattığı cep telefonu sayısının ortalamasının aynı olup olmadığını kontrol etmek istiyorsunuz. Performansı nasıl karşılaştırırsınız?

İlgili ekiplerin 200 rastgele müşteriye sattığı cep telefonu sayısının ortalamasını alıp farkı belirlersiniz. İlk pazarlama ekibi ortalama 120 telefon satarken, ikinci ekip 80 telefon satmıştır.

Öyleyse açık ki ilk ekip satışta ikinci ekipten daha iyi performans göstermiştir. Öyle mi? Emin olamayız; veri seti rastgele müşterilerden toplanmıştır ve o hafta telefonu satın alan tüm kişileri temsil etmez.

Peki hangi ekibin daha iyi performans gösterdiğini nasıl belirleriz? İki ortalama arasındaki farkın gerçek mi yoksa sadece rastlantı eseri mi olduğunu anlamak için bir t-testi kullanacağız.

T-testi, iki grubun örneklerini alarak bu grupların ortalamaları arasında anlamlı bir fark olup olmadığını belirleyen istatistiksel bir hipotez testidir. Nasıl çalışır? Örneklem büyüklüğünü ve verinin değişkenlik derecesini dikkate alırken her iki örneklem ortalamasını ve standart sapmasını karşılaştırır.

Bu eğitimde t-testlerinin sınıflandırmasını (tek örneklem, iki örneklem ve eşleştirilmiş örneklem t-testi) R kod örnekleriyle öğrenecek ve sonuçları yorumlamayı göreceğiz.

Not: R'ye yeniyseniz, temelleri anlamak için mini bir R Programlamaya Giriş kursu alın.

R'de t.test() Fonksiyonu

R dili, Tek Örneklem, İki Örneklem ve Eşleştirilmiş t-testleri için basit bir t.test yerleşik fonksiyonu sağlar. 

t.test fonksiyonunu kullanmanın iki yolu vardır: varsayılan ve formül yöntemleri. 

Varsayılan yöntem 

x ve y gruplarından sayısal örnekler sağlar, alternative hipotezini, varsayılan ortalama mu'yu ve aralığın güven düzeyini belirtirsiniz. Ayrıca, paired argümanını değiştirerek Eşleştirilmiş t-testi ve var.equal argümanını değiştirerek eşit varyanslı İki Örneklem t-testini gerçekleştirebilirsiniz. 

t.test(x, y,
      alternative = c("two.sided", "less", "greater"),
      mu = 0, paired = FALSE, var.equal = FALSE,
      conf.level = 0.95, ...)

Formül yöntemi

Bu yöntemde, x~y formülünü sağlarsınız; burada x, data içinden sayısal bir vektör veya sütun, y ise grup türlerini içeren ikili bir sütundur.     

t.test(formula, data, subset, na.action, ...)

R'de Tek Örneklem t-testi Nasıl Yapılır

Tek örneklem t-testi, örneklem ortalaması ile hipotezdeki veya varsayılan anakütle ortalaması arasında anlamlı bir fark olup olmadığını test etmek için kullanılan istatistiksel bir hipotez testidir. Test, verideki değişkenliği dikkate alarak örneklem ortalamasını hipotez ortalamasıyla karşılaştırır. 

Tek Örneklem t-testi

  • 1 = Örneklem ortalaması
  • μ = Varsayılan anakütle ortalaması
  • s = Örneklem standart sapması
  • n = Örneklem büyüklüğü

Bu eğitimde, t-testi kod örnekleri için Çim Bitkilerinde Karbon Dioksit Alımı R veri setini kullanacağız. Veri seti 84 satır ve 5 sütundan oluşur ve Echinochloa crus-galli türünün soğuğa dayanıklılığını test etmek için yapılan bir deneyden toplanmıştır. Testlerimizde çoğunlukla uptake, Treatment ve Type sütunlarını dikkate alacağız. 

head(CO2)

Çim Bitkilerinde Karbon Dioksit Alımı

Örnekte, veri setindeki conc (karbon dioksit derişimleri) sütununu kullanacağız. 

Ortalamayı, dağılımı ve aykırı değerleri bir kutu grafiği ile gözlemleyebiliriz. 

boxplot(CO2$conc)

kutu grafiği 1

Tek örneklem t-testi için `t.test(x,mu=0)` kullanacağız. Burada x değişkendir, mu ise sıfır hipoteziyle belirlenir. Bizim durumumuzda 550'dir. 

t.test(CO2$conc, mu = 550)

Sonuç:

Karbon dioksit derişimi 550'ye eşit değildir ve varsayılan anakütle ortalamasından anlamlı derecede düşüktür. 

One Sample t-test

data:  CO2$conc
t = -3.5617, df = 83, p-value = 0.0006134
alternative hypothesis: true mean is not equal to 550
95 percent confidence interval:
370.7805 499.2195
sample estimates:
mean of x
      435 

R'de İki Örneklem t-testi Nasıl Yapılır

İki Örneklem t-testlerinde, iki tedavi türünün karbon dioksit alım hızlarını karşılaştıracağız: soğutulmamış ve soğutulmuş. 

İki grubun dağılımını bir kutu grafiği ile görselleştirebiliriz.  

plot(uptake ~ Treatment, data=CO2)

iki grubun dağılımı

Welch İki Örneklem t-testi

Bu, varyansları eşit olmayabilecek iki bağımsız grubun ortalamaları arasında anlamlı bir fark olup olmadığını araştıran istatistiksel bir hipotez testidir. Test, her grubun içindeki değişkenliği dikkate alarak iki grubun ortalamalarını karşılaştırır.  

Welch İki Örneklem t-testi

  • 1 = Birinci grubun örneklem ortalaması
  • 2 = İkinci grubun örneklem ortalaması
  • n1 = Birinci grubun örneklem büyüklüğü
  • n2 = İkinci grubun örneklem büyüklüğü
  • s12 = Birinci grubun örneklem varyansı
  • s22 = İkinci grubun örneklem varyansı

Varsayılan olarak, t.test() fonksiyonu iki grubun varyansının eşit olmadığını varsayar (var.equal=FALSE). Bu nedenle herhangi bir değişiklik yapmamıza gerek yoktur. 

T-testi sonuçlarını elde etmek için formül yöntemini kullanıyoruz; burada uptake sayısal bir vektör ve Treatment, CO2 veri setinin ikili bir kategori sütunudur. 

t.test(uptake ~ Treatment, data = CO2)

Sonuç:

İki grubun ortalamaları arasında anlamlı bir fark vardır ve soğutulmamış grubun alımı soğutulmuş gruptan daha yüksektir. 

 Welch Two Sample t-test

data:  uptake by Treatment
t = 3.0485, df = 80.945, p-value = 0.003107
alternative hypothesis: true difference in means between group nonchilled and group chilled is not equal to 0
95 percent confidence interval:
  2.382366 11.336682
sample estimates:
mean in group nonchilled    mean in group chilled
                30.64286                 23.78333  

Eşit Varyanslı İki Örneklem t-testi

İki Örneklem t-testi, iki bağımsız grubun ortalamaları arasında, iki grubun varyanslarının eşit olduğu varsayımı altında, anlamlı bir fark olup olmadığını belirlemek için kullanılan istatistiksel bir hipotez testidir. Test, her grubun içindeki değişkenliği dikkate alarak iki grubun ortalamalarını karşılaştırır. 

Eşit Varyanslı İki Örneklem t-testi

  • 1 = Birinci grubun örneklem ortalaması
  • 2 = İkinci grubun örneklem ortalaması
  • n1 = Birinci grubun örneklem büyüklüğü
  • n2 = İkinci grubun örneklem büyüklüğü
  • sp = Birleştirilmiş standart sapma

Eşit varyanslı İki Örneklem t-testi yapmak için var.equal'ı TRUE olarak ayarlayıp aynı formül ve veri setiyle testi yeniden çalıştırmamız gerekir.

t.test(uptake ~ Treatment, data = CO2, var.equal = TRUE)

Sonuç:

Gördüğümüz gibi, iki grup arasında anlamlı bir ortalama farkı olduğu yönünde neredeyse benzer sonuçlar elde ettik.

Two Sample t-test

data:  uptake by Treatment
t = 3.0485, df = 82, p-value = 0.003096
alternative hypothesis: true difference in means between group nonchilled and group chilled is not equal to 0
95 percent confidence interval:
  2.38324 11.33581
sample estimates:
mean in group nonchilled    mean in group chilled
                30.64286                 23.78333

R'de Eşleştirilmiş t-testi Nasıl Yapılır

Eşleştirilmiş t-testi, iki ilişkili veya eşleştirilmiş örneklemin ortalamaları arasında anlamlı bir fark olup olmadığını belirlemek için kullanılan istatistiksel bir hipotez testidir. Eşleştirilmiş gözlemler arasındaki farkları, bu farklardaki değişkenliği de dikkate alarak karşılaştırıp t-testi değerini hesaplar. 

R'de eşleştirilmiş t-testi

  • dࠡ = Eşleştirilmiş gözlemlerdeki ortalama farklar
  • sd = Farkların örneklem standart sapması
  • n = Çift sayısı

R'de Eşleştirilmiş t-testi yapmak için paired argümanını TRUE yapıp aynı formül ve veri setiyle testi yeniden çalıştırmamız gerekir.

t.test(uptake ~ Treatment, paired = TRUE, data = CO2)

Sonuç:

t ve p-değerini dikkate aldığımızda iki grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark vardır. 

Paired t-test

data:  uptake by Treatment
t = 7.939, df = 41, p-value = 8.051e-10
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
5.114589 8.604458
sample estimates:
mean difference
      6.859524 

İkinci örnekte, aynı bitkinin iki türü için alım oranını ele alacağız. Biri Quebec, diğeri Mississippi kökenlidir.

plot(uptake ~ Type, data=CO2)

alım oranı

Formülde Treatment'ı Type ile değiştirerek eşleştirilmiş t-testi sonuçlarına bakalım. 

t.test(uptake ~ Type, paired = TRUE, data = CO2)

Sonuç:

Yine, Quebec ve Mississippi gruplarının ortalamaları arasında anlamlı bir fark vardır. 

 Paired t-test

data:  uptake by Type
t = 11.374, df = 41, p-value = 2.937e-14
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
10.41177 14.90727
sample estimates:
mean difference
      12.65952  

R'de t-testi DataLab Çalışma Kitabını deneyin. Kod kaynakları ve sonuçlarla birlikte gelir. Ayrıca çalışma kitabını kopyalayıp farklı örneklerde pratik yapmaya başlayabilirsiniz. 

Not: Güçlü bir istatistik temeli, hangi sektörde olursanız olun size iyi hizmet eder. İstatistik, modern yapay zekânın bel kemiğidir ve yolculuğunuza R ile İstatistik Temelleri beceri yolunu alarak başlamalısınız.

R'de t-testi Sonuçları Nasıl Yorumlanır

Sonuçlar üretiyoruz; peki df, p-değeri, alternatif hipotez veya örneklem tahminleri ne anlama geliyor? Bu bölümde, R'de t-testi sonuçlarının nasıl yorumlanacağını öğreneceğiz. 

rnorm fonksiyonunu kullanarak iki grup oluşturarak başlayalım ve İki Örneklem t-testlerini çalıştıralım. 

set.seed(125)

group1 <- c(rnorm(100, mean = 24, sd = 3))
group2 <- c(rnorm(100, mean = 43, sd = 2.4))

t.test(group1, group2)

Çıktı:

 Welch Two Sample t-test

data:  group1 and group2
t = -47.765, df = 179.99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-19.51569 -17.96722
sample estimates:
mean of x mean of y
24.30063  43.04208 
  • data: İki Örneklem t-testinde kullanılan veriler (group1 ve group2) 
  • t: t test-istatistiği. -47.765 negatif t-değeri, group1 örneklem ortalamasının group2'den anlamlı derecede küçük olduğunu gösterir.
  • df: t-testi değeriyle ilişkili serbestlik derecesidir.
  • p-value: sonucun istatistiksel anlamlılığını gösterir. p-değeri 2.2e-16 olup alfa (0.005)'ten düşüktür; bu da iki grup arasında bu kadar büyük bir farkın tesadüfen elde edilme olasılığının çok küçük olduğunu gösterir.
  • alternative hypothesis: alternatif hipotezi ayarlayabiliriz. Bizim durumumuzda, gerçek ortalama farkının sıfıra eşit olup olmadığını kontrol etmek üzere ayarlanmıştır.
  • 95 percent confidence interval: Gerçek anakütle ortalamaları arasındaki farkın iki grup için -19.51569 ile -17.96722 aralığında olduğundan %95 emin olunmaktadır.
  • sample estimates: her grup için örneklem ortalamalarını verir; group1 ve group2 sırasıyla 24.30063 ve 43.04208'dir. Bu da ortalama olarak group2'nin group1'den daha yüksek bir değere sahip olduğu anlamına gelir. 

T-testi için iki hipotez vardır:

  1. H0: µ1 = µ2: iki anakütle ortalaması eşittir.
  2. HA: µ1 ≠µ2: iki anakütle ortalaması eşit değildir.

Sonuç olarak, Welch İki Örneklem t-testinin sonuçları, group1 ile group2 arasında istatistiksel olarak anlamlı bir fark olduğuna dair güçlü kanıtlar olduğunu göstermektedir. 

Sonuç 

Bu eğitimde, R programlama örnekleriyle Tek Örneklem, İki Örneklem ve Eşleştirilmiş t-testlerini ve sonucun nasıl yorumlanacağını öğrendik. 

T-testi, hipotez testinde kullanılan birçok istatistiksel araçtan biridir ve hipotez testine dair her şeyi öğrenmek istiyorsanız etkileşimli R'de Hipotez Testi kursunu alın. Kurs, t-testleri, ANOVA, oran testleri ve ki-kare testlerini kapsar.

Ayrıca bir adım ileri gidip temel becerileri ustalıkla öğrenmek ve istatistikçi olarak iş bulmak için R ile İstatistikçi kariyer yoluna kaydolabilirsiniz.

Konular