Program
Bir veri bilimi profesyoneli olarak, anlamlı sonuçlar çıkarmak için bir veri kümesindeki değişkenleri sık sık analiz etmeniz, test etmeniz ve aralarındaki ilişkileri kurmanız gerekir. Hipotez testi kavramı ve t-testi ile z-testi gibi çeşitli testler, veriler arasındaki ilişkileri ortaya koymak için analitiklerde yaygın kullanılan araçlardır.
Bu eğitimde, gerçek örneklerle t-testi ve Z-testinin farkını öğreneceksiniz. Ayrıca ileri öğrenme için ek kaynaklar da sunacağım.
Hızlı Özet: t-testleri vs. Z-testleri
t-testi ile Z-testi arasında seçim yaparken şu kurallar özetlenebilir:
- t-testi kullanın: Örneklem büyüklüğü küçük olduğunda (n < 30) ve/veya anakütle varyansı bilinmiyorsa.
- Z-testi kullanın: Örneklem büyüklüğü büyük olduğunda (n ≥ 30) ve anakütle varyansı biliniyorsa.
Her iki durumda da verilerin normal dağıldığını varsayarız. Testlerin her birini ve aralarındaki farkları ayrıntılı olarak öğrenmek için okumaya devam edin. Önce hipotez testine kısa bir giriş yapacağız.
Hipotez Testine Giriş
Hipotez testi, örneklem verilerine dayanarak anakütle parametrelerini çıkarsamak için temel bir istatistiksel yöntemdir. Bir anakütle hakkında öne sürülen iddia veya varsayımları ampirik kanıtlarla değerlendirmek için yapılandırılmış bir yaklaşım sunar.
Hipotez testinin merkezinde iki tamamlayıcı ifade vardır:
- Null hipotezi (H₀) etki, fark veya ilişki olmadığını ifade eder. Mevcut durumu ya da hâkim anlayışı temsil eder.
- Alternatif hipotez (H₁) null hipoteze karşıt bir ifadedir. Araştırmacının kanıtlamak istediği iddiayı veya yeni anlayışı temsil eder.
Örneğin, yeni bir öğretim yönteminin öğrenci sınav puanlarını iyileştirip iyileştirmediğini belirlemek istediğinizi varsayalım. Şu hipotezleri kurabilirsiniz:
- Null hipotezi (H₀): Yeni öğretim yöntemi öğrenci sınav puanları üzerinde etkili değildir.
- Alternatif hipotez (H₁): Yeni öğretim yöntemi öğrenci sınav puanlarını artırır.
Hipotez testi, örneklem verisi toplama, test istatistiklerini hesaplama ve null hipotezi doğruysa bu tür sonuçların gözlenme olasılığını belirlemeyi içerir. Bu olasılığa dayanarak null hipotezi alternatif lehine reddedip reddetmeyeceğimize karar verebiliriz.
Test edilen veri türlerine ve araştırma sorularına bağlı olarak hipotez testi için çeşitli istatistiksel testler mevcuttur. Bu eğitimde t-testi ve Z-testine odaklanacağız.
t-testi nedir?
t-testi, iki grubun ortalamaları arasında veya bir örneklem ortalaması ile bilinen bir değer arasında anlamlı bir fark olup olmadığını belirlemek için kullanılan bir istatistiksel testtir. Özellikle örneklem büyüklüğünün küçük olduğu veya anakütle standart sapmasının bilinmediği durumlarda kullanışlıdır.
Tek örneklem t-testinin test istatistiği şu formülle hesaplanır:

t-testi denklemi. Görsel: Yazar.
burada:
- Xˉ örneklem ortalamasıdır
- μ anakütle ortalamasıdır (veya karşılaştırma grubunun ortalaması)
- s örneklem standart sapmasıdır ve
- n örneklem büyüklüğüdür.
t-testlerinin türleri
Üç ana t-testi türü vardır. Her biri farklı koşullar altında ortalamaları karşılaştırır:
- Tek örneklem t-testi: Tek bir örneklemin ortalamasını bilinen bir değer veya anakütle ortalaması ile karşılaştırır. Örneklem ortalamasının belirli bir ölçüt değerden anlamlı biçimde sapıp sapmadığını belirler. Örneğin, küçük bir sınıfın ortalama sınav puanının ulusal ortalamadan farklı olup olmadığını değerlendirmek için tek örneklem t-testi kullanabiliriz.
- Bağımsız iki örneklem t-testi: İki bağımsız grubun ortalamalarını karşılaştırarak aralarında istatistiksel olarak anlamlı bir fark olup olmadığını belirler. İki grubun farklı uygulamalara veya koşullara tabi tutulduğu deneylerde yaygın olarak kullanılır. Örneğin, iki farklı öğretim yöntemiyle eğitim alan öğrencilerin sınav puanlarını karşılaştırarak yöntemlerden birinin daha etkili olup olmadığını görmek için bağımsız iki örneklem t-testi uygulanabilir.
- Eşleştirilmiş t-testi: Aynı grubun farklı zamanlarda veya farklı koşullar altındaki ortalamalarını karşılaştırır. Bir müdahale sonrasında veya zaman içinde aynı grup içinde anlamlı bir değişim olup olmadığını değerlendirir. Örneğin, yeni bir öğretim stratejisi uygulanmadan önce ve sonra öğrenci performansını ölçerek etkisini değerlendirmek buna örnektir.
t-testinin varsayımları
Geçerli sonuçlar üretebilmesi için t-testi bazı varsayımlara dayanır:
- Verilerin normalliği: t-testi, her bir gruptaki verilerin yaklaşık olarak normal dağıldığını varsayar. Bu, özellikle küçük örneklemlerle çalışırken önemlidir. Veriler normal dağılmıyorsa t-testi sonuçları güvenilir olmayabilir.
- Varyansların homojenliği: Bağımsız iki örneklem t-testinde karşılaştırılan iki grubun varyanslarının eşit olduğu varsayılır. Bu varsayım, t-testinin her bir gruptaki değişkenliği doğru şekilde hesaba katmasını sağlar. Varyanslar eşit değilse testin doğruluğu etkilenebilir.
- Gözlemlerin bağımsızlığı: Her gruptaki gözlemler bağımsız olmalıdır. Yani bir gözlemin değeri başka bir gözlemin değerini etkilememeli veya onunla ilişkili olmamalıdır. Bu varsayımın ihlali yanlış sonuçlara yol açabilir.
Sonuçların geçerli olması için t-testini uygulamadan önce bu varsayımları kontrol etmek önemlidir. R veya Python'da t-testlerinin nasıl yapılacağını öğrenmek için R'de T-testleri Eğitimi ya da Python T-Testlerine Giriş yazımızı okuyun.
Z-testi nedir?
Z-testi, anakütle varyansının bilindiği ve örneklem büyüklüğünün büyük olduğu durumlarda, örneklem ortalaması ile anakütle ortalaması veya iki grubun ortalamaları arasında anlamlı bir fark olup olmadığını belirlemek için kullanılan bir istatistiksel testtir.
Özellikle örneklem büyüklüğü 30'u aştığında kullanılır; bu durumda test istatistiğinin dağılımını yaklaşım olarak normal dağılım ile modellemek mümkündür.
Tek örneklem Z-testinin test istatistiği şu formülle hesaplanır:

Z-testi denklemi. Görsel: Yazar.
burada:
- Xˉ örneklem ortalamasıdır,
- μ anakütle ortalamasıdır,
- σ anakütle standart sapmasıdır ve
- n örneklem büyüklüğüdür.
Z-testlerinin türleri
Başlıca üç Z-testi türü vardır:
- Tek örneklem Z-testi: Tek bir örneklemin ortalamasını bilinen anakütle ortalamasıyla karşılaştırır. Anakütle varyansının bilindiği varsayımıyla, örneklem ortalamasının anakütle ortalamasından anlamlı biçimde sapıp sapmadığını değerlendirmek için kullanılır. Örneğin, 30'dan fazla kişiden oluşan bir grubun ortalama boyunun bilinen ulusal ortalama boydan farklı olup olmadığını belirlemek için tek örneklem Z-testi kullanılabilir.
- İki örneklem Z-testi: İki bağımsız örneklemin ortalamalarını karşılaştırarak aralarında anlamlı bir fark olup olmadığını belirler. Her iki örneklemin de büyük olduğu ve anakütle varyanslarının bilindiği durumlarda kullanılır. Örneğin, iki farklı okulun öğrencilerinin ortalama sınav puanlarını karşılaştırarak performanslarında anlamlı bir fark olup olmadığını incelemek buna örnektir.
- Oran Z-testi: Bir örneklemde belirli bir özelliğin oranını bilinen anakütle oranıyla ya da iki örneklem oranıyla karşılaştırır. Örneklemde gözlenen oranın anakütle oranına göre beklenenden anlamlı biçimde farklı olup olmadığını değerlendirmek için kullanılır. Örneğin, belirli bir adayı destekleyen seçmenlerin oranını, önceki seçimlerde gözlenen oranla karşılaştırmak için oran Z-testi uygulanabilir.
Eşleştirilmiş Z-testi, regresyon katsayıları için Z-testi ve ortalama farkları için Z-testi gibi ek varyasyonlar da vardır.
Z-testinin varsayımları
Geçerli sonuçlar üretebilmesi için Z-testi bazı varsayımlara dayanır:
- Bilinen anakütle varyansı: Z-testi, anakütle varyansının bilindiğini varsayar. Bu, genellikle anakütle varyansının bilinmediği t-testinden temel bir ayrımdır. Bilinen varyans, test istatistiğinin anlamlılığını değerlendirmek için z-dağılımının kullanılmasına olanak tanır.
- Büyük örneklem büyüklüğü: Z-testi tipik olarak 30'dan büyük örneklemler için varsayılır. Daha büyük örneklemlerde, Merkezî Limit Teoremi'ne göre örneklem ortalamasının örnekleme dağılımı normal dağılıma yaklaşır; bu da Z-testinin kullanımını gerekçelendirir.
- Anakütlenin normal dağılımı: Verilerin normal dağılan bir anakütleden çekildiği varsayılır. Bu varsayım büyük örneklemler için daha az kritik olsa da örneklem büyüklüğü orta düzeydeyken önem taşır.
t-testleri ve Z-testleri Arasındaki Temel Farklar
t-testi ve Z-testi, örneklem istatistiklerini anakütle parametreleriyle karşılaştırmak için kullanılır; ancak dayandıkları varsayımlar, uygulamaları ve en uygun oldukları koşullar bakımından farklılık gösterir. İki test arasındaki farkları analiz edip anlayalım:
Örneklem büyüklüğü dikkate alındığında
- t-testi: Genellikle örneklem büyüklüğü küçük olduğunda, yani 30'dan az olduğunda kullanılır. Merkezî Limit Teoremi'ni uygulamak için gereken eşik karşılanmadığında da sağlam olacak şekilde tasarlanmıştır.
- Z-testi: Örneklem büyüklüğü büyük olduğunda, tipik olarak 30'dan fazla olduğunda kullanılır. Büyük örneklemlerde ortalamanın örnekleme dağılımı yaklaşık olarak normaldir; bu da Z-testinin kullanımını haklı çıkarır.
Anakütle varyansının bilinmesi
- t-testi: Anakütle varyansı bilinmediğinde kullanılır. Anakütle varyansı yerine test istatistiğini hesaplamak için örneklem varyansı kullanılır. Normal dağılıma göre daha kalın kuyruklara sahip t-dağılımı, anakütle varyansının tahmin edilmesinden kaynaklanan ek belirsizliği hesaba katar.
- Z-testi: Anakütle varyansının bilinmesini gerektirir. Bu temel bir varsayımdır; çünkü test istatistiğinin hesaplanmasında standart normal dağılımın kullanılmasına imkân tanır. Anakütle varyansı bilindiğinde Z-testi daha hassas tahminler sağlar.
Dağılım varsayımları
- t-testi: Her bir gruptaki verilerin yaklaşık olarak normal dağıldığını varsayar. Bu, özellikle küçük örneklemler söz konusu olduğunda önemlidir. t-testindeki test istatistiği t-dağılımını izler ve bu dağılım, normal dağılımdan daha geniş kuyruklara sahiptir. Bu durum, küçük örneklemden anakütle standart sapmasının tahmin edilmesinden kaynaklanan ek değişkenlik ve belirsizliği karşılar.
- Z-testi: Verilerin normal dağıldığını veya örneklem büyüklüğünün Merkezî Limit Teoremi'ni uygulamak için yeterince büyük olduğunu varsayar. Merkezî Limit Teoremi, büyük örneklemler için, temel veriler tam olarak normal olmasa bile ortalamanın örnekleme dağılımının yaklaşık normal olacağını güvence altına alır.
Pratik uygulamalar ve kullanım durumları
- t-testi: Anakütle varyansının bilinmediği, pilot çalışmalar gibi küçük örneklemli çalışmalarda yaygın olarak kullanılır. Örneğin, küçük bir grupta iki tedavinin etkinliğini karşılaştırmak veya aynı grup içinde zaman içindeki değişimleri değerlendirmek.
- Z-testi: Varyansın bilindiği, iyi tanımlanmış anakütlelerle veya büyük örneklemlerle yürütülen çalışmalarda kullanılır. Genellikle kalite kontrol, anket analizi ve büyük ölçekli deneysel çalışmalarda uygulanır.
İşte temel farkları gösteren bir tablo:
t-testi ve Z-testi arasındaki temel farklar. Görsel: Yazar.
Sonuç
Bu eğitimde hipotez testine ve yaygın olarak kullanılan iki teste—t-testleri ve z-testlerine—giriş yaptık. Her testin tanımlarını, türlerini ve varsayımlarını öğrenirken aralarındaki temel farkları da netleştirdik. Hangi senaryoda hangi testin daha uygun olduğuna vardık ve böylece hipotez testi yoluyla değişkenler arasındaki ilişkileri güvenle kurmanıza yardımcı olduk.
Hipotez testinin arkasındaki istatistiksel kavramları İstatistiğe Giriş kursumuzla pekiştirdikten sonra, bu kavramları popüler teknolojilerle uygulamanızı şu kaynaklarla öneririm:
- Python ile Hipotez Testi kursu
- R ile Hipotez Testi kursu
- Excel'de Hipotez Testi (ki-kare testi) eğitimi
Keyifli öğrenmeler!

Kıdemli veri bilimcisi olarak, işletmelerin veriye dayalı daha iyi kararlar almasına yardımcı olmak için büyük ölçekli makine öğrenimi çözümleri tasarlıyor, geliştiriyor ve uyguluyorum. Veri bilimi yazarı olarak, öğrendiklerimi, kariyer tavsiyelerimi ve ayrıntılı uygulamalı eğitimleri paylaşıyorum.
Sıkça Sorulan Sorular
t-testi ile Z-testi arasındaki temel fark nedir?
Temel fark şudur: t-testi, küçük örneklem büyüklükleri (n <30) veya anakütle varyansı bilinmediğinde kullanılır ve t-dağılımını kullanır. Z-testi ise büyük örneklem büyüklükleri ( n>30) ve bilinen anakütle varyansı için kullanılır ve normal dağılıma dayanır.
Tek örneklem t-testini ne zaman, Z-testini ne zaman kullanmalıyım?
Tek bir örneklemin ortalamasını bilinen bir anakütle ortalamasıyla karşılaştırırken ve anakütle varyansı bilinmiyorsa tek örneklem t-testini kullanın. Örneklem büyükse ve anakütle varyansı biliniyorsa bunun yerine tek örneklem Z-testini kullanmalısınız.
t-testinde t-dağılımının rolü nedir?
t-dağılımı, örneklem büyüklüğü küçük ve anakütle varyansı bilinmiyorken test istatistiğindeki ek değişkenlik ve belirsizliği hesaba katmak için t-testinde kullanılır.
Anakütle varyansını bilmiyorsam Z-testini kullanabilir miyim?
Hayır, Z-testi anakütle varyansının bilinmesini gerektirir. Anakütle varyansı bilinmiyorsa, varyansı örneklem verisinden tahmin eden t-testini kullanmalısınız.
Eşleştirilmiş t-testi mi, bağımsız iki örneklem t-testi mi kullanmalıyım?
Aynı grubun farklı zamanlardaki veya farklı koşullardaki ortalamalarını karşılaştırıyorsanız (ör. bir müdahale öncesi ve sonrası), eşleştirilmiş t-testini kullanın. Birbiriyle ilişkili olmayan iki farklı grubun ortalamalarını karşılaştırıyorsanız (ör. iki farklı sınıfın veya tedavinin puanlarını karşılaştırmak), bağımsız iki örneklem t-testini kullanın.