Direkt zum Inhalt

T-Test vs. Z-Test: Wann sollte man sie verwenden?

Verwende t-Tests, wenn du mit kleinen Stichproben oder unbekannter Varianz zu tun hast, und Z-Tests, wenn die Stichproben groß sind und die Varianz bekannt ist.
Aktualisierte 16. Jan. 2025  · 10 Min. Lesezeit

Als Data-Science-Experte musst du oft Beziehungen zwischen Variablen in einem Datensatz analysieren, testen und herstellen, um aussagekräftige Schlussfolgerungen zu ziehen. Ein Konzept, das Hypothesentests genannt wird, sowie verschiedene Tests, darunter t-Tests und z-Tests, gehören zu den häufig verwendeten Instrumenten in der Analytik, um Beziehungen zwischen Datenpunkten herzustellen. 

In diesem Lernprogramm lernst du anhand von Beispielen den Unterschied zwischen einem t-Test und einem Z-Test kennen. Ich werde auch zusätzliche Ressourcen für das weitere Lernen bereitstellen.

Eine kurze Zusammenfassung: t-Tests vs. Z-Tests

Die Wahl zwischen einem t-Test und einem Z-Test lässt sich mit diesen Richtlinien zusammenfassen:

  • Verwende einen t-Test: Wenn die Stichprobengröße klein ist (n < 30) und/oder die Varianz der Grundgesamtheit unbekannt ist.
  • Verwende einen Z-Test: Wenn der Stichprobenumfang groß ist (n ≥ 30) und die Varianz der Grundgesamtheit bekannt ist.

In beiden Fällen gehen wir davon aus, dass die Daten normal verteilt sind. Lies weiter, um mehr über die einzelnen Tests und ihre Unterschiede im Detail zu erfahren. Wir beginnen mit einer kurzen Einführung in das Testen von Hypothesen.

Eine Einführung in die Hypothesenprüfung

Hypothesentests sind eine grundlegende statistische Methode, um aus Stichprobendaten auf Populationsparameter zu schließen. Sie bietet einen strukturierten Ansatz zur Bewertung von Behauptungen oder Annahmen über eine Population anhand empirischer Belege.

Im Mittelpunkt der Hypothesentests stehen zwei sich ergänzende Aussagen:

  • Die Nullhypothese (H₀) besagt, dass es keinen Effekt, Unterschied oder Zusammenhang gibt. Er repräsentiert den Status quo oder das aktuelle Verständnis.
  • Die Alternativhypothese (H₁) ist eine Aussage, die der Nullhypothese widerspricht. Sie steht für die Behauptung oder das neue Verständnis, das der Forscher beweisen möchte.

Angenommen, du willst herausfinden, ob eine neue Lehrmethode die Testergebnisse der Schüler/innen verbessert. Du könntest die folgenden Hypothesen aufstellen:

  • Nullhypothese (H₀): Die neue Unterrichtsmethode hat keinen Einfluss auf die Testergebnisse der Schüler.
  • Alternativhypothese (H₁): Die neue Unterrichtsmethode verbessert die Testergebnisse der Schüler.

Bei der Hypothesenprüfung werden Stichprobendaten gesammelt, Teststatistiken berechnet und die Wahrscheinlichkeit bestimmt, dass die Ergebnisse eintreffen, wenn die Nullhypothese wahr ist. Anhand dieser Wahrscheinlichkeit können wir entscheiden, ob wir die Nullhypothese zugunsten der Alternative verwerfen oder sie nicht verwerfen.

Je nach Art der Daten und der untersuchten Forschungsfragen stehen verschiedene statistische Tests für die Hypothesenprüfung zur Verfügung. In diesem Lernprogramm konzentrieren wir uns auf den t-Test und den Z-Test.

Was ist ein t-Test?

Ein t-Test ist ein statistischer Test, der verwendet wird, um festzustellen, ob ein signifikanter Unterschied zwischen den Mittelwerten zweier Gruppen oder zwischen einem Stichprobenmittelwert und einem bekannten Wert besteht. Sie ist besonders nützlich, wenn du mit kleinen Stichprobengrößen arbeitest oder die Standardabweichung der Grundgesamtheit unbekannt ist. 

Die t-Test-Statistik für einen t-Test mit einer Stichprobe wird mit der folgenden Formel berechnet:

t-Test Gleichung

t-test Gleichung. Bild vom Autor.

wo:

  • Xˉ ist der Stichprobenmittelwert
  • μ ist der Mittelwert der Bevölkerung (oder der Mittelwert der Vergleichsgruppe)
  • s ist die Standardabweichung der Stichprobe, und 
  • n ist der Stichprobenumfang.

Arten von t-Tests

Es gibt drei Haupttypen von t-Tests. Jeder vergleicht die Mittelwerte unter verschiedenen Bedingungen:

  • t-Test bei einer Stichprobe: Bei diesem Test wird der Mittelwert einer einzelnen Stichprobe mit einem bekannten Wert oder dem Bevölkerungsmittelwert verglichen. Sie bestimmt, ob der Stichprobenmittelwert signifikant von einer bestimmten Benchmark abweicht. Wir können zum Beispiel einen t-Test mit einer Stichprobe verwenden, um festzustellen, ob sich das durchschnittliche Testergebnis einer kleinen Klasse vom nationalen Durchschnitt unterscheidet.
  • Unabhängiger t-Test bei zwei Stichproben: Bei diesem Test werden die Mittelwerte zweier unabhängiger Gruppen verglichen, um festzustellen, ob es einen statistisch signifikanten Unterschied zwischen ihnen gibt. Sie wird häufig in Experimenten verwendet, bei denen zwei Gruppen unterschiedlichen Behandlungen oder Bedingungen ausgesetzt sind. Wir könnten zum Beispiel einen unabhängigen t-Test mit zwei Stichproben verwenden, um die Testergebnisse von Schülern zu vergleichen, die mit zwei verschiedenen Unterrichtsmethoden unterrichtet wurden, um zu sehen, ob eine Methode effektiver ist.
  • Gepaarte t-Tests: Dieser Test vergleicht Mittelwerte derselben Gruppe zu verschiedenen Zeiten oder unter verschiedenen Bedingungen. Sie bewertet, ob es innerhalb derselben Gruppe nach einer Intervention oder im Laufe der Zeit eine signifikante Veränderung gibt. Ein Beispiel dafür ist die Messung der Schülerleistungen vor und nach der Einführung einer neuen Unterrichtsstrategie, um deren Wirkung zu beurteilen.

Annahmen des t-Tests

Der t-Test ist auf bestimmte Annahmen angewiesen, um gültige Ergebnisse zu liefern:

  • Normalität der Daten: Der t-Test geht davon aus, dass die Daten in jeder Gruppe annähernd normalverteilt sind. Das ist besonders wichtig, wenn du mit kleinen Stichprobengrößen arbeitest. Wenn die Daten nicht normal verteilt sind, können die Ergebnisse des t-Tests unzuverlässig sein.
  • Homogenität der Varianzen: Bei einem unabhängigen t-Test mit zwei Stichproben wird angenommen, dass die Varianzen der beiden zu vergleichenden Gruppen gleich sind. Diese Annahme stellt sicher, dass der t-Test die Variabilität innerhalb jeder Gruppe korrekt berücksichtigt. Wenn die Varianzen nicht gleich sind, kann das die Genauigkeit des Tests beeinträchtigen.
  • Unabhängigkeit der Beobachtungen: Die Erfassungen innerhalb jeder Gruppe sollten unabhängig voneinander sein. Das bedeutet, dass der Wert einer Beobachtung den Wert einer anderen Beobachtung nicht beeinflussen oder mit ihm verbunden sein sollte. Ein Verstoß gegen diese Annahme kann zu falschen Schlussfolgerungen führen.

Es ist wichtig, diese Annahmen zu überprüfen, bevor du den t-Test bei einer Analyse anwendest, um die Gültigkeit der Ergebnisse sicherzustellen. Lies unser T-Tests in R Tutorial oder unsere Einführung in Python T-Tests, um zu lernen, wie man t-Tests in R oder Python durchführt. 

Was ist ein Z-Test?

Ein Z-Test ist ein statistischer Test, mit dem festgestellt werden kann, ob ein signifikanter Unterschied zwischen dem Mittelwert der Stichprobe und dem Mittelwert der Grundgesamtheit oder zwischen den Mittelwerten zweier Gruppen besteht, wenn die Varianz der Grundgesamtheit bekannt ist und der Stichprobenumfang groß ist.

Sie wird vor allem dann verwendet, wenn der Stichprobenumfang 30 übersteigt, was die Verwendung der Normalverteilung zur Annäherung an die Verteilung der Teststatistik ermöglicht.

Die Z-Test-Statistik für einen Z-Test mit einer Stichprobe wird mit der folgenden Formel berechnet:

Z-Test Gleichung

Z-Test Gleichung. Bild vom Autor.

wo: 

  • Xˉ ist der Stichprobenmittelwert, 
  • μ ist der Mittelwert der Bevölkerung, 
  • σ ist die Standardabweichung der Bevölkerung und 
  • n ist der Stichprobenumfang.

Arten von Z-Tests

Es gibt drei Haupttypen von Z-Tests:

  • Z-Test bei einer Stichprobe: Bei diesem Test wird der Mittelwert einer einzelnen Stichprobe mit einem bekannten Populationsmittelwert verglichen. Sie wird verwendet, wenn du beurteilen willst, ob der Stichprobenmittelwert signifikant vom Mittelwert der Grundgesamtheit abweicht, vorausgesetzt, die Varianz der Grundgesamtheit ist bekannt. Ein z-Test mit einer Stichprobe kann zum Beispiel verwendet werden, um festzustellen, ob die Durchschnittsgröße einer Gruppe von mehr als 30 Personen von der bekannten nationalen Durchschnittsgröße abweicht.
  • Zwei-Stichproben-Z-Test: Dieser Test vergleicht die Mittelwerte zweier unabhängiger Stichproben, um festzustellen, ob es einen signifikanten Unterschied zwischen ihnen gibt. Sie wird verwendet, wenn beide Stichproben groß und die Varianzen der Grundgesamtheit bekannt sind. Ein Beispiel dafür wäre der Vergleich der durchschnittlichen Testergebnisse von Schülern aus zwei verschiedenen Schulen, um zu sehen, ob es einen signifikanten Unterschied in den Leistungen zwischen den beiden Schulen gibt.
  • Anteil Z-Test: Dieser Test vergleicht den Anteil eines bestimmten Merkmals in einer Stichprobe mit einem bekannten Bevölkerungsanteil oder zwischen zwei Stichprobenanteilen. Sie wird verwendet, um zu bewerten, ob der beobachtete Anteil in der Stichprobe signifikant von dem abweicht, der aufgrund des Bevölkerungsanteils erwartet wird. Ein Z-Test kann zum Beispiel verwendet werden, um den Anteil der Wählerinnen und Wähler, die eine bestimmte Kandidatin oder einen bestimmten Kandidaten in einer Stichprobe bevorzugen, mit dem Anteil zu vergleichen, der bei früheren Wahlen beobachtet wurde.

Es gibt noch weitere Varianten des Tests, wie den gepaarten Z-Test, den Z-Test für Regressionskoeffizienten und den Z-Test für Mittelwertunterschiede.

Annahmen des Z-Tests

Der Z-Test ist auf bestimmte Annahmen angewiesen, um gültige Ergebnisse zu liefern:

  • Bekannte Populationsvarianz: Der Z-Test setzt voraus, dass die Varianz der Grundgesamtheit bekannt ist. Dies ist ein wichtiger Unterschied zum t-Test, bei dem die Varianz der Grundgesamtheit in der Regel unbekannt ist. Die bekannte Varianz ermöglicht die Verwendung der z-Verteilung, um die Signifikanz der Teststatistik zu beurteilen.
  • Große Stichprobengröße: Der Z-Test setzt eine große Stichprobengröße voraus, in der Regel mehr als 30. Bei größeren Stichproben nähert sich die Stichprobenverteilung des Stichprobenmittelwerts gemäß dem zentralen Grenzwertsatz einer Normalverteilung an, selbst wenn die ursprünglichen Daten nicht normal verteilt sind.
  • Normalverteilung der Population: Es wird angenommen, dass die Daten aus einer normalverteilten Grundgesamtheit stammen. Diese Annahme ist bei großen Stichproben weniger kritisch, aber immer noch wichtig, wenn der Stichprobenumfang moderat ist.

Hauptunterschiede zwischen t-Tests und Z-Tests

Der t-Test und der Z-Test werden verwendet, um Stichprobenstatistiken mit Populationsparametern zu vergleichen, aber sie unterscheiden sich in ihren Grundannahmen, Anwendungen und den Bedingungen, unter denen sie am besten geeignet sind. Lass uns die Unterschiede zwischen den beiden Tests analysieren und verstehen:

Überlegungen zum Stichprobenumfang

  • t-test: Der t-Test wird in der Regel verwendet, wenn die Stichprobengröße klein ist, in der Regel weniger als 30. Sie ist so konzipiert, dass sie robust ist, wenn der Stichprobenumfang nicht den Schwellenwert erreicht, der für die Anwendung des zentralen Grenzwertsatzes erforderlich ist.
  • Z-Test: Der Z-Test wird verwendet, wenn der Stichprobenumfang groß ist, in der Regel größer als 30. Bei großen Stichproben ist die Stichprobenverteilung des Mittelwerts annähernd normal, was die Verwendung des Z-Tests rechtfertigt.

Wissen über die Varianz der Bevölkerung

  • t-test: Der t-Test wird verwendet, wenn die Varianz der Grundgesamtheit unbekannt ist. Statt der Varianz der Grundgesamtheit wird die Varianz der Stichprobe zur Berechnung der Teststatistik verwendet. Die t-Verteilung, die schwerere Schwänze als die Normalverteilung hat, berücksichtigt die zusätzliche Unsicherheit, die durch die Schätzung der Bevölkerungsvarianz entsteht.
  • Z-Test: Der Z-Test setzt voraus, dass die Varianz der Grundgesamtheit bekannt ist. Dies ist eine wichtige Annahme, denn sie ermöglicht die Verwendung der Standardnormalverteilung zur Berechnung der Teststatistik. Wenn die Varianz der Bevölkerung bekannt ist, liefert der Z-Test genauere Schätzungen.

Annahmen zur Verteilung

  • t-test: Der t-Test geht davon aus, dass die Daten innerhalb jeder Gruppe annähernd normalverteilt sind. Das ist besonders wichtig, wenn du mit kleinen Stichprobengrößen arbeitest. Die Teststatistik bei einem t-Test folgt einer t-Verteilung, die breitere Schwänze hat als die Normalverteilung. Dies berücksichtigt die zusätzliche Variabilität und Unsicherheit bei der Schätzung der Standardabweichung der Grundgesamtheit anhand einer kleinen Stichprobe.
  • Z-Test: Der Z-Test setzt voraus, dass die Daten normal verteilt sind oder dass der Stichprobenumfang groß genug ist, um den zentralen Grenzwertsatz anzuwenden. Der zentrale Grenzwertsatz stellt sicher, dass die Stichprobenverteilung des Mittelwerts bei großen Stichproben annähernd normal ist, auch wenn die zugrunde liegenden Daten nicht vollkommen normal sind.

Praktische Anwendungen und Anwendungsfälle

  • t-test: Der t-Test wird häufig bei Studien mit kleinen Stichproben verwendet, z. B. bei Pilotstudien, bei denen die Varianz der Grundgesamtheit unbekannt ist. Beispiele sind der Vergleich der Wirksamkeit von zwei Behandlungen in einer kleinen Gruppe oder die Bewertung von Veränderungen innerhalb derselben Gruppe im Laufe der Zeit.
  • Z-Test: Der Z-Test wird in Studien mit großen Stichproben oder bei gut etablierten Populationen verwendet, bei denen die Varianz bekannt ist. Sie wird häufig bei der Qualitätskontrolle, der Analyse von Umfragen und groß angelegten experimentellen Studien eingesetzt.

Hier ist eine Tabelle mit den wichtigsten Unterschieden:

Die wichtigsten Unterschiede zwischen T-Test und Z-Test.Die wichtigsten Unterschiede zwischen T-Test und Z-Test. Bild vom Autor.

Fazit

In diesem Tutorium hast du Hypothesentests und zwei häufig verwendete Tests kennengelernt - Tests und Z-Tests. Außerdem lernten wir die Definitionen, verschiedenen Arten und Annahmen der einzelnen Tests kennen und verstanden ihre wichtigsten Unterschiede. Wir sind zu dem Schluss gekommen, welcher Test in welchem Szenario am besten geeignet ist. So kannst du mit Hilfe von Hypothesentests sicher Beziehungen zwischen Variablen herstellen.

Nachdem du in unserem Kurs "Einführung in die Statistik" die statistischen Konzepte hinter den Hypothesentests gefestigt hast, möchte ich dich ermutigen, diese Konzepte mit Hilfe der folgenden Ressourcen mit einer der gängigen Technologien umzusetzen:

Viel Spaß beim Lernen!

Werde ein ML-Wissenschaftler

Bilde dich in Python weiter, um ein/e Wissenschaftler/in für maschinelles Lernen zu werden.
Kostenloses Lernen beginnen

Arunn Thevapalan's photo
Author
Arunn Thevapalan
LinkedIn
Twitter

Als Senior Data Scientist konzipiere, entwickle und implementiere ich umfangreiche Machine-Learning-Lösungen, um Unternehmen dabei zu helfen, bessere datengestützte Entscheidungen zu treffen. Als Data-Science-Autorin teile ich Erfahrungen, Karrieretipps und ausführliche praktische Anleitungen.

Häufig gestellte Fragen

Was ist der Hauptunterschied zwischen einem t-Test und einem Z-Test?

Der Hauptunterschied besteht darin, dass ein t-Test bei kleinen Stichprobengrößen (n <30) oder wenn die Varianz der Grundgesamtheit unbekannt ist, verwendet wird und die t-Verteilung verwendet wird. Ein Z-Test wird für große Stichprobengrößen (n>30) mit bekannter Varianz der Grundgesamtheit verwendet und beruht auf der Normalverteilung.

Wann sollte ich einen t-Test mit einer Stichprobe und wann einen Z-Test verwenden?

Verwende einen t-Test mit einer Stichprobe, wenn du den Mittelwert einer einzelnen Stichprobe mit einem bekannten Populationsmittelwert vergleichst und die Populationsvarianz unbekannt ist. Wenn der Stichprobenumfang groß und die Varianz der Grundgesamtheit bekannt ist, solltest du stattdessen einen Ein-Stichproben-Z-Test verwenden.

Welche Rolle spielt die t-Verteilung bei einem t-Test?

Die t-Verteilung wird in einem t-Test verwendet, um die zusätzliche Variabilität und Unsicherheit in der Teststatistik zu berücksichtigen, wenn die Stichprobengröße klein und die Varianz der Grundgesamtheit unbekannt ist.

Kann ich einen Z-Test verwenden, wenn ich die Varianz der Grundgesamtheit nicht kenne?

Nein, ein Z-Test setzt voraus, dass die Varianz der Grundgesamtheit bekannt ist. Wenn die Varianz der Grundgesamtheit nicht bekannt ist, solltest du einen t-Test verwenden, der die Varianz anhand der Stichprobendaten schätzt.

Wie stelle ich fest, ob ich einen gepaarten t-Test oder einen unabhängigen t-Test mit zwei Stichproben verwenden soll?

Verwende einen gepaarten t-Test, wenn du die Mittelwerte derselben Gruppe zu verschiedenen Zeiten oder unter verschiedenen Bedingungen (z. B. vor und nach einer Intervention) vergleichst. Verwende einen unabhängigen t-Test mit zwei Stichproben, wenn du Mittelwerte von zwei verschiedenen, nicht miteinander verbundenen Gruppen vergleichst (z. B. wenn du die Ergebnisse von zwei verschiedenen Klassen oder Behandlungen vergleichst).

Themen

Lernen mit DataCamp

Kurs

Introduction to Statistics

4 hr
89.1K
Learn the fundamentals of statistics, including measures of center and spread, probability distributions, and hypothesis testing with no coding involved!
Siehe DetailsRight Arrow
Kurs starten
Mehr anzeigenRight Arrow
Verwandt

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

4 Min.

Der Blog

Die 32 besten AWS-Interview-Fragen und Antworten für 2024

Ein kompletter Leitfaden zur Erkundung der grundlegenden, mittleren und fortgeschrittenen AWS-Interview-Fragen, zusammen mit Fragen, die auf realen Situationen basieren. Es deckt alle Bereiche ab und sorgt so für eine abgerundete Vorbereitungsstrategie.
Zoumana Keita 's photo

Zoumana Keita

30 Min.

Der Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 Min.

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Mehr anzeigenMehr anzeigen