GLM in R: Verallgemeinertes lineares Modell

Lerne generalisierte lineare Modelle (GLM) kennen und erfahre, wie sie sich von linearen Modellen unterscheiden.

Aktualisierte 11. Sept. 2024 · 2 Min. Lesezeit

Das verallgemeinerte lineare Modell (Generalized Linear Model, GLM) ist eine Verallgemeinerung der gewöhnlichen linearen Regression, die Antwortvariablen mit anderen Fehlerverteilungsmodellen als der Normalverteilung (z. B. Gaußverteilung) zulässt.

Grundlagen des GLM

GLMs werden mit der Funktion glm() angepasst. Wie lineare Modelle (lm()s) haben auch glm()s Formeln und Daten als Eingaben, aber auch eine Familieneingabe.

Syntax des verallgemeinerten linearen Modells

Die Gauß-Familie ist die Art und Weise, wie R auf die Normalverteilung verweist und ist die Standardeinstellung für glm().

Ähnlichkeit mit linearen Modellen

Wenn die Familie gaußförmig ist, ist ein GLM dasselbe wie ein LM.

Nicht-normale Fehler oder Verteilungen

Verallgemeinerte lineare Modelle können nicht-normale Fehler oder Verteilungen haben. Allerdings gibt es Einschränkungen bei den möglichen Verteilungen. Du kannst zum Beispiel die Poisson-Familie für Zähldaten oder die Binomialfamilie für Binomialdaten verwenden.

Nichtlineare Verknüpfungsfunktionen

GLMs haben auch eine nichtlineare Verknüpfungsfunktion, die die Regressionskoeffizienten mit der Verteilung verknüpft und eine Verallgemeinerung des linearen Modells ermöglicht.

Interaktives Beispiel für die Vorhersage mit glm()

In diesem Beispiel wird die erwartete Zahl der täglichen zivilen Brandopfer für die nordamerikanischen Sommermonate Juni, Juli und August mit Hilfe der Poisson-Regression und dem Datensatz newDat vorhergesagt.

Hier sind die Daten im newDat-Datensatz:

Die Poisson-Schätzungen für Steigung und Achsenabschnitt liegen auf der natürlichen Logarithmus-Skala und können zur besseren Verständlichkeit exponentiert werden. Du kannst dies tun, indem du type = "response" mit der Vorhersagefunktion angibst.

# use the model to predict with new data
predOut <- predict(object = poissonOut, newdata = newDat, type = "response")

# print the predictions
print(predOut)

Wenn wir den obigen Code ausführen, erhalten wir das folgende Ergebnis:

         1          2          3
0.08611111 0.12365591 0.07795699

Probiere es selbst aus.

Wenn du mehr über verallgemeinerte lineare Modelle in R erfahren möchtest, schau dir dieses Video aus unserem Kurs Verallgemeinerte lineare Modelle in R an.

Dieser Inhalt stammt aus dem DataCamp-Kurs " Generalized Linear Models in R" von Richard Erickson.

Schau dir unser Tutorial zur logistischen Regression in R an.

Themen

Datenwissenschaft

R Kurse

Kurs

Einführung in R

4 Std.

Beherrsche die Grundlagen der Datenanalyse in R, einschließlich Vektoren, Listen und Datenrahmen, und übe R mit echten Datensätzen.

Siehe Details

Kurs starten

Kurs

R für Fortgeschrittene

6 Std.

650.6K

Setze deine Reise zum R-Ninja fort, indem du etwas über bedingte Anweisungen, Schleifen und Vektorfunktionen lernst.

Siehe Details

Kurs starten

Kurs

Generalized Linear Models in R

4 Std.

20.6K

The Generalized Linear Model course expands your regression toolbox to include logistic and Poisson regression.

Siehe Details

Kurs starten

Verwandt

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.

Hesam Sheikh Hassani

15 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!

Nisha Arya Ahmed

15 Min.

Mehr anzeigen Mehr anzeigen

Grundlagen des GLM

Syntax des verallgemeinerten linearen Modells

Ähnlichkeit mit linearen Modellen

Nicht-normale Fehler oder Verteilungen

Nichtlineare Verknüpfungsfunktionen

Interaktives Beispiel für die Vorhersage mit glm()

Top 30 Generative KI Interview Fragen und Antworten für 2024

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Einführung in R

R für Fortgeschrittene

Generalized Linear Models in R

Top 30 Generative KI Interview Fragen und Antworten für 2024

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Einführung in R