Direkt zum Inhalt

GLM in R: Verallgemeinertes lineares Modell

Lerne generalisierte lineare Modelle (GLM) kennen und erfahre, wie sie sich von linearen Modellen unterscheiden.
Aktualisierte 11. Sept. 2024  · 2 Min. Lesezeit

Das verallgemeinerte lineare Modell (Generalized Linear Model, GLM) ist eine Verallgemeinerung der gewöhnlichen linearen Regression, die Antwortvariablen mit anderen Fehlerverteilungsmodellen als der Normalverteilung (z. B. Gaußverteilung) zulässt.

Grundlagen des GLM

GLMs werden mit der Funktion glm() angepasst. Wie lineare Modelle (lm()s) haben auch glm()s Formeln und Daten als Eingaben, aber auch eine Familieneingabe.

Syntax des verallgemeinerten linearen Modells

Syntax des verallgemeinerten linearen Modells

Die Gauß-Familie ist die Art und Weise, wie R auf die Normalverteilung verweist und ist die Standardeinstellung für glm().

Ähnlichkeit mit linearen Modellen

Wenn die Familie gaußförmig ist, ist ein GLM dasselbe wie ein LM.

Ähnlichkeit mit linearen Modellen

Nicht-normale Fehler oder Verteilungen

Verallgemeinerte lineare Modelle können nicht-normale Fehler oder Verteilungen haben. Allerdings gibt es Einschränkungen bei den möglichen Verteilungen. Du kannst zum Beispiel die Poisson-Familie für Zähldaten oder die Binomialfamilie für Binomialdaten verwenden.

Nichtlineare Verknüpfungsfunktionen

GLMs haben auch eine nichtlineare Verknüpfungsfunktion, die die Regressionskoeffizienten mit der Verteilung verknüpft und eine Verallgemeinerung des linearen Modells ermöglicht.

Interaktives Beispiel für die Vorhersage mit glm()

In diesem Beispiel wird die erwartete Zahl der täglichen zivilen Brandopfer für die nordamerikanischen Sommermonate Juni, Juli und August mit Hilfe der Poisson-Regression und dem Datensatz newDat vorhergesagt.

Hier sind die Daten im newDat-Datensatz:

  Month   
1     6
2     7
3     8 

Die Poisson-Schätzungen für Steigung und Achsenabschnitt liegen auf der natürlichen Logarithmus-Skala und können zur besseren Verständlichkeit exponentiert werden. Du kannst dies tun, indem du type = "response" mit der Vorhersagefunktion angibst.

# use the model to predict with new data
predOut <- predict(object = poissonOut, newdata = newDat, type = "response")

# print the predictions
print(predOut)

Wenn wir den obigen Code ausführen, erhalten wir das folgende Ergebnis:

         1          2          3
0.08611111 0.12365591 0.07795699 

Probiere es selbst aus.

Wenn du mehr über verallgemeinerte lineare Modelle in R erfahren möchtest, schau dir dieses Video aus unserem Kurs Verallgemeinerte lineare Modelle in R an.

Dieser Inhalt stammt aus dem DataCamp-Kurs " Generalized Linear Models in R" von Richard Erickson.

Schau dir unser Tutorial zur logistischen Regression in R an.

Themen

R Kurse

Kurs

Introduction to R

4 hr
2.8M
Master the basics of data analysis in R, including vectors, lists, and data frames, and practice R with real data sets.
Siehe DetailsRight Arrow
Kurs starten
Mehr anzeigenRight Arrow
Verwandt

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 Min.

Der Blog

Die 32 besten AWS-Interview-Fragen und Antworten für 2024

Ein kompletter Leitfaden zur Erkundung der grundlegenden, mittleren und fortgeschrittenen AWS-Interview-Fragen, zusammen mit Fragen, die auf realen Situationen basieren. Es deckt alle Bereiche ab und sorgt so für eine abgerundete Vorbereitungsstrategie.
Zoumana Keita 's photo

Zoumana Keita

30 Min.

See MoreSee More