Ana içeriğe atla

Genelleştirilmiş Doğrusal Model (GLM): Teori ve Koda Yeni Başlayanlar için Kılavuz

GLM’lere pratik bir giriş – ne oldukları, üç bileşenin nasıl birlikte çalıştığı ve Python ile R’da nasıl uydurulup yorumlandıkları.
Güncel 12 Haz 2026  · 13 dk. oku

Doğrusal regresyon denemek için harika bir ilk modeldir, ancak verileriniz normal dağılıma uymadığı anda yetersiz kalır.

Diyelim ki bir müşterinin terk edip etmeyeceğini (evet veya hayır sonucu) tahmin etmeye çalışıyorsunuz. Doğrusal regresyon bunu yapmayı bilmez. Sürekli değerler tahmin eder, bu yüzden yalnızca 0 veya 1 olabilen bir şey için -0.3 veya 1.7 gibi çıktılar elde edersiniz. Aynı sorun, saat başına destek bileti sayısı gibi sayım verilerinde de ortaya çıkar. Doğrusal regresyon negatif sayımlar tahmin edebilir ki bunun bir anlamı yoktur.

Genelleştirilmiş doğrusal modeller (GLM’ler), farklı türde sonuçları ele alacak şekilde doğrusal regresyonu genişleterek bunu düzeltir. Temel fikir aynıdır – girdilerin doğrusal bir birleşimi – ancak ikili verileri ve diğer normal olmayan dağılımları modelleme esnekliğine sahiptir.

Bu makalede GLM’lerin ne olduğunu açıklayacak, üç temel bileşenini adım adım ele alacak ve hem Python hem de R’da nasıl uydurulup yorumlanacaklarını göstereceğim.

Peki doğrusal regresyon tam olarak nasıl çalışır? Varsayımlarını ve tanılarını ve sonuçların nasıl yorumlanacağını öğrenmek için Basit Doğrusal Regresyon rehberimizi okuyun.

Genelleştirilmiş Doğrusal Model Nedir?

Genelleştirilmiş doğrusal model (GLM), yanıt değişkeninin yalnızca normal dağılım değil, farklı olasılık dağılımlarını da takip etmesine olanak tanıyan doğrusal regresyonun bir uzantısıdır.

Burada akılda tutulması gereken ana nokta, GLM’nin tek bir model olmadığıdır. Bu bir çerçevedir. Doğrusal regresyon, lojistik regresyon ve Poisson regresyonu, hepsi GLM’dir. Her biri farklı bir dağılım ve girdileri çıktılara bağlamanın farklı bir yolunu kullanır, ancak hepsi aynı yapıyı takip eder.

Genelleştirilmiş Doğrusal Modeller Neden Gerekli?

Standart doğrusal regresyon iki büyük varsayım yapar: sonucunuz normal dağılır ve varyans tahminler boyunca sabit kalır. Bu varsayımlar sağlanmazsa, hiçbir anlam ifade etmeyen sonuçlar elde edersiniz.

Örneğin, bir kredi başvuru sahibinin temerrüde düşüp düşmeyeceğini tahmin eden bir model kuruyorsanız, sonuç ikilidir – 0 veya 1. Doğrusal regresyon bu sınırları gözetmez. Hem -0.2 hem de 1.4 gibi imkânsız değerleri tahmin edebilir.

Sayım verileri de aynı soruna sahiptir. Aylık yeniden yatış sayısını tahmin ediyorsanız, doğrusal regresyon negatif sayılar verebilir. -3 yeniden yatış olamaz.

Her iki durumda da sorun, girdilerin doğrusal birleşimi değildir – o kısım gayet iyi çalışır. Sorun, modelin bu girdileri çıktıya nasıl eşlediğidir. GLM’ler, çıktıyı verinin doğal aralığına uyduracak şekilde dönüştüren bir bağ (link) fonksiyonu ekleyerek bunu çözer. Olasılıklar 0 ile 1 arasında kalır. Sayımlar negatif olmaz. Az sonra hepsini göreceksiniz.

Bir GLM’nin Üç Bileşeni

Her GLM üç kısımdan oluşur: bir dağılım, bir doğrusal yordayıcı ve bir bağ fonksiyonu. Her birini açıklayayım.

Rastgele bileşen (dağılım)

Rastgele bileşen, yanıt değişkeninizin ne tür veri ürettiğini tanımlar. Başka bir deyişle, sonucunuzu en iyi tanımlayan olasılık dağılımını seçer.

Doğrusal regresyon normal dağılım varsayar, bu nedenle sonuç süreklidir ve ortalama etrafında simetriktir. Ancak tüm veriler böyle davranmaz.

Sonucunuz ikiliyse (evet/hayır, 0/1), binom dağılımı kullanırsınız. Sayım verilerini – örneğin gün başına hata sayısını – modelliyorsanız, Poisson dağılımı daha uygundur.

Seçtiğiniz dağılım, modeldeki diğer her şeyi kontrol eder.

Sistematik bileşen (doğrusal yordayıcı)

Sistematik bileşen, doğrusal regresyondan zaten bildiğiniz kısımdır. Girdi değişkenlerinizin doğrusal bir birleşimidir:

Systematic component

Sistematik bileşen

Burada X özellikler matrisinizdir ve β katsayı vektörüdür. Her özelliği kendi ağırlığıyla çarpar ve toplarsınız.

Bu kısım farklı GLM’ler arasında değişmez. Başka bir deyişle, lojistik regresyon ya da Poisson regresyonu uyduruyor olun, doğrusal yordayıcı aynı görünür.

Bağ (link) fonksiyonu

Bağ fonksiyonu, doğrusal yordayıcıyı yanıt değişkeninin beklenen değerine bağlar. GLM’leri esnek kılan parça budur.

Bir bağ fonksiyonu olmadan doğrusal yordayıcı, eksi sonsuzluktan artı sonsuzluğa kadar değerler üretir. Bu, sürekli sonuçlar için uygundur, ancak olasılıklar veya sayımlar için değil. Bağ fonksiyonu, tahminin seçtiğiniz dağılım için doğru aralıkta olmasını sağlayacak şekilde çıktıyı dönüştürür.

Örneğin lojistik regresyon logit bağını kullanır; bu, herhangi bir gerçek sayı olabilen doğrusal yordayıcıyı 0 ile 1 arasındaki bir olasılığa eşler. Poisson regresyonu ise log bağını kullanır ve tahminlerin her zaman pozitif olmasını sağlar.

Tam GLM denklemi bu üç bileşeni birleştirir:

GLM equation

GLM denklemi

Burada g() bağ fonksiyonudur ve μ yanıtın beklenen değeridir. Dağılım, μnun ne anlama geldiğini tanımlar, doğrusal yordayıcı yı hesaplar ve bağ fonksiyonu ikisi arasında köprü kurar.

Yaygın Bağ Fonksiyonları (Sezgisel Anlatım)

Bağ fonksiyonu, doğrusal yordayıcının sonuca nasıl dönüştüğünü belirler. Farklı veri türlerinin farklı dönüşümlere ihtiyacı vardır ve her GLM türünün dağılımıyla eşleşen varsayılan bir bağ fonksiyonu bulunur.

Birim (identity) bağı

Birim bağı en basitidir – hiçbir şey yapmaz. Doğrusal yordayıcı, yanıtın beklenen değerine eşittir:

Identity link

Birim bağı

Doğrusal regresyonun kullandığı şey budur. Girdileriniz ağırlıklı bir toplamda birleşir ve bu toplam tahmindir. Herhangi bir dönüşüm gerekmez çünkü sonuç herhangi bir sürekli değer alabilir.

Logit bağı

Logit bağı, bir olasılığı (0 ile 1 arasında) tüm gerçek sayı doğrusuna eşler:

Logit link

Logit bağı

Lojistik regresyonun kullandığı şey budur. Doğrusal yordayıcı eksi sonsuzluktan artı sonsuzluğa kadar herhangi bir değer üretebilir, ancak ters dönüşümden sonra tahmin her zaman 0 ile 1 arasında kalır. Logaritma içindeki o oran – μ/(1-μ) – "olasılık oranı"dır (odds) ve bunun logaritması log-odds’tur. Dolayısıyla lojistik regresyon katsayılarını yorumlarken log-odds uzayında çalışırsınız.

Log bağı

Log bağı, beklenen değerin doğal logaritmasını alır:

Log link

Log bağı

Poisson regresyonunun kullandığı şey budur. Doğrusal yordayıcı herhangi bir gerçek sayı olabilir, ancak geri üsselendirildiğinde (ters dönüşüm), tahmin her zaman pozitiftir. Bu, negatif olayların olamayacağı sayım verileri için tam olarak ihtiyacınız olan şeydir.

Genelleştirilmiş Doğrusal Modellere Örnekler

GLM’ler, onları zaten bildiğiniz modellere dönüştürmeden soyut gelebilir. Doğrusal regresyon, lojistik regresyon ve Poisson regresyonu, hepsi GLM’dir. Tek fark, her birinin farklı bir dağılım ve bağ fonksiyonu kombinasyonu kullanmasıdır.

Bir GLM olarak doğrusal regresyon

Doğrusal regresyon en basit GLM’dir. Yanıt normal dağılımı izler ve bağ fonksiyonu, yani herhangi bir dönüşüm olmayan birim bağıdır.

Linear regression as a GLM

Bir GLM olarak doğrusal regresyon

Doğrusal yordayıcı, beklenen sonuca doğrudan eşittir. Aslında baştan beri kullandığınız GLM budur, sadece adını böyle koymamıştınız.

Lojistik regresyon

Lojistik regresyon, ikili sonuçları binom dağılımı ve logit bağı ile modeller.

Logistic regression as a GLM

Bir GLM olarak lojistik regresyon

Sol taraf olayın log-odds’udur. Sağ taraf, girdilerin standart doğrusal birleşimidir. Logit bağı, ne kadar büyük ya da küçük olursa olsun, tahminlerin 0 ile 1 arasındaki olasılıklara eşlenmesini sağlar.

Poisson regresyonu

Poisson regresyonu, sayım verilerini Poisson dağılımı ve log bağı ile modeller.

Poisson regression as a GLM

Bir GLM olarak Poisson regresyonu

Beklenen sayının logu, doğrusal yordayıcıya eşittir. Her iki tarafı da üsselendirirseniz μ = e^(Xβ) elde edersiniz; bu her zaman pozitiftir – sayımların tam da gerektirdiği şey.

GLM’ler Nasıl Eğitilir

GLM’ler, doğrusal regresyon gibi en küçük kareler yöntemini kullanmaz. Bunun yerine en çok olabilirlik kestirimi (MLE)ne dayanırlar.

Fikir basittir. MLE, seçilen dağılım altında gözlemlenen verilerinizi en olası kılan katsayı kümesini bulur. Lojistik regresyon için, binom modele göre gözlenen 0 ve 1’leri en olası kılan katsayıları bulur. Poisson regresyonu için, gözlenen sayımları en iyi açıklayan katsayıları bulur.

Çoğu GLM için kapalı formda bir çözüm yoktur, bu nedenle en iyileme yinelemelidir. Algoritma, katsayılar için bir başlangıç tahminiyle başlar, veriye ne kadar iyi uyduklarını değerlendirir, ayarlar ve tahminler yakınsayana kadar tekrarlar.

En yaygın yöntem yinelemeli ağırlıklandırılmış en küçük kareler (IRLS)tir; bu yöntem, MLE problemini bir dizi ağırlıklı doğrusal regresyon olarak yeniden formüle eder. Gradyan tabanlı yöntemler de çalışır; en dik iyileşme yönünü hesaplayıp o yöne adım atarlar. statsmodels ve R’ın glm() gibi kütüphaneler tüm bunları arka planda yapar, bu yüzden çözücüyü kendiniz uygulamanız gerekmez.

Unutulmaması gereken şey, dağılımı ve bağ fonksiyonunu sizin seçtiğiniz, eniyileyicinin ise en iyi katsayıları bulduğudur. Fikir bu – şimdi size bunun pratikte nasıl işlediğini göstereyim.

Python ve R’da Genelleştirilmiş Doğrusal Modeller

Bu bölümde, aynı veri kümesini kullanarak – maaş, deneyim yılı, mesai saati, çalışanın ayrılıp ayrılmadığı (ikili) ve alınan hastalık izni sayısı (sayım) sütunlarına sahip simüle edilmiş bir çalışan devri veri seti – hem Python hem de R’da lojistik ve Poisson regresyonunu adım adım ele alacağım.

Veri kümesi

Belirtilen veri kümesini Python’da oluşturacak ve ardından hem Python hem de R’da hesaplamalar için kullanacağım:

import numpy as np
import pandas as pd

np.random.seed(42)
n = 500

# Employee dataset
df = pd.DataFrame({
    "salary": np.random.normal(55000, 12000, n).astype(int),
    "experience_years": np.random.poisson(5, n),
    "overtime_hours": np.random.poisson(8, n),
})

# Simulate binary outcome: left the company
prob_left = 1 / (1 + np.exp(-(
    -2 + -0.00003 * df["salary"] + -0.05 * df["experience_years"] + 0.12 * df["overtime_hours"]
)))
df["left"] = np.random.binomial(1, prob_left)

# Simulate count outcome: sick days per year
df["sick_days"] = np.random.poisson(
    np.exp(1.2 + 0.00001 * df["salary"] + 0.02 * df["overtime_hours"])
)

# Save to use later in R
df.to_csv("data.csv", index=False)

df.head()

Sample employee attrition dataset

Örnek çalışan devri veri seti

Python uygulaması

Python size GLM’ler için iki ana seçenek sunar: statsmodels ve scikit-learn. Burada statsmodels kullanacağım çünkü size katsayılar, p-değerleri ve güven aralıkları dahil tam bir istatistiksel özet sunar. Bir GLM’i yorumlarken bunlara ihtiyacınız olacak.

Bir çalışanın ayrılıp ayrılmadığını tahmin etmek için lojistik regresyonu şu şekilde uydurabilirsiniz:

import statsmodels.api as sm

X = sm.add_constant(df[["salary", "experience_years", "overtime_hours"]])
logit_model = sm.GLM(df["left"], X, family=sm.families.Binomial())
logit_results = logit_model.fit()

print(logit_results.summary())

GLM logistic regression results

GLM lojistik regresyon sonuçları

Temel satır sm.families.Binomial() ifadesidir. Bu, tek bir argümanla hem dağılımı (binom) hem de varsayılan bağ fonksiyonunu (logit) ayarlar. Varsayılandan farklı bir bağ istemedikçe bağ fonksiyonunu ayrıca belirtmeniz gerekmez.

Şimdi aynı veri setinde hastalık izni günlerini tahmin etmek için bir Poisson regresyonu uyduralım:

poisson_model = sm.GLM(df["sick_days"], X, family=sm.families.Poisson())
poisson_results = poisson_model.fit()

print(poisson_results.summary())

GLM Poisson regression results

GLM Poisson regresyon sonuçları

Sadece Binomial() yerine Poisson() kullanmanız yeterlidir ve model, log bağıyla birlikte bir Poisson dağılımı kullanır. Çıktı tablosu aynı görünür, ancak bağ fonksiyonu değiştiği için yorumlama değişir.

Şimdi de lojistik regresyondan tahmin edilen olasılıkları mesai saatlerine karşı görselleştireyim:

Predicted probabilities for leaving the company against overtime hours

Mesai saatlerine karşı şirketten ayrılma için tahmin edilen olasılıklar

Grafik, x ekseninde mesai saatlerini, y ekseninde ayrılma olasılığını gösterir. Gri noktalar gerçek sonuçlardır – 0 (kaldı) veya 1 (ayrıldı). Yeşil eğri, modelin tahmin ettiği olasılıktır. Mesai saatleri arttıkça ayrılma olasılığı artar, ancak asla 0’ın altına inmez veya 1’in üzerine çıkmaz. Bu, logit bağ fonksiyonunun etkisidir – doğrusal yordayıcıyı, girdi değerleri ne kadar uç olursa olsun, geçerli bir olasılık aralığına sıkıştırır.

R uygulaması

R’ın yerleşik glm() fonksiyonu aynı mantığı izler ancak farklı bir sözdizimine sahiptir. family argümanı dağılımı ve bağ fonksiyonunu ayarlar ve modeli R’ın formül arayüzüyle tanımlarsınız.

İşte R’da aynı lojistik regresyon:

# Read the dataset
df <- read.csv("data.csv")

# Fit logistic regression
logit_model <- glm(left ~ salary + experience_years + overtime_hours,
                   data = df,
                   family = binomial(link = "logit"))
summary(logit_model)

GLM logistic regression in R

R’da GLM lojistik regresyon

left ~ salary + experience_years + overtime_hours formülü, R’a neyin tahmin edileceğini ve hangi girdilerin kullanılacağını söyler. family = binomial(link = "logit") kısmı dağılımı ve bağı ayarlar. Bunu family = binomial() olarak kısaltabilirsiniz; çünkü binom ailesi için varsayılan bağ logit’tir.

Poisson regresyonu büyük ölçüde aynıdır:

poisson_model <- glm(sick_days ~ salary + experience_years + overtime_hours,
                     data = df,
                     family = poisson(link = "log"))
summary(poisson_model)

GLM Poisson regression in R

R’da GLM Poisson regresyonu

Sadece binomial() yerine poisson() ile değiştirmeniz, yanıt değişkenini değiştirmeniz yeterlidir; işlem tamam.

Dağılım ve bağ nasıl belirtilir

Her iki dil de aynı yaklaşımı kullanır – dağılımı ve onun varsayılan bağ fonksiyonunu birleştiren bir aile/dağılım argümanı geçersiniz:

Specifying distribution and link in Python and R

Python ve R’da dağılım ve bağ belirtme

Her ailenin bir varsayılan bağı vardır, ancak bunu geçersiz kılabilirsiniz. Python’da bir bağ nesnesi geçebilirsiniz: sm.families.Binomial(link=sm.families.links.Probit()). R’da sadece link argümanını değiştirin: family = binomial(link = "probit").

Çoğu kullanım durumu için varsayılan bağ doğru seçimdir.

GLM Katsayılarının Yorumlanması

GLM katsayıları farklı model türleri arasında aynı şeyi ifade etmez. Bağ fonksiyonu, onları nasıl yorumlayacağınızı değiştirir.

Doğrusal regresyonda yorumlama kolaydır. experience_years üzerinde 500’lük bir katsayı, her ek deneyim yılının tahmin edilen maaşa 500 eklediği anlamına gelir. Birim bağı, katsayıların doğrudan sonuca eşlendiği anlamına gelir.

Lojistik regresyon farklıdır. Logit bağı, katsayıların log-odds uzayında olduğu anlamına gelir. overtime_hours üzerinde 0.12’lik bir katsayı, ayrılma olasılığının 0.12 artması anlamına gelmez. Her ek mesai saati için ayrılmanın log-odds’unun 0.12 arttığı anlamına gelir. Daha yorumlanabilir bir şeye ulaşmak için katsayıyı üsselendirin: e^0.12 ≈ 1.127. Bu size bir odds oranı verir. Her ek mesai saati, ayrılma odds’unu yaklaşık 1.13 ile çarpar.

Poisson regresyonu katsayıları log bağı üzerinden işler. overtime_hours üzerinde 0.02’lik bir katsayı, her ek saatin beklenen sayımın logunu 0.02 artırdığı anlamına gelir. Üsselendirdiğinizde: e^0.02 ≈ 1.02, her ek mesai saatinin beklenen hastalık izni sayısını yaklaşık 1.02 ile çarptığını görürsünüz.

Desen şudur: Katsayı uzayından sonuç uzayına geçmek için her zaman bağ fonksiyonunun tersini uygulayın.

Genelleştirilmiş Doğrusal Model Ne Zaman Kullanılır

Doğru GLM’i seçmek tek bir soruya bağlıdır: sonuç değişkeniniz nasıl görünüyor?

Sonucunuz ikili ise (evet/hayır, 0/1, geçti/kaldı), lojistik regresyon kullanın. Binom dağılımı, logit bağı. Bu, müşteri kaybını tahmin etme, sahtekârlık tespiti, hastalık sınıflandırması (var/yok) veya bir hastanın tedaviye yanıt verip vermeyeceği gibi sınıflandırma görevlerini kapsar.

Sonucunuz bir sayım ise (bir zaman penceresindeki olay sayısı), Poisson regresyonu kullanın. Poisson dağılımı, log bağı. Bu, saatlik web sitesi ziyaret sayısını veya yıllık sigorta taleplerini tahmin etmek gibi problemler için uygundur.

Sonucunuz sürekli ve kabaca normalse (gelir, test puanları), standart doğrusal regresyon gayet iyi iş görür. Normal dağılım, birim bağı. Bu, zaten bildiğiniz GLM’dir.

Her zaman sonuç değişkeninden başlayın, onu bir dağılımla eşleştirin ve ardından bağ fonksiyonu kendiliğinden gelir.

GLM’lerde Yaygın Hatalar

GLM’lerle çalışırken kaçınmanız gereken bazı yaygın hatalar şunlardır.

Yanlış dağılım seçmek

Bu en yaygın hatadır. Sonucunuz bir sayımken doğrusal regresyon uydurursanız, negatif tahminler elde edersiniz. İkiliyken Poisson kullanırsanız, model anlamlı olmayacaktır. Her zaman önce sonuç değişkeninize bakın ve ona uyan dağılımı seçin.

Bağ fonksiyonunu yanlış anlamak

Bağ fonksiyonu, girdiler ile çıktı arasındaki ilişkiyi dönüştürür. Lojistik regresyonda 0.5’lik bir katsayı "olasılık 0.5 artar" demek değildir. "Log-odds 0.5 artar" demektir. Dönüşümü unutmak, etki büyüklükleri ve değişken önemine dair yanlış sonuçlara yol açar.

Model türleri arasında katsayıları yanlış yorumlamak

Poisson regresyonundaki katsayılar, sayılar benzer görünse bile lojistik regresyondaki katsayılarla karşılaştırılamaz. 0.3’lük bir katsayı, log ya da logit bağı üzerinden geçip geçmediğine bağlı olarak farklı anlamlara gelir. Katsayıları her zaman kullandığınız belirli modelin bağlamında yorumlayın.

Model varsayımlarını göz ardı etmek

GLM’ler doğrusal regresyondan daha esnektir, ancak yine de varsayımları vardır. Poisson regresyonu, ortalamanın varyansa eşit olduğunu varsayar – sayım verilerinizin ortalamadan çok daha büyük bir varyansı varsa, modelin standart hataları çok küçük olur ve p-değerleriniz yanıltıcı olur. Lojistik regresyon, gözlemlerin bağımsız olduğunu varsayar.

Bunun üstesinden gelmek için, herhangi bir GLM’i uydurduktan sonra artık değerlere (residual) bakın ve kötü uyumu işaret eden desenleri arayın.

Sonuç

GLM’ler, doğrusal regresyonun ötesine yapılandırılmış bir şekilde geçmenizi sağlar, ancak temel mantığını korur. Girdilerin doğrusal birleşimi fikri aynı kalır, fakat çalıştığınız veriye uyması için dağılım ve bağ fonksiyonu değişir.

GLM’lerin arkasında üç bileşen vardır. Doğru dağılımı nasıl seçeceğinizi, doğrusal yordayıcıyı nasıl kuracağınızı ve doğru bağ fonksiyonunu nasıl uygulayacağınızı bildiğinizde, aynı zihinsel modelle ikili sonuçları, sayımları ve sürekli verileri ele alabilirsiniz.

En iyi sonraki adım denemektir. Normal olmayan bir sonuca sahip bir veri seti seçin, Python veya R’da bir GLM uydurun ve katsayıları bağ fonksiyonu üzerinden yorumlama pratiği yapın. Önemsediğiniz bir veri seti kullanın; konuşulan tüm teori birkaç dakika içinde yerine oturacaktır.

Doğrusal regresyon ve GLM’lerin ötesine geçmek isterseniz, Python ile Makine Öğrenimi Bilimcisi programımıza kaydolun. 2026’da işe hazır olmanız için gereken her şeyi gösterir.


Dario Radečić's photo
Author
Dario Radečić
LinkedIn
Hırvatistan merkezli Kıdemli Veri Bilimci. 700’ün üzerinde yayımlanmış makaleyle 10 M+ görüntüleme elde eden, önde gelen bir teknoloji yazarı. TPOT ile Makine Öğrenimi Otomasyonu kitabının yazarı.

FAQs

Genelleştirilmiş doğrusal model nedir?

Genelleştirilmiş doğrusal model (GLM), normal dağılımlı olmayan sonuçları da ele almak için doğrusal regresyonu genişleten bir çerçevedir. Bir olasılık dağılımını bir bağ fonksiyonu ile eşleyerek ikili verileri, sayımları ve diğer yanıt türlerini modellemenizi sağlar. Doğrusal regresyon, lojistik regresyon ve Poisson regresyonu, hepsi GLM’dir.

Doğrusal regresyon yerine ne zaman GLM kullanmalıyım?

Sonuç değişkeniniz standart doğrusal regresyonun varsayımlarına uymadığında her zaman bir GLM kullanın. İkili bir sonucu (evet/hayır), sayımları (olay sayısı) veya sürekli ve normal dağılmayan herhangi bir yanıtı tahmin ediyorsanız, doğru dağılım ve bağ fonksiyonuna sahip bir GLM, doğru aralıkta kalan geçerli tahminler verecektir.

Bir GLM&rsquo;in üç bileşeni nelerdir?

Her GLM’in bir rastgele bileşeni (sonucun olasılık dağılımı), bir sistematik bileşeni (doğrusal yordayıcı ) ve ikisini birbirine bağlayan bir bağ fonksiyonu vardır. Dağılım, ne tür bir veriyi modellediğinizi tanımlar; doğrusal yordayıcı girdilerinizi birleştirir ve bağ fonksiyonu çıktıyı dağılımın kısıtlarına uyacak şekilde dönüştürür.

GLM bir tür doğrusal model midir?

Evet. GLM’lere "doğrusal" denir çünkü model parametrelerde doğrusaldır – girdiler, tıpkı doğrusal regresyonda olduğu gibi, ağırlıklı bir toplam şeklinde birleşir. Bağ fonksiyonu, girdiler ile sonuç arasındaki ilişkiyi doğrusal olmayan hale getirebilir, ancak temel yapı hâlâ katsayıların doğrusal bir birleşimidir. Dolayısıyla GLM’ler doğrusal modellere dahildir ve standart doğrusal regresyon GLM çerçevesi içinde özel bir durumdur.

Bir GLM&rsquo;de katsayıları nasıl yorumlarım?

Bağ fonksiyonuna bağlıdır. Doğrusal regresyonda (birim bağı) bir katsayı, girdideki bir birimlik değişime karşılık sonuçtaki değişimi doğrudan temsil eder. Lojistik regresyonda (logit bağı) katsayıyı üsselendirerek bir odds oranı elde etmeniz gerekir. Poisson regresyonunda (log bağı) üsselendirme, beklenen sayım üzerinde çarpan etkisi verir. Katsayıları her zaman modelin bağ fonksiyonu merceğinden yorumlayın.

Konular

DataCamp ile öğrenin

Kurs

R ile Veri Bilimi için Lineer Cebir

4 sa
21K
Bu ders, veri biliminin temelini oluşturan en önemli matematik konularından biri olan doğrusal cebire giriş niteliğindedir.
Ayrıntıları GörRight Arrow
Kursa Başla
Devamını GörRight Arrow