RMSE Açıklaması: Regresyon Tahmin Doğruluğuna Kılavuz

RMSE’nin regresyon analizinde ne anlama geldiğini, nasıl hesaplandığını ve model performansını değerlendirmede ne zaman kullanılacağını öğrenin. Python ve R örnekleriyle pratik yorumlar görün.

Güncel 22 Nis 2026 · 8 dk. oku

RMSE (kök ortalama kare hata), bir regresyon modelindeki hataların ortalama büyüklüğünü ölçen ve regresyon analizinde yaygın olarak kullanılan bir doğruluk değerlendirme metriğidir.

Açıklanan varyansı nicelleştiren R-kare’den farklı olarak RMSE, yanıt değişkeninin birimiyle aynı birimde doğrudan bir tahmin hatası ölçüsü sunar. Bu da hataların büyüklüğünü en aza indirmeyi ve model performansını gerçek dünya terimleriyle yorumlamayı hedeflediğimiz durumlarda onu özellikle kullanışlı kılar.

Bu yazıda RMSE’nin anlamını, hesaplanışını, yorumlanmasını ve yaygın yanlış anlaşılmalarını inceleyeceğiz. Ayrıca, Python ve R örnekleri üzerinden RMSE’nin farklı modelleme koşullarında nasıl davrandığına bakacağız.

RMSE Nedir?

RMSE, gözlenen değerlerle tahmin edilen değerler arasındaki farkların karelerinin ortalamasının kareköküdür. Ortalama olarak, tahminlerimizden ne kadar hata bekleyebileceğimizi söyleyen yaygın bir regresyon metriğidir.

RMSE’yi hesaplamanın matematiksel formülü şöyledir:

burada:

y_i gözlem i için gerçek değerdir,
_ŷ, gözlem i için tahmin edilen değerdir,
n toplam gözlem sayısıdır.

Artıkları ortalamadan önce kareye alarak, RMSE büyük hataları küçük hatalara göre daha fazla cezalandırır. Bu hassasiyet, büyük tahmin hatalarının özellikle istenmediği durumlarda onu iyi bir seçenek yapar. RMSE her zaman negatif olmayan bir değerdir ve daha düşük değerler daha iyi uyum sağlayan bir modeli gösterir.

RMSE’yi Hesaplamanın Üç Eşdeğer Yolu

RMSE hesaplamak kolaydır. Artıkları hesaplamak, karelerini almak, ortalamak ve karekökünü almak yeterlidir.

Bunu hesaplamanın birkaç farklı yoluna bakalım.

Artıkları kullanarak

Bu yöntemde, artık değerleri elde etmek için tahminleri gerçek değerlerden çıkararak başlarız. Sonra her artığın karesini alır, hepsinin ortalamasını bulur ve sonunda karekökünü alırız.

burada:

y gerçek değerler vektörüdür,
ŷ, tahmin edilen değerler vektörüdür.

Bu doğrudan yaklaşım, bizzat tahmin hatalarının kendisini vurgular.

Ortalama kare hata (MSE) kullanarak

Bu yöntem bir yeniden ifade gibi görünse de aslında daha fazlası vardır: RMSE, MSE’nin karekökünden ibarettir.

burada:

şunlarla:

y_i gözlem i için gerçek değer,
ŷ, gözlem i için tahmin edilen değer,
n toplam gözlem sayısıdır.

Bu formülasyon kullanışlıdır çünkü MSE, model optimizasyonunda yaygın bir kayıp fonksiyonudur. Bu eşdeğerlik özellikle makine öğreniminde önemlidir; eğitim sırasında sıklıkla gradyan inişi ile minimize edilen kayıp fonksiyonu MSE’dir.

Bununla ilgili not: Tam da RMSE karekök içerdiği için birçok makine öğrenimi algoritması model eğitiminde RMSE’yi optimize etmeyi tercih etmez. Türevleri daha basit olduğundan (karekök doğrusal olmayanlık getirdiği için) bu optimizasyonlarda MSE tercih edilir. Ardından RMSE genellikle sonradan, performansı yorumlanabilir birimlerle raporlamak için kullanılır.

Matris biçiminde

Çoklu regresyonda RMSE, matris cebiri kullanılarak artık vektöründen de türetilebilir:

burada:

Y gerçek değerlerin sütun vektörüdür,
ŷ tahmin edilen değerlerin sütun vektörüdür,
n gözlem sayısıdır.

Bu matris temelli formülasyon özellikle büyük veri kümeleri veya model boru hatları için oldukça derli toplu ve hesaplama açısından verimlidir. Matematiğini çalışmak isterseniz özel bir lineer cebir kursumuz var.

RMSE’yi Yorumlamak

RMSE, ortalama tahmin hatası olarak yorumlanır ve modelin tahmin doğruluğunu belirler. Basitçe ifade etmek gerekirse, sonuç değişkeniyle aynı ölçekte, tahminlerin ortalama olarak gerçek değerlerden ne kadar saptığını gösterir.

Daha düşük bir RMSE, daha küçük ortalama tahmin hatalarına ve dolayısıyla daha doğru tahminlere işaret eder; ancak “kabul edilebilir” RMSE bütünüyle bağlama bağlıdır. Örneğin, milimetre cinsinden badem boyunu tahmin ederken RMSE’nin 2 olması iyi olabilir, ama yıllık badem rekoltesini ton cinsinden tahmin ederken pek ikna edici olmayabilir.

Anlamlı olması için RMSE, aynı veriler üzerinde eğitilmiş modeller arasında karşılaştırılmalı ya da geçmiş performansa göre kıyaslanmalıdır.

RMSE Ne Zaman Kullanılır?

RMSE özellikle şu senaryolarda faydalıdır:

Mutlak tahmin doğruluğu kritik olduğunda
Aynı veri kümesi üzerinde modelleri karşılaştırırken
Model hatalarının normal dağıldığı durumlarda
Amacımız büyük hataları en aza indirmek olduğunda
Hataları doğal birimlerle yorumlamak önemli olduğunda

Ancak RMSE’nin dezavantajları da vardır:

Aykırı değerlere duyarlıdır. Birkaç büyük artığın RMSE üzerinde orantısız etkisi olabilir ve yanıltıcı hale getirebilir.
Normalize edilmemiştir. Bu, hedef değişken ölçeklenmedikçe farklı veri kümeleri ve hedef ölçekleri arasında karşılaştırılamayacağı anlamına gelir.

Python ve R ile RMSE Örnekleri

Şimdi Kaggle’daki Dondurma Satışları Veri Kümesini kullanarak R ve Python’da RMSE’nin nasıl hesaplandığını gösterelim. Her iki programlama dilinde de iki model kurup her biri için RMSE hesaplayacağız:

Model 1: İlgili yordayıcıyı (sıcaklık) kullanır.
Model 2: Rastgele, ilgisiz bir yordayıcı ekler.

Python örneği

Python ile başlayalım.

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Load dataset
df = pd.read_csv("Ice Cream.csv")

# Extract features and target
X = df[['Temperature']]
y = df['Revenue']

# Model 1
model1 = LinearRegression()
model1.fit(X, y)
pred1 = model1.predict(X)
rmse1 = np.sqrt(mean_squared_error(y, pred1))
print(f"Model 1 RMSE: {rmse1:.3f}")

# Model 2 with an irrelevant predictor
np.random.seed(0)
df['Noise'] = np.random.normal(0, 1, size=len(df))
X2 = df[['Temperature', 'Noise']]

model2 = LinearRegression()
model2.fit(X2, y)
pred2 = model2.predict(X2)
rmse2 = np.sqrt(mean_squared_error(y, pred2))
print(f"Model 2 RMSE: {rmse2:.3f}")

Model 1 RMSE: 24.915
Model 2 RMSE: 24.911

Model 2 için RMSE’nin Model 1 ile çok benzer olduğunu görebiliriz. Model 2 daha karmaşık görünse de, yalnızca faydalı bilgi taşımayan rastgele gürültü eklediğimiz için gerçek tahmin doğruluğu kötüleşebilir.

Python’da regresyon becerilerinizi geliştirmek için şu kurslara kaydolun:

R örneği

Şimdi R’de deneyelim.

# Load dataset
df <- read.csv("Ice Cream.csv")

# Model 1
model1 <- lm(Revenue ~ Temperature, data = df)
pred1 <- predict(model1, df)
rmse1 <- sqrt(mean((df$Revenue - pred1)^2))
cat("Model 1 RMSE:", round(rmse1, 3), "\n")

# Model 2 with an irrelevant predictor
set.seed(0)
df$Noise <- rnorm(nrow(df), mean = 0, sd = 1)
model2 <- lm(Revenue ~ Temperature + Noise, data = df)
pred2 <- predict(model2, df)
rmse2 <- sqrt(mean((df$Revenue - pred2)^2))
cat("Model 2 RMSE:", round(rmse2, 3), "\n")

Model 1 RMSE: 24.915 
Model 2 RMSE: 24.915

Burada aynı örneği R’de yeniden düzenledim. İlgisiz bir yordayıcı eklediğimizde RMSE tam olarak aynı kaldı. Bu, özellikle model bu değişkene ihmal edilebilir bir ağırlık verdiğinde, gürültü değişkenleri eklendiğinde RMSE’nin her zaman değişmeyebileceğini doğrular. Ancak karmaşıklık yine de artar ve model yeni verilerde daha kötü genelleme yapabilir.

İki örnek arasında küçük bir fark fark etmiş olabilirsiniz: Python’da ilgisiz yordayıcıyı ekledikten sonra RMSE hafifçe düştü, R’de ise aynı kaldı. Bunun nedeni, her iki ortamda üretilen rastgele gürültünün (aynı dağılımdan çekildiğinden emin olmama rağmen) özdeş olmamasıdır.

R kodunuzu derlemekte zorlandıysanız veya sonucu yorumlamakta güçlük çektiyseniz şu kurslarımızı deneyin:

RMSE ve İlgili Metrikler

RMSE, daha geniş bir regresyon hata metrikleri ailesinin parçasıdır. Kısaca diğerleriyle karşılaştıralım, aralarındaki farkları netleştirelim ve her birinin ne zaman en yararlı olduğunu vurgulayalım.

RMSE ve MAE

RMSE, artıkları kareye aldığı için büyük hataları daha ağır cezalandırır ve aykırı değerlere daha duyarlıdır. Buna karşılık MAE (ortalama mutlak hata) aykırı değerlere karşı daha dayanıklıdır, tüm hataları eşit biçimde ele alır ve aykırıların sorun olmadığı durumlarda tipik hata büyüklüğünü ölçmek için daha iyi çalışır. RMSE kare kaybını minimize ederken, MAE mutlak kaybı minimize eder.

Genel olarak, büyük hataların özellikle maliyetli olabileceği durumlarda RMSE’yi; aykırı değerlere daha az duyarlı, medyan benzeri bir hata görünümü istediğimizde MAE’yi kullanmalıyız.

RMSE ve R-kare

RMSE, özgün birimlerde ortalama hatayı verir; bu da pratik yorum için daha sezgisel hale getirir. Buna karşılık R-kare modelin ne kadar varyans açıkladığını anlatır ancak tahmin hatası büyüklüğünü göstermez.

Genellikle birlikte kullanılırlar: R-kare göreli uyum için, RMSE ise mutlak performans için.

RMSE ve MSE

RMSE, MSE’nin karekökünden ibarettir ve sonuç değişkeniyle aynı birimde olduğu için yorumlaması daha kolaydır.

Yorumun ötesinde, MSE makine öğrenimi eğitiminde optimizasyon için özellikle kullanışlıdır. RMSE üzerinde optimize etseydiniz, karekök fonksiyonu modelin daha büyük hatalara daha fazla ağırlık vermesine neden olurdu. Ayrıca MSE’nin türevi düzgündür; bu nedenle stokastik gradyan inişi gibi gradyan tabanlı algoritmalarla iyi çalışır ve eğitim sırasında verimli yakınsamayı sağlar. Kısacası, verilerin ölçeğinde sonuçlara baktığımız için RMSE’yi yorumlamak daha kolaydır; ancak derin öğrenmenin sıklıkla RMSE değil, MSE’yi optimize ettiğini bilmeliyiz.

RMSE ve MAPE

MAPE (ortalama mutlak yüzde hata) hataları yüzde olarak döndürür; bu da veri kümeleri arasında karşılaştırma için kullanışlıdır. Ancak gerçek değerler sıfıra yakın olduğunda bozulur ve kararsız hale gelir. RMSE bu sorunu yaşamaz ve küçük hedef değerlerin bulunduğu durumlarda daha güvenilirdir.

RMSE ve olabilirlik (log-likelihood)

Şu da ilginç bir ilişki: RMSE, Gauss hataları altında negatif log-olabilirlikle biçimsel olarak eşdeğerdir. Ya da şöyle söylemeliyiz: RMSE’yi minimize etmek, sabit varyanslı normal dağılmış hatalar varsayımı altında (bir regresyon modelinin) log-olabilirliğini maksimize etmeye eşdeğerdir. Burada RMSE’nin tek başına tam log-olabilirliği tahmin ettiğini söylemiyorum; ancak RMSE’yi minimize etmenin, normal hata varsayımı altında log-olabilirliği örtük olarak maksimize ettiğini söylüyorum.

Bununla birlikte, hatalar çarpıksa veya aykırı değerler varsa, Huber ya da kuantil kaybı gibi alternatifler daha iyi performans gösterebilir. Her durumda, metrik seçimimizi bir model tasarımı kararı olarak ele almalı, sonradan düşünülecek bir ayrıntı olarak görmemeliyiz.

RMSE Hakkındaki Yaygın Yanılgılar

RMSE ile ilgili yaygın mitleri netleştirelim:

“Düşük bir RMSE, modelin iyi genelleme yapacağını garanti eder.” Bu her zaman doğru değildir. Bir model eğitim verisi üzerinde düşük RMSE değerine sahip olabilir ama aşırı uyum nedeniyle yeni, görülmemiş verilerde kötü performans gösterebilir. Genellemeyi verimli biçimde değerlendirmek için çapraz doğrulama yapmalı veya ayrı bir test kümesi kullanmalıyız.
“RMSE, bir modelin aşırı uyum yapıp yapmadığını belirleyebilir.” Tek başına RMSE bunu yapamaz. Eğitim ve doğrulama veri kümeleri arasında karşılaştırılmalıdır: eğitim RMSE’si düşük ama doğrulama RMSE’si çok daha yüksekse bu, aşırı uyuma (overfitting) işaret eder.
“İyi bir RMSE için sabit, evrensel bir eşik vardır.” Hayır yoktur. RMSE değerinin “iyi” olup olmadığı bütünüyle bağlama, alana ve sonuç değişkeninin birimlerine bağlıdır. Başka bir deyişle, bağlam olmadan RMSE değerleri anlamsızdır.

Sonuç

Özetle RMSE, hedef değişkenin birimleri cinsinden ortalama tahmin hatasını ileten, pratik, yorumlanabilir ve sezgisel bir tahmin doğruluğu ölçüsüdür. Özellikle hata büyüklüklerinin önemli olduğu durumlarda, regresyon performans değerlendirmesi için başvurulan bir metriktir.

Ancak daha kapsamlı bir model kalite değerlendirmesi için RMSE’yi R-kare, MAE ve çapraz doğrulama puanları gibi diğer metriklerle birlikte kullanmalıyız. Bu ölçüye körü körüne güvenmek yerine her zaman ölçek, bağlam ve model karmaşıklığını dikkate almalıyız. Ayrıca RMSE’yi görsel tanı testleriyle eşleştirmek önyargıyı tespit etmeye yardımcı olabilir.

Kısacası, RMSE modelimizin gerçek anlamda ortalama olarak ne kadar yanıldığını söyler; bu da öngörücü sistemler kurarken elde tutulması gereken güçlü bir bakış açısıdır.

Bu yazıda kafanızı karıştıran bir şey olduysa endişelenmeyin. Yardımcı olacak pek çok harika kaynağımız var:

Basit Doğrusal Regresyon: Bilmeniz Gereken Her Şey eğitimi
Kareler Toplamını Anlamak: SST, SSR ve SSE’ye Kılavuz eğitimi
Python ile statsmodels’a Giriş: Regresyon kursu
R ile Regresyona Giriş kursu

Author

Elena Kosourova

IBM Sertifikalı Veri Bilimci (2020); daha önce dünya genelindeki petrol ve gaz sahalarında 12+ yıllık uluslararası iş deneyimine sahip Petrol Jeoloğu/Jeomodelleyicisi. Python, R ve SQL konusunda yetkin. Uzmanlık alanları: veri temizleme, veri işleme, veri görselleştirme, veri analizi, veri modelleme, istatistik, hikâye anlatımı, makine öğrenimi. Veri bilimi topluluklarını yönetme ve veri bilimi ile kariyer konularında makale ve eğitim yazma/gözden geçirme konusunda kapsamlı deneyim.

RMSE nedir?

RMSE nasıl hesaplanır?

Düşük bir RMSE ne ifade eder?

İyi bir RMSE için evrensel bir eşik var mı?

RMSE’yi ne zaman kullanırsınız?

Konular

Veri Analizi

DataCamp ile öğrenin

Kurs

Python'da Model Doğrulama

4 sa

30.2K

Model doğrulamanın temellerini ve doğrulama tekniklerini öğrenin ve doğrulanmış, yüksek performanslı modeller oluşturmaya başlayın.

Ayrıntıları Gör

Kursa Başla

Kurs

R'da Regresyona Giriş

4 sa

77.2K

R'de regresyon analizini uygulayarak, analiz ederek ve yorumlayarak konut fiyatlarını ve reklam tıklama oranını tahmin edin.

Ayrıntıları Gör

Kursa Başla

Kurs

Python ile statsmodels kullanarak Regresyona Giriş

4 sa

60.1K

Python'da statsmodels ile regresyon analizi uygulayarak, analiz ederek ve yorumlayarak konut fiyatlarını ve reklam tıklama oranını tahmin edin.

Ayrıntıları Gör

Kursa Başla

Devamını Gör

İlgili

blog

2026’da En Popüler 40 Yazılım Mühendisi Mülakat Sorusu

Algoritmalar, sistem tasarımı ve davranışsal senaryoları kapsayan bu temel sorularla teknik mülakat sürecine hakim olun. Uzman cevapları, kod örnekleri ve kanıtlanmış hazırlık stratejileri edinin.

Dario Radečić

15 dk.

blog

Hızlı Sevkiyat İçin Pratik Vibe Kodlama Teknoloji Yığını

Ön uç, arka uç, veritabanları, kimlik doğrulama, depolama, e-posta, test, dağıtım ve izleme için en iyi araçları keşfedin.

Abid Ali Awan

14 dk.

Eğitim

Python'da Listeyi String'e Nasıl Dönüştürürsünüz

Bu hızlı eğitimde, Python'da bir listeyi string'e nasıl dönüştüreceğinizi öğrenin.

Adel Nehme

Eğitim

.gitignore Nasıl Kullanılır: Örneklerle Pratik Bir Giriş

Git deponuzu temiz tutmak için .gitignore’u nasıl kullanacağınızı öğrenin. Bu eğitim; temelleri, yaygın kullanım durumlarını ve başlamanıza yardımcı olacak pratik örnekleri kapsar!

Kurtis Pykes

Devamını Gör Devamını Gör

RMSE Nedir?

RMSE’yi Hesaplamanın Üç Eşdeğer Yolu

Artıkları kullanarak

Ortalama kare hata (MSE) kullanarak

Matris biçiminde

RMSE’yi Yorumlamak

RMSE Ne Zaman Kullanılır?

Python ve R ile RMSE Örnekleri

Python örneği

R örneği

RMSE ve İlgili Metrikler

RMSE ve MAE

RMSE ve R-kare

RMSE ve MSE

RMSE ve MAPE

RMSE ve olabilirlik (log-likelihood)

RMSE Hakkındaki Yaygın Yanılgılar

Sonuç

SSS

Düşük bir RMSE ne ifade eder?

İyi bir RMSE için evrensel bir eşik var mı?

RMSE&rsquo;yi ne zaman kullanırsınız?

2026’da En Popüler 40 Yazılım Mühendisi Mülakat Sorusu

Hızlı Sevkiyat İçin Pratik Vibe Kodlama Teknoloji Yığını

Python'da Listeyi String'e Nasıl Dönüştürürsünüz

.gitignore Nasıl Kullanılır: Örneklerle Pratik Bir Giriş

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Python'da Model Doğrulama

R'da Regresyona Giriş

Python ile statsmodels kullanarak Regresyona Giriş

2026’da En Popüler 40 Yazılım Mühendisi Mülakat Sorusu

Hızlı Sevkiyat İçin Pratik Vibe Kodlama Teknoloji Yığını

Python'da Listeyi String'e Nasıl Dönüştürürsünüz

.gitignore Nasıl Kullanılır: Örneklerle Pratik Bir Giriş

RMSE’yi ne zaman kullanırsınız?

Python'da Model Doğrulama