Program
OpenAI'den gelen son haberler, özellikle GPT-5 mini kullanıcıları için ilgi çekici: yeni GPT-5.4 mini modeli iki kat daha hızlı ve tüm alanlarda iyileştirilmiş bir performans sunuyor. Buna ek olarak, OpenAI en verimli model sınıfının en yeni sürümü olan GPT-5.4 nano'yu da yayınladı.
Bu yazıda, GPT-5.4 mini ve nano'nun ne olduğunu, GPT-5.4 ile karşılaştırıldığında nasıl performans gösterdiklerini ve kimlerin OpenAI’nin en yeni “hız şeridi” modellerinden fayda sağlayabileceğini ele alacağız.
Ayrıca GPT-5.4 ve Claude Opus karşılaştırmamıza ve OpenAI Frontier rehberimize de göz atmayı unutmayın.
GPT-5.4 mini Nedir?
GPT-5.4 mini, GPT-5 mini’nin yerini alan OpenAI’nin en yeni küçük LLM’idir. Seçim nedenlerinden biri olan iki kat hızın yanı sıra selefinin performansında önemli iyileştirmeler getirir.
API içinde geniş bir özellik yelpazesini destekler:
- Metin ve görsel girdiler
- Araç kullanımı ve fonksiyon çağrıları
- Web araması
- Bilgisayar kullanımı
- Beceriler
GPT-5.4 nano Nedir?
GPT-5.4 nano, OpenAI’nin en yeni model serisinin en küçük sürümüdür ve GPT-5 nano’nun yerini alır. Adından da anlaşılacağı üzere mini modele kıyasla daha düşük performansla birlikte daha da verimlidir. Yine de GPT-5.4 nano, pek çok benchmarkta eski mini model olan GPT-5 mini’yi geride bırakır.
Mini model kadar çok özelliği desteklemese de, görsel girdi, araç kullanımı, fonksiyon çağrısı ve yapılandırılmış çıktı gibi günümüzün standart API özelliklerini sunar.
GPT-5.4 mini ve nano Gerçekten Kimler İçin?
Yeni sürüm, bir yanda performans ile diğer yanda gecikme ve fiyat arasındaki klasik ödünleşimi gözeterek doğru modeli seçmede esneklik sunuyor.
OpenAI, gecikme istemediğiniz uygulamalar üzerinde çalışan geliştiriciler için mini ve nano'yu öneriyor. Temelde, kullanıcıların gecikmeye pek tahammül etmeyeceği, tepkisel hissettirmesi gereken işler için.
Hata payının az olduğu akıl yürütme ağırlıklı görevlerde, çok kipli (multimodal) kullanımda ve etmen tabanlı görevlerde ise ilk tercih GPT-5.4 olmaya devam ediyor.
GPT-5.4 mini ve nano Karşılaştırma Sonuçları (Benchmarks)
Haydi LLM karşılaştırmalarına bakalım. Bazı dikkat çekici sonuçlar:
- Kodlama: Hem 5.4 mini (%54,4) hem de nano (%52,4) SWE‑Bench Pro’da %50’nin üzerine çıkıyor ve GPT-5.4’ün çok gerisinde kalmıyor. GPT-5 mini’ye (%45,7) kıyasla iyileşme kayda değer.
- Terminal ajanları: Terminal‑Bench 2.0’da, 5.4 modellerinin üç farklı çeşidi arasındaki mesafe belirginleşiyor. GPT-5.4 mini (%60,0), GPT 5.2 (%62,2) gibi önceki amiral gemisi modellerle rekabet edebilirken, 5.4 nano (%46,3) GPT-5 (%49,6) ile benzer, ancak her ikisi de GPT-5.4’ün en üst düzey performansından uzak.
- Bilgisayar kullanımı: GPT-5.4 mini, GPT-5.4’ü yakından takip ederek OSWorld‑Verified’da etkileyici bir %72,1’e ulaşırken, GPT-5.4 nano belirgin şekilde geride kalıyor (%39,0). Nano’nun bilgisayar kullanımı görevleri için yaratılmadığı açık.

Bizi hemen etkileyen bir diğer nokta, (neredeyse) tüm kategorilerde sıralamanın aynı olmasıydı: GPT-5.4 > GPT-5.4 mini > GPT-5.4 nano > GPT-5 mini. Yayınlanan tüm puanlar boyunca tek istisna, eski mini modelin görsel ve bilgisayar kullanımı alanlarında GPT-5.4 nano’yu geçmesiydi ki bu alanlar nano’nun hedef alanları değil.
Bununla birlikte, GPT-5 mini için mevcut olmayan yeni “xhigh” akıl yürütme çaba düzeyinin ne kadar fark yarattığı belirsiz.
Elbette performans her şey değil. OpenAI, sağladıkları grafiklerde görüldüğü gibi azalan getiriler konusuna dikkat çekmeye çalışıyor. Karşılaştırılan dört model arasında GPT-5.4 en yavaş ve en pahalı olanı.

Eğriler azalan getirileri gösteriyor: Bir modele daha fazla hesaplama/kaynak para harcayıp mütevazı doğruluk kazanımları elde edebilirsiniz, ancak sıçramalar küçülür. GPT-5.4’ün son birkaç yüzde puanı, ilk puanlardan çok daha pahalıya mal oluyor. Bu tür bir grafik, mühendislerin, belirli uygulamalarında fazladan %3–4 doğruluğun bedeline değip değmediğine karar vermelerine yardımcı olur.

Yine de grafiği eleştirel olarak değerlendirme ihtiyacı hissediyoruz: Y ekseni 0’dan değil %35’ten başlıyor. Bu, modeller arasındaki görsel farkları gerçekten abartıyor. %35’ten başlayan grafikte GPT-5.4’ün GPT-5 mini’ye karşı üstünlüğü, sıfırdan başlayan grafiğe göre daha büyük görünüyor.
Ayrıca OpenAI, bu gecikme rakamlarının gerçek üretim çalışmaları yerine modellenmiş tahminlerden geldiğini belirtiyor. Bu biraz uyumsuz görünüyor. OpenAI altyapı kararları hakkında pek çok öneride bulunuyor, ancak grafiklerinde yalnızca modelleme tahminleri var.
Hata çubukları olmadan modelleme tahminlerine bakmayı da garipsiyoruz. OpenAI bunları eklemeyi seçseydi, hata çubuklarının büyük ölçüde üst üste bineceğine iddiaya girerim.
GPT-5.4 mini ve nano’ya Nasıl Erişilir
GPT‑5.4 mini’yi ChatGPT tarayıcı arayüzünde, Codex’te ve API’de halihazırda bulabilmeniz gerekir. ChatGPT’de Ücretsiz ve Go katmanlarındaki kullanıcılar için varsayılan “Düşünme” modeli ve GPT-5.4 Düşünme oran sınırına ulaşan diğer tüm kullanıcılar için yedek modeldir.
GPT‑5.4 nano ise yalnızca API üzerinden kullanılabilir.
GPT-5.4 mini ve nano Fiyatlandırma
GPT-5.4 mini, 1M girdi token’ı için 0,75 ABD doları ve 1M çıktı token’ı için 4,50 ABD dolarıdır. Yine yalnızca API’de sunulan GPT‑5.4 nano ise 1M girdi token’ı için 0,20 ABD doları ve 1M çıktı token’ı için 1,25 ABD dolarıdır. Bu fiyatlar karşılığında 400k bağlam penceresi elde edersiniz.
Bu, elbette OpenAI’nin amiral gemisi modelinden (1M girdi/çıktı başına 2,50/15 ABD doları) çok daha ucuzdur.
GPT-5.4 mini ve nano vs. Claude Haiku 4.5
Asıl ilginç olan, GPT-5.4 nano’nun, rakiplerin daha düşük performanslı küçük modellerinin çoğundan, özellikle de 1 milyon girdi token’ı için 1 ABD doları ve 1 milyon çıktı token’ı için 5 ABD doları fiyatlandırılan rakip Claude Haiku 4.5’tan daha düşük fiyatla sunulması. Yani OpenAI, her iki durumda da Claude Haiku’nun fiyatını kırdı.
Peki modeller testlerde nasıl karşılaştırılıyor? İkisini karşılaştırmak biraz zor çünkü farklı test varyantlarında değerlendirilmişler. SWE-bench sonuçları tamamen karşılaştırılamaz çünkü tamamen farklı sürümler kullanıyorlar. Claude Haiku 4.5, SWE-bench Verified üzerinde test edildi ve %73,3 puan aldı; GPT-5.4 nano ise SWE-bench Pro (Public) üzerinde test edildi ve %52,4 puan aldı. Pro, daha zor ve daha güncel bir testtir.

Claude Haiku 4.5, OSWorld’de %50,7 puan
Elma ile elmanın en temiz karşılaştırıldığı iki testte, GPT-5.4 nano her ikisinde de önde.
- GPQA Diamond’da GPT-5.4 nano %9,8 daha yüksek puan alıyor ve
- τ2-bench Telecom’da GPT-5.4 nano %9,5 daha yüksek puan alıyor.
Bununla birlikte, benchmark varyantları karşılaştırmayı zorlaştırsa da Haiku 4.5, OSWorld bilgisayar kullanımında üstünlük sağlayabilir.
- Claude Haiku 4.5 standart OSWorld üzerinde test edildi ve %50,7 puan aldı
- GPT-5.4 nano OSWorld-Verified üzerinde test edildi ve %39,0 puan aldı.
OSWorld-Verified daha zor bir testtir, ancak neredeyse %12’lik fark oldukça anlamlı görünüyor. SWE-bench Verified ve SWE-bench Pro’da olduğu gibi, Verified sürümünde iyi olan modellerin Pro sürümünde sıklıkla daha kötü performans gösterdiğinin bilindiği bir durumda, OSWorld ve OSWorld-Verified için aynı hikayenin geçerli olduğuna dair daha az kanıt olduğundan bu farkı göz ardı etme konusunda daha temkinliyiz.

GPT-5.4 nano, OSWorld-Verified’da %39 puan
GPT-5.4 mini ve nano Hakkında Söylenenler
Çevrimiçi tepkilerin çoğu, teknolojide tanıdık bir kalıba işaret etti: geçen yılın amiral gemisi, gelecek yılın ücretsiz katmanı olur. Tüm bunlar beklenebilirdi, ancak değişim hızı şaşırtıcı.
İnsanlar, sınır teknolojisi (frontier AI) ürünlerinin şimdiye kadar üretilmiş herhangi bir üründen daha hızlı değer kaybettiğini söylüyor. Bugün prim ödediğiniz modelin altı ay sonra hâlâ buna değip değmeyeceğini merak ediyorlar. Bazen geliştiriciler, ince ayar sürecinden geçtilerse veya maliyet ve performans kalibrasyonları yaptıysalar bir modeli diğeriyle öylesine değiştirmek istemeyebilirler.
Sonuç
Karşılaştırmalar, GPT-5.4’ten 5.4 mini’ye, oradan 5.4 nano’ya doğru temiz bir performans basamağı gösteriyor. Ancak birçok görevde, pratik seçim birkaç ekstra yüzde puanı sıkıştırmaktan ziyade gecikme ve bütçeye daha çok bağlı.
Pek çok üretim uygulaması için, kaliteli bir frontier hissi verirken yüksek hacimli kullanım için yeterince ucuz ve hızlı olduğundan GPT-5.4 mini harika bir yeni varsayılan olabilir.
GPT-5.4 nano ise, gecikmeye çok duyarlı büyük gerçek zamanlı iş yükleri için daha uzman bir modeldir. Ayrıca, daha yüksek performanslı Düşünme modelleri tarafından devredilen daha kolay “kitle” işlerini yapacak alt ajanlar için de idealdir.
Geçen yılın amiral gemisinin bu yılın “mini”si olduğu bir dünyada, modelleri kolayca değiştirebilen sistemler tasarlamak, tek bir model sürümü için optimize etmeye göre daha üstün bir tercihtir. Bu sorunu ele alan ve Ölçeklenebilir Etmenik Sistemler Oluşturma kursumuzu almanızı öneririm; bu kurs aynı zamanda Model Context Protocol (MCP) gibi etmenik çerçeveleri kullanmayı öğretir.
GPT-5.4 mini ve nano Hakkında SSS
GPT‑5.4 mini sadece daha hızlı bir GPT‑5 mini mi?
Hayır, hem daha hızlı hem de SWE‑Bench Pro gibi kıyaslamalarda belirgin biçimde daha güçlü, üstelik 400k bağlam penceresini koruyor.
GPT‑5.4 ile 5.4 mini arasındaki temel ödünleşim nedir?
Maksimum kalite için hâlâ GPT‑5.4 en iyisidir; 5.4 mini, çok daha iyi gecikme ve maliyet için biraz doğruluktan feragat eder.
Ne zaman GPT‑5.4 nano’yu mini yerine kullanmalıyım?
Üst düzey doğruluktan ziyade maliyet ve hızın daha önemli olduğu, ultra gecikme duyarlı veya çok yüksek hacimli iş yükleri için nano’yu kullanın.
GPT-5.4 mini ve nano araçları ve görselleri destekliyor mu?
Evet, her ikisi de API’de görsel girdi, araç kullanımı, fonksiyon çağrısı ve yapılandırılmış çıktıları destekler.
GPT-5.4 mini ve nano kodlama ve ajanlar için yeterince iyi mi?
Evet. Özellikle 5.4 mini, SWE‑Bench Pro’da %50’nin üzerine çıkar ve Terminal‑Bench 2.0’da rekabetçi puanlar alır; bu da onu kod ve terminal ajanları için güçlü kılar.
5.4 nano daha zayıftır, ancak yine de yönlendirme, ucuz bir alt ajan olarak görev yapma ve hız ile maliyetin en çok önem taşıdığı basit terminal iş akışlarını yürütme gibi birçok destek görevi için yeterince yeteneklidir.

Bilimsel dergilerde yayımlanan araştırma makalelerine katkıları olan bir veri bilimi yazarı ve editörüyüm. Özellikle lineer cebir, istatistik, R ve benzeri konularla ilgileniyorum. Aynı zamanda epey satranç da oynarım!

Tom bir veri bilimci ve teknik eğitmendir. DataCamp'in veri bilimi eğitim içerikleri ve blog yazılarını yazar ve yönetir. Daha önce Tom, Deutsche Telekom'da veri bilimi alanında çalıştı.



