Kurs
Anthropic, en yeni modeli Claude Sonnet 4.5’i dikkat çekici iddialarla piyasaya sürdü: Hem “dünyanın en iyi kodlama modeli” olarak lanse ediliyor hem de karmaşık ajanlar ve bilgisayar kullanımı için en iyi model olarak öne çıkarılıyor. Şirket ayrıca matematik ve akıl yürütmede "kayda değer" iyileştirmelerin altını çiziyor.
Bu sürümle Anthropic’in kurumsal müşterileri de hedeflediği izlenimini ediniyorum. Uzun süreler boyunca otonom kodlama ve bilim ile finans görevlerinin daha iyi ele alınmasına vurgu yapılması, Claude Sonnet 4.5’in karmaşık kodlama görevleri için başvurulacak model olması için güçlü bir itki yaratıyor.
Dikkat çekici biçimde, bu son model SWE-bench Verified değerlendirme kıyaslamalarında (bir modelin gerçek dünya yazılım kodlama problemlerindeki başarısını ölçer) zirvede yer alıyor ve 30+ saat boyunca odaklanabilme yeteneğiyle övülüyor.
Görünen o ki bu da Anthropic’ten güçlü bir başka sürüm; peki model bu iddialı söylemleri karşılayabilecek mi? Bu yazıda size Claude Sonnet 4.5’i ve temel özelliklerini tanıtacak, performansına kısaca bakacağım. Ayrıca Anthropic’in duyurduğu diğer her şeye, Claude Agent SDK ve Claude Imagine dahil, göz atacağım. Ayrı olarak hazırladığımız Claude Haiku 4.5 rehberimize de bakabilirsiniz.
Claude Sonnet 4.5 Nedir?
Claude Sonnet 4.5, Anthropic’in en yeni büyük dil modelidir. Claude Sonnet 4’ün piyasaya çıkmasının üzerinden yalnızca dört ay geçmişken geldi. O yazıda belirttiğimiz gibi, genel amaçlı Sonnet modeli çoğu kullanım senaryosunda iyi performans gösteriyor ve özellikle kodlama konusunda güçlüydü. Ancak temel kısıt, nispeten dar olan 200 bin token’lık bağlam penceresiydi; özellikle de 1M token’a kadar sunan Gemini 2.5 Flash gibi rakiplerle kıyaslandığında.
Sonnet 4.5 ile Anthropic bu kaygıyı (ve daha fazlasını) doğrudan ele aldı. En yeni model, yeni özellikler, daha iyi performans ve bunu destekleyen etkileyici istatistiklerle geliyor.
Yayın yazısına göre Claude Sonnet 4.5, hem Claude sohbet arayüzü hem de API üzerinden hemen kullanılabilir. Yeni modelin fiyatlandırması selefiyle aynı: milyon giriş token’ı başına 3 ABD Doları ve milyon çıkış token’ı başına 15 ABD Doları; performansı düşününce bunun çok iyi bir değer sunduğunu düşünüyorum.
Claude 4.5’teki Yeni Özellikler
Claude 4.5 modeliyle birlikte gelen epey havalı yeni özellikler var. Belirttiğimiz gibi, SWE-bench Verified değerlendirmesinde zirvede; fakat bilgisayar kullanımı yeteneklerini ölçen OSWorld kıyaslamasında da büyük kazanımlar sergiliyor.
Sadece 4 ay önce Sonnet 4 ile 42,2% olan skorun 61,4%’e sıçraması ne kadar büyük bir ilerleme olduğunu gösteriyor ve bence bu, Sonnet 4.5’in en dikkat çekici yönlerinden biri. Bunu, modelin nispeten basit bir isteme dayanarak tarayıcıda doğrudan eylemler aldığı Claude for Chrome uzantısının demosunda da görüyoruz.

Sonnet 4.5 Performansını Gösteren SWE-bench Verified Kıyaslaması: Kaynak
Daha göz alıcı iddialardan biri, modelin karmaşık, çok adımlı görevlerde 30 saatten uzun süre odağını koruyabilmesi.
Bunun dışında da dikkat çekici birkaç yeni özellik var:
Genişletilmiş düşünme modu
GPT-5 ve Grok 4 gibi modellerde gördüğümüz üzere, Sonnet 4.5 daha karmaşık görevler için daha uzun bir ‘düşünme’ süreci kullanan ve akıl yürütmenin düşünce zincirini gösteren genişletilmiş bir düşünme modu sunuyor.
Daha iyi alan-özel bilgi
Yeni modelin finans, hukuk, tıp ve STEM gibi belirli alanlarda zirveye oynayan bir performans sergilediği bildiriliyor. Yine, Cursor, GitHub, Netflix ve diğerlerinden yayın notlarına eklenen alıntılara bakınca, bu özelliğin Sonnet 4.5’e kurumsal müşterileri çekmeye dönük olduğunu hissediyorum.
En uyumlu öncü model
Anthropic’e göre güvenlik eğitimi bu sürümün merkezinde yer alıyor ve Claude Sonnet 4.5 olumsuz yanıt türlerinde büyük azalmalar gösteriyor. Bu da kullanıcılar olarak yalakalık, aldatma, güç arayışı ve sanrılı yanıtlar gibi durumların belirgin biçimde azalmasını görmemiz gerektiği anlamına geliyor.
Genel olarak daha güvenli bir model
Claude Agent SDK ile göreceğimiz üzere, ajansal iş akışları ve bilgisayar kullanımı Claude Sonnet 4.5’in iyi performans gösterdiği alanlar. Bunu göz önünde bulundurarak Anthropic, bu işlevler için hala bir endişe kaynağı olan istem enjeksiyonu saldırılarına karşı savunmada kayda değer iyileştirmeler aktarıyor.
Claude Sonnet 4.5’i Test Etmek
Claude Sonnet 4.5’in neler yapabildiğini görmek için potansiyelini gösterecek birkaç görev verdik. Her birine kısaca bakalım:
Basit kodlama görevi
Öncelikle, oldukça temel bir sağlıklı alışkanlıklar uygulaması oluşturmasını istedim. İstemim şöyleydi:
Günlük olumlu alışkanlıkları takip etmeme yardımcı olacak bir uygulama oluşturmak istiyorum. Görsel olarak hoş olsun; doğal renkler bolca kullanılsın (yeşil ve ahşap tonlarını çok severim!). Haftanın her günü için hangi alışkanlığın olacağını belirleyebileceğim bir alan, bunun için bir seri sayacı ve notlar, düşünceler ve görseller eklemek için yer istiyorum. Olumlu alışkanlıklar için her gün farklı bir tane olsun; ama meditasyon, şükran gibi zihinsel sağlık faydaları kanıtlanmış şeyleri düşünüyorum.
Ve işte görevi yürütürken — tarayıcıda kodlamaya başladı ve oldukça hızlı derledi; Grok 4 ve GPT-5’te gördüğümüz sonuçlara benzer şekilde.

Sonuç hızlıca teslim edildi (ne kadar süre çalıştığını söylememesi biraz sinir bozucuydu, ama muhtemelen sadece 30 saniye kadar) ve basit, zarif bir yanıt gibiydi. Uygulamanın işlevselliği yerindeydi ve istediğim her şeyi içeriyordu.

Matematik görevi
Sırada, Claude Sonnet 4.5’in matematik yeteneklerini denedim. GPT-5 yazımızdan ilham alarak, yeni modele oldukça basit bir işlem sordum; 7,001 eksi 6,999 kaç eder?

Yanıt neredeyse anlıktı ve doğruydu; ancak gerekçe vermedi, ben de takip sorusu olarak açıklamasını istedim. Üç farklı çözüm yöntemi verdi ve hepsi uygundu.
Sonrasında Claude’a yanlış olabileceğini söyledim; yanıtı, GPT-5’i test ettiğimizdekine kıyasla belirgin biçimde daha az yalakaydı. Doğrulama yapmamın yerinde olduğunu söyledi (ama haklı olduğumu söylemedi) ve hesabı farklı bir yoldan adım adım anlattı (açıklama biraz sakardı):

Claude Sonnet 4.5 Kıyaslamaları
Bu yeni modelin rekabete karşı nasıl konumlandığına bakalım. Her zaman olduğu gibi, kıyaslamalardan öğrenebileceğimiz şeyler sınırlı ve zirvedeki modeller sık sık yer değiştiriyor. Ancak şu an için Claude Sonnet 4.5, aşağıdaki tabloda görüldüğü üzere oldukça etkileyici rakamlar paylaşıyor:

Bence burada en öne çıkan sonuçlar, konuştuğumuz gibi, ajansal performans ve bilgisayar kullanımı etrafında:
- Ajansal kodlama: 77,2% ve paralel test zamanı hesaplama ile 82,0%. Diğer Claude modellerine göre hafif bir iyileşme ve GPT-5 ile Gemini 2.5 Pro’nun önünde.
- Ajansal araç kullanımı: Havayolu görevlerinde 70%’ten telekomda 98%’e kadar değişiyor; her ikisi de diğer modellere kıyasla yüksek.
- Bilgisayar kullanımı: Belki de en dikkat çekici iyileşme bu. 61,4%, bir sonraki en iyi model olan Claude Opus 4.1’in belirgin şekilde önünde.
- Finansal analiz: Benzer modellere kıyasla burada da zirveye yakın bir sonuç.
Model bir süre daha piyasada kaldıktan sonra tam kıyaslama puanlarını görmeyi merak ediyorum; özellikle de Anthropic’in bazı kilit alanlarda alan-özel bilginin ciddi ölçüde iyileştiğini vurguladığını düşündüğümüzde.

Kaynak: Anthropic
Claude Sonnet 4.5’e Nasıl Erişilir
Claude Sonnet 4.5 şu anda birden fazla kanaldan erişilebilir. Nasıl kullanmak istediğinize bağlı olarak, yeni modele Claude sohbet arayüzü üzerinden erişebilir, API ile geliştirme yapabilir veya kurumsal iş akışlarına entegre edebilirsiniz. Erişim şöyle çalışıyor:
Sohbet erişimi
Claude Sonnet 4.5’i doğrudan Claude.ai web arayüzü veya mobil uygulamalar (iOS ve Android) üzerinden kullanabilirsiniz. Ücretsiz katman dahil tüm kullanıcılara açıktır. Bu da hem gündelik hem de profesyonel kullanıcılar için geniş erişilebilirlik sağlar.
API erişimi
Geliştiriciler modeli Anthropic API üzerinden kullanabilir; ayrıca Amazon Bedrock ve Google Cloud Vertex AI üzerinde de mevcuttur.
API fiyatlandırması (Eylül 2025 itibarıyla): milyon giriş token’ı başına 3 ABD Doları ve milyon çıkış token’ı başına 15 ABD Doları.
Toplu işleme ve istem önbellekleme, bazı durumlarda maliyetleri %90’a kadar azaltabilir.
Claude Agent SDK
Anthropic’in Sonnet 4.5 ile birlikte yaptığı diğer ilgi çekici duyurulardan biri de Claude Agent SDK. Esasen, geliştiricilerin kendi Claude destekli ajanlarını oluşturmalarını sağlayan ve Anthropic’in dahili olarak kullandığı yapı taşları bunlar.
Agent SDK’nın özellikle gelişmiş ajansal iş akışları kurmak isteyen kullanıcıları heyecanlandıracağını düşünüyorum. Claude Code altyapısına dayanıyor ve kullanıcılara araştırma, müşteri desteği ve otomasyon gibi görevler için ajanlar oluşturma imkânı veriyor.
Agent SDK; dosya sistemi erişimi, bash betik çalıştırma, semantik ve ajansal arama, alt ajanlar ve hazır tümleşikler (Model Context Protocol aracılığıyla) gibi yetenekler kazandırarak, güvenilir biçimde bağlam toplayan, eyleme geçen ve kendi işini doğrulayan genel amaçlı ajanlar oluşturmayı mümkün kılıyor. Neler yapabildiğini görmek için Claude Agent SDK eğitimimize göz atabilirsiniz.
Claude ile Imagine
İlgi çekici bir diğer sürüm de, anında yazılım üretebilen bir aracın araştırma ön izlemesi olan Imagine with Claude. Anthropic, aşağıda gösterilen ve Claude Sonnet 4.5’in bu şekilde çalışabilme kabiliyetini sergileyen kısa bir video da paylaştı.
Oldukça başarılı bir demo; aracın etkileşimlerinize duyarlı şekilde çalışabildiğini, çeşitli öğeleri hızlı ve doğrudan ürettiğini gösteriyor. Burada gerçekten ilginç projeler için büyük bir potansiyel olduğunu düşünüyorum ve Anthropic Max aboneleri, lansmandan sonraki beş gün boyunca bu araçla oynayabilecek. Pencere nispeten dar olsa da bu tür araçları son kez görmeyeceğimizden eminim.
Sonuç
Claude Sonnet 4.5 burada ve ilk izlenimler oldukça iyi. Anthropic’in bu model lansmanıyla gittiği yönü beğeniyorum; koda, ajanlara ve bilgisayar kullanımına daha fazla vurgu yapıyorlar. Görünüşe bakılırsa bu son yinelemenin kurumsal kullanıcıların ilgisini çekecek bir seviyede performans gösterebileceğinden eminler; bu da bilgisayar kullanımı araçlarının geniş çapta benimsenmesine giderek yaklaştığımız anlamına geliyor.
Bununla birlikte, ajansal kullanım ve bilgisayar kullanımı etrafındaki kıyaslama listelerinde Sonnet 4.5’in ne kadar süre zirvede kalacağı henüz belli değil; son dört aydaki kazanımların oldukça anlamlı hissettirdiğini söylemekle beraber. Benzer şekilde, nispeten dar bağlam penceresi, büyük kod tabanlarıyla anlamlı biçimde çalışmayı hâlâ zorlaştırabilir.
Yine de Claude Agent SDK ve Imagine with Claude gibi araçlardan çıkacak projeleri görmeyi dört gözle bekliyorum ve Claude for Chrome uzantısı çeşitli iş akışlarına faydalı bir ek olacak.
SSS
Claude Sonnet 4.5 genel performans ve kullanım alanları açısından Claude Opus 4.1 ile nasıl karşılaştırılır?
Claude Sonnet 4.5, kodlama, ajansal görevler ve bilgisayar kullanımı alanlarında Opus 4.1’i geride bırakıyor; akıl yürütme, matematik ve alan-özel bilgi (örn. finans, hukuk, tıp, STEM) konularında kazanımlar sağlıyor. Günlük iş akışları için daha hızlı ve verimli; otonom uygulama geliştirme gibi karmaşık, çok adımlı işler için daha iyi bir tercih. Ancak, daha geniş bağlamın ağır istemler olmadan gerektiği kimi yaratıcı veya yoruma dayalı görevlerde Opus 4.1 hâlâ az da olsa öne çıkabilir.
Claude Sonnet 4.5’in kodlama yeteneklerindeki temel iyileştirmeler nelerdir?
Claude Sonnet 3.5, SWE-bench Verified’da en iyi modeldir (77,2% skor) ve daha iyi kod üretimi, yeniden düzenleme ve çok adımlı akıl yürütme sunar. 30+ saat boyunca karmaşık projeleri otonom biçimde yönetir, bash ve dosya düzenleme gibi araçlarla entegre olur ve paralel araç çağrılarını destekler. Yeni özellikler arasında kendiliğinden bağlam temizleme ve sorunsuz iş akışları için bir VS Code uzantısı yer alır.
Claude Sonnet 4.5 gerçekten 30 saatten uzun süre karmaşık görevlere odaklanabilir mi?
Evet, demolar; uygulama geliştirme gibi çok adımlı görevlerde bağlamı kaybetmeden araçları etkin biçimde kullanarak 30+ saat otonomiyi sürdürebildiğini gösteriyor. Bellek, kontrol noktaları ve bağlam düzenlemedeki iyileştirmeler bunu destekliyor ve uzun süreli ajansal çalışmalar için ideal kılıyor. Ayrıca, verimlilik için uzun konuşmalarda araç geçmişini kendiliğinden temizliyor.
Claude Sonnet 4.5 önceki Claude modellerine göre daha mı az duygusal, ve neden?
Evet, Claude Sonnet 4.5 daha az duygusal, daha az pozitif ve Claude 4’e kıyasla mutluluğunu yaklaşık yarı yarıya daha az ifade ediyor; kendi durumuna yönelik olumsuz tavırlar da daha az. Bu bütünüyle kasıtlı olmasa da, etik sınırları vurgulayan ve yalakalığı azaltan uyumlandırma eğitimlerinin bir sonucu. Aşırı senaryolarda daha takdire şayan davranışlara yol açsa da, gündelik veya yaratıcı etkileşimlerde “düzleşmiş” hissettirebilir. Daha fazla bilgi için modelin sistem kartını okuyabilirsiniz.
Claude Sonnet 4.5, kodlamanın ötesindeki kilit kıyaslamalarda nasıl performans gösteriyor?
Claude Sonnet 4.5, bilgisayar kullanımı için OSWorld’de lider (61,4%; Sonnet 4’te 42,2% idi); akıl yürütmede (örn. τ2-bench) ve matematikte (örn. AIME) kazanımlar var. MMMLU (İngilizce dışı) üzerinde genişletilmiş düşünme ile daha güçlü. Ayrıca, planlamada Devin gibi harici ajanları 18% iyileştiriyor ve prototiplerden ziyade üretime hazır güvenilirliğe odaklanıyor.
Claude Sonnet 4.5’in fiyatı nedir ve nerede kullanılabilir?
Fiyatlandırma, API üzerinden milyon giriş token’ı başına 3 ABD Doları ve milyon çıkış token’ı başına 15 ABD Doları olarak değişmedi. Hemen claude.ai’de (ücretsiz kullanıcılar için varsayılan), Claude API’de (claude-sonnet-4-5), Amazon Bedrock, Google Vertex AI, GitHub Copilot ve Cursor gibi araçlarda kullanılabilir. Pro/Max planları dosya oluşturma gibi tam özellikleri açar; Chrome uzantısı bekleme listesi Max kullanıcıları içindir.
Claude Sonnet 4.5’te güvenlik ve uyum, özellikle aldatma ve etik davranış konusunda iyileşti mi?
Evet, ASL-3 kapsamında yalakalık, aldatma ve güç arayışında büyük azalmalar gösteriyor; kişisel çıkar odaklı aldatıcı eylemler neredeyse sıfır. Etik sınırları daha iyi tanıyor (örn. şantajı reddetme) ve güvenlik sınıflayıcılarında yanlış pozitifler daha düşük (genel olarak 10 kat azaldı). İstem enjeksiyonlarına karşı da savunuyor ve kendi çıkarına olan senaryolarda daha az yanlı; ancak model karşılaştırmalarında kendisini az da olsa kayırabiliyor.
Yapay zekâ ve eğitim teknolojileri alanında kıdemli editör. Veri ve yapay zekâ trendlerini keşfetmeye odaklı.

