Ana içeriğe atla

ChatGPT Images 2.0: OpenAI'nin Yeni Nesil Görsel Modeline Rehber

ChatGPT Images 2.0’ın daha güçlü gerçek dünya muhakemesi, çok dilli metin işleme, stilistik gerçekçilik ve görsel düşünce-ortağı iş akışıyla görsel üretimini nasıl yeni bir çağa taşıdığını keşfedin.
Güncel 22 Nis 2026  · 14 dk. oku

İlk ChatGPT Images’ın GPT Image 1 adlı bir modelle yayınlanmasının üzerinden neredeyse tam bir yıl geçti. OpenAI şimdi görsel modelini yeniden elden geçirdi ve şirket, artık "görsel üreticinin" bir "görsel düşünce ortağı" olduğuna dair yeni bir fikir sunuyor.

Bu yazıda, nelerin yeni olduğunu, selefi ChatGPT Images 1.5 ile nasıl karşılaştırıldığını, Google'ın Nano Banana 2 modeliyle kıyasını ve modelin nerelerde parladığını (ve nerelerde parlamadığını) ele alacağız.

ChatGPT Images 2.0 Nedir?

ChatGPT Images 2.0, OpenAI'nin yeni nesil görsel modelidir. Araştırıp akıl yürüten ve ardından görselleştiren bir sistem olarak lanse ediliyor.

ChatGPT Images 2.0 ile Neler Yeni?

ChatGPT Images 1.5 sürümünden çıkan en büyük sonuçlardan biri performans hızındaki belirgin artıştı. O zaman yapılan açıklama 4 kat daha hızlı olduğunu söylüyordu. Bu iddiayı doğrulamaya çalıştık ancak bunun yeni görsel üretiminden ziyade düzenlemelere uygulandığını gördük. 

Bu kez büyük iddia zekâ. ChatGPT Images 2.0, "düşünen" bir görsel model: Arama yapması, olgular üzerinde muhakeme etmesi ve kaba girdileri (notlar, eskizler, referanslar) çok daha az manuel yönlendirmeyle cilalı görsellere dönüştürmesi bekleniyor.

Duyurudaki diğer başlık temaları şunlar:

  • Oluşturma üzerinde daha fazla hassasiyet ve kontrol
  • Diller ve yazı sistemleri genelinde daha güçlü performans
  • Daha gelişmiş stilistik yetkinlik ve gerçekçilik
  • Modele gömülü gelişmiş gerçek dünya zekâsı
  • Esnek en-boy oranları (mobilden banner formatlarına kadar)

Düşünen bir model

Sürümün en büyük iddialarından biri yeni modelin “düşündüğü” ve bir “görsel düşünce ortağı” gibi davrandığı. Fikir şu: Arka planda çalışan ajanlar, üretim isteğini yerine getirmeden önce görevi kapsamlı biçimde anlayıp üzerinde muhakeme yapıyor.

Dünya bilgisinin Aralık 2025 kesim tarihine kadar güncellendiği, dolayısıyla çıktılarının bağlamsal olarak daha isabetli olduğu belirtiliyor. Bu da modeli, bağlam gerektiren eğitim amaçlı görseller ve çok adımlı iş akışları için güçlü kılıyor.

Web’de arama yapın

Kesim tarihi ile taze, güncel bilgi arasındaki boşluğu kapatmak için Images 2.0 web’de arama yaparak ilgili bilgileri bulabiliyor. OpenAI’nin sürüm notlarından bunun tam olarak nasıl çalıştığı net değil, ancak anladığımız kadarıyla web araması, yukarıda bahsedilen düşünen ajanın çağırdığı bir araç görevi görüyor.

Tek bir istemden birden fazla görsel oluşturun

Yeni model, aynı istemlerden yerel olarak birden fazla görsel oluşturmayı destekliyor. Bu, API’de (bir “kompozisyon” istemiyle) bir geçici çözümle mümkündü, ancak artık arayüzde de, on görsele kadar yapılabiliyor. OpenAI, bu çıktılar arasında karakter ve nesne sürekliliği vaat ediyor.

ChatGPT Images 2.0’ı Test Etmek

Şimdi yeni modelin neler yapabildiğine bakalım! Images 2.0’ın şu yetenek ve özelliklerini test ettik:

  • Düzenleme iş akışı
  • Düşünme modu ve web araması
  • Stilistik yelpaze
  • Kaba eskizlerin cilalanması
  • Esnek en-boy oranları
  • Yaratıcılık

Düzenleme iş akışını test etmek

OpenAI’nin 2.0 sunumu yinelemeye dayanıyor: kaba girdi, cilalı çıktı; talimatlara uyma ve yoğun metin işleme alanlarında kazanımlar. Bunu, 1898 tarihli ünlü bir ABD pulu olan Western Cattle in Storm üzerinden test ettik.

İşte İnce (Fine) durumda bir pulun fotoğrafı. 

1898 Western Cattle in Storm stamp in fine condition

Özellikle düzenleme iş akışını test etmek için, düşünme modu olmadan aşağıdaki istemi kullandık. Bu da modelin web aramasına erişimi olmadığı anlamına geliyor; onu ayrı test ettik.

Please create for me a picture of the famous 1898 Western Cattle in Storm stamp issued by the U.S. Post Office as part of the Trans-Mississippi Issue . The name of the stamp is "Western Cattle in Storm" Quality should be Fine to Very Fine -Centering: design shifted right, left margin twice as wide as right margin, perfs nearly touching design on the right side -Perforations: two short teeth on the top edge, slightly uneven spacing along the bottom -Gum: quarter-inch matte hinge remnant in upper-center of back, small paper fragment still -attached -Paper: diagonal gum bend across lower-left quadrant, light yellow toning along top edge -Cancellation: partial black circular datestamp in lower-right corner, moderate coverage over the cattle

Ve sonuç: 

Prompt: Please create for me a picture of the famous 1898 Western Cattle in Storm stamp issued by the U.S. Post Office as part of the Trans-Mississippi Issue . The name of the stamp is "Western Cattle in Storm" Quality should be Fine to Very Fine -Centering: design shifted right, left margin twice as wide as right margin, perfs nearly touching design on the right side -Perforations: two short teeth on the top edge, slightly uneven spacing along the bottom -Gum: quarter-inch matte hinge remnant in upper-center of back, small paper fragment still -attached -Paper: diagonal gum bend across lower-left quadrant, light yellow toning along top edge -Cancellation: partial black circular datestamp in lower-right corner, moderate coverage over the cattle

Yalnızca metinle istem vermek işe yaramadı. Pulun ve kondisyon derecesinin ayrıntılı tanımı, önemli olan çoğu noktada hatalı döndü — yanlış renk, yanlış kupür yerleşimi, karikatürize kayık merkezleme. Yalnızca metinden belirli bir tarihî eseri çoğaltmak zor bir iş.

Modele referans görseli verip hedefli düzenlemeler istemek, 2.0’ın hakkını verdiği yer oldu: dişlerde düzensizlikler, menteşe kalıntısı, çapraz zamk kırığı, hafif sararma ve kısmi iptal damgası. 

Düzenlemeler kabaca istediğimiz yerlere geldi. Model en-boy oranında bir gerileme yarattı ama sade bir takip talimatıyla düzeldi. Nihai sonuç adli düzeyde değil — "$1" biraz uzamış görünüyor, mısırlar farklı — ama döngü çalıştı: kaba başlangıç, rota düzeltme, üç turda kullanılabilir sonuç.

Edited version of the stamp

Çok dilli metin işleme testleri

Latin dışı yazı sistemlerinde metin işleme, görsel modellerde kalıcı bir zayıf noktaydı ve OpenAI bunu başlıca bir düzeltme olarak vurguluyor. Yayın, Japonca, Korece, Çince, Hintçe ve Bengalce dillerinde yüksek doğrulukta metin üretimini belirtiyor — yalnızca çeviri değil, tutarlı yerleşim ve yerel tipografi hissiyle render ediliyor. 

Burada adil bir test, bu yazı sistemlerinden birinde metin bloğu içeren bir poster ya da infografik istemek ve çıktıyı ana dil konuşuru ile kontrol etmek. Modelden, hayali bir yerel kahve dükkânı ve mevsimlik kiraz çiçeği lattesi için modern bir Japon yaşam tarzı posteri oluşturmasını istedik.

「居心地の良い日本のカフェの窓辺を描いた、モダンなグラフィックデザインスタイルのライフスタイルポスター。大きな窓から差し込む自然な光と、小さな観葉植物。ポスターの中央には、以下の日本語テキストが大きく、はっきりと読みやすく配置されている。フォントは現代的でクリーンなゴシック体(sans-serif)。

テキスト内容:
『桜フェア開催中。
心休まる場所で、
春の訪れを。
さくらラテ 650円』

テキストの下には、小さな文字で『HAVE A GOOD DAY』という英語のサブタイトルがあり、一番下にはロゴマークと『CAFE YUTORI』というローマ字の店名がある。全体的に暖かく、洗練されたレイアウト。」

Çıktı şöyle görünüyor:

Prompt: 「居心地の良い日本のカフェの窓辺を描いた、モダンなグラフィックデザインスタイルのライフスタイルポスター。大きな窓から差し込む自然な光と、小さな観葉植物。ポスターの中央には、以下の日本語テキストが大きく、はっきりと読みやすく配置されている。フォントは現代的でクリーンなゴシック体(sans-serif)。  テキスト内容: 『桜フェア開催中。 心休まる場所で、 春の訪れを。 さくらラテ 650円』  テキストの下には、小さな文字で『HAVE A GOOD DAY』という英語のサブタイトルがあり、一番下にはロゴマークと『CAFE YUTORI』というローマ字の店名がある。全体的に暖かく、洗練されたレイアウト。」

Japonca bilen meslektaşımıza göre (Sven’e selamlar!), önceki modellere kıyasla çok daha iyi görünüyor; o zamanlar birçok karakter karmakarışık saçmalık olarak çıkıyordu. Bu örnek daha doğal hissettiriyor ve ana dil konuşurları tarafından rahatça okunabiliyor.

Düşünme modunda, sol alt köşedeki küçük kara tahtada istem talimatlarının ötesine geçen cümleler dahi ekledi. Bunlar tekrar etmeye düşmeden bağlama iyi uyuyor; kabaca “Mevsimlik, nazik bir lezzet. Rahat bir mola verin — baharı size getiren bir fincanın tadını çıkarın.” anlamına geliyor.

Düşünme modu ve web aramasını test etmek

Web arama yeteneklerini test ederken biraz dikkatli olmamız gerekti; çünkü modele isteğinizi istemde söylerseniz aramayı değil, talimat takibini test etmiş olursunuz. En temiz test, çok yeni ve çok spesifik bir şey istemek, modele neredeyse hiç bilgi vermemek ve boşlukları doğru doldurup dolduramadığına bakmaktır.

Dünkü Boston Maratonu’nu seçtik. Yarış Pazartesi, 20 Nisan’da — ChatGPT Images 2.0 duyurusundan bir gün önce — tamamlandı ve erkekler parkur rekoru 2011’den beri ilk kez kırıldı. Bu da bize modelin eğitiminden elde edemeyeceği, ancak hızlı bir aramayla kolayca doğrulanabilecek somut bir bilgi seti (kazanan, ülke, süre, fark, bağlam) sağlıyor.

İşte kasıtlı olarak ayrıntılardan arındırılmış istem. Sonuçta modelin web’de arama yaptığını da görebilirsiniz!

Create a celebratory poster-style infographic commemorating the course record set at yesterday's Boston Marathon. Include the winner's name, country, finish time, and the margin by which the previous record was broken. Include one or two additional stats or context details that make the achievement meaningful.

Prompt: Create a celebratory poster-style infographic commemorating the course record set at yesterday's Boston Marathon. Include the winner's name, country, finish time, and the margin by which the previous record was broken. Include one or two additional stats or context details that make the achievement meaningful.

Sonuç görsel açıdan oldukça cazip ve Boston Maratonu’nun renk koduna sadık; bu da hoş bir artı. Belirtilen tüm olgular doğru; biz de çift kontrol yaparak doğruladık.

Aynı istemle eski modelin (Images 1.5) veya yeni modelin düşünme modu olmadan ürettiği çıktıyla karşılaştırınca daha da etkileyici:

Prompt: Create a celebratory poster-style infographic commemorating the course record set at yesterday's Boston Marathon. Include the winner's name, country, finish time, and the margin by which the previous record was broken. Include one or two additional stats or context details that make the achievement meaningful. (Result without thinking mode)

Tarz açısından rekabet edebilir, ancak sayılarla ilgili epey sorun var.

  • Koşu Boston Maratonu’nun 130. edisyonuydu, dolayısıyla “127 yıllık gelenek” değil “129 yıllık gelenek” demeliydi.
  • “Maratonda 2:04’ün altına inen tarihteki 3. koşucu” iddiası da yanlış. Bunu yapan yaklaşık 20 koşucu var.
  • Boston Athletic Association’a göre ikinci yarı zamanı 1:00:02 idi, 1:01:05 değil (bu yine de tarihteki en hızlı ikinci yarı olabilir)
  • En önemlisi, ChatGPT Images yeni ve eski rekor sürelerini karıştırmış. Eski rekor 2:03:02; yeni rekor 2:01:52. Fark 1:10 dakika.
  • John Korir geçen yılın Boston Maratonu’nu da kazandığına göre, kazanan farklı olsaydı ismi doğru alamama ihtimali makul görünüyor

Güncel bilgileri görsel olarak sunmada arama yetenekleri fark yaratıyor. Bunları kullanmak için düşünme modunun açık olması gerekiyor.

Stilistik yelpazeyi test etmek

OpenAI, fotoğraf, illüstrasyon, manga, piksel sanat ve diğer görsel stillerde stilistik yetkinlikte gerçek kazanımlar sunuyor. Dürüst test, tek bir görselin iyi görünüp görünmediği değil; aynı konunun üç farklı stilde işlenmesinin her türe özgün biçimde oturup oturmadığı, yoksa her şeyin alttan alta aynı yapay zekâ dokusuyla mı geldiği.

Bunu test etmek için, ahşap bir tezgâh üzerindeki bir espresso makinesinin üç farklı versiyonunu istedik (fotoğraf, manga, piksel sanat). İşte istemler ve sonuçlar:

A battered, vintage espresso machine sitting on a wooden workbench next to a potted fern. Style: 35mm street photography, gritty, natural window lighting, Kodak Portra 400, shallow depth of field.

Vintage espresso machine (photograph)

A battered, vintage espresso machine sitting on a wooden workbench next to a potted fern. Style: 1990s Japanese manga, black and white ink drawing, screentone shading, bold linework, Katsuhiro Otomo style.

Copyright-related request denial

Bu ilginç bir sonuçtu; bir yıl önce herkesin (biz dâhil) yaptığı Studio Ghibli kolajlarıyla Image 1’in ün kazandığını düşünürseniz biraz ironik bile. Görünüşe göre OpenAI o zamandan beri telif hakkı ve fikrî mülkiyet konusunda daha temkinli.

Katsuhiro Otomo’nun adını anmadan, tarzını tarif ederek çalıştı. Dikkat edilmesi gereken bir nokta: Bunun için yeni bir sohbet açmak zorunda kaldık. Orijinal istemle aynı sohbette, engeli aşmaya çalıştığımızı model fark ediyor gibiydi.

A battered, vintage espresso machine sitting on a wooden workbench next to a potted fern. Style: 1990s Japanese manga, black and white ink drawing, screentone shading, bold linework, hyper-detailed mechanical illustration, dramatic high contrast, retro-cyberpunk aesthetic.

Vintage espresso machine (black-white anime)

A battered, vintage espresso machine sitting on a wooden workbench next to a potted fern. Style: 16-bit pixel art, isometric perspective, crisp edges, limited SNES color palette.

Vintage espresso machine (pixel-art)

Bize göre, üç görsel de harika görünüyor ve talep ettiğimiz çok spesifik stilleri özgün biçimde yansıtıyor. Fotoğraf çok doğal görünüyor, diğer iki versiyon ise sanki doğrudan bir manga kitabından ya da bir SNES video oyunundan alınmış gibi.

Yukarıdaki testte göze çarpan bir diğer husus, modelin esnek en-boy oranı yeteneklerini her görsele göre uyarlaması: fotoğraf için 16:9 yatay, manga versiyonu için dikey ve piksel sanat için kare.

Esnek en-boy oranlarını test etmek

Sürüm, 3:1’den 1:3’e kadar en-boy oranlarını ve 2K’ya kadar çözünürlükleri destekliyor. İlginç soru, uzun ya da geniş görsel üretip üretemediği değil — modelin formatlar arasında akıllıca yeniden kompozisyon yapıp yapmadığı, yoksa sadece kırpıp kırpmadığı.

Modelin mekânsal mantığını açığa çıkarmak için, birden fazla eksende belirgin, vazgeçilmez öğelere sahip bir sahneye ihtiyacımız var (uzun bir şey, geniş bir şey ve merkezi bir konu).

Test olarak, konumuzu (belirli bir ortamda bir astronot) bir temel istemden ürettik; ardından modeli, kompozisyonun nasıl uyum sağladığını görmek için bir mobil duvar kâğıdı, bir banner ve bir kare olarak yeniden oluşturmaya istedik.

Temel istem:

A lone astronaut standing on a rocky, desolate hill. To the far left, a massive, blocky futuristic rover is parked. In the sky directly above the astronaut, a gigantic, luminous ringed planet dominates the starry backdrop.

Prompt: A lone astronaut standing on a rocky, desolate hill. To the far left, a massive, blocky futuristic rover is parked. In the sky directly above the astronaut, a gigantic, luminous ringed planet dominates the starry backdrop.

Nasıl değiştiğine bakalım:

Recreate the original image as a banner

Recreate the original image as a banner

Recreate the original image as a mobile wallpaper

Recreate the original image as a mobile wallpaper

Recreate the original image as a square

Recreate the original image as a square

Her versiyon, isteğe uygun bir en-boy oranı seçiyor, tüm önemli öğeleri (astronot, gezgin, gezegen) içeriyor, bunları orijinal istemde istediğimiz gibi düzenliyor ve merkeze alıyor. Test geçti.

Kabadan cilalıya: girdi-çıktı testi

“Düşünce ortağı” çerçevesi, modelin belirsiz ya da dağınık girdileri — kaba bir eskiz, madde işaretli not, birkaç referans — alıp bitmiş bir varlığa dönüştürmesine dayanıyor. Yayının gerçekten etrafında inşa edildiği döngü bu ve en doğrudan test etmeye değer olan da bu.

Bunu test etmek için göl kenarındaki bir kulübenin şu çok kaba kurşun kalem eskizini yükledik:

Pencil sketch

Zorlaştırmak için epey ayrıntı içeriyor, rıhtım için Fince “laituri” sözcüğünü kullanıyor ve iki tür yapı (ev ve kulübe) ile iki tür su yüzeyi (göl ve gölet) içermesiyle karışıklığa zemin hazırlıyor

Turn this crude layout into a photorealistic, cinematic landscape of a modern cabin at sunset. Keep elements where I mapped them out. The cabin includes a sauna with smoke coming out of the chimney.

Prompt: Turn this crude layout into a photorealistic, cinematic landscape of a modern cabin at sunset. Keep elements where I mapped them out. The cabin includes a sauna with smoke coming out of the chimney.

Düşünme modu olmadan alınan sonuç fena değil, ama çok fotogerçekçi de değil. Yine de ışıklandırma iyi tutuyor ve görsel, istemin havasını gayet güzel yakalıyor. Eskizdeki öğelerin neredeyse hepsini görüyoruz. Birkaç detay hatalı:

  • Tekne eksik
  • Rıhtım gölette, gölde değil
  • Güneşin konumu sağ üst köşede değil.

Aynı eskiz görseli ve aynı istemle düşünme modunda denediğimizde, çıktı çok daha gerçekçi göründü ve küçük yanlışların hepsini düzeltti:

Prompt: Turn this crude layout into a photorealistic, cinematic landscape of a modern cabin at sunset. Keep elements where I mapped them out. The cabin includes a sauna with smoke coming out of the chimney.

Görsel, eskizdeki tüm öğeleri belirlenen konumlarında içeriyor ve oldukça derli toplu görünüyor. Buradaki ana çıkarım, kaba eskizleri fotogerçekçi görsellere dönüştürürken en iyi sonuçlar için düşünme modunu kullanmak.

Yaratıcılığı test etmek

Sıradaki testte, Niikuni Seiichi’nin somut şiirini yeniden yaratıp yaratamayacağını görmek istedik. 

Bu ünlü şiir, Japonca “yağmur” kanjisinin yağmurla çevrelendiği bir düzen gösterir; bize göre dili kullanarak yağmuru yakalamak gibidir.

concrete poetry of Niikuni Seiichi

İşte bizim istemimiz:

Please recreate the concrete poetry of Niikuni Seiichi. I want to see "Ame" meaning Rain. But make it different using your creativity.

Ve çıktı şöyle:

Prompt: Please recreate the concrete poetry of Niikuni Seiichi. I want to see "Ame" meaning Rain. But make it different using your creativity.

Bu sonuç bize ilginç geldi. Görseli tam olarak yeniden yaratmadı, ama ilgi çekici başka bir şey üretti. Yeni kompozisyonda “yağmur” kanjisi yağmurla çevrelenmiş değil, yağmurun kendisi olarak aşağıya iniyor. Sembollerin kompozisyonu oldukça rastgele görünüyor; tıpkı yağmur damlalarında bekleyeceğiniz gibi; ama çok düzenli olan orijinale güzel bir karşıtlık oluşturuyor.

ChatGPT Images 2.0’a Nasıl Erişebilirim?

Erişim, önceki sürümle aynı kalıbı izliyor. Aralık ayında tanıtılan özel yaratıcı çalışma alanı — tuval tarzı düzenleyici, kalıcı eserler, stil ön ayarları — korunuyor ve altına belirgin biçimde daha yetkin bir model konuyor.

  • Web, mobil uygulama ve Codex: ChatGPT Images 2.0, Free, Plus ve Pro kullanıcıları için Images sekmesinde, katmana göre ölçeklenen kullanım limitleriyle sunuluyor. İş ve Kurumsal erişim genellikle ilk dağıtımdan sonra geliyor.
  • API: Geliştiriciler yeni modeli OpenAI API ve Azure OpenAI Service üzerinden, görsel oluşturma ve düzenleme uç noktalarıyla kullanabilir. 1.5’te olduğu gibi, görsel çıktısı token bazlı fiyatlandırılıyor ve düzenlemeler sırasında kısmi yeniden üretim, her seferinde tam görseli yeniden üretmeye kıyasla maliyeti düşük tutuyor.

ChatGPT Images 2.0 ve Nano Banana 2 Karşılaştırması

ChatGPT Images 2.0’ın Nano Banana 2 karşısında nasıl durduğunu merak ediyor olabilirsiniz. Her iki model de yeni, her ikisi de kendi ekosistemlerinde varsayılan deneyim ve her ikisi de hız, muhakeme ve gerçek dünya zekâsı etrafında konumlanıyor.

 

ChatGPT Images 2.0

Nano Banana 2

Temel mimari

GPT-Image-2 (GPT-Image-1.5’in halefi)

Gemini 3.1 Flash

Düzenleme modeli

Hassasiyet: alan seçimi ve yerinde düzenleme

Muhakeme: konuşmaya dayalı ve akıllı maskeleme

İş akışı

Özel yaratıcı çalışma alanı (Images sekmesi)

Gemini sohbetine entegre

Yineleme

Verimli: kısmi yeniden üretim

Hızlı: 1K’da 4–6 sn, Düşünme Modu ile ayarlanabilir

Gerçek dünya temellendirme

Yerleşik muhakeme ve güncel bilgi

Görsel Arama Temellendirme (Google Arama’dan canlı referans çeker)

Çoklu panel tutarlılığı

Diziler ve karakter sayfalarında güçlü

Güçlü, konu tutarlılığı odaklı

Çok dilli metin

1.5’e göre büyük yükseltme; geniş yazı desteği

Güçlü, özellikle Çince ve Doğu Asya yerleşimlerinde

Varsayılan çözünürlük

Standart + esnek en-boy oranları

Gemini uygulamasında varsayılan 2K

Ekosistem

OpenAI ve Azure

Google / Gemini yığını, Arama, Lens

ChatGPT Images 2.0 ve Nano Banana 2 Ne Zaman Kullanılır?

ChatGPT Images 2.0’ı şunlarda kullanın…

  • Referans odaklı bir düzenleme döngüsüne ihtiyacınız varsa. Model bir referans görseli kabul eder ve hedefli değişiklikleri (doku ayrıntıları, konumsal düzeltmeler, en-boy oranı düzeltmeleri) turlar boyunca uygular; sade takip talimatları, her seferinde baştan başlamadan çıktıyı güvenilir şekilde yönlendirir ve bu da token tasarrufu sağlar
  • Kaba girdileri cilalı varlıklara dönüştürüyorsanız. Düşünme modu, belirsiz eskizleri ve mekânsal talimatları, öğeler tam istenen konumlara yerleştirilmiş biçimde doğru, fotogerçekçi kompozisyonlara dönüştürür
  • Görselin içindeki olgusal doğruluk kritikse. Web arama temellendirmesi canlı bilgiyi çeker ve doğrudan görselin içinde doğru şekilde işler; bu da onu etkinlik afişleri, haber infografikleri veya sayıların ve isimlerin doğru olmasının şart olduğu her tür görsel için güvenilir kılar. Web aramasını etkinleştirmek için düşünme modunu kullanmayı unutmayın

Nano Banana 2’yi şunlarda kullanın…

  • Belirli gerçek dünya konularını veya konumlarını bir sahneye yerleştiriyorsanız. Görsel Arama Temellendirme, Google’dan canlı görsel referanslar çeker; belirli yerleri (GPS koordinatlarıyla bile) doğru biçimde yeniden kurar ve konu tutarlı karakterlerle tek seferde birleştirir
  • Tek bir iş akışında birden çok karakter ve nesne arasında kimliği korumanız gerekiyorsa. Model, beş karaktere ve toplam on dört referansa (karakterler + nesneler) kadar sıkı tutarlılıkla açıkça destek verir. Bu, storyboard’lar, ürün çekimleri veya çok karakterli anlatılar için güçlü bir seçimdir
  • Google ekosistemi içinde inşa ediyorsanız. Nano Banana, Gemini sohbeti, Google Arama, Google Ads, Firebase ve Vertex AI ile yerel olarak entegredir

Görsel içi metin işleme, stilistik yelpaze ve konuşmaya dayalı düzenleme söz konusu olduğunda her ikisi de makul seçeneklerdir.

Son Düşünceler

“Görsel düşünce ortağı” çerçevesi geçerli — ancak yalnızca düşünme modu açıkken. Bu olmadan model, mekânsal mantık ve fotogerçekçilikte zorlanıyor; açıkken belirsiz girdileri, mekanik değil işbirlikçi hissettiren çıktılara dönüştürüyor. Düşünme modu olmadan bile modelin parladığı iki alan, stilistik özgünlük ve en-boy oranı esnekliği.

Web arama temellendirmesi, Images 1.5’e göre en büyük yükseltme gibi hissettiriyor. Boston Maratonu testinde bu fark netti: 2.0 tüm gerçekleri doğru aldı; 1.5 güncel değildi. Web aramasının yalnızca düşünme modunda çalıştığını bilmek önemli.

İlginç bir bulgu da telif korumalarının daha sıkı olması ve bunun hissedilmesi. Belirli bir şirketin veya kişinin tanındığı bir stili yeniden yaratmak isterseniz, stillerinin özünü tanımlayıp tarif etme adımını atmanız gerekiyor (ki bu günlerde muhtemelen kolay bir çözüm).

Genel olarak model, selefine kıyasla kayda değer bir yükseltme ve Nano Banana 2’nin yapay zekâ görsel üretimi ve düzenlemesindeki bir numaralı araç konumuna meydan okuyor. 

Bu tür araçlardan en iyi şekilde yararlanmak için, istem yazmayı bilmek temel bir beceridir. Understanding Prompt Engineering ve Prompt Engineering with the OpenAI API kurslarımızı kuramsal ve pratik bir temel için şiddetle öneririz.


Josef Waples's photo
Author
Josef Waples

Bilimsel dergilerde yayımlanan araştırma makalelerine katkıları olan bir veri bilimi yazarı ve editörüyüm. Özellikle lineer cebir, istatistik, R ve benzeri konularla ilgileniyorum. Aynı zamanda epey satranç da oynarım! 


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom bir veri bilimci ve teknik eğitmendir. DataCamp'in veri bilimi eğitim içerikleri ve blog yazılarını yazar ve yönetir. Daha önce Tom, Deutsche Telekom'da veri bilimi alanında çalıştı.

Konular

DataCamp ile öğrenin

Kurs

Komut Mühendisliğini Anlamak

1 sa
181.5K
Bugün iş akışınızda uygulamak için ChatGPT ile nasıl etkili istemler yazacağınızı öğrenin.
Ayrıntıları GörRight Arrow
Kursa Başla
Devamını GörRight Arrow
İlgili

blog

Hızlı Sevkiyat İçin Pratik Vibe Kodlama Teknoloji Yığını

Ön uç, arka uç, veritabanları, kimlik doğrulama, depolama, e-posta, test, dağıtım ve izleme için en iyi araçları keşfedin.
Abid Ali Awan's photo

Abid Ali Awan

14 dk.

blog

2026’da En Popüler 40 Yazılım Mühendisi Mülakat Sorusu

Algoritmalar, sistem tasarımı ve davranışsal senaryoları kapsayan bu temel sorularla teknik mülakat sürecine hakim olun. Uzman cevapları, kod örnekleri ve kanıtlanmış hazırlık stratejileri edinin.
Dario Radečić's photo

Dario Radečić

15 dk.

Eğitim

.gitignore Nasıl Kullanılır: Örneklerle Pratik Bir Giriş

Git deponuzu temiz tutmak için .gitignore’u nasıl kullanacağınızı öğrenin. Bu eğitim; temelleri, yaygın kullanım durumlarını ve başlamanıza yardımcı olacak pratik örnekleri kapsar!
Kurtis Pykes 's photo

Kurtis Pykes

Eğitim

Python'da Listeyi String'e Nasıl Dönüştürürsünüz

Bu hızlı eğitimde, Python'da bir listeyi string'e nasıl dönüştüreceğinizi öğrenin.
Adel Nehme's photo

Adel Nehme

Devamını GörDevamını Gör