Kurs
GPT-5.4 bilgisayar kullanımı yetenekleri sunarak modellerin, uygulamaya özel API’lere güvenmek yerine yazılım arayüzleriyle doğrudan etkileşime girmesini sağlar. Ekran görüntülerini inceleyip tıklama, yazma ve gezinme gibi eylemler üreterek model; tarayıcıları ve uygulamaları bir insan kullanıcı gibi çalıştırabilir.
Bu eğitimde, OpenAI’nin Computer-Using Agent (CUA) örnek uygulaması ile GPT-5.4’ün gerçek arayüzlerle nasıl etkileştiğini keşfedecek ve ardından ortamı genişleterek seçilen bir konuda en yeni haberleri toplayıp özetleyen canlı bir haber panosu oluşturacağız.
Bu süreçte, gözlem–karar–eylem döngüsünün pratikte nasıl çalıştığını anlamak için önce Kanban otomasyonu, tuval çizimi ve rezervasyon iş akışı gibi birkaç yerleşik bilgisayar kullanımı senaryosunu inceleyeceğiz. Ardından aynı fikri uygulayarak, son haberleri alan, kilit bilgileri çıkaran ve sonuçları yapılandırılmış bir kullanıcı arayüzünde sunan küçük bir pano oluşturacağız.
Bu eğitimin sonunda şunları nasıl yapacağınızı anlayacaksınız:
- GPT-5.4 Bilgisayar Kullanımı ortamını çalıştırma
- Aracıların gerçek arayüzlerle nasıl etkileştiğini gözlemleme
- Codex kullanarak yeni uygulama özellikleri üretme ve
- Canlı bir haber panosu oluşturma
Güncelleme: GPT 5.4’ün halefi modelin arkasındaki teoriyi derinlemesine incelemek için tGPT-5.5 blog yazımıza göz atmanızı öneririm.
GPT-5.4 Bilgisayar Kullanımı Nedir?
GPT-5.4, modellerin bir insan operatöre benzer şekilde yazılım arayüzleriyle etkileşime girmesine olanak tanıyan yerel bilgisayar kullanımı yetenekleri sunar. Uygulamaya özel API’lere güvenmek yerine model, arayüzün görsel durumundan doğrudan çalışır; ekran görüntülerini ve UI geri bildirimlerini kullanarak bir sonraki adımda hangi eylemleri gerçekleştireceğine karar verir. Bu, aracıların tarayıcılar, panolar ve üretkenlik araçları gibi gerçek ortamlarla etkileşime girmesini sağlar.
Bilgisayar kullanımıyla model şu eylemleri gerçekleştirebilir:
- Web sayfalarında gezinme
- UI öğelerine tıklama
- Alanlara metin yazma
- Belgeleri veya sayfaları kaydırma
- Panolar ve uygulamalarla etkileşim kurma
Model arayüzün kendisi üzerinden akıl yürüttüğü için, özel tümleştirmelere ihtiyaç duymadan farklı araçlar arasında çok adımlı iş akışlarını tamamlayabilir.
Örneğin, bir bilgisayar kullanımı aracısı web’de bilgi arayabilir, ilgili verileri çıkarabilir, bir rapor oluşturabilir ve bir panoyu güncelleyebilir.
Sistem, kaputun altında, arayüzü tekrar tekrar gözlemleyen, bir eyleme karar veren ve sonucu doğrulayan basit bir aracı döngüsüyle çalışır. İş akışı şöyle ilerler:
- İstek gönderme: Geliştirici bir hedef istemi, bilgisayar kullanım aracı ve arayüzün ilk ekran görüntüsünü sağlayarak başlar.
- Model akıl yürütme ve eylem önerisi: GPT-5.4 ekran görüntüsünü analiz eder ve gezinme, tıklama, yazma veya kaydırma gibi UI eylemleri önerir.
- Yürütme: İstemci veya çalıştırıcı bu eylemleri ortamda uygular.
- Güncellenmiş durumu döndürme: Eylem tamamlandıktan sonra modele yeni bir ekran görüntüsü ve geçerli sayfa durumu gönderilir.
- Döngüyü yineleme: Model, güncellenen arayüzü gözlemleyip görev tamamlanana kadar bir sonraki eyleme karar verir.
Bu döngü genellikle şöyle özetlenir:
observe -> decide -> act -> observe
GPT-5.4 Bilgisayar Kullanımı Demosu: Canlı Bir Haber Panosu Oluşturma (Ek Örneklerle)
Bu bölümde, OpenAI’nin CUA örnek uygulamasını kullanarak GPT-5.4 bilgisayar kullanımıyla çalışan canlı bir haber panosu oluşturacağız. Aracı, kullanıcı tarafından seçilen bir konuda en güncel haberleri toplamak, sonuçları özetlemek ve bunları yapılandırılmış bir panoda sunmak için gerçek bir tarayıcı ortamıyla etkileşime girecek.
İş akışı şu şekilde işler:
- Kullanıcı panoda ilgi duyduğu bir konuyu seçer.
- Aracı, tarayıcıda güvenilir haber kaynaklarında gezinir ve konuyla ilgili güncel, ilgili makaleleri belirler.
- GPT-5.4 her makaleden başlığı, kaynağı ve kilit bilgileri çıkarır.
- Aracı bulguları özetler ve üç kısa haber özeti üretir.
- Sonuçlar pano tarzı bir yerleşimde sunulur.
Haber panosuna ek olarak, aynı ortam içinde GPT-5.4 bilgisayar kullanımının etkileşimli uygulamalar üretebileceğini gösteren birkaç küçük istemi de kısaca inceleyeceğiz.
Kaputun altında sistem, modelin ekran görüntüleriyle ortamı gözlemlediği, UI eylemleri (ör. gezinme veya etkileşim) önerdiği ve her adım sonrası güncellenmiş durumu aldığı bilgisayar kullanımı aracı döngüsü üzerinden çalışır.
Adım 1: CUA örnek uygulamasını klonlayıp kurun
Başlamak için OpenAI’nin CUA örnek uygulamasını kullanacak ve depoyu cihazımızda yerel olarak kuracağız. Depoyu klonlayın ve bağımlılıkları şu şekilde yükleyin:
git clone https://github.com/openai/openai-cua-sample-app.git
cd openai-cua-sample-app
corepack enable
pnpm install
cp .env.example .env
Bu işlem, OpenAI API anahtarınızı ekleyeceğiniz bir .env dosyası oluşturur. OpenAI hesabınıza giriş yapıp panoya giderek yeni bir API anahtarı oluşturabilirsiniz.
Eğer pnpm install sharp veya esbuild gibi isteğe bağlı paketlere ilişkin uyarılar verirse, bunlar yerel geliştirme için yok sayılabilir. Sonrasında Playwright tarayıcı çalışma zamanını yükleyin:
pnpm playwright:install
Linux sistemlerde ayrıca işletim sistemi bağımlılıklarına ihtiyacınız olabilir:
pnpm playwright:install:with-deps
Son olarak geliştirme sunucularını başlatın:
pnpm dev
Artık CUA operatör konsolunu http://127.0.0.1:3000 adresinde açabilirsiniz. Bu konsol, aracı çalıştırmalarını başlatmanıza ve günlükleri ile ekran görüntülerini incelemenize olanak tanır.

Adım 2: Yerleşik bilgisayar kullanımı senaryolarını keşfetme
Örnek uygulama, bilgisayar kullanım davranışını göstermek için tasarlanmış üç kum havuzu ortamı içerir. Bu ortamlar, GPT-5.4’ün arayüzlerle nasıl etkileştiğini gözler önüne serer.
Kanban panosu otomasyonu
Kanban panosu senaryosu, GPT-5.4 bilgisayar kullanımının görsel etkileşim yoluyla yapılandırılmış UI yerleşimlerini nasıl kavrayıp manipüle edebildiğini gösterir.
Bu örnekte, aracıya bir Kanban panosundaki görevleri yeniden düzenlemek gibi bir hedef verilir. Herhangi bir uygulama API’sini çağırmak yerine aracı, tıpkı bir insan gibi arayüzle etkileşime girer; yani panoyu gözlemler, görev kartlarını belirler ve sürükle-bırak işlemleri gerçekleştirir.
Kaputun altında GPT-5.4, bilgisayar kullanımı aracı döngüsünü çalıştırır:
- Aracı, geçerli URL ile birlikte Kanban panosunun bir ekran görüntüsünü alır.
- Model, görsel yerleşimi analiz eder ve görev kartlarının ve sütunların nerede olduğunu belirler.
- GPT-5.4 şu tür UI eylemleri önerir:
- imleci bir kartın üzerine taşımak
- tıklayıp basılı tutmak
- kartı başka bir sütuna sürüklemek
- Çalıştırıcı bu eylemleri Playwright işaretçi olaylarıyla uygular.
- Güncellenmiş pano durumunu doğrulayabilmesi için yeni bir ekran görüntüsü alınır ve modele geri gönderilir.
Süreç, pano istenen yapılandırmayı yansıtana kadar devam eder.
Bu örneği ilginç kılan; modelin Kanban uygulamasına dair hiçbir dahili bilgiye güvenmemesidir.
Bunun yerine, ekran görüntüsüne dayanarak nereye tıklayıp sürükleyeceğini ve öğeleri nereye bırakacağını arayüzün görsel durumundan tamamen kendisi çıkarır. Bu, GPT-5.4 bilgisayar kullanımının önemli bir avantajını gösterir: geliştiriciler, her araç için özel tümleştirmeler veya API’ler inşa etmeksizin iş akışlarını otomatikleştirebilir.
Tuval (Paint) etkileşimi
Paint senaryosu, basit form doldurmadan ziyade görsel yerleşime, mekânsal akıl yürütmeye ve hassas imleç kontrolüne dayanan görevleri ele alır. Bu düzenekte aracı, bir çizim talimatı alır ve bunu doğrudan tarayıcı tabanlı karalama uygulaması içinde tamamlamak zorundadır.
Aracıdan, tuval boyunca farklı sahneleri karalamasını istedim ve GPT-5.4; renkler seçerek, doğru çizim alanını bularak ve ızgarayı buna göre doldurarak görevi yerine getirdi.
Kanban örneğinde temel zorluk, yapılandırılmış kartları sütunlar arasında taşımakken; bu senaryoda uygulamanın görsel durumunu yorumlamak ve bir dizi düşük seviyeli etkileşim kararı almak çok daha belirleyicidir. Bu demoda bilgisayar kullanımı bunu şu şekilde yaptı:
- İmleç hareketi ve hedefleme: GPT-5.4 ilk olarak çizim arayüzünün düzenini, soldaki renk paletini ve ortadaki boş piksel tarzı tuvali yorumlar.
- Araç ve renk seçimi: Mevcut palet seçeneklerini belirler ve çizmeden önce uygun renge tıklar. Kaydedilen çalıştırmada model, renkleri değiştirir ve tuvalde farklı bölgeler oluşturmak için bunları bilinçli olarak kullanır.
- Tuval etkileşimi: Herhangi bir tuval API’sini çağırmak yerine aracı, imleci belirli hücrelere taşıyıp bunları tekrar eden desenlerle doldurarak uygulamayla tamamen UI eylemleri üzerinden etkileşime girer.
- Durum doğrulama: Her eylem grubundan sonra çalıştırıcı yeni bir ekran görüntüsü alır ve beklenen desenin tuvalde belirdiğini doğrulayabilmesi için modeli geri besler.
Dikkate değer bir nokta, GPT-5.4’ün rastgele tıklamıyor oluşuydu. Bunun yerine ekran görüntüsü geri besleme döngüsünü kullanarak çizimin nereye yapılması gerektiği, hangi rengin seçili olduğu ve her eylemden sonra tuvalin nasıl değiştiği üzerine akıl yürütüyordu.
İlerleyen karelerde; tuvalin boş bir ızgaradan, büyük renkli bölgeler içeren yapılandırılmış bir kompozisyona evrildiğini net biçimde görebilirsiniz; bu da modelin birden çok tur boyunca hem ilerlemenin hem de yerleşimin farkında olduğunu gösterir.
Rezervasyon iş akışı
Bu ortamda aracı, simüle edilmiş bir rezervasyon web sitesiyle etkileşime girer ve bir rezervasyon akışını tamamlaması istenir. Bu da tekil, yalıtılmış bir eylemi çözmek yerine bir dizi UI durumundan sırayla geçmesi gerektiği anlamına gelir.
Bu demoda bilgisayar kullanımı şöyle uygulanır:
- Arayüzü anlama: GPT-5.4, geçerli ekran yerleşimini yorumlayarak düğmeleri, form alanlarını, takvimleri, açılır menüleri ve onay kontrollerini belirler.
- Adım adım gezinme: Aracı; bir seçeneği belirleme, sonraki ekrana geçme veya bir form öğesini açma gibi, iş akışının önce hangi kısmının tamamlanacağına karar verir.
- Form doldurma: Gerekli değerleri metin kutularına girer ve açılır menüler veya tarih seçiciler gibi denetimlerle etkileşime girer.
- Turlar arasında durum takibi: Her eylemden sonra çalıştırıcı yeni bir ekran görüntüsü alır ve modeli geri besler; böylece model hangi alanların tamamlandığını ve nelerin yapılması gerektiğini doğrular.
- Onay ve tamamlama: Gerekli girişler doldurulduğunda aracı nihai onay adımına ilerler ve rezervasyonun başarıyla tamamlandığını kontrol eder.
Kanban, Paint ve Rezervasyon senaryoları her ne kadar UI kontrolünü gösterse de, bunları daha pratik uygulamalara taşımamız gerekir.
Bir sonraki bölümde, aynı fikri kullanarak, yakın tarihli haberleri toplayan, sonuçları yapılandıran ve bunları Codex uygulaması içinde kodsuz bir iş akışıyla kullanılabilir bir arayüzde sunan canlı bir haber panosu oluşturacağım.
Adım 3: GPT-5.4 ile canlı bir haber panosu oluşturma
Bu adımda, aynı bilgisayar kullanımı yeteneklerini kullanarak canlı bir haber panosu oluşturacağız. Hedef; kullanıcının AI, siyaset, iklim, teknoloji, bilim vb. gibi ilgi duyduğu bir konuyu seçebildiği küçük bir pano yaratmak ve sistemin ardından şunları yapmasıdır:
- Güvenilir kaynaklardan yakın tarihli haberleri toplamak
- Bu makalelerden kilit bilgileri çıkarmak
- Üç kısa özet üretmek
- Sonuçları yapılandırılmış bir pano biçiminde sunmak
Uygulamayı elle yazmak yerine, GPT-5.4 bilgisayar kullanımı ortamı içinde Codex’i kullanacak ve mevcut CUA deposunun içine özelliği doğrudan üretmesi için aşağıdaki istemi ileteceğiz.
Codex, CUA örnek uygulamasıyla aynı ortama bağlı olduğu için aracı; depoyu analiz edebilir, panonun nerede yer alması gerektiğine karar verebilir ve UI ile mantığı otomatik olarak uygulayabilir.
İstem:
Build a live News Dashboard in this repo.
Goal:
Create a dashboard where a user can enter a topic of interest, fetch the latest important news in real time from trusted sources, and render exactly 3 structured results that are meaningful and topic-relevant.
Requirements:
- The dashboard must allow the user to type a topic such as AI, politics, climate, health, science, or tech.
- Fetch live results at request time. Do not hardcode stories.
- Use trusted sources appropriate to the topic. Prefer official or well-known outlets.
- Return exactly 3 items.
- Each item must include:
- HEADLINE
- SOURCE
- SUMMARY
- Summaries must be in your own words, concise, and clearly related to the article and topic.
- Avoid low-quality results such as homepages, category pages, generic aggregator wrappers, or meaningless titles.
- Prefer direct article URLs over search/aggregator wrapper links.
- Keep the UI minimal and consistent with the repo’s existing design language.
- Reuse the existing framework/tooling. Do not add new dependencies unless truly necessary.
Implementation plan:
1. Inspect the repo and place the dashboard in the existing app structure without breaking the current console.
2. Add a topic input UI with a search action and a loading/error state.
3. Add a server-side news fetch path that:
- maps topics to trusted source sets
- fetches recent results in real time
- filters out irrelevant or low-quality matches
- resolves direct article URLs where possible
- extracts useful metadata for headline/source/summary
4. Render the dashboard with:
- page title
- topic
- date
- intro
- exactly 3 cards/items
- a structured export block that can be copied into another dashboard
5. Keep the export block in this exact format:
---BEGIN DASHBOARD CONTENT---
TITLE: News Brief — [TOPIC]
DATE: [today's date]
INTRO: Top 3 [TOPIC] updates from trusted sources.
ITEM 1:
HEADLINE: [headline]
SOURCE: [source name or URL]
SUMMARY: [2–4 sentences]
ITEM 2:
HEADLINE: [headline]
SOURCE: [source name or URL]
SUMMARY: [2–4 sentences]
ITEM 3:
HEADLINE: [headline]
SOURCE: [source name or URL]
SUMMARY: [2–4 sentences]
SOURCES_USED: [comma-separated list of sites used]
---END DASHBOARD CONTENT---
Deliverables:
- A working live dashboard route in the app
- Real-time topic search
- Exactly 3 relevant results per search
- Structured export block visible in the UI
- Short run instructions
- Basic tests for parsing/formatting logic if the repo already has a test runner
Bu istem, ayrıntılı uygulama kodu olmak yerine yüksek düzeyli bir teknik şartname olarak davranarak Codex’e mevcut depo içinde canlı bir haber panosu inşa etmesini söyler.
Codex, öncelikle proje yapısını inceleyerek pano UI’sinin ve arka uç mantığının nereye eklenmesi gerektiğini belirler. Ardından bir konu giriş alanı oluşturur, güvenilir kaynaklardan gerçek zamanlı olarak yakın tarihli makaleleri getirir, başlık, kaynak ve özet gibi kilit meta verileri çıkarır ve alakayı sağlamak için sonuçları süzer.
Son olarak, panoda kolayca görüntülenip dışa aktarılabilen, temiz ve yapılandırılmış bir yerleşimde tam olarak üç haber öğesi sunar.

GPT-5.4 bilgisayar kullanımı, özelliği üretirken modelin geliştirme ortamını gözlemleyip onunla etkileşime girmesine olanak tanıyarak bu iş akışını mümkün kılar.
Codex, salt bir kod üreteci gibi davranmak yerine depoyu analiz eder, yeni bileşenlerin nerede yer alması gerektiğini belirler ve sonuçları doğrularken panoyu artımlı olarak uygular.
İş akışı birkaç kilit adımı içerir:
- Depo incelemesi: Codex, pano UI’sinin ve destekleyici mantığın nereye eklenmesi gerektiğini belirlemek için proje yapısını tarar.
- Kullanıcı arayüzü: Kullanıcıların AI, iklim veya teknoloji gibi konuları arayabilmesini sağlayan bir konu giriş alanı oluşturur.
- Gerçek zamanlı haber alma: Sistem, sabit kodlanmış örneklere güvenmek yerine güvenilir kaynaklardan yakın tarihli makaleler toplar.
- Süzme ve özetleme: GPT-5.4, başlık, kaynak ve özet gibi faydalı meta verileri çıkarır ve sonuçların seçilen konuyla ilgili kalmasını sağlar.
- Yapılandırılmış sunum: Son olarak pano, sonuçların kolay taranabilmesi için tam olarak üç haber öğesini kart tarzı bir yerleşimde görüntüler.
Not: Nihai pano tek bir istemden üretilmedi. İstenen davranış ve çıktı biçimini elde etmek için birkaç yineleme ve istem iyileştirmesi gerekti. Benzer deneyleri çalıştırırken, istemi ve kısıtları ayarlarken deneme-yanılmayı bekleyin. Ayrıca, bilgisayar kullanımı iş akışlarını engelleyebileceklerinden, tarayıcınızın veya sisteminizin otomatik tarayıcı etkileşimlerini engellemediğinden emin olun.
Sonuç
Bu eğitimde, GPT-5.4 Bilgisayar Kullanımı’nın, geleneksel API’lere güvenmek yerine gerçek yazılım ortamlarıyla etkileşime giren aracıları oluşturmak için nasıl kullanılabileceğini inceledik. OpenAI’nin CUA örnek uygulamasını kullanarak önce bilgisayar kullanımı döngüsünün kum havuzu senaryoları üzerinden nasıl çalıştığını; yani modelin arayüzleri nasıl gözlemlediğini, eylemler önerdiğini ve ekran görüntüleriyle sonuçları doğruladığını gördük.
Ardından aynı konsepti CUA ortamında Codex kullanarak canlı bir haber panosu inşa etmek için uyguladık. Uygulamayı elle yazmak yerine bir istem, yüksek düzeyli bir şartname olarak hareket etti; bu sayede Codex depoyu inceleyip pano için UI ve mantığı oluşturdu, güvenilir kaynaklardan yakın tarihli haberleri aldı ve sonuçları yapılandırılmış bir biçimde sundu.
Buradan hareketle şu tür aracıları oluşturarak bu fikri daha da genişletebilirsiniz:
- Dahili panoları veya raporlama araçlarını otomatikleştirme
- Araştırma hatları oluşturma
- Sektör trendlerini gerçek zamanlı izleme
- Mevcut depoların içinde doğrudan yeni ürün özellikleri prototipleme
Bilgisayar kullanımı modelleri gelişmeye devam ettikçe; hem yazılım arayüzleriyle hem de kod tabanlarıyla etkileşime girebilen daha genel amaçlı geliştirme ve otomasyon aracılarına kapı aralayabilirler.
GPT-5.4 Bilgisayar Kullanımı Hakkında SSS
GPT-5.4 Bilgisayar Kullanımı nedir?
GPT-5.4 Bilgisayar Kullanımı, yapay zekâ modellerinin ekran görüntüleri ve tıklama, yazma, gezinme gibi eylemler aracılığıyla yazılım arayüzleriyle etkileşime girmesini sağlayan bir yetenektir.
CUA örnek uygulamasını ne güçlendirir?
Mevcut uygulama şunları kullanır:
- Tarayıcı otomasyonu için Playwright
- OpenAI Responses API’si
- bir Next.js operatör konsolu
GPT-5.4 gerçek web sitelerini otomatikleştirebilir mi?
Evet, ancak geliştiricilerin site politikalarına saygı göstermesi ve CAPTCHA’ları veya güvenlik mekanizmalarını atlatmaktan kaçınması gerekir.
Bilgisayar kullanımı ile ne tür uygulamalar geliştirilebilir?
Bilgisayar kullanımına yönelik bazı uygulama örnekleri şunlardır:
- araştırma asistanları
- veri panoları
- otomasyon aracıları
- üretkenlik araçları
ML (Üretken Yapay Zekâ) alanında Google Developers Uzmanıyım, Kaggle 3x Expert unvanına sahibim ve 3+ yıllık teknoloji deneyimiyle Women Techmakers Elçisiyim. 2020'de bir sağlık teknolojileri girişiminin kurucu ortağı oldum ve Georgia Tech'te makine öğrenmesi alanında uzmanlaşarak bilgisayar bilimleri yüksek lisansı yapıyorum.

