Ana içeriğe atla

Derin Öğrenme Nedir? Yeni Başlayanlar için Bir Eğitim

Bu eğitim, derin öğrenme hakkında en sık sorulan soruları yanıtlar ve gerçek hayattan örneklerle derin öğrenmenin çeşitli yönlerini inceler.
Güncel 22 Nis 2026  · 15 dk. oku

Derin Öğrenme nedir?

Derin Öğrenme Nedir?

Derin öğrenme, bilgisayarların insanlar gibi örneklerden öğrenerek görevleri yerine getirmesini sağlayan bir makine öğrenmesi türüdür. Bir bilgisayara kedileri tanımayı öğrettiğinizi düşünün: ona bıyık, kulak ve kuyruk aramasını söylemek yerine binlerce kedi resmi gösterirsiniz. Bilgisayar, ortak desenleri kendi kendine bulur ve bir kediyi nasıl tanıyacağını öğrenir. Derin öğrenmenin özü budur.

Teknik açıdan bakıldığında, derin öğrenme, insan beyninden esinlenen “sinir ağları”nı kullanır. Bu ağlar, bilgiyi işleyen ve birbiriyle bağlantılı düğümlerden oluşan katmanlardan meydana gelir. Katman sayısı arttıkça ağ “derinleşir”; bu da daha karmaşık özellikleri öğrenmesini ve daha sofistike görevleri yerine getirmesini sağlar.

Nöronlar ve sinir ağları arasındaki benzerlik

Nöronlar ve Sinir Ağları Arasındaki Benzerlik

Makine Öğrenmesinden Derin Öğrenmeye Evrim

Makine öğrenmesi nedir?

Makine öğrenmesi, bilgisayarların verilerden öğrenmesini ve açıkça programlanmadan kararlar almasını sağlayan bir yapay zekâ (AI) alt kümesidir. Sistemlerin desenleri tanımasını, tahminlerde bulunmasını ve zamanla performansını iyileştirmesini sağlayan çeşitli teknik ve algoritmaları kapsar. Makine öğrenmesi ile yapay zekâ arasındaki farkı ayrı bir yazıda inceleyebilirsiniz. 

Derin öğrenmenin geleneksel makine öğrenmesinden farkı

Makine öğrenmesi kendi başına dönüştürücü bir teknoloji olsa da derin öğrenme, genellikle insan uzmanlığı gerektiren pek çok görevi otomatikleştirerek işleri bir adım öteye taşır.

Derin öğrenme, üç veya daha fazla katmana sahip sinir ağlarını kullanmasıyla ayrışan, makine öğrenmesinin özelleşmiş bir alt kümesidir. Bu sinir ağları, büyük miktarda veriden “öğrenmek” için insan beyninin davranışını taklit etmeye çalışır—elbette onun yeteneğine yaklaşmaktan uzak bir biçimde. Makine öğrenmesi ve derin öğrenme farkını ayrı bir yazıda daha detaylı inceleyebilirsiniz. 

Özellik mühendisliğinin önemi

Özellik mühendisliği, ham veriden “özellik” olarak bilinen en ilgili değişkenleri seçme, dönüştürme veya oluşturma sürecidir ve bu özellikler makine öğrenmesi modellerinde kullanılır.

Örneğin bir hava tahmin modeli kuruyorsanız, ham veri sıcaklık, nem, rüzgâr hızı ve basınç gibi değerleri içerebilir. Özellik mühendisliği, bu değişkenlerden hangilerinin hava durumunu tahmin etmek için en önemli olduğuna karar vermeyi ve gerekirse bunları dönüştürmeyi (ör. sıcaklığı Fahrenheit’tan Santigrat’a çevirmek) kapsar.

Geleneksel makine öğrenmesinde özellik mühendisliği genellikle alan bilgisi gerektiren, elle ve zaman alıcı bir süreçtir. Oysa derin öğrenmenin avantajlarından biri, ilgili özellikleri ham veriden otomatik olarak öğrenebilmesi ve böylece manuel müdahale ihtiyacını azaltmasıdır.

Derin Öğrenme Neden Önemlidir?

Derin öğrenmenin sektör standardı hâline gelmesinin nedenleri:

  • Yapılandırılmamış veriyi işleme: Yapılandırılmış veri üzerinde eğitilen modeller, yapılandırılmamış veriden de kolayca öğrenebilir; bu da veri kümelerini standartlaştırmada zaman ve kaynak tasarrufu sağlar.
  • Büyük veriyi işleme: Grafik işlem birimlerinin (GPU) devreye girmesi sayesinde derin öğrenme modelleri çok büyük verileri inanılmaz hızda işleyebilir.
  • Yüksek doğruluk: Derin öğrenme modelleri, bilgisayarlı görü, doğal dil işleme (NLP) ve ses işleme alanlarında en doğru sonuçları sunar.
  • Desen tanıma: Çoğu model makine öğrenmesi mühendisi müdahalesi gerektirirken, derin öğrenme modelleri her türlü deseni otomatik olarak tespit edebilir.

Bu eğitimde derin öğrenme dünyasına dalacak ve yapay zekâ (AI) alanında kariyere başlamanız için gereken temel kavramları keşfedeceğiz. Uygulamalı alıştırmalarla öğrenmek istiyorsanız Python ile Derin Öğrenmeye Giriş kursumuza göz atın.

Derin Öğrenmenin Temel Kavramları

Derin öğrenme algoritmalarının karmaşıklıklarına ve uygulamalarına dalmadan önce, bu teknolojiyi devrimci kılan temel kavramları anlamak esastır. Bu bölümde derin öğrenmenin yapı taşları olan sinir ağları, derin sinir ağları ve aktivasyon fonksiyonlarıyla tanışacaksınız.

Sinir ağları

Derin öğrenmenin merkezinde, insan beyninden esinlenen hesaplamalı modeller olan sinir ağları bulunur. Bu ağlar, bilgiyi işlemek ve kararlar almak için birlikte çalışan, “nöron” adı verilen birbiriyle bağlantılı düğümlerden oluşur. Nasıl ki beynimizde farklı görevler için farklı bölgeler varsa, bir sinir ağında da belirli işlevlere ayrılmış katmanlar vardır.

Daha ayrıntılı bir anlatım için Sinir Ağları Nedir başlıklı rehberimize göz atabilirsiniz.

Derin sinir ağları

Bir sinir ağını “derin” yapan, girdi ile çıktı arasında yer alan katman sayısıdır. Derin bir sinir ağı birden fazla katmana sahiptir; bu sayede daha karmaşık özellikleri öğrenebilir ve daha doğru tahminler yapabilir. Bu ağların “derinliği”, derin öğrenmeye hem adını hem de karmaşık problemleri çözme gücünü verir.

Derin sinir ağlarına giriş eğitimimiz, DNN’lerin derin öğrenme ve yapay zekâdaki önemini ele alır.

Aktivasyon fonksiyonları

Bir sinir ağında aktivasyon fonksiyonları karar vericiler gibidir. Hangi bilginin bir sonraki katmana iletilmesi gerektiğine karar verirler. Bu fonksiyonlar ağa karmaşıklık katar ve ağın veriden öğrenmesini, nüanslı kararlar almasını sağlar.

Derin Öğrenme Nasıl Çalışır

Derin öğrenme, aynı etikete ait benzer özellikleri tanımak için özellik çıkarımı kullanır ve ardından her etiketi doğru temsil eden özellikleri belirlemek üzere karar sınırlarından yararlanır. Kedi-köpek sınıflandırmasında derin öğrenme modelleri, hayvanların gözleri, yüzleri ve vücut şekilleri gibi bilgileri çıkarır ve bunları iki sınıfa ayırır.

Derin öğrenme modeli, derin sinir ağlarından oluşur. Basit bir sinir ağı bir giriş katmanı, bir gizli katman ve bir çıkış katmanından oluşur. Derin öğrenme modelleri ise birden çok gizli katman içerir; ek katmanlar modelin doğruluğunu artırır.

Basit sinir ağı Basit Sinir Ağı

Girdi katmanları ham veriyi içerir ve veriyi gizli katmanlardaki düğümlere aktarır. Gizli katmanlardaki düğümler, veri noktalarını daha geniş hedef bilgiye göre sınıflandırır; her bir sonraki katmanda hedef değerin kapsamı daralarak daha doğru çıkarımlar yapılır. Çıkış katmanı, gizli katmanlardaki bilgileri kullanarak en olası etiketi seçer. Bizim örneğimizde bir görüntünün kedi değil de köpek olduğunu doğru şekilde tahmin etmek gibi.

Yapay Zekâ vs. Derin Öğrenme

İnternette en sık sorulan sorulardan birini yanıtlayalım: “Derin öğrenme yapay zekâ mıdır?” Kısa cevap: Evet. Derin öğrenme, makine öğrenmesinin; makine öğrenmesi de AI’ın bir alt kümesidir.

AI vs. ML vs. DL AI vs. ML vs. DL

Yapay zekâ, insan davranışını taklit eden veya insan zekâsını aşan akıllı makineler inşa etme fikridir. AI, insan görevlerini tamamlamak için makine öğrenmesi ve derin öğrenme yöntemlerini kullanır. Kısacası, AI; akıllı kararlar alabilen en gelişmiş algoritma olduğundan derin öğrenmeyi içerir.

Derin Öğrenme Ne İçin Kullanılır?

Son dönemde teknoloji dünyasında yapay zekâ uygulamalarında bir patlama yaşandı ve bunların tümü derin öğrenme modelleriyle güçlendiriliyor. Uygulamalar, Netflix’te film önermekten Amazon’un depo yönetim sistemlerine kadar uzanıyor.

Bu bölümde derin öğrenme ile geliştirilen en bilinen uygulamalardan bazılarını inceleyeceğiz. Bu, derin sinir ağlarının tüm potansiyelini görmenize yardımcı olacak.

Bilgisayarlı Görü

Bilgisayarlı görü (CV), otonom araçlarda nesneleri algılamak ve çarpışmalardan kaçınmak için kullanılır. Yüz tanıma, poz tahmini, görüntü sınıflandırma ve anomali tespitinde de kullanılır.

Yüz tanıma Yüz Tanıma

Otomatik Konuşma Tanıma

Otomatik konuşma tanıma (ASR) dünyada milyarlarca kişi tarafından kullanılıyor. Telefonlarımızda yer alır ve genellikle “Hey Google” veya “Hey Siri” diyerek etkinleştirilir. Bu tür ses uygulamaları, metinden konuşmaya, ses sınıflandırmaya ve ses etkinliği tespitine kadar pek çok alanda kullanılır.

Konuşma deseni tanıma Konuşma Deseni Tanıma

Üretken Yapay Zekâ

Bir CryptoPunk NFT’nin 1 milyon dolara satılması ile üretken yapay zekâya olan talep arttı. CryptoPunk, derin öğrenme modelleri kullanılarak oluşturulan üretken bir sanat koleksiyonudur. GPT-4 modelinin OpenAI tarafından tanıtılması, güçlü ChatGPT aracıyla metin üretimi alanında devrim yarattı; artık modelleri, bir romanın tamamını yazacak ya da veri bilimi projeleriniz için kod yazacak şekilde öğretebilirsiniz. 

Üretken sanat Üretken Sanat

Çeviri

Derin öğrenme ile çeviri yalnızca dillerle sınırlı değildir; artık OCR kullanarak fotoğrafları metne çevirebiliyor, NVIDIA GauGAN2 ile metinden görüntü üretebiliyoruz.

Dil çevirisi Dil Çevirisi

Zaman Serisi Tahmini

Zaman serisi tahmini, piyasa çöküşlerini, hisse senedi fiyatlarını ve hava durumundaki değişimleri öngörmek için kullanılır. Finans sektörü, spekülasyon ve gelecek projeksiyonlarıyla ayakta kalır. Derin öğrenme ve zaman serisi modelleri, desenleri tespit etmede insanlardan daha iyidir; bu nedenle bu ve benzeri sektörlerde kilit araçlardır.

Zaman serisi tahmini Zaman Serisi Tahmini

Otomasyon

Derin öğrenme görevlerin otomasyonu için kullanılır; örneğin depo yönetimi için robotların eğitilmesi. En popüler kullanım alanlarından biri, video oyunları oynamak ve bulmacaları daha iyi çözmektir. Yakın zamanda OpenAI’nin Dota AI’ı profesyonel OG takımını yendi; bu, beş botun birden dünya şampiyonlarını alt etmesi beklenmediği için dünyayı şaşırttı.

Pekiştirmeli öğrenme ile çalışan robot kol Pekiştirmeli Öğrenme ile Çalışan Robot Kol

Müşteri Geri Bildirimi

Derin öğrenme, müşteri geri bildirimlerini ve şikâyetlerini yönetmek için kullanılır. Her sohbet botu uygulamasında kesintisiz müşteri hizmeti sunmak için yer alır.

Müşteri geri bildirimi Müşteri Geri Bildirimi

Biyomedikal

Bu alan, derin öğrenmenin gelişiyle en fazla faydayı sağlamıştır. DL biyomedikalde kanser tespiti, stabil ilaç geliştirme, akciğer röntgenlerinde anomali tespiti ve tıbbi ekipmanlara yardımcı olmak için kullanılır.

DNA dizilerinin analizi DNA Dizilerinin Analizi

Derin Öğrenme Modelleri

Farklı derin öğrenme modellerini ve nasıl çalıştıklarını öğrenelim.

Denetimli Öğrenme

Denetimli öğrenme, etiketli bir veri kümesini kullanarak modelleri veriyi sınıflandırma veya değer tahmini yapma konusunda eğitir. Veri kümesi, algoritmanın zamanla tahmin edilen ve gerçek etiketler arasındaki kaybı en aza indirerek öğrenmesini sağlayan özellikler ve hedef etiketler içerir. Denetimli öğrenme, sınıflandırma ve regresyon problemlerine ayrılabilir.

Sınıflandırma

Sınıflandırma algoritması, veri kümesini özellik çıkarımlarına dayanarak çeşitli kategorilere ayırır. Yaygın derin öğrenme modelleri, görüntü sınıflandırma için ResNet50 ve metin sınıflandırma için BERT (dil modeli))’tir.

Sınıflandırma Sınıflandırma

Regresyon

Veri kümesini kategorilere ayırmak yerine, regresyon modeli girdi ve çıktı değişkenleri arasındaki ilişkiyi öğrenerek sonucu tahmin eder. Regresyon modelleri yaygın olarak öngörücü analiz, hava tahmini ve borsa performansı tahmininde kullanılır. LSTM ve RNN, popüler derin öğrenme regresyon modelleridir.

Doğrusal regresyon Doğrusal Regresyon

Denetimsiz Öğrenme

Denetimsiz öğrenme algoritmaları, etiketlenmemiş bir veri kümesi içindeki desenleri öğrenir ve kümeler oluşturur. Derin öğrenme modelleri, insan müdahalesi olmadan gizli desenleri öğrenebilir ve bu modeller genellikle tavsiye motorlarında kullanılır.

Denetimsiz öğrenme; türlerin gruplanması, tıbbi görüntüleme ve pazar araştırmalarında kullanılır. Kümeleme için en yaygın derin öğrenme modelı derin gömülü kümeleme algoritmasıdır.

Verinin kümelenmesi Verinin Kümelenmesi

Pekiştirmeli Öğrenme

Pekiştirmeli öğrenme (RL), ajanların çevreden çeşitli davranışlar öğrendiği bir makine öğrenmesi yöntemidir. Ajan rastgele eylemler alır ve ödüller kazanır. Ajan, karmaşık bir ortamda insan müdahalesi olmadan deneme-yanılma ile hedeflere ulaşmayı öğrenir.

Nasıl ki bir bebek, ebeveynlerinin teşvikiyle yürümeyi öğreniyorsa, AI da ödülleri maksimize ederek belirli görevleri yapmayı öğrenir; ödül politikası tasarımcı tarafından belirlenir. Son dönemde robotik, otonom araçlar, profesyonel oyuncuları oyunlarda yenme ve roketleri dünyaya geri indirme gibi alanlardaki gelişmeler sayesinde RL otomasyonda yüksek talep görmektedir.

Pekiştirmeli öğrenme çerçevesi Pekiştirmeli Öğrenme Çerçevesi

Mario video oyununu örnek alalım:

  • Başlangıçta ajan (Mario karakteri) çevreden sıfır durum alır.
  • Duruma göre ajan bir eylem alır; bizim örneğimizde Mario sağa hareket eder.
  • Artık durum değişmiştir ve karakter yeni bir karede yer alır.
  • Ajan bir ödül alır; sağa hareket ettiği için karakter ölmemiştir. Temel hedefimiz ödülleri maksimize etmektir.

Ajan, bölümün sonuna ulaşana veya ölünceye kadar eylem alma ve ödülleri maksimize etme döngüsünü sürdürür. Daha fazlasını Pekiştirmeli Öğrenmeye Giriş yazısında öğrenin.

Generative Adversarial Networks

Generative adversarial networks (GAN’ler), iki sinir ağı kullanır ve birlikte, orijinal verinin sentetik örneklerini üretir. GAN’ler, büyük sanatçıları taklit ederek başyapıtlar üretebildikleri için son yıllarda oldukça popüler hâle geldi. Sentetik sanat, video, müzik ve metin üretiminde yaygın olarak kullanılırlar. Gerçek dünya uygulamaları hakkında daha fazlası için Generative Adversarial Networks Tutorial sayfasına bakın.

Generative adversarial network çerçevesi Generative Adversarial Network Çerçevesi 

GAN’ler sentetik görüntü üretiminde nasıl çalışır:

  • Önce, üreteç ağları rastgele gürültüyü girdi olarak alır ve sahte görüntüler üretir.
  • Üretilen ve gerçek görüntüler ayrıştırıcıya beslenir.
  • Ayrıştırıcı, üretilen görüntünün gerçek olup olmadığına karar verir. Sıfırın sahte, birin gerçek görüntüyü temsil ettiği 0 ile 1 arasında olasılıklar döndürür.
  • GAN mimarisi, iki geri besleme döngüsü içerir. Ayrıştırıcı, gerçek görüntülerle bir geri besleme döngüsündeyken üreteç de ayrıştırıcıyla bir geri besleme döngüsündedir. Daha gerçekçi görüntüler üretmek için senkronize çalışırlar.

Graf Sinir Ağı

Bir graf, kenarlar ve köşelerden oluşan bir veri yapısıdır. Köşeler (düğümler) arasında yönlü bağımlılıklar varsa kenarlar yönlü olabilir; buna yönlü graf denir. Aşağıdaki diyagramdaki yeşil daireler düğümleri, oklar ise kenarları temsil eder.

Yönlü bir graf

Yönlü Bir Graf

Graf sinir ağı (GNN), doğrudan graf yapıları üzerinde çalışan bir derin öğrenme mimarisidir. GNN’ler büyük veri kümelerinin analizi, öneri sistemleri ve bilgisayarlı görü alanlarında uygulanır.

Bir graf ağı Bir Graf Ağı

Düğüm sınıflandırma, bağlantı tahmini ve kümeleme için de kullanılırlar. Bazı durumlarda, graf sinir ağları, örneğin nesne tanıma ve anlamsal ilişkileri tahmin etmede evrişimsel sinir ağlarından daha iyi performans göstermiştir.

Doğal Dil İşleme

Doğal dil işleme (NLP), derin öğrenme teknolojisini kullanarak bilgisayarların doğal insan dilini öğrenmesine yardımcı olur. NLP, insan dilini okumak, çözmek ve anlamak için derin öğrenmeden yararlanır. Konuşma, metin ve görüntülerin işlenmesinde yaygın olarak kullanılır. Transfer öğrenmesinin tanıtılmasıyla, az sayıda örnekle modeli ince ayar yapıp en son duruma ait performans elde edebildiğimiz için NLP bir üst seviyeye taşınmıştır.

NLP alt kategorileri NLP Alt Kategorileri

NLP birden çok alana ayrılabilir:

  • Çeviri: dillerin, moleküler yapının ve matematiksel denklemlerin çevrilmesi
  • Özetleme: büyük metin parçalarını temel bilgileri koruyarak birkaç satıra indirmek.
  • Sınıflandırma: metni çeşitli kategorilere ayırmak.
  • Üretim: metinden metne üretim; tek bir satır metinle tüm bir deneme yazılabilir.
  • Sohbet: Sanal asistan; geçmiş konuşma bilgisini koruma ve insan konuşmalarını taklit etme.
  • Soru yanıtlama: AI, S&J verilerini kullanarak soruları yanıtlar.
  • Özellik çıkarımı: metindeki desenleri tespit etmek veya “ad varlık tanıma” ve “sözcük türü” gibi bilgileri çıkarmak.
  • Cümle benzerlikleri: farklı metinler arasındaki benzerlikleri değerlendirmek.
  • Metinden konuşmaya: metni sesli konuşmaya dönüştürmek.
  • Otomatik konuşma tanıma: çeşitli sesleri anlayıp metne dönüştürmek.
  • Optik karakter tanıma: görüntülerden metin verisi çıkarımı.

NLP’nin çeşitli uygulamalarını denemek isterseniz Hugging Face Spaces’ı deneyin. Spaces, NLP projeniz için ilham alabileceğiniz her tür web uygulamasına ev sahipliği yapar.

Derin Öğrenme Kavramlarına Daha Derin Bakış

Aktivasyon Fonksiyonları

Sinir ağlarında aktivasyon fonksiyonu, çıktı karar sınırlarını üretir ve model performansını iyileştirmek için kullanılır. Aktivasyon fonksiyonu, girdinin önemine bağlı olarak bir nörondan geçip geçmemesine karar veren matematiksel bir ifadedir. Ayrıca ağlara doğrusal olmayanlık katar. Aktivasyon fonksiyonu olmadan sinir ağı basit bir doğrusal regresyon modeline dönüşür.

Birçok aktivasyon fonksiyonu türü vardır:

  • Tanh
  • ReLU
  • Sigmoid
  • Doğrusal
  • Softmax
  • Swish

Aktivasyon fonksiyonu Aktivasyon Fonksiyonu

Bu fonksiyonlar, yukarıdaki görselde gösterildiği gibi farklı çıktı sınırları üretir. Birden çok katman ve aktivasyon fonksiyonuyla, herhangi bir karmaşık problemi çözebilirsiniz. Daha fazlası için derin öğrenmede aktivasyon fonksiyonları nedir? yazısına bakın.

Kayıp Fonksiyonu

Kayıp fonksiyonu, gerçek ve tahmin edilen değerler arasındaki farktır. Sinir ağlarının modelin genel performansını takip etmesini sağlar. Belirli problemlere bağlı olarak, örneğin ortalama karesel hata gibi belirli bir fonksiyon türü seçeriz.

Kayıp = Toplam (Tahmin − Gerçek)²

Derin öğrenmede en çok kullanılan kayıp fonksiyonları:

  • İkili çapraz entropi
  • Kategorik menteşe
  • Ortalama karesel hata
  • Huber
  • Seyrek kategorik çapraz entropi

Geri Yayılım

İleri yayılımda, sinir ağımızı rastgele girdilerle başlatır ve buna bağlı olarak rastgele bir çıktı üretiriz. Modelimizin daha iyi performans göstermesi için, geri yayılım kullanarak ağırlıkları ayarlarız. Model performansını takip etmek için, modelin doğruluğunu maksimize edecek küresel minimumu bulmamıza yardımcı olan bir kayıp fonksiyonuna ihtiyaç duyarız.

Stokastik Gradyan İnişi

Gradyan inişi, kayıp fonksiyonunu en aza indirmek için ağırlıkları kontrollü bir şekilde değiştirerek optimize etmekte kullanılır. Artık bir amacımız var; fakat daha iyi performans için ağırlıkları artırıp artırmayacağımıza ya da azaltıp azaltmayacağımıza dair bir yöne ihtiyacımız var. Kayıp fonksiyonunun türevi bize yönü verir; bunu kullanarak ağın ağırlıklarını güncelleyebiliriz.

Gradyan inişi Gradyan İnişi

Aşağıdaki denklem, ağırlıkların gradyan inişiyle nasıl güncellendiğini gösterir.

w = w -Jw

Stokastik gradyan inişinde, tüm veri kümesini kullanmak yerine örnekler partilere bölünür ve gradyan inişi bu şekilde optimize edilir. Bu yaklaşım, minimum kayba daha hızlı ulaşmak ve hesaplama gücünü verimli kullanmak istediğinizde faydalıdır.

Hiperparametre

Hiperparametreler, eğitim süreci çalıştırılmadan önce ayarlanan ve ayarlanabilir parametrelerdir. Bu parametreler model performansını doğrudan etkiler ve küresel minimuma daha hızlı ulaşmanıza yardımcı olur.

En sık kullanılan hiperparametreler:

  • Öğrenme oranı: her yinelemenin adım boyutu; 0,1 ile 0,0001 arasında ayarlanabilir. Kısaca modelin hangi hızla öğrendiğini belirler.
  • Yığın boyutu (batch size): aynı anda sinir ağından geçirilen örnek sayısı.
  • Epoch sayısı: modelin ağırlıkları kaç kez değiştirdiğine ilişkin yineleme. Çok fazla epoch aşırı öğrenmeye, çok azı yetersiz öğrenmeye yol açabilir; dolayısıyla orta bir sayı seçmeliyiz.

Bu bileşenlerin birlikte nasıl çalıştığını öğrenmek için Keras Eğitimi: Python’da Derin Öğrenme yazısını takip edin.

Popüler Algoritmalar

Evrişimsel Sinir Ağları

Evrişimsel sinir ağı (CNN), ileri beslemeli bir sinir ağıdır ve yapılandırılmış veri dizilerini işleyebilir. Görüntü sınıflandırma gibi bilgisayarlı görü uygulamalarında yaygın olarak kullanılır.

Evrişimsel sinir ağı mimarisi Evrişimsel Sinir Ağı Mimarisi

CNN’ler, desenleri, çizgileri ve şekilleri tanımakta iyidir. CNN; bir evrişim katmanı, havuzlama (pooling) katmanı ve çıktı katmanından (tam bağlı katmanlar) oluşur. Görüntü sınıflandırma modelleri genellikle birden çok evrişim katmanı içerir; bunları havuzlama katmanları izler; ek katmanlar modelin doğruluğunu artırır. Evrişim katmanları hakkında daha fazla bilgi için: Python’da Evrişimsel Sinir Ağları.

Yinelemeli Sinir Ağları

Yinelemeli sinir ağları (RNN), ileri beslemeli ağlardan farklıdır; katmanın çıktısı, katmanın çıktısını tahmin etmek için girdiye geri beslenir. Bu, önceki örneklerin bilgisini saklayabildiği için ardışık verilerle daha iyi performans göstermesine yardımcı olur. Daha fazlası için Yinelemeli Sinir Ağı (RNN) Eğitimi: Türler ve Örnekler yazısına bakın.

Yinelemeli sinir ağı mimarisi Yinelemeli Sinir Ağı Mimarisi

Geleneksel sinir ağlarında katmanların çıktısı mevcut girdi değerlerine göre hesaplanırken, RNN’de çıktı önceki girdilere göre de hesaplanır. Bu da onu bir sonraki kelimeyi tahmin etmede, hisse senedi fiyatlarını öngörmede, AI sohbet botlarında ve anomali tespitinde oldukça iyi kılar.

Uzun Kısa Süreli Bellek Ağları

Uzun kısa süreli bellek ağları (LSTM), geçmiş değerlere ilişkin daha fazla bilgiyi tutabilen gelişmiş bir yinelemeli sinir ağı türüdür. Basit RNN’lerde görülen kaybolan gradyan problemini çözer.

LSTM mimarisi LSTM Mimarisi

Tipik bir RNN, tek bir tanh katmanına sahip tekrar eden sinir ağlarından oluşurken, LSTM büyük veri dizilerini işlemek için birbirleriyle iletişim kuran dört etkileşimli katmandan oluşur.

Aşağıdaki Eğitim: Hisse senedi tahminleri için LSTM ile pratik yapabilir veya derin öğrenme modelleri hakkında daha fazla bilgi edinmek istiyorsanız Keras ile ileri derin öğrenme kursunu alabilirsiniz.

Derin Öğrenme Çatılarının (Framework) Listesi

MxNet, CNTK ve Caffe2 gibi birden çok derin öğrenme çatısı vardır; ancak biz en popüler olanları öğreneceğiz.

Tensorflow

Tensorflow (TF), derin öğrenme uygulamaları oluşturmak için kullanılan açık kaynaklı bir kütüphanedir. Deney yapmanız ve ticari AI ürünleri geliştirmeniz için gerekli tüm araçları içerir. Karmaşık modellerin eğitimi için CPU, GPU ve TPU’yu destekler. TF, başlangıçta Google AI ekibi tarafından dahili kullanım için geliştirilmiş, ardından genel kullanıma sunulmuştur.

Tensorflow API’si tarayıcı tabanlı uygulamalar ve mobil cihazlar için kullanılabilir; TensorFlow Extended ise üretim için idealdir. TF artık sektör standardı hâline gelmiştir ve hem akademik araştırmalarda hem de üretimde derin öğrenme modellerinin devreye alınmasında kullanılır.

TF ayrıca, makine öğrenmesi deneylerinizi analiz edebilen bir pano olan Tensorboard ile gelir. Son dönemde Tensorflow geliştiricileri, derin sinir ağları geliştirmede popüler olan Keras’ı da çatıya entegre etmiştir. Daha fazlası için Python’da TensorFlow’a Giriş kursuna göz atın.

Keras

Keras, Python ile yazılmış bir sinir ağı çatısıdır ve Tensorflow ile Theano gibi birden çok çatı üzerinde çalışabilir. Keras, derin öğrenmede hızlı deney yapmayı mümkün kılmak ve kavramlarınızı kolayca çalışan AI uygulamalarına dönüştürebilmeniz için geliştirilmiş açık kaynaklı bir kütüphanedir.

Dokümantasyonu oldukça anlaşılırdır ve API’si Numpy’ye benzer; bu da herhangi bir veri bilimi projesine kolayca entegre etmenizi sağlar. TF gibi Keras da mevcut donanıma bağlı olarak CPU, GPU ve TPU üzerinde çalışabilir. Daha fazlası için Keras ile Derin Öğrenmeye Giriş kursuna bakın.

PyTorch

PyTorch, en popüler ve en kolay derin öğrenme çatısıdır. GPU tarafından hızlandırılan hızlı sayısal hesaplama için Numpy dizisi yerine tensör kullanır. PyTorch ağırlıklı olarak derin öğrenme ve karmaşık makine öğrenmesi modellerinin geliştirilmesinde kullanılır.

Akademik araştırmacılar esneklik ve kullanım kolaylığı nedeniyle PyTorch’u tercih eder. C++ ve Python ile yazılmıştır; GPU ve TPU hızlandırmasıyla birlikte gelir. Derin öğrenme problemlerinin tamamı için tek duraklı bir çözüm hâline gelmiştir. PyTorch hakkında daha fazla bilgi edinmek isterseniz PyTorch ile Derin Öğrenmeye Giriş kursunu deneyin.

Sonuç

Bu eğitimde derin öğrenmenin ne olduğunu, derin öğrenmenin bazı temellerini, nasıl çalıştığını ve uygulamalarını ele aldık. Ayrıca derin sinir ağlarının nasıl çalıştığını ve farklı derin öğrenme modeli türlerini öğrendik. Son olarak, bazı popüler derin öğrenme çatılarından bahsedildi.

Bu eğitim, derin öğrenme alanına başlamak için gerekli tüm temel bilgileri size sundu. Öğreniminizi ilerletmek için Python’da Derin Öğrenme Yol Haritası, gerçek dünya projelerinde çalışmaya sizi hazırlayacaktır. R programlama dilinde rahatsanız R ile Keras kullanarak derin öğrenme içeriğine de göz atabilirsiniz.


Abid Ali Awan's photo
Author
Abid Ali Awan
LinkedIn
Twitter

Sertifikalı bir veri bilimcisi olarak, yenilikçi makine öğrenimi uygulamaları oluşturmak için en son teknolojileri kullanmaya büyük ilgi duyuyorum. Konuşma tanıma, veri analizi ve raporlama, MLOps, konuşma yapay zekası ve NLP alanlarında güçlü bir geçmişe sahip olarak, gerçek bir etki yaratabilecek akıllı sistemler geliştirme becerilerimi geliştirdim. Teknik uzmanlığımın yanı sıra, karmaşık kavramları açık ve özlü bir dille ifade etme yeteneğine sahip, becerikli bir iletişimciyim. Sonuç olarak, veri bilimi konusunda aranan bir blog yazarı oldum ve giderek büyüyen veri profesyonelleri topluluğuyla görüşlerimi ve deneyimlerimi paylaşıyorum. Şu anda, içerik oluşturma ve düzenlemeye odaklanıyorum. Büyük dil modelleriyle çalışarak, hem işletmelerin hem de bireylerin verilerinden en iyi şekilde yararlanmalarına yardımcı olabilecek güçlü ve ilgi çekici içerikler geliştiriyorum.

Konular