Ana içeriğe atla
GirişSpark

Kurs

PySpark ile Big Data Temelleri

İleri SeviyeBeceri Seviyesi
Güncel 02.2025
PySpark ile büyük verilerle çalışmanın temellerini öğrenin.
Kursa Ücretsiz Başlayın
SparkData Engineering
4 sa
16 video
55 Egzersiz
4,600 XP
65,294
Başarı Belgesi

Ücretsiz Hesabınızı Oluşturun

Google ile devam edinDaha fazla seçenek göster

veya


Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.

Binlerce şirketten öğrencinin sevgisini kazandı

Group

Bir Ekibi Eğitiyor musunuz?

İşletmeler için deneyin

Kurs Açıklaması

Son birkaç yıldır Big Data hakkında çok konuşuluyor ve artık birçok şirket için ana akım hâline geldi. Peki bu Big Data tam olarak nedir? Bu kurs, PySpark üzerinden Big Data’nın temellerini kapsar. Spark, Big Data için "şimşek hızında küme hesaplama" çerçevesidir. Genel bir veri işleme platformu sunar ve programlarını bellekte 100 kata, diskte ise 10 kata kadar Hadoop’dan daha hızlı çalıştırmana olanak tanır. Spark programlama için bir Python paketi olan PySpark’ı ve SparkSQL, MLlib (machine learning için) gibi güçlü, üst düzey kütüphanelerini kullanacaksın. William Shakespeare’in eserlerini keşfedecek, Fifa 2018 verilerini analiz edecek ve genomik veri kümeleri üzerinde kümeleme gerçekleştireceksin. Bu kursun sonunda, PySpark’ı ve genel Big Data analizindeki kullanımını derinlemesine kavramış olacaksın.

Önkoşullar

Introduction to Python
1

Spark ile Big Data analizine giriş

Bu bölüm, Big Data’nın heyecan verici dünyasını ve Big Data’yı işlemek için kullanılan farklı kavramları ve çerçeveleri tanıtır. Apache Spark’ın neden BigData için en iyi çerçeve olarak görüldüğünü anlayacaksın.
Bölümü Başlat
2

PySpark RDD’lerinde programlama

Spark’ın sunduğu temel soyutlama, bu motorun omurgası olan dayanıklı dağıtık veri kümesi (RDD)’dir. Bu bölüm, RDD’leri tanıtır ve RDD Dönüşümleri (Transformations) ve Eylemleri (Actions) kullanılarak RDD’lerin nasıl oluşturulup çalıştırılacağını gösterir.
Bölümü Başlat
4

PySpark MLlib ile Machine Learning

PySpark MLlib, Python’da Apache Spark’ın ölçeklenebilir machine learning kütüphanesidir ve yaygın öğrenme algoritmaları ile yardımcı araçlardan oluşur. Bu son bölüm boyunca önemli Machine Learning algoritmalarını öğreneceksin. Bir film öneri motoru ve spam filtresi oluşturacak ve k-means kümeleme kullanacaksın.
Bölümü Başlat
PySpark ile Big Data Temelleri
Kurs
Tamamlandı

Başarı Belgesi Kazanın

Bu kimlik bilgisini LinkedIn profilinize, özgeçmişinize veya CV'nize ekleyin
Sosyal medyada ve performans incelemenizde paylaşın
Şimdi kaydolun

Bugün 19 milyondan fazla öğrenciye katılın ve PySpark ile Big Data Temelleri eğitimine başlayın!

Ücretsiz Hesabınızı Oluşturun

Google ile devam edinDaha fazla seçenek göster

veya


Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.

DataCamp for Mobile ile veri becerilerinizi geliştirin

Mobil kurslarımız ve günde 5 dakikalık kodlama görevlerimizle hareket halindeyken ilerleme kaydedin.