Ana içeriğe atla
GirişR

Kurs

R ile Veri Temizleme

Orta SeviyeBeceri Seviyesi
Güncel 08.2024
Ham verilerden harika içgörülere ulaşmak için verileri olabildiğince hızlı ve doğru bir şekilde temizlemeyi öğrenin.
Kursa Ücretsiz Başlayın
RData Preparation
4 sa
13 video
44 Egzersiz
3,700 XP
60,988
Başarı Belgesi

Ücretsiz Hesabınızı Oluşturun

Google ile devam edinDaha fazla seçenek göster

veya


Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.

Binlerce şirketten öğrencinin sevgisini kazandı

Group

Bir Ekibi Eğitiyor musunuz?

İşletmeler için deneyin

Kurs Açıklaması

R'de Yinelenenleri Kaldırma Gibi Yaygın Veri Sorunlarını Aşın

Veri hazırlığı çok önemlidir: Veri bilimcilerin işinin %80'i verileri temizlemek ve işlemektir. İşin yalnızca %20'si gerçekten analiz etmektir. Temizlik için harcanan zaman çok önemlidir, çünkü kirli verileri analiz etmek sizi yanlış sonuçlara götürebilir.

Bu kursta, R kullanarak kirli verileri temizlemenize yardımcı olacak çeşitli teknikler öğreneceksiniz. Verileri dönüştürmek, aralık kısıtlamaları uygulamak ve çift saymayı önlemek için tam ve kısmi yinelemelerle başa çıkmakla başlayacaksınız.

Gelişmiş Veri Zorluklarını Keşfedin

Yaygın veri sorunları üzerinde çalışmayı öğrendikten sonra, ölçümlerde tutarlılığı sağlamak ve eksik verilerle başa çıkmak gibi daha ileri düzeydeki zorluklara geçeceksiniz. Her yeni kavramın ardından, bilgilerinizi pekiştirmek ve deneyiminizi geliştirmek için uygulamalı bir alıştırma yapma fırsatınız olacak.

Veri Temizleme Sırasında Kayıt Bağlantısını Kullanmayı Öğrenin

Kayıt Bağlantısı, değerlerde yazım hataları veya farklı yazımlar gibi sorunlar olduğunda veri kümelerini birleştirmek için kullanılır. Bu yararlı tekniği son bölümde inceleyecek ve iki restoran yorum veri setini tek bir veri setinde birleştirmek için kullanarak uygulamayı pratik edeceksiniz.

Önkoşullar

Joining Data with dplyr
1

Yaygın Veri Sorunları

Bu bölümde, en yaygın kirli veri sorunlarının üstesinden gelmeyi öğreneceksin. Veri türlerini dönüştürecek, gelecekteki veri noktalarını elemek için aralık kısıtları uygulayacak ve çift sayımı önlemek için yinelenen veri noktalarını kaldıracaksın.
Bölümü Başlat
2

Kategorik ve Metin Verileri

Kategorik ve metin verileri, yapılandırılmamış yapıları nedeniyle bir veri kümesinin en dağınık kısımları olabilir. Bu bölümde, kategori etiketlerindeki boşluk ve büyük/küçük harf tutarsızlıklarını düzeltecek, birden fazla kategoriyi tek bir kategoride toplayacak ve tutarlılık için dizeleri yeniden biçimlendireceksin.
Bölümü Başlat
3

İleri Düzey Veri Sorunları

Bu bölümde, örneğin ağırlıkların pound yerine kilogram olarak yazıldığından emin olmak gibi daha ileri düzey veri temizleme sorunlarına dalacaksın. Ayrıca, değerlerin doğru eklendiğini doğrulamaya ve eksik değerlerin analizlerini olumsuz etkilememesine yardımcı olacak çok değerli beceriler kazanacaksın.
Bölümü Başlat
4

Record Linkage

Record linkage, yazım hataları veya farklı yazımlar olduğunda birden çok veri kümesini birleştirmek için kullanılan güçlü bir tekniktir. Bu bölümde, dizeler arasındaki benzerliği hesaplayarak kayıtları nasıl bağlayacağını öğreneceksin—sonrasında yeni becerilerini kullanarak iki restoran yorumu veri kümesini tek ve temiz bir ana veri kümesinde birleştireceksin.
Bölümü Başlat
R ile Veri Temizleme
Kurs
Tamamlandı

Başarı Belgesi Kazanın

Bu kimlik bilgisini LinkedIn profilinize, özgeçmişinize veya CV'nize ekleyin
Sosyal medyada ve performans incelemenizde paylaşın
Şimdi kaydolun

Bugün 19 milyondan fazla öğrenciye katılın ve R ile Veri Temizleme eğitimine başlayın!

Ücretsiz Hesabınızı Oluşturun

Google ile devam edinDaha fazla seçenek göster

veya


Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.

DataCamp for Mobile ile veri becerilerinizi geliştirin

Mobil kurslarımız ve günde 5 dakikalık kodlama görevlerimizle hareket halindeyken ilerleme kaydedin.