Kurs
Bu yazıda, en sık sorulan Pandas mülakat sorularını ve yanıtlarını derledim. Soruların bir kısmı, Target’ta veri bilimci pozisyonu için girdiğim mülakat deneyimlerimden. Hadi başlayalım!
Pandas Temel Mülakat Soruları
Önce pandas ile ilgili bazı temel mülakat sorularına bakalım. Nazik mülakatçılar, başlangıçta sizi rahatlatmak için bu basit sorularla başlayabilir; diğerleri ise kütüphaneye olan temel hâkimiyetinizi ölçmek için aynı soruları sorabilir.
1. Python’da pandas nedir?
pandas, veri kümelerini verimli şekilde temizlemek, analiz etmek ve dönüştürmek için güçlü ve yerleşik yöntemlere sahip, açık kaynaklı bir Python kütüphanesidir. 2008’de Wes McKinney tarafından geliştirilen bu güçlü paket, Python’daki çeşitli diğer veri bilimi modülleriyle kolayca entegre olabilir.
Başlangıçta NumPy üzerinde inşa edilmiş olsa da, modern pandas (v2.0+) PyArrow arka ucunu da destekler. Bu, önceki yalnızca NumPy mimarisine kıyasla işlemlerin önemli ölçüde hızlanmasını, gerçek dize veri türlerini ve eksik değerlerin (nullable türler) daha iyi ele alınmasını sağlar.
2. Bir pandas DataFrame’inin ilk 5 ve son 5 satırına hızlıca nasıl erişirsiniz?
pandas içindeki head() yöntemi bir DataFrame’in ilk 5 satırına, tail() yöntemi ise son 5 satırına erişmek için kullanılır.
-
İlk 5 satıra erişmek için:
dataframe_name.head() -
Son 5 satıra erişmek için:
dataframe_name.tail()
3. Neden DataFrame.shape parantezsizdir?
pandas’ta shape bir yöntem değil, bir özniteliktir. Bu yüzden parantez olmadan erişmelisiniz.
DataFrame.shape, bir DataFrame’deki satır ve sütun sayısını içeren bir demet (tuple) döndürür.
4. Series ile DataFrame arasındaki fark nedir?
-
DataFrame:
pandasDataFrame’i, her bir sütunun farklı veri türlerinde olabildiği, çok sayıda satır ve sütundan oluşan tablolar hâlindedir. -
Series: Series, herhangi bir veri türünü depolayabilen, ancak tüm değerlerinin aynı veri türünde olması gereken tek boyutlu, etiketli bir dizidir. Series veri yapısı, DataFrame’deki tek bir sütuna daha çok benzer.
Series veri yapısı, DataFrame’den daha az bellek tüketir. Bu nedenle, bazı veri işleme görevleri Series üzerinde daha hızlıdır.
Buna karşılık, bir DataFrame büyük ve karmaşık veri kümelerini depolayabilirken bir Series yalnızca homojen veriyi ele alabilir. Dolayısıyla, bir DataFrame üzerinde gerçekleştirebileceğiniz işlem kümesi, Series’e göre belirgin şekilde daha fazladır.
5. pandas’ta indeks nedir?
İndeks, bir DataFrame’deki her satırı benzersiz şekilde tanımlayabilen etiketler dizisidir. İndeks herhangi bir veri türünde olabilir (tamsayı, dize, hash vb.).
df.index, df DataFrame’inin mevcut satır indekslerini yazdırır.
Orta Düzey Pandas Mülakat Soruları
Bu sorular biraz daha zorludur ve pandas kullanımı konusunda önceki deneyim gerektiren rollerde bunlarla karşılaşma olasılığınız daha yüksektir.
6. pandas’ta çoklu indeksleme (multi-indexing) nedir?
pandas’taki indeks, bir DataFrame’in her satırını benzersiz şekilde tanımlar. Genellikle, her satırı benzersiz tanımlayabilen bir sütunu seçip indeks olarak ayarlarız. Peki bunu yapabilecek tek bir sütununuz yoksa?
Örneğin, bir DataFrame’de “name”, “age”, “address” ve “marks” sütunlarına sahipsiniz. Bu sütunların hiçbiri tüm farklı satırlar için benzersiz değerlere sahip olmayabilir ve indeks olarak uygun değildir.
Ancak “name” ve “address” sütunları birlikte DataFrame’in her satırını benzersiz tanımlayabilir. Bu durumda her iki sütunu da indeks olarak ayarlayabilirsiniz. Artık DataFrame’iniz çoklu (veya hiyerarşik) indekse sahiptir.
7. pandas yeniden indeksleme (reindexing) nedir? Bir örnek verin.
Yeniden indeksleme, bir DataFrame’i yeni bir indekse uydurmak için kullanılır. En yaygın kullanım alanı, zaman serilerindeki eksik boşlukları doldurmak veya sıfır değere sahip olanlar da dâhil tüm kategorilerin bir rapora girdiğinden emin olmaktır.
Yeni indeks, orijinal DataFrame’de bulunmayan etiketler içeriyorsa, pandas bu satırlar için NaN (veya belirtilen bir doldurma değeri) koyar.
Örnek: Diyelim ki Q1 ve Q3 için satış veriniz var, ancak Q2 ve Q4 satışlar sıfır olduğu için eksik. Standart bir grafik yanıltıcı görünebilir. reindex(), eksik çeyrekleri DataFrame’e zorlayarak bunu düzeltir.
import pandas as pd
# Original data (Note: Q2 and Q4 are missing)
data = {'Quarter': ['Q1', 'Q3'], 'Sales': [15000, 18000]}
df = pd.read_json(pd.DataFrame(data).to_json()) # Simulating loaded data
df = df.set_index('Quarter')
# The complete index we REQUIRE for the report
all_quarters = ['Q1', 'Q2', 'Q3', 'Q4']
# Reindex forces Q2 and Q4 to appear, filling them with 0 instead of NaN
df_full = df.reindex(all_quarters, fill_value=0)
8. loc ve iloc arasındaki fark nedir?
.loc() ve .iloc() yöntemlerinin her ikisi de bir DataFrame’den alt küme seçmek için kullanılır. Pratikte, bunlar koşullara göre filtreleme yapmak için yaygın şekilde kullanılır.
.loc() yöntemini satır ve sütunların gerçek etiketleriyle seçim yapmak için, .iloc() yöntemini ise satır ve sütunların tamsayı indekslerine göre veri çekmek için kullanmalıyız.
9. Bir pandas DataFrame’i oluşturmanın iki farklı yolunu gösterin
Sözlükten (dictionary):
import pandas as pd
data = {'Name': ['John', 'Cataline', 'Matt'],
'Age': [50, 45, 30],
'City': ['Austin', 'San Francisco', 'Boston'],
'Marks' : [70, 80, 95]}
df = pd.DataFrame(data)
Liste listelerinden:
import pandas as pd
data = [['John', 25, 'Austin',70],
['Cataline', 30, 'San Francisco',80],
['Matt', 35, 'Boston',90]]
columns = ['Name', 'Age', 'City', 'Marks']
df = pd.DataFrame(data, columns=columns)
10. Bir DataFrame’de kategorik bir sütunun tüm benzersiz değerlerinin sayımını nasıl alırsınız?
Series.value_counts() işlevi, bir serideki veya sütundaki her benzersiz değerin sayımını döndürür.
Örnek:
Bir Sex adlı kategorik sütun içeren bir df DataFrame’i oluşturduk ve o sütundaki her benzersiz değerin sayısını görmek için .value_counts() işlevini çalıştırdık.
import pandas as pd
data = [['John', 50, 'Male', 'Austin', 70],
['Cataline', 45 ,'Female', 'San Francisco', 80],
['Matt', 30 ,'Male','Boston', 95]]
# Column labels of the DataFrame
columns = ['Name','Age','Sex', 'City', 'Marks']
# Create a DataFrame df
df = pd.DataFrame(data, columns=columns)
df['Sex'].value_counts()
Sadece ham sayımlar yerine yüzde dağılımını görmek isterseniz, normalize=True argümanını .value_counts() içinde kullanın.
11. category veri türü nedir ve neden kullanılır?
category veri türü, sınırlı sayıda benzersiz dize değeri olan (düşük kardinaliteli) sütunlar için kullanılır. Pandas, dizeleri bir kez bir arama tablosunda saklayıp asıl veri sütununda hafif tamsayılar kullandığı için büyük miktarda bellek tasarrufu sağlar ve sıralama, gruplayma gibi işlemleri hızlandırır.
Deneyimli Uygulayıcılar için Pandas Mülakat Soruları
pandas konusunda zaten güçlü bir geçmişe sahip olup daha kıdemli rollere başvuranlar, bu sorulardan bazılarıyla karşılaşabilir:
12. pandas ile büyük veri kümelerinde performansı nasıl optimize edersiniz?
-
PyArrow kullanın: Veriyi
engine="pyarrow"vedtype_backend="pyarrow"ile yükleyin. Bu, standartNumPytürlerine göre daha hızlı ve çok daha bellek verimlidir. -
Döngüler yerine vektörleştirme: Döngüler ve yinelemeler, özellikle büyük veri kümelerinde maliyetlidir. Bunun yerine, tüm bir sütuna bir kerede uygulanan vektörleştirilmiş işlemleri tercih edin; satır satır yinelemelerden daha hızlıdırlar.
-
Yalnızca ihtiyacınızı yükleyin:
read_csv()veyaread_parquet()içindeusecolsparametresini kullanarak yüklenen veri miktarını sınırlayın. -
Bellek verimli türler:
pandas’taki varsayılan veri türleri bellek açısından verimli değildir. Örneğin, tamsayılar varsayılan olarakint64alır; ancak değerlerinizint32aralığına sığıyorsa türüint32olarak ayarlamak bellek kullanımını optimize eder. Düşük kardinaliteli dizelericategorytürüne dönüştürmek de iyi bir fikirdir. -
Veri toplulaştırma kullanın: Veriyi toplulaştırmaya ve istatistiksel işlemler yapmaya çalışın; çünkü toplulaştırılmış veri üzerindeki işlemler tüm veri kümesine göre daha verimlidir.
-
Paralel işleme: Yerel
pandastek iş parçacıklıdır. Tek makinede paralellik için tercih edilen çözüm, varsayılan olarak çok iş parçacıklı olanPolarsveyaModingibi,pandasiçin paralel bir ikame olarak çalışan kütüphanelerdir.
13. pandas’ta .join() ve .merge() yöntemleri arasındaki fark nedir?
-
Join: İki DataFrame’i indekslerine göre birleştirir. Ancak açıkça sütunlara göre birleştirmek isterseniz isteğe bağlı
onargümanı vardır. Varsayılan olarak sol birleştirme yapar. Sözdizimidf1.join(df2)şeklindedir. -
Merge:
merge()işlevi daha esnektir ve DataFrame’leri hangi sütunlar üzerinden birleştireceğinizi belirtmenize olanak tanır. Varsayılan olarak iç birleştirme uygular, ancak sol, sağ, dış, iç ve çapraz gibi farklı birleştirme türleriyle özelleştirilebilir. Sözdizimipd.merge(df1, df2, on=”column_names”)şeklindedir.
14. Timedelta nedir?
Timedelta, iki tarih veya zaman arasındaki farkı ifade eden süreyi temsil eder ve gün, saat, dakika, saniye gibi birimlerle ölçülür.
15. .append() yöntemi kaldırıldı. Artık DataFrame’leri nasıl birleştirirsiniz?
Modern bir Pandas ortamında (sürüm 2.0 veya sonrası) .append() kullanmaya çalışırsanız, daha verimli kodlama uygulamalarını teşvik etmek için yöntem kaldırıldığından bir hata alırsınız.
Bunun yerine, tüm DataFrame’lerinizi veya satırlarınızı bir listeye toplayıp bir kez pd.concat() çağırmalısınız:
new_df = pd.concat([df1, df2], ignore_index=True)
16. pandas yerine ne zaman Polars kullanmalısınız?
Polars’ı (Rust tabanlı bir DataFrame kütüphanesi) şu durumlarda düşünmelisiniz:
-
Veri kümesi mevcut RAM’den belirgin şekilde büyükse:
Polarstembel değerlendirme/akış (lazy/streaming) sunar. -
Çok iş parçacıklı performansa ihtiyacınız varsa:
pandasişlemleri büyük ölçüde tek iş parçacıklıdır. -
Her milisaniye önemliyse: Yüksek performanslı bir veri hattı inşa ediyorsanız.
Pandas Kodlama Mülakat Soruları
Teknik bir mülakatta başarılı olmak söz konusu olduğunda, pratik beceriler teorik bilgi kadar önemlidir. Bu nedenle, mülakatçıyla görüşmeden önce bilmeniz gereken bazı pandas kodlama mülakat soruları şunlardır.
17. pandas kullanarak Excel dosyalarını CSV’ye nasıl okur/yazarsınız?
Önce, Excel verisini bir değişkene almak için .read_excel() işlevini kullanmalıyız. Ardından, sorunsuz bir dönüşüm için .to_csv() işlevini uygulayabiliriz.
Örnek kod aşağıdadır:
import pandas as pd
#input your excel file path into the read_excel() function.
excel_data = pd.read_excel("/content/sample_data/california_housing_test.xlsx")
excel_data.to_csv("CSV_data.csv", index = None, header=True)
Not: Modern bir mülakatta, büyük veri kümeleriyle çalışırken veri türlerini koruduğu için parquet formatına ( .to_parquet() ile, .to_csv() yerine) yazmanın çoğu zaman üstün olduğunu belirtin.
18. Bir DataFrame’i sütunlara göre nasıl sıralarsınız?
Bir veya birden fazla sütuna göre sıralamak için .sort_values() yöntemini çağırırız.
Sözdizimi şu şekildedir: df.sort_values(by=[“column_names”]); aşağıdaki örnekte olduğu gibi:
import pandas as pd
data = [['John', 50, 'Male', 'Austin', 70],
['Cataline', 45 ,'Female', 'San Francisco', 80],
['Matt', 30 ,'Male', 'Boston', 95],
['Oliver',35,'Male', 'New york', 65]]
# Column labels of the DataFrame
columns = ['Name','Age','Sex', 'City', 'Marks']
# Create a DataFrame df
df = pd.DataFrame(data, columns=columns)
# Sort values based on ‘Age’ column
df.sort_values(by=['Age'])
df.head()`
19. Veriyi filtrelemenin iki farklı yolunu gösterin
Aşağıdaki DataFrame üzerinde nasıl filtreleme yapacağımızı gösterelim:
import pandas as pd
data = {'Name': ['John', 'Cataline', 'Matt'],
'Age': [50, 45, 30],
'City': ['Austin', 'San Francisco', 'Boston'],
'Marks' : [70, 80, 95]}
# Create a DataFrame df
df = pd.DataFrame(data)
Yöntem 1: Boolean indeksleme
new_df = df[(df.Name == "John") | (df.Marks > 90)]
print (new_df)
Yöntem 2: .query() yöntemini kullanmak
df.query('Name == "John" or Marks > 90')
print (new_df)
20. Veriyi nasıl toplulaştırırsınız (ör. ortalama veya toplam)?
.groupby() işlevi, belirli sütunlara göre veriyi gruplandırmanıza ve gruplandırılmış veri üzerinde işlemler yapmanıza olanak tanır. Daha iyi okunabilirlik için .agg() ile birlikte kullanın.
Aşağıdaki kodda veriler Name sütununa göre gruplanır ve her grubun Grades ortalaması hesaplanır:
import pandas as pd
# Create a DataFrame
data = {
'Name': ['John', 'Matt', 'John', 'Matt', 'Matt', 'Matt'],
'Grades': [10, 20, 30, 15, 25, 18]
}
# Create a DataFrame df
df = pd.DataFrame(data)
# mean marks of John and Matt
print(df.groupby('Name').agg(
avg_grade=('Grades', 'mean'),
)
21. Mevcut sütunlardan türetilen yeni bir sütunu nasıl oluşturursunuz?
Mevcut sütunlardan yeni sütun oluşturmanın iki yolu vardır:
-
Doğrudan atama: Yeni bir adla bir sütunu mevcut sütun(lar)ın dönüşümüne atamak:
df['Total'] = df['Math'] + df['Science'] -
Yöntem zincirleme:
.assign()ile lambda işlevi kullanmak:df = df.assign(Total=lambda x: x['Math'] + x['Science'])
Günümüzde yöntem zincirleme tercih edilir; çünkü ara değişkenlere olan ihtiyacı ortadan kaldırarak kodun okunabilirliğini artırır. Tüm veri dönüşümünüzün tek bir mantıksal boru hattı olarak kalması, analiz sırasında yanlış veya güncel olmayan bir DataFrame sürümüne kazara başvurma riskinizi azaltarak hataları önemli ölçüde düşürür.
Veri Bilimciler için Pandas Mülakat Soruları
pandas ile ilgili genel ve kodlama mülakat sorularını ele aldığımıza göre, şimdi de pandas veri bilimi mülakat sorularına bakalım.
22. pandas’ta null veya eksik değerleri nasıl ele alırsınız?
pandas’ta eksik değerleri ele almak için aşağıdaki üç yöntemden herhangi birini kullanabilirsiniz:
-
dropna(): Eksik satırları veya sütunları DataFrame’den kaldırır. -
fillna(): Eksik değerleri belirli bir değerle doldurur. -
interpolate(): Eksik değerleri hesaplanan enterpolasyon değerleriyle doldurur.
PyArrow arka ucuyla, tamsayılar artık NA değerlerini float’a dönüştürmeden saklayabilir; bu da bilimsel iş akışlarında veri sadakatini korur.
23. fillna() ile interpolate() yöntemleri arasındaki fark
-
fillna(): Statik bir değerle doldurur (ör. 0 veya "Unknown")..fillna()içindemethod='ffill'argümanıyla ileri doldurma kullanımı kullanımdan kaldırılmıştır; bunun yerine doğrudan.ffill()kullanın. -
interpolate(): Noktalar arasında matematiksel tahminle (lineer, polinom, spline) doldurur. Zaman serilerinde “noktaları birleştirmek” istediğiniz durumlar için kritiktir.
24. Yeniden örnekleme (resampling) nedir?
Yeniden örnekleme, zaman serisi verisinin raporlandığı sıklığı değiştirmek için kullanılır. Örneğin aylık zaman serisi verinizi haftalık ya da yıllık veriye dönüştürmek istediğinizde yeniden örnekleme yapılır.
Aylıktan haftalığa veya günlük veriye dönüştürmek esasen yukarı örneklemedir (upsampling). Burada sıklığı artırmak için enterpolasyon teknikleri kullanılır.
Buna karşılık, aylıktan yıllığa dönüştürme aşağı örnekleme (downsampling) olarak adlandırılır ve veri toplulaştırma teknikleri uygulanır.
25. pandas kullanarak one-hot encoding nasıl yapılır?
One-hot encoding, kategorik değerleri sayısal değerlere dönüştürmek için uygulanır; böylece makine öğrenmesi algoritmasına beslenebilirler.
import pandas as pd
data = {'Name': ['John', 'Cateline', 'Matt', 'Oliver'],
'ID': [1, 22, 23, 36],
'Category': ['A', 'B', 'A', 'B']}
df = pd.DataFrame(data)
#one hot encoding
new_df = pd.get_dummies(df, columns=['Category'])
new_df.head()
Prodüksiyon için, şemayı koruduğu için Scikit-learn’ün OneHotEncoder’ını kullanmak tercih edilir.
26. pandas’ta çizgi grafiği (line plot) nasıl oluşturulur?
Çizgi grafiği oluşturmak için pandas’taki plot işlevini kullanırız.
import pandas as pd
data = {'units': [1, 2, 3, 4, 5],
'price': [7, 12, 8, 13, 16]}
# Create a DataFrame df
df = pd.DataFrame(data)
df.plot(kind='line', x='units', y='price')
Not: Etkileşimli grafikler için artık arka ucu Plotly olarak değiştirebilirsiniz: pd.options.plotting.backend = "plotly".
27. Bir DataFrame’deki tüm sütunların istatistiksel özetini almak için pandas yöntemi nedir?
df.describe(), DataFrame’deki her sütunun ortalama, yüzdelikler, min, max vb. istatistiklerini döndürür.
28. Hareketli ortalama (rolling mean) nedir?
Hareketli ortalama, belirli bir pencere için veri noktalarının ortalamasını hesaplama ve bu pencereyi veri boyunca kaydırma fikrine dayandığı için hareketli ortalama (moving average) olarak da adlandırılır. Bu, dalgalanmaları azaltır ve zaman serilerindeki uzun vadeli eğilimleri öne çıkarır.
Sözdizimi şu şekildedir: df['column_name'].rolling(window=n).mean()
29. SettingWithCopyWarning nedir ve nasıl düzeltilir?
Bu uyarı, pandas’ın bir görünümü (view) mü yoksa bir kopyayı mı değiştirdiğinizden emin olamadığı durumlarda ortaya çıkardı. Modern pandasta (3.0+ bağlamında) Copy-on-Write (CoW) varsayılandır. CoW, görünümler ve kopyalar arasında kesin ayrım yapar; böylece bir alt kümeyi değiştirmeniz, açıkça istenmedikçe orijinal çerçeveyi sessizce etkilemez. Bu, uyarıya yol açan belirsizliği büyük ölçüde ortadan kaldırır.
Daha eski pandas sürümlerinde düzeltmek için, açık indeksleme için .loc[] kullanın veya değişiklik yapmadan önce dilimi yeni bir değişkene atayın; böylece netlik sağlanır ve istenmeyen davranışlardan kaçınılır. Daha fazlası için şu blogu okuyun: SettingWithCopyWarning Nasıl Düzeltilir.
30. Üretimde DataFrame şemalarını nasıl doğrularsınız?
Endüstri standardı, çalışma zamanında sıkı veri kalite kontrolleri uygulayan pandera kütüphanesini kullanmaktır. pandera, sütun veri türlerini doğrulayan ve belirli bir aralıkta olma veya bir sütunun benzersiz olması gibi istatistiksel mantık uygulayan bir şema tanımlamanıza olanak tanır.
Fonksiyonlarınızın girdilerini ve çıktıları otomatik olarak doğrulamak için dekoratörlerini (ör. @pa.check_types) kullanabilirsiniz; böylece “kirli verinin” aşağı akış hatlarınızı sessizce bozmasının önüne geçilir. Bu, verinizin kendisi için birim testi etkisi yaratır.
Mülakata Hazırlık
En sık sorulan birkaç mülakat sorusunun sorulması muhtemeldir; bu nedenle hazırlık için bunları kullanmak iyi bir fikirdir. pandas’ın yanı sıra, veri odaklı bir iş rolü pek çok başka beceri de gerektirir. Genel mülakat sürecinde başarılı olmak için kontrol listesi şudur:
İş gereklerini anlama
İş tanımını ve sorumlulukları gözden geçirin ve becerileriniz ile özgeçmişinizin bunlarla uyumlu olduğundan emin olun. Ayrıca, şirketi ve rolünüzün şirkete etkisini bilmek artı puandır.
Python kodlama
Mülakatçı, kütüphanesi (pandas) hakkında sorular sormadan önce öncelikle Python becerilerinizi kontrol eder. Bu yüzden güçlü Python becerileriyle donanın.
Analist rolleri için yalnızca Python dili yeterlidir. Ancak veri bilimci veya ML mühendisi rolleri için başvuruyorsanız, Python kodlama alıştırmalarını çözmek önemlidir.
Veri projeleri
Özgeçmişinizde çözülmüş bazı gerçek dünya veri problemleri bulunduğundan emin olun. Deneyimli olanlar geçmiş projelerinden bahsedebilir. Alana yeni giriyorsanız, Kaggle’dan bazı projeleri tamamlamayı deneyin.
İleri kavramlar
Temellerin ötesinde, ek sorular role bağlı olacaktır.
Analistler için sorular Excel, veri görselleştirme panoları, istatistik ve olasılık konularından gelebilir.
Buna ek olarak, veri bilimci veya ML mühendisi rolleri için başvuruyorsanız mülakatçı makine öğrenmesi ve derin öğrenme konularına derinlemesine girebilir.
Yüksek teknik veya kıdemli roller için başvuruyorsanız sistem tasarımıyla ilgili sorular bekleyin. Yaygın tasarım sorularını gözden geçirin ve uçtan uca ML sistem tasarımı problemlerini pratik edin.
Sonuç
Veri sektöründe iş bulmak çoğu zaman güçlü Pandas becerileri gerektirir. Yukarıdaki hem teorik hem uygulamalı mülakat soruları listesi, mülakatın pandas kısmında başarılı olmanıza yardımcı olacaktır. Ayrıca, sonda yer alan ipuçları, mülakatınızın genel olarak sorunsuz geçmesini sağlar.
pandas mülakatına hazırlanmanıza yardımcı olacak şu kaynakları kullanabilirsiniz:
- pandas ile Veri Manipülasyonu: Gerçek dünya veri kümeleriyle pandas temellerini, veri manipülasyonunu ve görselleştirme tekniklerini kapsayan bir başlangıç kursu.
- pandas ile Veri Hazırlama: isnull(), dropna() ve fillna() gibi işlevleri öğreterek pandas ile eksik verileri ele alma konusunda pratik beceriler sunan bir eğitim.
- Python’da Kodlama Mülakat Soruları Pratiği: Kodlama mülakatlarına hazırlık için ideal; Python veri yapıları, dize işleme ve veri bilimi mülakatlarının kilit alanlarını kapsar.
- Veri Bilimi Mülakat Hazırlığı: Çeşitli mülakat formatları için kapsamlı hazırlık ipuçları ve Python, R, SQL ve daha fazlasında teknik becerileri kapsar.
Srujana, Bilgisayar Bilimleri alanında dört yıllık dereceye sahip serbest çalışan bir teknoloji yazarıdır. Veri bilimi, bulut bilişim, geliştirme, programlama, güvenlik ve daha birçok konuyu yazmak onun için doğal bir süreçtir. Klasik edebiyata ve yeni yerler keşfetmeye tutkuyla bağlıdır.
