Open Courses

資料框整理技巧

33
33

在 R 語言導論中我們介紹了一種資料類型叫資料框,實務中我們面對的多數資料分析專案都是將原始資料讀為一個資料框再開始進行後續工作。我們將在這門課程中跟著草帽海賊團在新世界冒險,一邊學習各種資料框整理技巧,像是欄與列的技巧、生成衍生變數、轉置以及聯結等,努力成為懸賞金額破億的超新星海賊,一場爭奪 One Piece 的海上冒險故事!

建立與探索資料框

在學習資料框的整理技巧之前,我們得先在 R 語言的工作環境中建立出可供我們練習的資料框才行,在本章我們首先會複習在 R 語言導論中學過的內容,像是建立一個資料框以及一些快速探索資料框的好用函數,一場爭奪 One Piece 的海上冒險故事!

欄與列的相關技巧

實務上我們很常會有新增變數、刪除變數或者篩選觀測值 ... 等的需求,在資料框的結構中,其實就是針對欄或者列進行整理,我們將在本章節學習這些技巧與概念,一場爭奪 One Piece 的海上冒險故事!

生成衍生變數

從資料庫查詢得到的結果或者既有資料的變數有時候並不能滿足我們的分析需求,這時我們會需要生成衍生變數,可能是將類別型變數重新歸類、將數值型變數歸類為類別型變數或者針對數值型變數作計算 ... 等,我們將在本章節學習這些技巧與概念,一場爭奪 One Piece 的海上冒險故事!

欄位聚合與資料轉置

分析資料框常需要對某些欄位進行摘要統計,可能是求取總和或者平均值,讓你對變數的分佈更為清楚;有時候甚至你需要依據某個類別變數,分別計算不同類別的摘要統計,一如你在 Excel 中使用樞紐分析表一般;有經驗的資料科學家還必須熟悉長資料框與寬資料框的互相轉換,視需求靈活調整資料結構。我們將在本章節學習這些技巧與概念,一場爭奪 One Piece 的海上冒險故事!

聯結資料框

在一個資料分析專案中,資料可能散落在多個資料框中,因此對於資料框的聯結你必須要有清晰的認知,假如你使用過關聯式資料庫進行資料查詢,你在這章節的練習中會覺得駕輕就熟;假如你沒有使用過也不要緊,我們將在本章節學習這些技巧與概念,一場爭奪 One Piece 的海上冒險故事!