跳至内容
首页R

课程

R 的可扩展数据处理

高级技能水平
更新时间 2024年8月
学习如何使用 bigmemory 和 iotools 包,用 R 编写可扩展代码来处理大数据。
免费开始课程
RProgramming
4小时
15 视频
49 道练习
3,950 XP
6,148
成就证明

创建您的免费帐户

继续使用 Google显示更多选项


继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。

深受数千家公司学习者的喜爱

Group

需要团队培训?

企业版试用

课程描述

数据集往往比可用的 RAM 更大,这会给 R 程序员带来问题,因为默认情况下所有变量都存储在内存中。您将学习直接从磁盘处理、探索和分析数据的工具。您还将实践 split-apply-combine 方法,并学习如何使用 bigmemory 和 iotools 包编写可扩展的代码。在本课程中,您将使用美国联邦住房金融局(Federal Housing Finance Agency)的数据,这是一个公开的数据集,记录了 2009-2015 年间由联邦国民抵押贷款协会(Fannie Mae)和联邦住房贷款抵押公司(Freddie Mac)持有或证券化的所有按揭贷款。

先决条件

Writing Efficient R Code
1

处理日益庞大的数据集

本章将说明当数据集大于可用 RAM 时,为什么需要采用新技术。我们会展示使用 R 基础函数导入和导出数据可能很慢,以及一些简单的改进方法。最后,我们将介绍 bigmemory 包。
开始章节
2

使用 bigmemory 进行数据处理与分析

在您已经有了一些使用 bigmemory 的经验后,我们将讲解一些基础的数据探索与分析技术。特别是,我们将学习如何创建汇总表,并实现 split-apply-combine 方法。
开始章节
R 的可扩展数据处理
课程完成

获得成就证明

将此证书添加到您的 LinkedIn 档案、简历或履历中
在社交媒体和绩效评估中分享
立即注册

加入超过19百万学习者,今天就开始R 的可扩展数据处理!

创建您的免费帐户

继续使用 Google显示更多选项


继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。

通过 DataCamp for Mobile 提升您的数据技能

随时随地通过我们的移动课程和每日 5 分钟编程挑战提升技能。