课程描述

学习如何进行聚类分析

聚类分析是数据科学工作台中的强大工具集。它用于发现具有相似特征的观测组（簇）。这些相似性可以为各种商业决策提供依据；例如，在营销中，它可用于识别不同的客户群体，以便为其量身定制广告。

探索层次聚类和 K-Means 聚类技术

在本课程中，您将了解两种常用的聚类方法——层次聚类和 k-means 聚类。你不仅会学会如何使用这些方法，还会建立起对它们工作原理以及如何解读其结果的深刻直觉。你将通过探索三个不同的数据集来培养这种直觉：足球运动员位置、批发客户消费数据以及纵向职业工资数据。

通过实战案例研究提升你的技能

你将通过将新学到的技能应用于一个围绕平均薪资及其随时间变化的案例研究来完成这门课程。这将结合层次聚类技术，例如职业树、探索准备和职业簇绘图，以及 k-means 技术，包括肘部分析和平均轮廓宽度。

DataCamp 课程由视频、文章和实践练习组成，让您有机会测试并巩固新学到的技能，从而在课程之外应用这些技能时更有信心。

先决条件

Intermediate R

计算观测值之间的距离

聚类分析旨在找到彼此相似的观测组，同时不同组之间彼此不同。这样的相似性与差异由一种称为距离的度量来刻画。在本章中，您将学习如何在连续特征和分类特征下计算观测值之间的距离。您还将建立对特征量纲如何影响距离的直观理解。

课程描述

学习如何进行聚类分析

探索层次聚类和 K-Means 聚类技术

通过实战案例研究提升你的技能

获得成就证明

加入超过.css-nklxlk{color:var(--wf-brand--main, #03EF62);}19百万学习者，今天就开始R 中的聚类分析！

创建您的免费帐户

通过 DataCamp for Mobile 提升您的数据技能

加入超过19百万学习者，今天就开始R 中的聚类分析！