メインコンテンツへスキップ
ホームPython

コース

Pythonで学ぶデータプライバシーと匿名化

上級スキルレベル
更新日 2022/06
プライバシー保護手法を用いて、機密情報を安全に処理する方法を学びましょう。
コースを無料で開始
PythonMachine Learning
4時間
16 ビデオ
49 演習
3,850 XP
3,757
修了証明書

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

何千もの企業の従業員が支持

Group

チームのトレーニングを担当していますか?

Businessをお試しください

コース説明

データプライバシーの重要性はこれまでになく高まっています。一方で、価値あるビジネスインサイトを収集・共有するニーズとの両立はどうすればよいのでしょうか?このコースでは、GoogleやAmazonが用いるのと同じ手法――データの一般化や、k-Anonymity や Differential Privacy といったプライバシーモデル――を使って、そのバランスの取り方を学びます。GDPR などの話題に触れつつ、従業員情報や収入データのような機微情報を保護しながら、Python で Machine Learning モデルを構築・学習させる方法も身につけます。さあ、始めましょう!

前提条件

Unsupervised Learning in Python
1

Introduction to Data Privacy

Get ready to apply anonymization techniques such as data suppression, masking, synthetic data generation, and generalization. In this chapter, you’ll learn how to distinguish between sensitive and non-sensitive personally identifiable information (PII), quasi-identifiers, and the basics of the GDPR. You'll also encounter real-life examples of what can go wrong if you don't follow these best practices.
チャプターを開始
2

More on Privacy-Preserving Techniques

Discover how to anonymize data by sampling from datasets following the probability distribution of the columns. You’ll then learn how to apply the k-anonymity privacy model to prevent linkage or re-identification attacks and use hierarchies to perform data generalization in categorical variables.
3

Differential Privacy

Learn about differential privacy, the model used by major technology companies such as Apple, Google, and Uber. In this chapter, you’ll explore data by generating private histograms and computing private averages in data. You’ll also create differentially private machine learning models that allow businesses to increase the utility of their data.
4

Anonymizing and Releasing Datasets

In this final chapter, you’ll learn how to apply dimensionality reduction methods such as principal component analysis (PCA) to anonymize large multi-column datasets. You’ll then use Faker to generate realistic and consistent datasets, and scikit-learn to create synthetic datasets that follow a normal distribution. Lastly, you’ll tie everything you learned in this course together as you combine multiple techniques to safely release datasets to the public.
Pythonで学ぶデータプライバシーと匿名化
コース完了

修了証明書を取得

この修了書をLinkedInや履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と共にPythonで学ぶデータプライバシーと匿名化を始めましょう!

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。