Accéder au contenu principal
AccueilPython

Cours

Confidentialité des données et anonymisation en Python

AvancéNiveau de compétence
Actualisé 06/2022
Apprenez à traiter les informations sensibles à l'aide de techniques préservant la confidentialité.
Commencer Le Cours Gratuitement
PythonMachine Learning4 h16 vidéos49 Exercices3,850 XP3,688Certificat de réussite.

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former 2 personnes ou plus ?

Essayez DataCamp for Business

Description du cours

La confidentialité des données n’a jamais été aussi cruciale. Mais comment trouver l’équilibre entre protection de la vie privée et besoin de recueillir et de partager des informations métier utiles ? Dans ce cours, vous apprendrez à le faire en vous appuyant sur les mêmes méthodes que Google et Amazon — notamment la généralisation des données et des modèles de confidentialité comme la k-anonymat et la differential privacy. En plus d’aborder des sujets comme le RGPD, vous découvrirez comment créer et entraîner des modèles de Machine Learning en Python tout en protégeant les informations sensibles des utilisateurs, telles que les données d’employés et de revenus. Commençons !

Prérequis

Unsupervised Learning in Python
1

Introduction to Data Privacy

Get ready to apply anonymization techniques such as data suppression, masking, synthetic data generation, and generalization. In this chapter, you’ll learn how to distinguish between sensitive and non-sensitive personally identifiable information (PII), quasi-identifiers, and the basics of the GDPR. You'll also encounter real-life examples of what can go wrong if you don't follow these best practices.
Commencer Le Chapitre
2

More on Privacy-Preserving Techniques

Discover how to anonymize data by sampling from datasets following the probability distribution of the columns. You’ll then learn how to apply the k-anonymity privacy model to prevent linkage or re-identification attacks and use hierarchies to perform data generalization in categorical variables.
Commencer Le Chapitre
3

Differential Privacy

Learn about differential privacy, the model used by major technology companies such as Apple, Google, and Uber. In this chapter, you’ll explore data by generating private histograms and computing private averages in data. You’ll also create differentially private machine learning models that allow businesses to increase the utility of their data.
Commencer Le Chapitre
4

Anonymizing and Releasing Datasets

In this final chapter, you’ll learn how to apply dimensionality reduction methods such as principal component analysis (PCA) to anonymize large multi-column datasets. You’ll then use Faker to generate realistic and consistent datasets, and scikit-learn to create synthetic datasets that follow a normal distribution. Lastly, you’ll tie everything you learned in this course together as you combine multiple techniques to safely release datasets to the public.
Commencer Le Chapitre
Confidentialité des données et anonymisation en Python
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire Maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Confidentialité des données et anonymisation en Python dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.