Accéder au contenu principal

Cours

Détection de fraude en R

IntermédiaireNiveau de compétence

Actualisé 08/2024

Apprenez à détecter les fraudes à l'aide des analyses dans R.

Commencer le cours gratuitement

RMachine Learning

4 h

16 vidéos

49 Exercices

3,900 XP

7,566

Certificat de formation

Apprécié par des utilisateurs provenant de milliers d'entreprises

Former une équipe ?

Essayez pour les entreprises

Description du cours

L’Association of Certified Fraud Examiners estime que la fraude coûte aux organisations du monde entier 3,7 billions de dollars par an et qu’une entreprise type perd cinq pour cent de son chiffre d’affaires annuel à cause de la fraude. Les tentatives de fraude devraient encore augmenter à l’avenir, rendant la détection de fraude indispensable dans la plupart des secteurs. Ce cours montre comment l’apprentissage de schémas de fraude à partir de données historiques permet de lutter contre la fraude. Certaines techniques de statistiques robustes et d’analyse des chiffres sont présentées pour repérer des observations inhabituelles probablement liées à des fraudes. Deux défis majeurs lors de la création d’un outil supervisé de détection de fraude sont le déséquilibre ou la dissymétrie des données, et les coûts variés selon les types d’erreurs de classification. Nous présentons des techniques pour résoudre ces problèmes et nous concentrons sur des jeux de données artificiels et réels issus d’un large éventail d’applications de fraude.

Prérequis

Unsupervised Learning in R Supervised Learning in R: Classification

1

Introduction & Motivation

This chapter will first give a formal definition of fraud. You will then learn how to detect anomalies in the type of payment methods used or the time these payments are made to flag suspicious transactions.

Introduction & Motivation

Imbalanced class distribution

Cost of not detecting fraud

Time features

Circular histogram

Suspicious timestamps

Frequency features

Frequency feature for one account

Frequency feature for multiple accounts

Recency features

Recency feature

Comparing frequency & recency

Commencer le chapitre

2

Social network analytics

In the second chapter, you will learn how to use networks to fight fraud. You will visualize networks and use a sociology concept called homophily to detect fraudulent transactions and catch fraudsters.

Social network analytics

Analyzing a network

Overlapping edges

Fraud and social network analysis

Looking for homophily in a network

Visualizing node attributes

Social network based inference

Relational vs non-relational models

Relational neighbor classifier

Social network metrics

Degree, closeness & betweenness

Adding network features

Commencer le chapitre

3

Imbalanced class distributions

Fortunately, fraud occurrences are rare. However, this means that you're working with imbalanced data, which if left as is will bias your detection models. In this chapter, you will tackle imbalance using over and under-sampling methods.

Dealing with imbalanced datasets

How to deal with class imbalance?

Visualizing patterns in the data

Random over-sampling

Random under-sampling

Shrinking the majority group

Combining ROS & RUS

Synthetic Over-sampling

Have you met SMOTE?

From dataset to detection model

Build your own detection model

True cost of fraud detection

Commencer le chapitre

4

Digit analysis and robust statistics

In this final chapter, you will learn about a surprising mathematical law used to detect suspicious occurrences. You will then use robust statistics to make your models even more bulletproof.

Digit analysis using Benford's law

Benford's Law for first digit

Conformity of census data

Benford's Law for fraud detection

Conformity to Benford's Law

Fire insurance claims

Payments data set

Detecting univariate outliers

Computing robust z-scores

Detecting multivariate outliers

Multivariate outlier detection

Commencer le chapitre

Détection de fraude en R

Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performanceS'inscrire maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Détection de fraude en R dès aujourd'hui !

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.