Pular para o conteúdo principal

Curso

Detecção de Fraudes em R

IntermediárioNível de habilidade

Atualizado 08/2024

Aprenda a detectar fraudes com análises no R.

Iniciar curso gratuitamente

RMachine Learning

4 h

16 vídeos

49 Exercícios

3,900 XP

7,566

Declaração de realização

Preferido por alunos de milhares de empresas

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

A Association of Certified Fraud Examiners estima que fraudes custam às organizações no mundo todo US$ 3,7 trilhões por ano e que uma empresa típica perde cinco por cento da receita anual devido a fraudes. A expectativa é que as tentativas de fraude aumentem ainda mais no futuro, tornando a detecção de fraudes essencial na maioria dos setores. Neste curso, você verá como aprender padrões de fraude a partir de dados históricos pode ajudar a combatê-la. Serão apresentadas técnicas de estatística robusta e análise de dígitos para detectar observações incomuns que provavelmente estão associadas a fraudes. Dois grandes desafios ao criar uma ferramenta supervisionada para detecção de fraudes são o desbalanceamento ou viés dos dados e os diferentes custos para cada tipo de erro de classificação. Apresentamos técnicas para resolver essas questões e focamos em conjuntos de dados artificiais e reais de uma ampla variedade de aplicações de fraude.

Pré-requisitos

Unsupervised Learning in R Supervised Learning in R: Classification

1

Introduction & Motivation

This chapter will first give a formal definition of fraud. You will then learn how to detect anomalies in the type of payment methods used or the time these payments are made to flag suspicious transactions.

Introduction & Motivation

Imbalanced class distribution

Cost of not detecting fraud

Time features

Circular histogram

Suspicious timestamps

Frequency features

Frequency feature for one account

Frequency feature for multiple accounts

Recency features

Recency feature

Comparing frequency & recency

Iniciar capítulo

2

Social network analytics

In the second chapter, you will learn how to use networks to fight fraud. You will visualize networks and use a sociology concept called homophily to detect fraudulent transactions and catch fraudsters.

Social network analytics

Analyzing a network

Overlapping edges

Fraud and social network analysis

Looking for homophily in a network

Visualizing node attributes

Social network based inference

Relational vs non-relational models

Relational neighbor classifier

Social network metrics

Degree, closeness & betweenness

Adding network features

Iniciar capítulo

3

Imbalanced class distributions

Fortunately, fraud occurrences are rare. However, this means that you're working with imbalanced data, which if left as is will bias your detection models. In this chapter, you will tackle imbalance using over and under-sampling methods.

Dealing with imbalanced datasets

How to deal with class imbalance?

Visualizing patterns in the data

Random over-sampling

Random under-sampling

Shrinking the majority group

Combining ROS & RUS

Synthetic Over-sampling

Have you met SMOTE?

From dataset to detection model

Build your own detection model

True cost of fraud detection

Iniciar capítulo

4

Digit analysis and robust statistics

In this final chapter, you will learn about a surprising mathematical law used to detect suspicious occurrences. You will then use robust statistics to make your models even more bulletproof.

Digit analysis using Benford's law

Benford's Law for first digit

Conformity of census data

Benford's Law for fraud detection

Conformity to Benford's Law

Fire insurance claims

Payments data set

Detecting univariate outliers

Computing robust z-scores

Detecting multivariate outliers

Multivariate outlier detection

Iniciar capítulo

Detecção de Fraudes em R

Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora

Faça como mais de 19 milhões de alunos e comece Detecção de Fraudes em R hoje mesmo!

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.