Ga naar hoofdinhoud

Cursus

Fraudedetectie in R

GemiddeldVaardigheidsniveau

Bijgewerkt 08-2024

Leer fraude opsporen met analytics in R.

Start Cursus Kosteloos

RMachine Learning

4 u

16 videos

49 Opdrachten

3,900 XP

7,568

Bewijs van Prestatie

Geliefd bij leerlingen van duizenden bedrijven

Een team trainen?

Probeer voor bedrijven

Cursusbeschrijving

De Association of Certified Fraud Examiners schat dat fraude organisaties wereldwijd jaarlijks 3,7 biljoen dollar kost en dat een gemiddeld bedrijf vijf procent van zijn jaarlijkse omzet verliest door fraude. De verwachting is dat fraudepogingen in de toekomst verder toenemen, waardoor fraudedetectie in de meeste sectoren hard nodig is. In deze cursus leer je hoe je fraudepatronen uit historische data kunt gebruiken om fraude te bestrijden. We behandelen technieken uit robuuste statistiek en cijferanalyse om ongewone observaties op te sporen die waarschijnlijk met fraude samenhangen. Twee grote uitdagingen bij het bouwen van een supervised tool voor fraudedetectie zijn de scheve of onevenwichtige verdeling van de data en de verschillende kosten van verschillende typen verkeerde classificaties. We presenteren technieken om deze problemen op te lossen en richten ons op kunstmatige en echte gegevenssets uit een brede waaier aan fraude-applicaties.

Vereisten

Unsupervised Learning in R Supervised Learning in R: Classification

1

Introductie & motivatie

In dit hoofdstuk krijg je eerst een formele definitie van fraude. Daarna leer je hoe je anomalieën opspoort in het type betaalmethoden dat wordt gebruikt of in het tijdstip waarop betalingen plaatsvinden, om verdachte transacties te markeren.

Introductie & motivatie

Ongelijke klassenverdeling

Kosten van het niet detecteren van fraude

Tijdkenmerken

Circulair histogram

Verdachte tijdstempels

Frequentiekenmerken

Frequentiekenmerk voor één rekening

Frequentiekenmerk voor meerdere accounts

Recency-kenmerken

Recency-feature

Frequentie en recentheid vergelijken

Hoofdstuk beginnen

2

Sociale-netwerkanalyse

In het tweede hoofdstuk leer je hoe je netwerken inzet om fraude te bestrijden. Je visualiseert netwerken en gebruikt een sociologisch concept, homofiel gedrag, om frauduleuze transacties te detecteren en fraudeurs te pakken.

Analyse van sociale netwerken

Een netwerk analyseren

Overlappende randen

Fraude en sociale netwerkanalyse

Zoeken naar homofolie in een netwerk

Node-attributen visualiseren

Inferentie op basis van sociale netwerken

Relationele vs niet-relationele modellen

Relational neighbor classifier

Kengetallen voor sociale netwerken

Degree, closeness & betweenness

Netwerkfeatures toevoegen

Hoofdstuk beginnen

3

Onevenwichtige klassenverdelingen

Gelukkig komt fraude niet vaak voor. Dat betekent echter dat je met onevenwichtige data werkt, wat je detectiemodellen kan vertekenen als je niets doet. In dit hoofdstuk pak je het onevenwicht aan met over- en undersampling-methoden.

Omgaan met onevenwichtige gegevenssets

Hoe ga je om met klassenonevenwicht?

Patronen in de data visualiseren

Willekeurig over-samplen

Willekeurig onder-samplen

De meerderheidsgroep verkleinen

ROS & RUS combineren

Synthetische oversampling

Heb je SMOTE al ontmoet?

Van gegevensset naar detectiemodel

Bouw je eigen detectiemodel

Werkelijke kosten van fraudedetectie

Hoofdstuk beginnen

4

Cijferanalyse en robuuste statistiek

In dit laatste hoofdstuk maak je kennis met een verrassende wiskundige wet om verdachte gebeurtenissen te detecteren. Vervolgens gebruik je robuuste statistiek om je modellen nog weerbaarder te maken.

Cijferanalyse met de wet van Benford

Wet van Benford voor het eerste cijfer

Overeenstemming van censusgegevens

De wet van Benford voor fraudedetectie

Conformiteit met de wet van Benford

Brandverzekeringsclaims

Gegevensset met betalingen

Univariate uitschieters opsporen

Robuuste z-scores berekenen

Multivariate uitschieters detecteren

Multivariate outlierdetectie

Hoofdstuk beginnen

Fraudedetectie in R

Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprekSchrijf je nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Fraudedetectie in R!

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.