Ga naar hoofdinhoud
HomeR

Cursus

Introductie tot anomaliedetectie in R

GemiddeldVaardigheidsniveau
Bijgewerkt 09-2024
Leer statistische tests om uitschieters te vinden en hoe je slimme algoritmes voor het scoren van afwijkingen kunt gebruiken.
Start Cursus Kosteloos
RProbability & Statistics
4 u
13 videos
47 Opdrachten
3,900 XP
7,338
Bewijs van Prestatie

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Geliefd bij leerlingen van duizenden bedrijven

Group

Een team trainen?

Probeer voor bedrijven

Cursusbeschrijving

Maak je je zorgen over onjuiste of verdachte records in je data, maar weet je niet waar je moet beginnen? Een anomaliedetectie-algoritme kan helpen! Anomaliedetectie is een verzameling technieken die zijn ontwikkeld om ongewone datapunten te identificeren en is cruciaal voor het opsporen van fraude en het beschermen van computernetwerken tegen schadelijke activiteiten. In deze cursus verken je statistische toetsen om uitschieters te identificeren en leer je geavanceerde anomaliescore-algoritmen gebruiken, zoals de local outlier factor en de isolation forest. Je past anomaliedetectie toe om ongewone wijnen te vinden in de UCI Wine Quality-gegevensset en om gevallen van schildklieraandoeningen te detecteren op basis van afwijkende hormoonmetingen.

Vereisten

Intermediate R
1

Statistische detectie van uitschieters

In dit hoofdstuk leer je hoe numerieke en grafische samenvattingen kunnen helpen om informeel te beoordelen of data ongewone punten bevatten. Je gebruikt een statistische procedure genaamd de toets van Grubbs om te controleren of een punt een uitschieter is, en je leert over het Seasonal-Hybrid ESD-algoritme, dat kan helpen uitschieters te identificeren wanneer de data een tijdreeks vormen.
Hoofdstuk beginnen
2

Afstands- en dichtheidsgebaseerde anomaliedetectie

In dit hoofdstuk leer je hoe je de k-nearest neighbors-afstand en de local outlier factor berekent, die worden gebruikt om continue anomaliescores te construeren voor elk datapunt wanneer de data meerdere kenmerken hebben. Je leert het verschil tussen lokale en globale anomalieën en hoe beide algoritmen in elk geval kunnen helpen.
Hoofdstuk beginnen
3

Isolation forest

k-nearest neighbors-afstand en local outlier factor gebruiken de afstand of relatieve dichtheid van de naaste buren om elk punt te scoren. In dit hoofdstuk verken je een alternatieve boomgebaseerde aanpak, een isolation forest, een snelle en robuuste methode om anomalieën te detecteren die meet hoe gemakkelijk punten kunnen worden gescheiden door de data willekeurig in steeds kleinere regio’s te splitsen.
Hoofdstuk beginnen
4

Prestaties vergelijken

Je hebt nu kennisgemaakt met een paar verschillende algoritmen voor het toekennen van anomaliescores. In dit laatste hoofdstuk leer je de detectieprestaties van de algoritmen te vergelijken in situaties waarin gelabelde anomalieën beschikbaar zijn. Je leert de precisie- en recall-statistieken voor een anomaliescore te berekenen en interpreteren, en hoe je de algoritmen kunt aanpassen zodat ze data met categorische kenmerken aankunnen.
Hoofdstuk beginnen
Introductie tot anomaliedetectie in R
Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprek
Schrijf je nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Introductie tot anomaliedetectie in R!

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.