Ir al contenido principal
InicioR

Curso

Introducción a la detección de anomalías en R

IntermedioNivel de habilidad
Actualizado 9/2024
Aprende pruebas estadísticas para identificar valores atípicos y cómo utilizar sofisticados algoritmos de puntuación de anomalías.
Comienza El Curso Gratis
RProbability & Statistics4 h13 vídeos47 Ejercicios3,900 XP7,313Certificado de logros

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formar a 2 o más personas?

Probar DataCamp for Business

Descripción del curso

¿Te preocupan los registros inexactos o sospechosos en tus datos y no sabes por dónde empezar? ¡Un algoritmo de detección de anomalías puede ayudarte! La detección de anomalías es un conjunto de técnicas diseñadas para identificar puntos de datos inusuales, y es clave para detectar fraude y proteger redes informáticas de actividad maliciosa. En este curso, explorarás pruebas estadísticas para identificar valores atípicos y aprenderás a usar algoritmos avanzados de puntuación de anomalías como el local outlier factor y el isolation forest. Aplicarás algoritmos de detección de anomalías para identificar vinos inusuales en el conjunto de datos UCI Wine Quality y también para detectar casos de enfermedad tiroidea a partir de mediciones hormonales anómalas.

Requisitos previos

Intermediate R
1

Statistical outlier detection

In this chapter, you'll learn how numerical and graphical summaries can be used to informally assess whether data contain unusual points. You'll use a statistical procedure called Grubbs' test to check whether a point is an outlier, and learn about the Seasonal-Hybrid ESD algorithm, which can help identify outliers when the data are a time series.
Iniciar Capítulo
2

Distance and density based anomaly detection

In this chapter, you'll learn how to calculate the k-nearest neighbors distance and the local outlier factor, which are used to construct continuous anomaly scores for each data point when the data have multiple features. You'll learn the difference between local and global anomalies and how the two algorithms can help in each case.
Iniciar Capítulo
3

Isolation forest

k-nearest neighbors distance and local outlier factor use the distance or relative density of the nearest neighbors to score each point. In this chapter, you'll explore an alternative tree-based approach called an isolation forest, which is a fast and robust method of detecting anomalies that measures how easily points can be separated by randomly splitting the data into smaller and smaller regions.
Iniciar Capítulo
4

Comparing performance

You've now been introduced to a few different algorithms for anomaly scoring. In this final chapter, you'll learn to compare the detection performance of the algorithms in instances where labeled anomalies are available. You'll learn to calculate and interpret the precision and recall statistics for an anomaly score, and how to adapt the algorithms so they can accommodate data with categorical features.
Iniciar Capítulo
Introducción a la detección de anomalías en R
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete Ahora

¡Únete a 19 millones de estudiantes y empieza Introducción a la detección de anomalías en R hoy mismo!

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.