Ir al contenido principal
InicioR

Curso

Introducción a la detección de anomalías en R

IntermedioNivel de habilidad
Actualizado 9/2024
Aprende pruebas estadísticas para identificar valores atípicos y cómo utilizar sofisticados algoritmos de puntuación de anomalías.
Comienza el curso gratis
RProbability & Statistics
4 h
13 vídeos
47 Ejercicios
3,900 XP
7,337
Certificado de logros

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formando un equipo?

Prueba para empresas

Descripción del curso

¿Te preocupan los registros inexactos o sospechosos en tus datos y no sabes por dónde empezar? ¡Un algoritmo de detección de anomalías puede ayudarte! La detección de anomalías es un conjunto de técnicas diseñadas para identificar puntos de datos inusuales, y es clave para detectar fraude y proteger redes informáticas de actividad maliciosa. En este curso, explorarás pruebas estadísticas para identificar valores atípicos y aprenderás a usar algoritmos avanzados de puntuación de anomalías como el local outlier factor y el isolation forest. Aplicarás algoritmos de detección de anomalías para identificar vinos inusuales en el conjunto de datos UCI Wine Quality y también para detectar casos de enfermedad tiroidea a partir de mediciones hormonales anómalas.

Requisitos previos

Intermediate R
1

Detección estadística de valores atípicos

En este capítulo, aprenderás cómo los resúmenes numéricos y gráficos pueden usarse para evaluar de forma informal si los datos contienen puntos inusuales. Utilizarás un procedimiento estadístico llamado prueba de Grubbs para comprobar si un punto es un valor atípico y conocerás el algoritmo Seasonal-Hybrid ESD, que puede ayudar a identificar valores atípicos cuando los datos forman una serie temporal.
Iniciar capítulo
2

Detección de anomalías basada en distancia y densidad

En este capítulo, aprenderás a calcular la distancia de los k vecinos más cercanos y el local outlier factor, que se utilizan para construir puntuaciones de anomalía continuas para cada punto de datos cuando los datos tienen múltiples características. Aprenderás la diferencia entre anomalías locales y globales y cómo pueden ayudar ambos algoritmos en cada caso.
Iniciar capítulo
3

Isolation forest

La distancia de los k vecinos más cercanos y el local outlier factor usan la distancia o la densidad relativa de los vecinos más cercanos para puntuar cada punto. En este capítulo, explorarás un enfoque alternativo basado en árboles llamado isolation forest, que es un método rápido y robusto para detectar anomalías y que mide lo fácilmente que se pueden separar los puntos dividiendo aleatoriamente los datos en regiones cada vez más pequeñas.
Iniciar capítulo
4

Comparación del rendimiento

Ya has conocido varios algoritmos para puntuar anomalías. En este capítulo final, aprenderás a comparar el rendimiento de detección de los algoritmos en casos donde hay anomalías etiquetadas. Aprenderás a calcular e interpretar las estadísticas de precisión y exhaustividad (recall) para una puntuación de anomalía, y cómo adaptar los algoritmos para que puedan manejar datos con características categóricas.
Iniciar capítulo
Introducción a la detección de anomalías en R
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete ahora

¡Únete a 19 millones de estudiantes y empieza Introducción a la detección de anomalías en R hoy mismo!

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.