Análisis exploratorio de datos en Python
Aprende a explorar, visualizar y extraer información de datos usando análisis exploratorio (EDA) en Python.
Comience El Curso Gratis4 horas14 vídeos49 ejercicios
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas
Preferido por estudiantes en miles de empresas
Descripción del curso
Así que tienes algunos datos interesantes, ¿por dónde empiezas tu análisis? Este curso cubrirá el proceso de exploración y análisis de datos, desde la comprensión de lo que se incluye en un conjunto de datos hasta la incorporación de los resultados de la exploración a un flujo de trabajo de ciencia de datos.
Utilizando datos sobre cifras de desempleo y precios de billetes de avión, aprovecharás Python para resumir y validar datos, calcular, identificar y reemplazar valores perdidos, y limpiar valores numéricos y categóricos. A lo largo del curso, crearás hermosas visualizaciones Seaborn para comprender las variables y sus relaciones.
Por ejemplo, examinarás cómo se relacionan el consumo de alcohol y el rendimiento de los alumnos. Por último, el curso mostrará cómo los hallazgos exploratorios alimentan los flujos de trabajo de la ciencia de datos creando nuevas características, equilibrando características categóricas y generando hipótesis a partir de los hallazgos.
Al final de este curso, tendrás la confianza necesaria para realizar tu propio análisis exploratorio de datos (EDA) en Python. ¡Serás capaz de explicar tus conclusiones visualmente a los demás y sugerir los siguientes pasos para recopilar información a partir de tus datos!
Utilizando datos sobre cifras de desempleo y precios de billetes de avión, aprovecharás Python para resumir y validar datos, calcular, identificar y reemplazar valores perdidos, y limpiar valores numéricos y categóricos. A lo largo del curso, crearás hermosas visualizaciones Seaborn para comprender las variables y sus relaciones.
Por ejemplo, examinarás cómo se relacionan el consumo de alcohol y el rendimiento de los alumnos. Por último, el curso mostrará cómo los hallazgos exploratorios alimentan los flujos de trabajo de la ciencia de datos creando nuevas características, equilibrando características categóricas y generando hipótesis a partir de los hallazgos.
Al final de este curso, tendrás la confianza necesaria para realizar tu propio análisis exploratorio de datos (EDA) en Python. ¡Serás capaz de explicar tus conclusiones visualmente a los demás y sugerir los siguientes pasos para recopilar información a partir de tus datos!
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másEn las siguientes pistas
- 1
Conocer un conjunto de datos
Gratuito¿Cuál es la mejor manera de abordar un nuevo conjunto de datos? Aprende a validar y resumir datos categóricos y numéricos y a crear visualizaciones Seaborn para comunicar tus conclusiones.
Exploración inicial50 xpFunciones para la exploración inicial100 xpContar valores categóricos100 xpDesempleo mundial en 2021100 xpValidación de datos50 xpDetectar tipos de datos100 xpValidar continentes100 xpRango de validación100 xpResumen de datos50 xpResúmenes con .groupby() y .agg()100 xpAgregaciones con nombre100 xpVisualizar resúmenes categóricos100 xp - 2
Limpieza e imputación de datos
Explorar y analizar datos a menudo significa tratar con valores perdidos, tipos de datos incorrectos y valores atípicos. En este capítulo, aprenderás técnicas para gestionar estos problemas y agilizar tus procesos en EDA.
Tratar los datos que faltan50 xpTratar los datos que faltan100 xpEstrategias para los datos que faltan100 xpImputar los precios de los aviones que faltan100 xpConvertir y analizar datos categóricos50 xpEncontrar el número de valores únicos100 xpCategorías de duración de los vuelos100 xpAñadir categorías de duración100 xpTrabajar con datos numéricos50 xpDuración del vuelo100 xpAñadir estadísticas descriptivas100 xpGestión de valores atípicos50 xpQué hacer con los valores atípicos100 xpIdentificar valores atípicos100 xpEliminar valores atípicos100 xp - 3
Relaciones en los datos
Las variables de los conjuntos de datos tienen relaciones entre sí. En este capítulo, examinarás las relaciones entre datos numéricos, categóricos e incluso DateTime, explorando la dirección y la fuerza de estas relaciones, así como las formas de visualizarlas.
Patrones a lo largo del tiempo50 xpImportar datos DateTime100 xpActualizar tipo de datos a DateTime100 xpVisualizar las relaciones a lo largo del tiempo100 xpCorrelación50 xpInterpretar un mapa de calor50 xpVisualizar las relaciones entre variables100 xpVisualizar las relaciones entre múltiples variables100 xpRelaciones y distribuciones de los factores50 xpDatos categóricos en gráficos de dispersión100 xpExplorando con las parcelas KDE100 xp - 4
Convertir el análisis exploratorio en acción
El análisis exploratorio de datos es un paso crucial en el flujo de trabajo de la ciencia de datos, ¡pero no es el final! Ahora es el momento de aprender técnicas y consideraciones que puedes utilizar para avanzar con éxito en tus proyectos una vez que hayas terminado de explorar.
Consideraciones para datos categóricos50 xpComprobación del desequilibrio de clases100 xpTabulación cruzada100 xpGenerar nuevas funciones50 xpExtraer características para la correlación100 xpCálculo de los percentiles salariales100 xpCategorizar los salarios100 xpGenerar hipótesis50 xpComparar salarios100 xpElegir una hipótesis100 xp¡Enhorabuena!50 xp
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másEn las siguientes pistas
colaboradores
George Boorman
Ver MásCurriculum Manager, DataCamp
Izzy Weber
Ver MásData Coach at iO-Sphere
¿Qué tienen que decir otros alumnos?
¡Únete a 14 millones de estudiantes y empieza Análisis exploratorio de datos en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.