Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas
Preferido por estudiantes en miles de empresas
Descripción del curso
Se suele decir que los científicos de datos dedican el 80% de su tiempo a limpiar y manipular los datos y sólo el 20% a analizarlos. El tiempo dedicado a la limpieza es vital, ya que analizar datos sucios puede llevarte a sacar conclusiones inexactas.
La limpieza de datos es una tarea esencial en la ciencia de datos. Sin unos datos correctamente depurados, los resultados de cualquier análisis de datos o modelo de machine learning podrían ser inexactos. En este curso, aprenderás a identificar, diagnosticar y tratar diversos problemas de limpieza de datos en Python, desde los más sencillos a los más avanzados. Tratarás con tipos de datos incorrectos, comprobarás que tus datos están en el intervalo correcto, manejarás los datos que faltan, realizarás la vinculación de registros, ¡y mucho más!
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másEn las siguientes pistas
Importar y limpiar datos con Python
Ir a la pista- 1
Problemas habituales con los datos
GratuitoEn este capítulo, aprenderás a superar algunos de los problemas más comunes con los datos sucios. Convertirás los tipos de datos, aplicarás restricciones de rango para eliminar puntos de datos futuros y eliminarás puntos de datos duplicados para evitar la doble contabilidad.
Restricciones del tipo de datos50 xpTipos de datos comunes100 xp¿Datos numéricos o ... ?100 xpSumar cadenas y concatenar números100 xpRestricciones del rango de datos50 xpLimitaciones del tamaño de los neumáticos100 xpRegreso al futuro100 xpRestricciones de unicidad50 xp¿Qué tamaño tiene tu subconjunto?50 xpEncontrar duplicados100 xpTratamiento de duplicados100 xp - 2
Problemas de texto y datos categóricos
Los datos categóricos y de texto pueden ser a menudo algunas de las partes más desordenadas de un conjunto de datos, debido a su naturaleza no estructurada. En este capítulo, aprenderás a corregir incoherencias de espacios en blanco y mayúsculas en las etiquetas de las categorías, a contraer varias categorías en una sola y a reformatear cadenas para que sean coherentes.
- 3
Problemas avanzados de datos
En este capítulo, te sumergirás en problemas más avanzados de limpieza de datos, como asegurarte de que todos los pesos están escritos en kilogramos en lugar de libras. También adquirirás conocimientos muy valiosos que te ayudarán a verificar que los valores se han añadido correctamente y que los valores que faltan no afectan negativamente a tus análisis.
- 4
Vinculación de registros
La vinculación de registros es una potente técnica para fusionar varios conjuntos de datos, que se utiliza cuando los valores tienen erratas o diferente ortografía. En este capítulo, aprenderás a enlazar registros calculando la similitud entre cadenas; luego, utilizarás tus nuevas habilidades para unir dos conjuntos de datos de reseñas de restaurantes en un conjunto de datos maestro limpio.
Comparar cadenas50 xpDistancia mínima de edición50 xpEl punto de corte100 xpReasignación de categorías II100 xpGenerar pares50 xp¿Enlazar o no enlazar?100 xpPares de restaurantes100 xpRestaurantes similares100 xpEnlazar DataFrames50 xpObtener el índice correcto50 xp¡Enlazándolos!100 xp¡Enhorabuena!50 xp
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másEn las siguientes pistas
Importar y limpiar datos con Python
Ir a la pistaSets De Datos
Ride sharing datasetAirlines datasetBanking datasetRestaurants datasetRestaurants dataset IIColaboradores
Adel Nehme
Ver MasVP of Media, DataCamp
¿Qué tienen que decir otros alumnos?
¡Únete a 13 millones de estudiantes y empieza Limpiar datos en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.