Introducción a la ingeniería de datos
Conoce el mundo de la ingeniería de datos en este breve curso, que abarca herramientas y temas como ETL y computación en la nube.
Comience El Curso Gratis4 Horas15 Videos57 Ejercicios
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas
Preferido por estudiantes en miles de empresas
Descripción del curso
¿Has oído hablar de los ingenieros de datos y te preguntas qué es lo que hacen? ¿Sabes lo que hacen los ingenieros de datos, pero no estás seguro de cómo convertirte en uno tú mismo? Este curso es la introducción perfecta. Aborda todo lo que necesitas saber para optimizar el procesamiento de tus datos. Este curso introductorio te dará el contexto suficiente para empezar a explorar el mundo de la ingeniería de datos. Es perfecto para las personas que trabajan en una empresa con varias fuentes de datos y no tienen una idea clara de cómo utilizar todas esas fuentes de datos de forma escalable. Sé el primero en introducir estas técnicas en tu empresa y conviértete en el empleado estrella.
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más- 1
Introducción a la ingeniería de datos
GratuitoEn este primer capítulo, conocerás el mundo de la ingeniería de datos. Explora las diferencias entre un ingeniero de datos y un científico de datos, obtén una visión general de las diversas herramientas que utilizan los ingenieros de datos y amplía tu comprensión de cómo la tecnología de la nube desempeña un papel en la ingeniería de datos.
¿Qué es la ingeniería de datos?50 xpTareas de un ingeniero de datos50 xp¿Ingeniero de datos o científico de datos?100 xpProblemas de la ingeniería de datos50 xpHerramientas del ingeniero de datos50 xpTipos de bases de datos50 xpTareas de procesamiento50 xpHerramientas de programación50 xpProveedores de nube50 xp¿Por qué la computación en la nube?50 xpGrandes nombres de la computación en nube100 xpServicios en la nube100 xp - 2
Caja de herramientas de ingeniería de datos
Ahora que conoces las principales diferencias entre un ingeniero de datos y un científico de datos, ¡prepárate para explorar la caja de herramientas del ingeniero de datos! Conoce en detalle los distintos tipos de bases de datos que utilizan los ingenieros de datos, cómo la computación paralela es una piedra angular del conjunto de herramientas del ingeniero de datos, y cómo programar trabajos de procesamiento de datos utilizando marcos de programación.
Bases de datos50 xpSQL frente a NoSQL100 xpEl esquema de la base de datos100 xpUniones en relaciones100 xpDiagrama de esquema en estrella50 xpQué es la computación paralela50 xp¿Por qué la computación paralela?50 xpDe la tarea a las subtareas100 xpUso de un DataFrame100 xpMarcos de computación paralela50 xpSpark, Hadoop y Hive100 xpGroupby de PySpark100 xpEjecución de archivos PySpark50 xpMarcos de programación de flujos de trabajo50 xpAirflow, Luigi y cron50 xpDAG de Airflow100 xp - 3
Extraer, Transformar y Cargar (ETL)
Después de haber conocido la caja de herramientas de los ingenieros de datos, ¡ha llegado el momento de pasar al pan de cada día del flujo de trabajo de un ingeniero de datos! Con ETL, aprenderás a extraer datos brutos de diversas fuentes, a transformar estos datos brutos en información procesable y a cargarlos en bases de datos relevantes, ¡listos para su consumo!
Extraer50 xpFuentes de datos50 xpObtener desde una API100 xpLeer de una base de datos100 xpTransformar50 xpDivisión del alquiler100 xpPreparación para transformaciones50 xpUniones con valoraciones100 xpCarga50 xpOLAP u OLTP50 xpEscritura en un archivo100 xpCargar en Postgres100 xpUnirlo todo50 xpDefinición de un DAG100 xpConfiguración de Airflow50 xpInterpretación del DAG50 xp - 4
Estudio de caso: DataCamp
Culmina todo lo que has aprendido en los tres capítulos anteriores completando un caso de uso de ingeniería de datos del mundo real de DataCamp. Realizarás y programarás un proceso ETL que transforme los datos brutos de calificación de los cursos en recomendaciones de cursos procesables para los estudiantes de DataCamp.
Valoraciones de cursos50 xpExploración del esquema50 xpConsulta de la tabla100 xpValoración media por curso100 xpDe las valoraciones a las recomendaciones50 xpFiltrar los datos corruptos100 xpUso de la transformación de recomendación100 xpProgramación de trabajos diarios50 xpLa tabla de destino100 xpDefinición del DAG100 xpActivación del DAG50 xpConsulta de las recomendaciones100 xp¡Enhorabuena!50 xp
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másSets De Datos
datacamp_application.sqlColaboradores
Vincent Vankrunkelsven
Ver MasData and Software Engineer @DataCamp
¿Qué tienen que decir otros alumnos?
¡Únete a 13 millones de estudiantes y empieza Introducción a la ingeniería de datos hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.