Curso
Introducción a Spark con sparklyr en R
IntermedioNivel de habilidad
Actualizado 10/2024
SparkData Engineering4 h4 vídeos50 Ejercicios4,600 XP20,229Certificado de logros
Crea tu cuenta gratuita
Continuar con GoogleMostrar más opcioneso
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Preferido por estudiantes en miles de empresas
¿Formando un equipo?
Prueba para empresasDescripción del curso
Descubre las ventajas de R, Spark y sparklyr
R está optimizado principalmente para ayudarte a escribir código de análisis de datos de forma rápida y legible. Apache Spark está diseñado para analizar rápidamente grandes conjuntos de datos. El paquete sparklyr te permite escribir código R dplyr que se ejecuta en un clúster Spark, lo que te ofrece lo mejor de ambos mundos. Este curso de 4 horas te enseña a manipular Spark DataFrames utilizando tanto la interfaz dplyr como la interfaz nativa de Spark, así como a probar técnicas de machine learning.Cargar datos en Spark y manipular DataFrames de Spark
Comenzarás este curso de Spark investigando cómo Spark y R funcionan bien juntos y practicando la carga de datos, listos para su limpieza, transformación y análisis. Utilizarás los marcos Spark y la sintaxis dplyr para manipular tus datos filtrando y ordenando filas, y modificando y resumiendo columnas.Adéntrate en el análisis de macrodatos con Spark MLib
Este curso se centra en desarrollar tus habilidades y confianza en el análisis de grandes conjuntos de datos. Los últimos capítulos te guían a través de las funciones de transformación de datos de machine learning de Spark y te ofrecen la oportunidad de practicar las rutinas de machine learning de sparklyr utilizándolo para realizar predicciones mediante árboles impulsados por gradientes y bosques aleatorios.Requisitos previos
Supervised Learning in R: Regression1
Light My Fire: primeros pasos con Spark usando sintaxis de dplyr
Aprenderás cómo Spark y R se complementan, cómo mover datos hacia y desde Spark, y cómo manipular data frames de Spark usando la sintaxis de dplyr.
2
Herramientas del oficio: uso avanzado de dplyr
Aprenderás más sobre el uso de la interfaz de
dplyr con Spark, incluyendo selección avanzada de campos, cálculo de estadísticas por grupo y unión de data frames.3
Volviéndote nativo: usa la interfaz nativa para manipular DataFrames de Spark
Aprenderás sobre las funciones de transformación de datos de Machine Learning en Spark y la funcionalidad para manipular DataFrames nativos.
4
Estudio de caso: aprender a ser una máquina: ejecutar modelos de Machine Learning en Spark
Un estudio de caso en el que aprenderás a usar las rutinas de Machine Learning de
sparklyr, prediciendo el año en que se publicó una canción.Introducción a Spark con sparklyr en R
Curso completo
Obtener certificado de logros
Añade esta certificación a tu perfil de LinkedIn o a tu currículum.Compártelo en redes sociales y en tu evaluación de desempeño.Inscríbete ahora
¡Únete a 19 millones de estudiantes y empieza Introducción a Spark con sparklyr en R hoy mismo!
Crea tu cuenta gratuita
Continuar con GoogleMostrar más opcioneso
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp
Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.