Ir al contenido principal
InicioSpark

Curso

Introducción a Spark con sparklyr en R

IntermedioNivel de habilidad
Actualizado 10/2024
Aprende a realizar análisis de big data con Spark y el paquete sparklyr en R, y explora Spark MLIb en solo 4 horas.
Comienza el curso gratis
SparkData Engineering
4 h
4 vídeos
50 Ejercicios
4,600 XP
20,229
Certificado de logros

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formando un equipo?

Prueba para empresas

Descripción del curso

Descubre las ventajas de R, Spark y sparklyr

R está optimizado principalmente para ayudarte a escribir código de análisis de datos de forma rápida y legible. Apache Spark está diseñado para analizar rápidamente grandes conjuntos de datos. El paquete sparklyr te permite escribir código R dplyr que se ejecuta en un clúster Spark, lo que te ofrece lo mejor de ambos mundos. Este curso de 4 horas te enseña a manipular Spark DataFrames utilizando tanto la interfaz dplyr como la interfaz nativa de Spark, así como a probar técnicas de machine learning.

Cargar datos en Spark y manipular DataFrames de Spark

Comenzarás este curso de Spark investigando cómo Spark y R funcionan bien juntos y practicando la carga de datos, listos para su limpieza, transformación y análisis. Utilizarás los marcos Spark y la sintaxis dplyr para manipular tus datos filtrando y ordenando filas, y modificando y resumiendo columnas.

Adéntrate en el análisis de macrodatos con Spark MLib

Este curso se centra en desarrollar tus habilidades y confianza en el análisis de grandes conjuntos de datos. Los últimos capítulos te guían a través de las funciones de transformación de datos de machine learning de Spark y te ofrecen la oportunidad de practicar las rutinas de machine learning de sparklyr utilizándolo para realizar predicciones mediante árboles impulsados por gradientes y bosques aleatorios.

Requisitos previos

Supervised Learning in R: Regression
1

Light My Fire: primeros pasos con Spark usando sintaxis de dplyr

Aprenderás cómo Spark y R se complementan, cómo mover datos hacia y desde Spark, y cómo manipular data frames de Spark usando la sintaxis de dplyr.
Iniciar capítulo
2

Herramientas del oficio: uso avanzado de dplyr

Aprenderás más sobre el uso de la interfaz de dplyr con Spark, incluyendo selección avanzada de campos, cálculo de estadísticas por grupo y unión de data frames.
Iniciar capítulo
Introducción a Spark con sparklyr en R
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete ahora

¡Únete a 19 millones de estudiantes y empieza Introducción a Spark con sparklyr en R hoy mismo!

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.