Curso
Introdução ao Spark com sparklyr em R
IntermediárioNível de habilidade
Atualizado 10/2024SparkData Engineering4 h4 vídeos50 Exercícios4,600 XP20,179Certificado de conclusão
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Preferido por alunos de milhares de empresas
Treinar 2 ou mais pessoas?
Experimentar DataCamp for BusinessDescrição do curso
Descubra as vantagens do R, Spark e sparklyr
O R é otimizado principalmente para ajudar você a escrever códigos de análise de dados de forma rápida e legível. O Apache Spark foi feito pra analisar grandes conjuntos de dados rapidinho. O pacote sparklyr permite que você escreva código R dplyr que roda em um cluster Spark, oferecendo o melhor dos dois mundos. Este curso de 4 horas ensina como mexer com Spark DataFrames usando tanto a interface dplyr quanto a interface nativa do Spark, além de experimentar técnicas de machine learning.Carregar dados no Spark e mexer nos DataFrames do Spark
Você vai começar esse curso do Spark vendo como o Spark e o R funcionam bem juntos e praticando o carregamento de dados, prontos para limpeza, transformação e análise. Você vai usar frames do Spark e a sintaxe do dplyr pra mexer nos seus dados, filtrando e organizando linhas, além de alterar e resumir colunas.Mergulhe na análise de Big Data com o Spark MLib
Este curso se concentra em desenvolver suas habilidades e confiança na análise de grandes conjuntos de dados. Os capítulos finais mostram os recursos de transformação de dados de machine learning do Spark e te dão a chance de praticar as rotinas de machine learning do sparklyr, usando-o para fazer previsões com árvores impulsionadas por gradiente e florestas aleatórias.Pré-requisitos
Supervised Learning in R: Regression1
Light My Fire: Starting To Use Spark With dplyr Syntax
In which you learn how Spark and R complement each other, how to get data to and from Spark, and how to manipulate Spark data frames using dplyr syntax.
2
Tools of the Trade: Advanced dplyr Usage
In which you learn more about using the
dplyr interface to Spark, including advanced field selection, calculating groupwise statistics, and joining data frames.3
Going Native: Use The Native Interface to Manipulate Spark DataFrames
In which you learn about Spark's machine learning data transformation features, and functionality for manipulating native DataFrames.
4
Case Study: Learning to be a Machine: Running Machine Learning Models on Spark
A case study in which you learn to use
sparklyr's machine learning routines, by predicting the year in which a song was released.Introdução ao Spark com sparklyr em R
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se Agora
Faça como mais de 19 milhões de alunos e comece Introdução ao Spark com sparklyr em R hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Desenvolva suas habilidades em dados com o app do DataCamp
Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.