Saltar al contenido principal
InicioSpark

Introducción a PySpark

"Aprende a implementar gestión de datos distribuidos y aprendizaje automático en Spark con PySpark."

Comienza El Curso Gratis
4 horas45 ejercicios146.232 aprendicesTrophyDeclaración de cumplimiento

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group

¿Entrenar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas


Descripción del curso

En este curso, aprenderás a utilizar Spark desde Python. Spark es una herramienta para realizar computación paralela con grandes conjuntos de datos y se integra bien con Python. PySpark es el paquete de Python que hace que se produzca la magia. Utilizarás este paquete para trabajar con datos sobre vuelos que viajan desde Portland y Seattle. Aprenderás a organizar estos datos y a construir toda una canalización de machine learning para prever si dichos vuelos van a retrasarse o no. Prepárate para poner un poco de Spark en tu código Python y sumergirte en el mundo del machine learning de alto rendimiento.
Empresas

Group¿Entrenar a 2 o más personas?

Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.
DataCamp Para EmpresasPara obtener una solución a medida, reserve una demostración.

En las siguientes pistas

Big Data con PySpark

Ir a la pista

Científico de machine learning en Python

Ir a la pista
  1. 1

    Conocer PySpark

    Gratuito

    En este capítulo, aprenderás cómo gestiona Spark los datos y cómo leer y escribir tablas desde Python.

    Reproducir Capítulo Ahora
    ¿Pero qué es Spark?
    50 xp
    Uso de Spark en Python
    50 xp
    Examen de SparkContext
    100 xp
    Uso de DataFrames
    50 xp
    Creación de SparkSession
    100 xp
    Visualización de tablas
    100 xp
    ¿Algo que consultar?
    100 xp
    Pandafy en Spark DataFrame
    100 xp
    Pon algo de Spark en tus datos
    100 xp
    Abandono del intermediario
    100 xp
  2. 3

    Introducción a las canalizaciones de machine learning

    PySpark tiene rutinas de machine learning de última generación integradas, junto con utilidades para crear canalizaciones completas de machine learning. Aprenderás todo esto en este capítulo.

    Reproducir Capítulo Ahora
Empresas

Group¿Entrenar a 2 o más personas?

Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.

En las siguientes pistas

Big Data con PySpark

Ir a la pista

Científico de machine learning en Python

Ir a la pista

conjuntos de datos

AirportsFlightsPlanes

colaboradores

Collaborator's avatar
Colin Ricardo

requisitos previos

Introduction to Python
Lore Dirick HeadshotLore Dirick

Director of Data Science Education at Flatiron School

Ver Más

¿Qué tienen que decir otros alumnos?

¡Únete a 15 millones de estudiantes y empieza Introducción a PySpark hoy mismo!

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.