Saltar al contenido principal
InicioSpark

curso

Introducción a PySpark

Intermedio
Actualizado 2/2025
"Aprende a implementar gestión de datos distribuidos y aprendizaje automático en Spark con PySpark."
Comienza el curso gratis

Incluido conPremium or Teams

SparkData Engineering4 horas45 ejercicios3,850 XP151,362Certificado de logros

Crea Tu Cuenta Gratuita

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group

¿Entrenar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas

Descripción del curso

En este curso, aprenderás a utilizar Spark desde Python. Spark es una herramienta para realizar computación paralela con grandes conjuntos de datos y se integra bien con Python. PySpark es el paquete de Python que hace que se produzca la magia. Utilizarás este paquete para trabajar con datos sobre vuelos que viajan desde Portland y Seattle. Aprenderás a organizar estos datos y a construir toda una canalización de machine learning para prever si dichos vuelos van a retrasarse o no. Prepárate para poner un poco de Spark en tu código Python y sumergirte en el mundo del machine learning de alto rendimiento.

Prerrequisitos

Introduction to Python
1

Conocer PySpark

Iniciar capítulo
2

Manipulación de datos

Iniciar capítulo
3

Introducción a las canalizaciones de machine learning

Iniciar capítulo
4

Ajuste y selección de modelos

Iniciar capítulo
Introducción a PySpark
Curso
Completo

Obtener certificado de logros

Añade esta credencial a tu perfil, currículum vitae o CV de LinkedIn
Compártelo en las redes sociales y en tu evaluación de desempeño

Incluido conPremium or Teams

Inscríbete ahora

Únete a más 15 millones de estudiantes y empezar Introducción a PySpark hoy

Crea Tu Cuenta Gratuita

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.