Curso
Introducción a PySpark
IntermedioNivel de habilidad
Actualizado 1/2026
SparkData Engineering4 h11 vídeos36 Ejercicios2,850 XP29,450Certificado de logros
Crea tu cuenta gratuita
Continuar con GoogleMostrar más opcioneso
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Preferido por estudiantes en miles de empresas
¿Formando un equipo?
Prueba para empresasDescripción del curso
¿Por qué Spark? ¿Por qué ahora?
Descubre la velocidad y la escalabilidad de Apache Spark, el potente marco diseñado para gestionar grandes volúmenes de datos. A través de lecciones interactivas y ejercicios prácticos, verás cómo el procesamiento en memoria de Spark le da una ventaja sobre los marcos tradicionales como Hadoop. Comenzarás configurando sesiones de Spark y profundizarás en componentes básicos como los conjuntos de datos distribuidos resilientes (RDD) y los DataFrame. Aprende a filtrar, agrupar y unir conjuntos de datos con facilidad mientras trabajas con ejemplos del mundo real.Mejora tus habilidades en Python y SQL para el big data
Aprende a utilizar PySpark SQL para consultar y gestionar datos utilizando la sintaxis SQL habitual. Aborda esquemas, tipos de datos complejos y funciones definidas por el usuario (UDF), al tiempo que desarrollas habilidades en el almacenamiento en caché y la optimización del rendimiento para sistemas distribuidos.Construye tus bases de big data
Al finalizar este curso, tendrás la confianza necesaria para manejar, consultar y procesar grandes volúmenes de datos utilizando PySpark. Con estas habilidades básicas, estarás listo para explorar temas avanzados como machine learning y el análisis de big data.Requisitos previos
Introduction to SQLData Manipulation with pandas1
Introducción a Apache Spark y PySpark
Una introducción general a PySpark y a la computación distribuida. Esta sección presenta PySpark, los DataFrames de PySpark y los RDDs.
2
PySpark en Python
Continuación sobre DataFrames y tipos de datos complejos. Esta sección amplía lo que ofrecen los DataFrames en PySpark e introduce algunos conceptos de Spark SQL.
3
Introducción a PySpark SQL
Profundiza en cómo aprovechar Spark SQL y PySpark para un procesamiento de datos escalable, combinando la sencillez de SQL con la potencia de computación distribuida de PySpark para manejar grandes conjuntos de datos de forma eficiente.
Introducción a PySpark
Curso completo
Obtener certificado de logros
Añade esta certificación a tu perfil de LinkedIn o a tu currículum.Compártelo en redes sociales y en tu evaluación de desempeño.Inscríbete ahora
¡Únete a 19 millones de estudiantes y empieza Introducción a PySpark hoy mismo!
Crea tu cuenta gratuita
Continuar con GoogleMostrar más opcioneso
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp
Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.