programa por habilidad
Big Data con PySpark
Mejora tus conocimientos de datos dominando Apache Spark. Utilizando la API Python de Spark, PySpark, aprovecharás la computación paralela con grandes conjuntos de datos, y te prepararás para el machine learning de alto rendimiento. Desde la limpieza de datos hasta la creación de funciones y la implementación de modelos de machine learning, ejecutarás flujos de trabajo integrales con Spark. El programa termina con la creación de un motor de recomendación utilizando el popular conjunto de datos MovieLens y el conjunto de datos Million Songs.
Python25 horas6 cursos1 proyectoDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas
Preferido por estudiantes en miles de empresas
Asistente de IARegístrate para usar el Asistente de IANuestro asistente de IA es de uso gratuito para todos los usuarios registrados. Regístrese o inicie sesión para acceder al asistente y mejorar su experiencia de aprendizaje.
Empresas
¿Entrenar a 2 o más personas?
Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y másInstructores
Únete a 14,600,000 estudiantes y empeza Big Data con PySpark hoy!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.