Curso
Reducción de la dimensionalidad en R
BásicoNivel de habilidad
Actualizado 12/2024
RMachine Learning4 h16 vídeos56 Ejercicios4,600 XP2,745Certificado de logros
Crea tu cuenta gratuita
Continuar con GoogleMostrar más opcioneso
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Preferido por estudiantes en miles de empresas
¿Formando un equipo?
Prueba para empresasDescripción del curso
Reducción de dimensionalidad
Vivimos en la era de la información, una era de sobrecarga de información. El arte de extraer información esencial de los datos es una habilidad muy cotizada en el mercado laboral. Los modelos se entrenan más rápido con datos reducidos. En producción, los modelos más pequeños significan un tiempo de respuesta más rápido. Quizás lo más importante es que los datos y modelos más pequeños suelen ser más fáciles de entender. La reducción de dimensionalidad es tu navaja de Occam en la ciencia de datos.
¿Qué aprenderás en este curso?
¡La diferencia entre selección de características y extracción de características! Con R, aprenderás a identificar y eliminar características con información escasa o redundante, conservando las características con mayor cantidad de información. Selección de características También aprenderás a extraer combinaciones de características como componentes condensados que contienen la máxima información. ¡Eso es la extracción de características!
Pero lo más importante es que, con el nuevo paquete tidymodel de R, utilizarás datos del mundo real para crear modelos con menos características sin sacrificar un rendimiento significativo.
Requisitos previos
Modeling with tidymodels in R1
Fundamentos de la reducción de la dimensionalidad
¡Prepárate para simplificar conjuntos de datos grandes! Aprenderás sobre la información, cómo evaluar la importancia de las variables y practicarás la identificación de variables con poca información. Al final del capítulo, entenderás la diferencia entre selección de variables y extracción de variables —los dos enfoques para reducir la dimensionalidad—.
2
Selección de variables para importancia de variables
Aprende a identificar variables ricas en información y pobres en información mediante las proporciones de valores ausentes, la varianza y la correlación. Después, descubrirás cómo crear recetas de tidymodels para seleccionar variables usando estos indicadores de información.
3
Selección de variables para el rendimiento del modelo
El capítulo tres introduce la diferencia entre enfoques no supervisados y supervisados para la selección de variables. Repasarás cómo usar flujos de trabajo de tidymodels para construir modelos. Luego, realizarás selección supervisada de variables usando regresión lasso y modelos de random forest.
4
Extracción de variables y rendimiento del modelo
En este último capítulo, desarrollarás una fuerte intuición sobre la extracción de variables al entender cómo los componentes principales extraen y combinan la información más importante de distintas variables. Después, aprende y aplica tres tipos de extracción de variables —análisis de componentes principales (PCA), t-SNE y UMAP—. Descubre cómo puedes usar estos métodos de extracción como paso de preprocesamiento en el proceso de construcción de modelos con tidymodels.
Reducción de la dimensionalidad en R
Curso completo
Obtener certificado de logros
Añade esta certificación a tu perfil de LinkedIn o a tu currículum.Compártelo en redes sociales y en tu evaluación de desempeño.Inscríbete ahora
¡Únete a 19 millones de estudiantes y empieza Reducción de la dimensionalidad en R hoy mismo!
Crea tu cuenta gratuita
Continuar con GoogleMostrar más opcioneso
Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp
Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.