Ir al contenido principal

Curso

Aprendizaje no supervisado en Python

IntermedioNivel de habilidad

Actualizado 12/2025

Aprende a agrupar en clústeres, transformar, visualizar y extraer información de conjuntos de datos no etiquetados con scikit-learn y scipy.

Comienza el curso gratis

PythonMachine Learning

4 h

13 vídeos

52 Ejercicios

4,150 XP

180K+

Certificado de logros

Preferido por estudiantes en miles de empresas

¿Formando un equipo?

Prueba para empresas

Descripción del curso

Supongamos que tienes una colección de clientes con diversas características, como edad, ubicación e historial financiero, y deseas descubrir patrones y clasificarlos en grupos. O quizá tengas un conjunto de textos, como páginas de Wikipedia, y quieras segmentarlos en categorías en función de su contenido. Este es el mundo del aprendizaje no supervisado, llamado así porque no estás guiando, o supervisando, el descubrimiento de patrones mediante alguna tarea de predicción, sino descubriendo la estructura oculta a partir de datos no etiquetados. El aprendizaje no supervisado engloba diversas técnicas de machine learning, desde la agrupación hasta la reducción de dimensiones y la factorización de matrices. En este curso, aprenderás los fundamentos del aprendizaje no supervisado e implementarás los algoritmos esenciales utilizando scikit-learn y SciPy. Aprenderás a agrupar, transformar, visualizar y extraer información de conjuntos de datos no etiquetados, y terminarás el curso construyendo un sistema de recomendación de artistas musicales populares.Los vídeos contienen transcripciones en directo que puedes mostrar haciendo clic en «Mostrar transcripción» en la parte inferior izquierda de los vídeos. El glosario del curso se encuentra a la derecha, en la sección de recursos.Para obtener créditos CPE, debes completar el curso y alcanzar una puntuación del 70 % en la evaluación cualificada. Puedes acceder a la evaluación haciendo clic en la llamada de créditos CPE situada a la derecha.

Requisitos previos

Supervised Learning with scikit-learn

1

Agrupación para la exploración de conjuntos de datos

Aprende a descubrir los grupos subyacentes (o "clústeres") en un conjunto de datos. Al final de este capítulo, podrás agrupar empresas utilizando sus cotizaciones bursátiles, y distinguir diferentes especies agrupando sus medidas.

Aprendizaje no supervisado

¿Cuántas agrupaciones?

Agrupación de puntos 2D

Inspecciona tu agrupación

Evaluar una agrupación

¿Cuántos clústeres de grano?

Evaluación de la agrupación de granos

Transformación de rasgos para mejorar las agrupaciones

Escala de datos de peces para la agrupación

Agrupación de los datos de los peces

Agrupación de acciones mediante K-Means

¿Qué acciones se mueven juntas?

Iniciar capítulo

2

Visualización mediante agrupamiento jerárquico y t-SNE

En este capítulo, aprenderás dos técnicas de aprendizaje no supervisado para la visualización de datos: la agrupación jerárquica y el t-SNE. La agrupación jerárquica agrupa las muestras de datos en clústeres cada vez más amplios, lo que da como resultado una visualización en forma de árbol de la jerarquía de clústeres resultante. El t-SNE proyecta las muestras de datos en un espacio bidimensional para que se pueda visualizar la proximidad entre ellas.

Visualizar jerarquías

¿Cuántas fusiones?

Agrupación jerárquica de los datos de los granos

Jerarquías de acciones

Etiquetas de clústeres en la agrupación jerárquica

¿Qué grupos están más cerca?

¡Vinculación diferente, agrupación jerárquica diferente!

Agrupaciones intermedias

Extraer las etiquetas de los clústeres

t-SNE para mapas bidimensionales

Visualización t-SNE del conjunto de datos sobre cereales

Un mapa t-SNE del mercado de valores

Iniciar capítulo

3

Decorrelación de tus datos y reducción de dimensiones

La reducción dimensional resume un conjunto de datos utilizando sus patrones comunes. En este capítulo, aprenderás cuál es la técnica más básica de reducción de dimensiones: el «análisis de componentes principales» (PCA). El PCA se suele utilizar antes del aprendizaje supervisado para mejorar el rendimiento y la generalización del modelo. También puede ser útil para el aprendizaje no supervisado. Por ejemplo, ¡utilizarás una variante del PCA que te permitirá agrupar los artículos de Wikipedia según su contenido!

Visualización de la transformación PCA

Datos correlacionados en la naturaleza

Descorrelación de las mediciones de grano mediante el análisis de componentes principales (PCA)

Componentes principales

Dimensión intrínseca

El primer componente principal

Varianza de las características del PCA

Dimensión intrínseca de los datos de los peces

Reducción de dimensiones con el PCA

Reducción dimensional de las medidas de los peces

Una matriz tf-idf de frecuencia de palabras

Agrupación Wikipedia parte I

Agrupación de Wikipedia, parte II

Iniciar capítulo

4

Descubrir rasgos interpretables

En este capítulo, aprenderás una técnica de reducción de dimensiones llamada «factorización de matrices no negativas» (NMF), que expresa las muestras como combinaciones de componentes interpretables. Por ejemplo, expresa los documentos como combinaciones de temas, y las imágenes en términos de patrones visuales habituales. ¡También aprenderás a usar el NMF para crear sistemas de recomendación que te sugieran artículos similares para leer o artistas musicales que se ajusten a tu historial de reproducción!

Factorización de matrices no negativas (NMF)

Datos no negativos

NMF aplicado a los artículos de Wikipedia

Características NMF de los artículos de Wikipedia

NMF reconstruye las muestras

El NMF aprende partes interpretables

El NMF identifica los temas de los documentos

Explora el conjunto de datos de dígitos LED

El NMF identifica las partes de las imágenes

PCA no aprende las piezas

Creación de sistemas de recomendación con NMF

¿Qué artículos son similares a "Cristiano Ronaldo"?

Recomienda artistas musicales parte I

Recomendaciones de artistas musicales, parte II

Reflexiones finales

Iniciar capítulo

Aprendizaje no supervisado en Python

Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.Inscríbete ahora

Para empresas

¿Formar a 2 o más personas?

Consigue para tu equipo acceso a la plataforma completa de DataCamp, incluidas todas las funciones.

En las siguientes pistas

Científico de datos asociado en PythonCertificación

Ingeniero Asociado de IA para Científicos de DatosCertificación

Fundamentos del aprendizaje automático en Python

Científico especializado en machine learning en Python

instructor

Benjamin Wilson

Benjamin Wilson

Director of Research at lateral.io

colaboradores

Curso recursos

Company stock price movementsconjunto de datos

Eurovision 2016conjunto de datos

Fish measurementsconjunto de datos

Grainsconjunto de datos

LCD digitsconjunto de datos

Musical artistsconjunto de datos

Wikipedia articlesconjunto de datos

Wineconjunto de datos

Course Glossaryconjunto de datos

¡Únete a 19 millones de estudiantes y empieza Aprendizaje no supervisado en Python hoy mismo!

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.