Vai al contenuto principale

Corso

Apprendimento non supervisionato in Python

IntermedioLivello di competenza

Aggiornato 12/2025

Impara a raggruppare, trasformare, visualizzare ed estrarre informazioni utili da set di dati non etichettati usando scikit-learn e scipy.

Inizia il corso gratis

PythonMachine Learning

4 h

13 video

52 Esercizi

4,150 XP

180K+

Attestato di conseguimento

Preferito dagli studenti di migliaia di aziende

Formare un team?

Prova per il Business

Descrizione del corso

Supponi di avere un insieme di clienti con varie caratteristiche, come età, posizione e storia finanziaria, e di voler scoprire schemi e raggrupparli in cluster. Oppure hai un insieme di testi, ad esempio pagine di Wikipedia, e vuoi suddividerli in categorie in base al contenuto. Questo è il mondo dell’apprendimento non supervisionato: si chiama così perché non guidi, o supervisioni, la scoperta dei pattern tramite un compito di previsione, ma fai emergere strutture nascoste da dati non etichettati. L’apprendimento non supervisionato comprende diverse tecniche di Machine Learning, dal clustering alla riduzione della dimensione fino alla fattorizzazione di matrici. In questo corso imparerai le basi dell’apprendimento non supervisionato e implementerai gli algoritmi essenziali usando scikit-learn e SciPy. Imparerai a raggruppare, trasformare, visualizzare ed estrarre insight da insiemi di dati non etichettati, e concluderai il corso costruendo un sistema di raccomandazione per suggerire artisti musicali popolari.I video includono trascrizioni che puoi mostrare cliccando su "Show transcript" in basso a sinistra nei video. Il glossario del corso è disponibile a destra nella sezione delle risorse.Per ottenere i crediti CPE devi completare il corso e raggiungere un punteggio del 70% nella valutazione qualificata. Puoi andare alla valutazione cliccando sul riquadro dei crediti CPE sulla destra.

Prerequisiti

Supervised Learning with scikit-learn

1

Clustering per esplorare gli insiemi di dati

Impara a individuare i gruppi sottostanti (o "cluster") in un insieme di dati. Alla fine di questo capitolo, farai il clustering delle aziende usando i loro prezzi di borsa e distinguerai specie diverse raggruppando le loro misurazioni.

Unsupervised Learning

Quanti cluster?

Clustering di punti 2D

Esamina il tuo clustering

Valutare un clustering

Quanti cluster di cereali?

Valutare il clustering dei cereali

Trasformare le caratteristiche per cluster più efficaci

Scalare i dati sui pesci per il clustering

Clustering dei dati sui pesci

Clustering dei titoli azionari con KMeans

Quali titoli si muovono insieme?

Inizia il capitolo

2

Visualizzazione con clustering gerarchico e t-SNE

In questo capitolo conoscerai due tecniche di apprendimento non supervisionato per la visualizzazione dei dati: clustering gerarchico e t-SNE. Il clustering gerarchico unisce i campioni in cluster via via più ampi, producendo una visualizzazione ad albero della gerarchia risultante. t-SNE mappa i campioni in uno spazio 2D in modo che si possa visualizzare la loro prossimità reciproca.

Visualizzare le gerarchie

Quante fusioni?

Clustering gerarchico dei dati sui cereali

Gerarchie di titoli azionari

Etichette di cluster nel clustering gerarchico

Quali cluster sono più vicini?

Linkage diverso, clustering gerarchico diverso!

Raggruppamenti intermedi

Estrarre le etichette dei cluster

t-SNE per mappe bidimensionali

Visualizzazione t-SNE dell'insieme di dati sui cereali

Una mappa t-SNE del mercato azionario

Inizia il capitolo

3

Decorrelazione dei dati e riduzione della dimensione

La riduzione della dimensione riassume un insieme di dati sfruttando i pattern che si ripetono. In questo capitolo scoprirai la più fondamentale tra le tecniche di riduzione della dimensione, la "Principal Component Analysis" ("PCA"). La PCA è spesso usata prima dell’apprendimento supervisionato per migliorare prestazioni e generalizzazione del modello. Può essere utile anche nell’apprendimento non supervisionato. Per esempio, userai una variante della PCA che ti permetterà di raggruppare articoli di Wikipedia in base al loro contenuto!

Visualizzare la trasformazione PCA

Dati correlati in natura

Decorrelare le misurazioni dei cereali con la PCA

Componenti principali

Dimensione intrinseca

La prima componente principale

Varianza delle feature della PCA

Dimensione intrinseca dei dati sui pesci

Riduzione della dimensione con PCA

Riduzione della dimensionalità delle misurazioni dei pesci

Un array di frequenze delle parole con tf-idf

Clustering di Wikipedia parte I

Clustering di Wikipedia, parte II

Inizia il capitolo

4

Scoprire caratteristiche interpretabili

In questo capitolo imparerai una tecnica di riduzione della dimensione chiamata "Non-negative matrix factorization" ("NMF"), che esprime i campioni come combinazioni di parti interpretabili. Per esempio, rappresenta i documenti come combinazioni di argomenti e le immagini in termini di pattern visivi ricorrenti. Imparerai anche a usare la NMF per costruire sistemi di raccomandazione in grado di suggerirti articoli simili da leggere o artisti musicali in linea con la tua cronologia di ascolto!

Fattorizzazione di matrici non negative (NMF)

Dati non negativi

NMF applicata agli articoli di Wikipedia

Feature NMF degli articoli di Wikipedia

NMF ricostruisce i campioni

NMF apprende parti interpretabili

NMF impara gli argomenti dei documenti

Esplora il dataset dei numeri LED

NMF impara le parti delle immagini

PCA non apprende parti

Creare sistemi di raccomandazione con NMF

Quali articoli sono simili a 'Cristiano Ronaldo'?

Consiglia artisti musicali parte I

Consiglia artisti musicali parte II

Considerazioni finali

Inizia il capitolo

Apprendimento non supervisionato in Python

Corso
completato

Ottieni Attestato di conseguimento

Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CV
Condividila sui social e nella valutazione delle tue performanceIscriviti ora

Per Aziende

Vuoi formare 2 o più persone?

Dai al tuo team accesso completo alla piattaforma DataCamp e a tutte le sue funzionalità.

Nei seguenti programmi

Scienziato dei dati associato in PythonCertificazione

Ingegnere AI associato per scienziati dei datiCertificazione

Fondamenti di apprendimento automatico in Python

Scienziato specializzato in apprendimento automatico in Python

istruttore

Benjamin Wilson

Benjamin Wilson

Director of Research at lateral.io

collaboratori

Corso risorse

Company stock price movementsset di dati

Eurovision 2016set di dati

Fish measurementsset di dati

Grainsset di dati

LCD digitsset di dati

Musical artistsset di dati

Wikipedia articlesset di dati

Wineset di dati

Course Glossaryset di dati

Unisciti a oltre 19 milioni di studenti e inizia Apprendimento non supervisionato in Python oggi!

Aumenta le tue competenze sui dati con l'app di DataCamp

Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.