Corso
Il laplaciano ricorre negli algoritmi basati su grafi, nelle pipeline di elaborazione delle immagini e nel clustering spettrale. Quindi, se stai costruendo modelli che lavorano con grafi, immagini o dati ad alta dimensionalità, il laplaciano non è matematica di contorno opzionale. È la cosa che fa davvero il lavoro dietro le quinte.
In questo articolo, partirò dalle basi del laplaciano: la matematica che c'è dietro, l'intuizione geometrica, il laplaciano dei grafi e la sua forma matriciale, e come viene usato nelle applicazioni concrete di machine learning.
Ti serve un'introduzione pratica alle equazioni differenziali? Leggi il nostro articolo recente per passare dai fondamenti alle applicazioni pratiche nel machine learning.
Che cos'è il laplaciano?
Il laplaciano è un operatore differenziale del secondo ordine. Ti dice come una funzione si incurva in un punto dato.
A volte viene descritto come la divergenza del gradiente.
Ed è la chiave per capire cosa fa davvero l'operatore:
- Il gradiente ti dice in quale direzione una funzione aumenta più velocemente
- La divergenza misura se quel flusso si espande o si concentra.
Combinati, il laplaciano ti dice se un punto è un picco locale, una valle locale o qualcosa di piatto nel mezzo.
In parole semplici, il laplaciano misura di quanto il valore di una funzione in un punto differisce dal valore medio dei suoi vicini. Se il laplaciano è zero, la funzione è localmente "bilanciata". Positivo significa che il punto sta sotto l'intorno. Negativo significa che sta sopra.
La formula
In 2D, per una funzione f(x, y):

Formula del laplaciano 2D
In 3D, per una funzione f(x, y, z):

Formula del laplaciano 3D
Lo schema vale in qualunque numero di dimensioni: sommi le derivate parziali seconde lungo ciascun asse. Questo rende il laplaciano perfetto per i dati ad alta dimensionalità, motivo per cui compare così spesso nel machine learning.
Formula del laplaciano nel calcolo multivariabile
La formula del laplaciano è più breve di quanto ti aspetteresti per qualcosa che appare in così tante aree del machine learning.
In 3D, per una funzione f(x, y, z), è così:

Formula del laplaciano 3D
Tutto qui. Stai sommando le derivate parziali seconde lungo ogni dimensione.
Ogni termine pone la stessa domanda lungo il suo asse: la funzione si incurva verso l'alto, verso il basso o è piatta? Sommando queste risposte, ottieni un singolo numero che descrive la curvatura complessiva in quel punto.
Dalle 3D alle n dimensioni
La formula si generalizza a n dimensioni. Questa è la formula generica per una funzione con n dimensioni in input:

Generalizzazione della formula del laplaciano
Ecco perché il laplaciano funziona bene nel machine learning, dove i tuoi dati spesso vivono in centinaia o migliaia di dimensioni. L'operatore somma semplicemente la curvatura lungo ciascuna dimensione.
Connessione all'ottimizzazione
Se hai lavorato con la discesa del gradiente, pensi già alle derivate prime: in che direzione si scende? Il laplaciano fa un passo in più.
Le derivate seconde ti dicono la forma di quella collina.
Un laplaciano grande e positivo in un punto significa che la funzione si incurva nettamente verso l'alto in tutte le direzioni: sei vicino a un minimo. Un valore grande e negativo significa che sei vicino a un massimo. Vicino a zero significa che la superficie è localmente piatta.
Queste informazioni di curvatura contano nei metodi di ottimizzazione di secondo ordine, che le usano per fare passi più intelligenti della semplice discesa del gradiente. Il laplaciano è un modo per riassumere quella curvatura in uno scalare.
Intuizione geometrica: cosa misura il laplaciano
Il segno del laplaciano in un punto ti dice la forma della funzione intorno a quel punto.
-
Se
∇²f > 0in un punto, la funzione si incurva verso l'alto in tutte le direzioni. Il punto è più basso del suo intorno. Questa è convessità. -
Se
∇²f < 0, la funzione si incurva verso il basso. Il punto è più alto del suo intorno. Questa è concavità. -
Se
∇²f = 0, la funzione è localmente piatta. Nessuna curvatura netta in nessuna direzione.
Questa è la versione multivariabile del test della derivata seconda che già conosci. In 1D, una seconda derivata positiva indica un minimo locale e una negativa un massimo locale. Il laplaciano estende la stessa idea a qualunque numero di dimensioni sommando la curvatura su tutti gli assi.
Relazione con l'hessiano
La matrice hessiana cattura il quadro completo della curvatura. È una matrice di tutte le derivate parziali seconde, e ogni elemento descrive come la funzione si incurva lungo una coppia di assi.
Il laplaciano è la traccia dell'hessiano: la somma dei suoi elementi diagonali. Dove l'hessiano ti dà la scomposizione completa della curvatura, il laplaciano la comprime in un solo numero.
Questo compromesso è importante nel machine learning. L'hessiano completo è costoso da calcolare per modelli ad alta dimensionalità: un modello con n parametri ha un hessiano n × n. Il laplaciano ti offre un riassunto scalare economico della curvatura, veloce da usare.
Perché questo conta nel machine learning
Quando alleni un modello, stai navigando una superficie di loss. Le regioni piatte significano apprendimento lento. Le aree convesse significano che l'ottimizzatore può andare oltre. Il laplaciano ti dà una lettura rapida della situazione in cui ti trovi.
I metodi basati su grafi usano il laplaciano per misurare quanto dolcemente i valori cambiano tra i nodi di un grafo. È un'estensione diretta della stessa intuizione sulla curvatura dalle funzioni continue alle strutture discrete.
Laplaciano e ottimizzazione nel machine learning
La discesa del gradiente usa solo derivate prime.
Il gradiente ti dice in quale direzione fare il passo. Non ti dice quanto grande debba essere quel passo. Un gradiente ripido in una valle ampia e piatta richiede un passo grande. Lo stesso gradiente ripido vicino al bordo di uno strapiombo richiede un passo piccolo. Le sole derivate prime non possono distinguere i due casi.
Qui entrano in gioco le derivate seconde.
Curvatura e dimensione del passo
La curvatura descrive quanto velocemente cambia il gradiente stesso. Alta curvatura significa che la superficie della loss si piega nettamente: piccoli passi nello spazio dei parametri producono grandi variazioni del gradiente. Bassa curvatura significa che la superficie è piatta e il gradiente cambia lentamente.
Se ignori la curvatura e usi un learning rate fisso, stai andando a tentoni. Troppo grande, e vai oltre nelle regioni ad alta curvatura. Troppo piccolo, e avanzi a rilento in quelle piatte.
I metodi di ottimizzazione di secondo ordine come il metodo di Newton usano la curvatura per impostare automaticamente le dimensioni dei passi. Dividono il gradiente per la curvatura, facendo passi più grandi dove la superficie è piatta e più piccoli dove è acuminata.
Dove si inserisce il laplaciano
Il laplaciano è la traccia dell'hessiano: uno scalare che riassume la curvatura totale in un punto. Non cattura il quadro completo come l'hessiano, ma è economico da calcolare e utile come segnale.
Ecco una spiegazione in parole semplici di cosa ricordare:
- Un laplaciano grande e positivo della loss in un punto significa che sei vicino a un minimo locale: la loss si incurva verso l'alto in tutte le direzioni
- Un valore negativo significa che sei vicino a un massimo
- Vicino a zero significa che sei in una regione piatta o a sella, esattamente dove la discesa del gradiente tende a bloccarsi
Stabilità e regolarizzazione
La curvatura è legata anche alla stabilità dell'addestramento. I minimi acuti, cioè regioni ad alta curvatura, tendono a generalizzare peggio di quelli piatti. Un modello che converge in un minimo acuto è sensibile a piccole variazioni in input.
Alcune tecniche di regolarizzazione penalizzano direttamente la curvatura per spingere l'ottimizzazione verso regioni più piatte della superficie di loss. Il laplaciano compare anche qui, come modo per misurare e limitare quanto bruscamente cambiano le predizioni del modello nello spazio degli input.
Capire la curvatura ti aiuta a capire perché il tuo ottimizzatore si blocca, perché il learning rate conta così tanto e perché alcuni minimi generalizzano meglio di altri.
Il laplaciano dei grafi e la matrice laplaciana
Finora, il laplaciano ha vissuto nel mondo delle funzioni continue. Ma cosa succede quando i tuoi dati non sono una superficie liscia, bensì un grafo?
Qui entra in gioco il laplaciano dei grafi. Prende la stessa idea di base — misurare come un valore in un punto differisce dai suoi vicini — e la applica a nodi e spigoli.
La formula
Il laplaciano del grafo L è definito come:

Formula del laplaciano del grafo (semplificata)
Due matrici. Tutto qui. Vediamo cosa significa ognuna.
La matrice di adiacenza
La matrice di adiacenza A codifica quali nodi sono connessi. Per un grafo con n nodi, A è una matrice n × n dove A_ij = 1 se c'è un arco tra il nodo i e il nodo j, e 0 altrimenti.
Per un grafo semplice non orientato con 3 nodi in cui il nodo 1 si collega ai nodi 2 e 3, ma 2 e 3 non sono collegati tra loro:

La matrice di adiacenza
La matrice dei gradi
La matrice dei gradi D è una matrice diagonale. Ogni elemento diagonale D_ii è il grado del nodo i, cioè il numero di archi a esso connessi. Tutti gli elementi fuori diagonale sono zero.
Questa è la formula per lo stesso grafo:

La matrice dei gradi
Il nodo 1 ha grado 2 (connesso a due nodi). I nodi 2 e 3 hanno grado 1 ciascuno.
Mettere tutto insieme
Sottrai A da D e ottieni L:

Sottrazione della matrice di adiacenza dalla matrice dei gradi
Ogni elemento diagonale ti dice quante connessioni ha un nodo. Ogni elemento fuori diagonale L_ij vale -1 se i nodi i e j sono collegati, e 0 se non lo sono.
Se moltiplichi L per un vettore di valori assegnati a ciascun nodo, il risultato misura quanto il valore di ogni nodo differisce dai valori dei suoi vicini. Questa è la versione discreta della stessa intuizione sulla curvatura di prima — applicata però a un grafo invece che a una superficie continua.
Cosa dicono gli autovalori su un grafo
Il vero potere di L deriva dai suoi autovalori e autovettori:
-
Il più piccolo autovalore di
Lè sempre 0. L'autovettore corrispondente è un vettore costante: ogni nodo riceve lo stesso valore. Ha senso: una funzione costante ha "variazione" zero sul grafo. -
Il numero di autovalori nulli è uguale al numero di componenti connesse del grafo. Se il tuo grafo ha tre cluster disconnessi,
Lha tre autovalori nulli. È un modo diretto per leggere la connettività del grafo da una matrice. -
Autovalori piccoli ma non nulli corrispondono ad autovettori che cambiano lentamente sul grafo: i nodi vicini ricevono valori simili. Autovalori grandi corrispondono ad autovettori che oscillano rapidamente tra nodi connessi.
Curiosità: Questo spettro di autovalori è ciò che dà il nome ai metodi spettrali.
Clustering spettrale e rilevazione di comunità
Il clustering spettrale usa gli autovettori di L per trovare cluster in dati strutturati a grafo. L'idea è che gli autovettori associati ad autovalori piccoli assegnano valori simili ai nodi fittamente connessi e diversi a quelli debolmente connessi.
Per trovare k cluster, prendi i k autovettori corrispondenti ai k più piccoli autovalori non nulli di L, impilali in una matrice e lancia k-means sulle righe. Ogni riga è un nodo, e la sua posizione in questo spazio a bassa dimensione riflette il suo vicinato nel grafo.
Questo funziona per la rilevazione di comunità nei social network, il clustering di documenti, la segmentazione di immagini e ovunque i tuoi dati abbiano una naturale struttura a grafo. Due nodi fortemente connessi finiscono vicini nello spazio degli autovettori. Due nodi di comunità diverse finiscono lontani.
Il laplaciano del grafo trasforma un problema combinatorio difficile — trovare i cluster in questo grafo — in un problema di algebra lineare facile da risolvere.
Laplaciano nel clustering spettrale
Il clustering spettrale è dove il laplaciano del grafo passa da matematica interessante a strumento pratico di ML.
L'idea di base è che invece di raggruppare direttamente i punti dati grezzi, li raggruppi in uno spazio definito dagli autovettori di L. Quello spazio cattura la struttura del grafo, così puoi vedere quali nodi sono strettamente connessi, quali lo sono debolmente e quali appartengono a comunità separate.
Come gli autovettori definiscono i cluster
Prendi i k autovettori corrispondenti ai k più piccoli autovalori non nulli di L. Impilali come colonne in una matrice. Ogni riga di quella matrice è un nodo, ora rappresentato come un punto in uno spazio a k dimensioni.
Gli autovettori associati ad autovalori piccoli cambiano lentamente sul grafo. I nodi densamente connessi finiscono con valori simili in questi autovettori — e valori simili significano righe simili — e righe simili significano che cadranno vicini nel nuovo spazio.
Laplaciano non normalizzato versus normalizzato
In pratica vedrai due versioni del laplaciano del grafo.
Il laplaciano non normalizzato è il semplice L = D - A. Funziona bene quando i nodi hanno gradi più o meno simili — cioè quando la maggior parte dei nodi ha un numero simile di connessioni
Il laplaciano normalizzato corregge gli squilibri di grado. Ci sono un paio di varianti, ma la più comune è:

Formula del laplaciano normalizzato
Questo riscalare contribuisce di ogni nodo in base al suo grado. Nei grafi del mondo reale — social network, grafi del web, reti di citazioni — alcuni nodi hanno centinaia di connessioni e altri solo una o due. Senza normalizzazione, i nodi ad alto grado dominano gli autovettori e i risultati del clustering ne risentono.
Usa il laplaciano normalizzato di default, a meno che tu non sappia che il tuo grafo ha una distribuzione dei gradi uniforme.
Applicazioni pratiche
Il clustering spettrale con il laplaciano del grafo compare in un'ampia gamma di task di machine learning. Eccone alcuni:
- Segmentazione di immagini - i pixel diventano nodi, i pesi degli archi codificano la similarità e i cluster mappano le regioni dell'immagine
- Clustering di documenti - i documenti diventano nodi, gli archi codificano termini condivisi o citazioni
- Analisi di reti sociali - gli utenti diventano nodi, gli archi codificano le connessioni e i cluster rivelano le comunità
- Sistemi di raccomandazione - gli oggetti o gli utenti formano un grafo e i metodi spettrali trovano gruppi con comportamenti simili
Ogni volta che i tuoi dati hanno una struttura naturale a grafo, o puoi costruirla da similarità a coppie, il clustering spettrale ti offre un modo rigoroso per trovare gruppi che i metodi puramente basati sulla distanza mancano.
Laplaciano nell'elaborazione di immagini e nella computer vision
Il laplaciano è uno degli strumenti più antichi della computer vision, ed è ancora usato attivamente oggi.
Nell'elaborazione di immagini, l'intensità del pixel è la funzione. Il laplaciano misura quanto l'intensità di un pixel differisce da quella dei suoi vicini. Dove l'intensità cambia lentamente, il laplaciano è vicino a zero. Dove cambia bruscamente — su un bordo — il laplaciano produce una risposta forte.
Questa è l'intera base del rilevamento di bordi con il laplaciano.
Perché le derivate seconde trovano i bordi
Una derivata prima trova dove l'intensità sta cambiando. Una derivata seconda trova dove quel cambiamento stesso sta cambiando — in altre parole, dove il tasso di variazione raggiunge il picco e poi cala.
Su un bordo, l'intensità sale e poi si stabilizza. La derivata prima ha un picco sulla rampa. La derivata seconda — il laplaciano — attraversa lo zero proprio al culmine di quel picco. Questi attraversamenti dello zero segnano l'esatta posizione di un bordo, il che rende il laplaciano più preciso per localizzare i bordi rispetto ai metodi a derivata prima come il filtro di Sobel.
Il kernel laplaciano discreto
In pratica, le immagini sono griglie di pixel, non funzioni continue. Il laplaciano continuo viene approssimato usando un kernel di convoluzione: una piccola matrice che fai scorrere sull'immagine.
Il kernel laplaciano discreto standard 3×3 è questo:

Kernel laplaciano discreto 3x3
Il peso centrale è -4 e i quattro vicini diretti hanno ciascuno +1. Quando applichi questo kernel a un pixel, stai calcolando la differenza tra l'intensità di quel pixel e la media dei suoi quattro vicini — la versione discreta della stessa domanda "come si confronta questo punto con l'intorno" di prima.
Considerazioni pratiche
Il filtraggio laplaciano grezzo è sensibile al rumore. Un singolo pixel rumoroso produce un picco di intensità, e il laplaciano lo segnalerà come un bordo.
La soluzione standard è sfumare prima l'immagine con un blur gaussiano, poi applicare il laplaciano. Questa combinazione è chiamata Laplacian of Gaussian (LoG). Il gaussiano sopprime il rumore e il laplaciano trova i bordi reali.
Nel deep learning, le reti neurali convoluzionali imparano dai dati i propri filtri di rilevamento dei bordi — ma quei filtri appresi spesso somigliano al kernel laplaciano. Quindi, in un certo senso, la matematica che ha reso utile il laplaciano nella computer vision classica è la stessa che le reti neurali riscoprono da sole.
Laplaciano discreto vs continuo
Il laplaciano è tre idee correlate che compaiono in contesti diversi.
Capire con quale versione stai lavorando evita molta confusione quando passi tra libri di calcolo, codice numerico e paper di graph ML.
Il laplaciano continuo
Il laplaciano continuo è quello del calcolo. Per una funzione liscia f definita su uno spazio continuo, è la somma delle derivate parziali seconde:

Il laplaciano continuo
Questa versione assume che la tua funzione sia liscia e derivabile ovunque. È il fondamento teorico — ma i dati reali non sono mai continui. Non puoi calcolare derivate esatte su una griglia di pixel o su una tabella di misure.
Il laplaciano discreto
Quando passi dalle funzioni continue ai dati campionati, le derivate vengono sostituite con differenze finite — approssimazioni calcolate dai valori dei vicini.
Per una funzione 1D campionata a punti equispaziati, la derivata seconda discreta nel punto i è:

Il laplaciano discreto
Stai confrontando il valore in i con i suoi due vicini. La stessa idea si estende a griglie 2D (immagini), volumi 3D e oltre. I kernel di convoluzione della sezione di elaborazione delle immagini sono esattamente questo: approssimazioni a differenze finite del laplaciano continuo, applicate a una griglia di pixel.
Questa discretizzazione rende il laplaciano calcolabile nei metodi numerici e nelle pipeline ML. Ogni volta che applichi un filtro laplaciano in codice, stai eseguendo un'approssimazione a differenze finite, non l'operatore esatto del calcolo.
Il laplaciano dei grafi
Il laplaciano dei grafi porta la discretizzazione un passo oltre. Invece di una griglia regolare con spaziatura uniforme, hai un insieme arbitrario di nodi collegati da archi con pesi variabili.
Qui non c'è il concetto di "pixel vicino" — solo nodi e connessioni tra loro. Il laplaciano del grafo L = D - A sostituisce la struttura a differenze finite con la struttura di adiacenza. La domanda di base resta la stessa: come si confronta il valore di un nodo con i suoi vicini? Ma ora i "vicini" sono definiti dal grafo, non dalla prossimità spaziale.
Perché questo conta nella ML
La maggior parte dei dati di ML non vive su una griglia regolare. Molecole, reti sociali, knowledge graph e point cloud 3D hanno strutture irregolari. Non puoi applicare loro un laplaciano standard a differenze finite.
Il laplaciano del grafo risolve questo rendendo esplicita la struttura di vicinato tramite la matrice di adiacenza. È il motivo per cui le graph neural network e i metodi spettrali possono applicare operazioni basate sul laplaciano a dati senza un sistema di coordinate naturale.
Esempio svolto: calcolare un laplaciano
Rendiamo tutto concreto con due esempi — uno continuo e uno basato su grafo.
Esempio 1: Laplaciano continuo di f(x, y) = x² + y²
Prendi la funzione f(x, y) = x² + y². È un semplice paraboloide — una forma a scodella che si incurva verso l'alto in ogni direzione.
Per calcolare il laplaciano, ti servono le derivate parziali seconde rispetto a ciascuna variabile.
Prima, rispetto a x:

Calcolo del laplaciano continuo (1)
Poi rispetto a y:

Calcolo del laplaciano continuo (2)
E ora somma semplicemente:

Calcolo del laplaciano continuo (3)
Il laplaciano è costante e vale 4 ovunque. Ha senso, perché un paraboloide ha la stessa curvatura in ogni punto. Il valore positivo ti dice che la funzione si incurva verso l'alto in tutte le direzioni, coerente con la forma a scodella.
Esempio 2: Laplaciano del grafo per un piccolo grafo
Prendi un grafo con 4 nodi e i seguenti archi:
- Il nodo 1 è connesso ai nodi 2 e 3
- Il nodo 2 è connesso ai nodi 1 e 4
- Il nodo 3 è connesso al nodo 1
- Il nodo 4 è connesso al nodo 2
La matrice di adiacenza A codifica le connessioni:

Calcolo del laplaciano del grafo (1)
La matrice dei gradi D mette il numero di connessioni di ciascun nodo sulla diagonale:

Calcolo del laplaciano del grafo (2)
I nodi 1 e 2 hanno 2 connessioni ciascuno. I nodi 3 e 4 ne hanno 1 ciascuno.
Infine, sottrai per ottenere L = D - A:

Calcolo del laplaciano del grafo (3)
Come leggere questa matrice: La riga 1 dice: il nodo 1 ha grado 2, ed è connesso ai nodi 2 e 3 (le voci -1). La riga 3 dice: il nodo 3 ha grado 1, connesso solo al nodo 1. Gli zeri ti dicono quali coppie di nodi non condividono archi.
Puoi anche calcolarla in Python per verificare:
import numpy as np
A = np.array([
[0, 1, 1, 0],
[1, 0, 0, 1],
[1, 0, 0, 0],
[0, 1, 0, 0]
])
D = np.diag(A.sum(axis=1))
L = D - A
print(L)

Calcolo del laplaciano del grafo in Python
Fraintendimenti comuni
Il laplaciano è simile ad altri concetti e le differenze non sono sempre ovvie dai nomi. In questa sezione, proverò a eliminare tutti i punti di confusione.
Laplaciano vs gradiente
Il gradiente ∇f è un vettore. Punta nella direzione di massima crescita e la sua magnitudine ti dice quanto velocemente la funzione sta salendo. Usa derivate prime.
Il laplaciano ∇²f è uno scalare. Non ti dice in che direzione muoverti — ti dice la forma della funzione in un punto. È costruito da derivate seconde.
Laplaciano vs hessiano
Questo è quello che più spesso trae in inganno.
L'hessiano H è una matrice di tutte le derivate parziali seconde. Per una funzione con n input, è una matrice n × n che cattura come cambia il gradiente lungo ogni coppia di assi. Ti dà il quadro completo della curvatura.
Il laplaciano è la traccia dell'hessiano — la somma delle sue voci diagonali. Perdi le informazioni di curvatura fuori diagonale, ma ottieni un singolo numero rapido da calcolare.
Usa l'hessiano quando ti serve la scomposizione completa della curvatura. Usa il laplaciano quando basta un riassunto scalare.
Laplaciano del grafo vs operatore differenziale
Condividono un nome e la stessa intuizione di base, ma operano su oggetti completamente diversi.
Il laplaciano differenziale agisce su funzioni lisce e continue. Richiede derivate, quindi assume che la tua funzione sia derivabile ovunque.
Il laplaciano del grafo L = D - A agisce sui grafi — strutture discrete con nodi e archi. Non ci sono derivate. Misura quanto il valore in ciascun nodo differisce da quello dei suoi vicini usando operazioni matriciali.
La connessione è concettuale, non computazionale. Entrambi misurano la deviazione locale dalla media del vicinato, ma sono del tutto diversi.
Convezioni di segno
Alcuni campi definiscono il laplaciano con un segno negativo: -∇²f. Lo vedrai in fisica e in alcuni paper di ML sulle graph neural network. Il laplaciano negativo −L è semidefinito positivo, il che ha proprietà migliori per certi problemi di ottimizzazione e rende l'analisi degli autovalori più pulita.
Quando leggi un paper e gli autovalori del laplaciano sono tutti non negativi, verifica se stanno usando L o -L. La matematica è equivalente, ma mescolare convenzioni può portarti a risultati sbagliati.
Perché il laplaciano conta nella data science
A questo punto, hai visto il laplaciano comparire nel calcolo, nella teoria dei grafi, nell'elaborazione di immagini e nell'ottimizzazione. Lo stesso operatore risolve lo stesso problema fondamentale in contesti diversi: misurare come un valore in un punto si relaziona con il suo intorno.
Ecco dove questo emerge nella data science:
-
ML basata su grafi: Il laplaciano del grafo
L = D - Aè il fondamento dei metodi spettrali. Ogni volta che i tuoi dati hanno una struttura naturale a grafo, il laplaciano ti dà una matrice che codifica l'intero schema di connettività in una forma su cui puoi fare algebra lineare -
Clustering: Il clustering spettrale usa gli autovettori di
Lper trovare gruppi che i metodi puramente basati sulla distanza mancano. Funziona bene quando i cluster non sono convessi o linearmente separabili -
Apprendimento semi-supervisionato: Molti metodi semi-supervisionati usano il laplaciano del grafo per propagare etichette dai nodi etichettati a quelli non etichettati. L'assunto è che i nodi connessi condividano probabilmente la stessa etichetta, e il laplaciano quantifica quanto dolcemente le etichette dovrebbero variare sul grafo
-
Manifold learning: Algoritmi come le Laplacian Eigenmaps usano il laplaciano del grafo per trovare rappresentazioni a bassa dimensione di dati ad alta dimensione. Gli autovettori di
Lmappano punti vicini nello spazio originale a punti vicini nello spazio ridotto -
Estrazione di feature da immagini: Il laplaciano discreto rileva bordi e regioni di rapido cambiamento di intensità. Queste feature alimentano direttamente sia pipeline di computer vision classica sia come prior nei modelli di deep learning
In sintesi, il laplaciano è uno dei pochi strumenti matematici che scala da una singola equazione di calcolo fino a grandi graph neural network.
Conclusione
Il laplaciano nasce come operatore del calcolo, un modo per misurare la curvatura nelle funzioni continue. Quando arrivi alla ML basata su grafi, è una matrice che codifica la struttura di un'intera rete. L'idea di base è esattamente la stessa, cambia solo la forma.
Iscriviti al nostro corso Linear Algebra for Data Science in R per fare pratica con molti concetti e argomenti trattati in questo articolo.
FAQ
Cos'è il laplaciano in parole semplici?
Il laplaciano è un operatore matematico che misura come il valore di una funzione in un punto si confronta con il valore medio dei suoi vicini. Se il laplaciano è positivo, il punto sta sotto il suo intorno. Se è negativo, sta sopra. È un singolo numero che riassume la curvatura locale di una funzione.
Qual è la differenza tra laplaciano e gradiente?
Il gradiente è un vettore che punta nella direzione di massima crescita: ti dice in che direzione muoverti. Il laplaciano è uno scalare che ti dice la forma della funzione in un punto, non la direzione. Entrambi si basano su derivate, ma rispondono a domande completamente diverse.
Dove si usa il laplaciano nel machine learning?
Il laplaciano compare in un'ampia gamma di task di ML: clustering spettrale, apprendimento semi-supervisionato, manifold learning e rilevamento dei bordi nelle immagini si basano tutti su di esso in qualche forma. Nei metodi basati su grafi, la matrice laplaciana codifica la struttura di una rete e alimenta algoritmi come le Laplacian Eigenmaps e le graph neural network. È uno dei pochi strumenti matematici che scala da una singola equazione a grandi sistemi di ML reali.
Cos'è il laplaciano del grafo e come si calcola?
Il laplaciano del grafo è una matrice definita come L = D - A, dove D è la matrice dei gradi e A è la matrice di adiacenza di un grafo. Ogni elemento diagonale contiene il numero di connessioni di un nodo, e ogni elemento fuori diagonale vale -1 se due nodi sono connessi e 0 se non lo sono. Gli autovalori e gli autovettori di questa matrice rivelano la struttura a cluster del grafo, che è esattamente ciò che sfruttano i metodi di clustering spettrale.
Qual è la differenza tra laplaciano del grafo normalizzato e non normalizzato?
Il laplaciano non normalizzato L = D - A funziona bene quando i nodi del tuo grafo hanno numeri di connessioni più o meno simili. Il laplaciano normalizzato corregge gli squilibri di grado riscalando il contributo di ciascun nodo — questo conta nei grafi reali come i social network, dove alcuni nodi hanno centinaia di connessioni e altri solo una o due. Senza normalizzazione, i nodi ad alto grado dominano gli autovettori e i risultati del clustering peggiorano, quindi la versione normalizzata è la scelta predefinita più sicura nella maggior parte delle applicazioni pratiche.


