Ir al contenido principal

El laplaciano explicado: del cálculo a ML

El operador laplaciano es una de las herramientas matemáticas más utilizadas en el machine learning moderno. Está detrás del clustering espectral, el aprendizaje de variedades, la detección de bordes en imágenes y los algoritmos basados en grafos.
Actualizado 4 may 2026  · 15 min leer

El laplaciano aparece en algoritmos basados en grafos, en flujos de procesamiento de imágenes y en clustering espectral. Así que, si construyes modelos que trabajan con grafos, imágenes o datos de alta dimensión, el laplaciano no es matemáticas de fondo opcionales. Es lo que realmente hace el trabajo bajo el capó.

En este artículo, veremos el laplaciano desde cero: las matemáticas que hay detrás, la intuición geométrica, el laplaciano de grafos y su forma matricial, y cómo se usa en aplicaciones reales de machine learning.

¿Necesitas una introducción práctica a las ecuaciones diferenciales? Lee nuestro artículo reciente para pasar de los fundamentos a aplicaciones prácticas en machine learning.

¿Qué es el laplaciano?

El laplaciano es un operador diferencial de segundo orden. Te indica cómo se curva una función en un punto dado.

A veces se describe como la divergencia del gradiente.

Y ahí está la clave para entender qué hace realmente el operador:

  • El gradiente te dice en qué dirección aumenta más rápido una función
  • La divergencia mide si ese flujo se expande o se concentra.

Combinados, el laplaciano te dice si un punto es un pico local, un valle local o una zona plana intermedia.

En pocas palabras, el laplaciano mide cuánto difiere el valor de una función en un punto respecto a la media de sus vecinos. Si el laplaciano es cero, la función está "equilibrada" localmente. Positivo significa que el punto está por debajo de su entorno. Negativo, que está por encima.

La fórmula

En 2D, para una función f(x, y):

2D Laplacian formula

Fórmula del laplaciano en 2D

En 3D, para una función f(x, y, z):

3D Laplacian formula

Fórmula del laplaciano en 3D

El patrón se mantiene en cualquier número de dimensiones: sumas las segundas derivadas parciales a lo largo de cada eje. Esto hace que el laplaciano encaje muy bien con datos de alta dimensión, que es justo por lo que aparece tan a menudo en machine learning.

Fórmula del laplaciano en cálculo multivariable

La fórmula del laplaciano es más corta de lo que esperarías para algo que aparece en tantas áreas del machine learning.

En 3D, para una función f(x, y, z), se ve así:

3D Laplacian formula

Fórmula del laplaciano en 3D

Eso es todo. Estás sumando las segundas derivadas parciales a lo largo de cada dimensión.

Cada término plantea la misma pregunta en su eje: ¿la función se curva hacia arriba, hacia abajo o está plana? Al sumar esas respuestas, obtienes un único número que describe la curvatura global en ese punto.

De 3D a n dimensiones

La fórmula se generaliza a n dimensiones. Esta es la fórmula genérica para una función con n dimensiones de entrada:

Laplacian formula generalization

Generalización de la fórmula del laplaciano

Por eso el laplaciano funciona bien en machine learning, donde tus datos a menudo viven en cientos o miles de dimensiones. El operador simplemente suma la curvatura a lo largo de cada dimensión.

Conexión con la optimización

Si has trabajado con descenso por gradiente, ya piensas en derivadas primeras: ¿en qué dirección está cuesta abajo? El laplaciano te lleva un paso más allá.

Las segundas derivadas te hablan de la forma de esa colina.

Un laplaciano grande y positivo en un punto significa que la función se curva con fuerza hacia arriba en todas las direcciones: estás cerca de un mínimo. Un valor grande y negativo indica que estás cerca de un máximo. Cerca de cero significa que la superficie es localmente plana.

Esta información de curvatura importa en métodos de optimización de segundo orden, que la usan para dar pasos más inteligentes que el descenso por gradiente puro. El laplaciano es una forma de resumir esa curvatura en un único valor escalar.

Intuición geométrica: qué mide el laplaciano

El signo del laplaciano en un punto te dice la forma de la función a su alrededor.

  • Si ∇²f > 0 en un punto, la función se curva hacia arriba en todas las direcciones. El punto está más bajo que su entorno. Eso es convexidad.

  • Si ∇²f < 0, la función se curva hacia abajo. El punto está más alto que su entorno. Eso es concavidad.

  • Si ∇²f = 0, la función es localmente plana. No hay curvatura neta en ninguna dirección.

Es la versión multivariable de la prueba de la segunda derivada que ya conoces. En 1D, una segunda derivada positiva implica un mínimo local y una negativa, un máximo local. El laplaciano extiende esa misma idea a cualquier número de dimensiones sumando la curvatura en todos los ejes.

Relación con el hessiano

La matriz hessiana captura la imagen de curvatura completa. Es una matriz de todas las segundas derivadas parciales, y cada entrada describe cómo se curva la función a lo largo de un par de ejes.

El laplaciano es la traza del hessiano: la suma de sus entradas diagonales. Mientras que el hessiano te da el desglose completo de la curvatura, el laplaciano lo reduce a un único número.

Ese equilibrio es importante en machine learning. El hessiano completo es costoso de calcular en modelos de alta dimensión: un modelo con n parámetros tiene un hessiano de n × n. El laplaciano te da un resumen escalar de la curvatura barato y rápido de manejar.

Por qué esto importa para machine learning

Cuando entrenas un modelo, navegas por una superficie de pérdida. Las zonas planas implican aprendizaje lento. Las áreas convexas pueden hacer que el optimizador se pase de largo. El laplaciano te da una lectura rápida de en cuál de estas situaciones estás.

Los métodos basados en grafos usan el laplaciano para medir cuán suavemente cambian los valores a través de los nodos de un grafo. Es una extensión directa de la misma intuición de curvatura de funciones continuas a estructuras discretas.

Laplaciano y optimización en machine learning

El descenso por gradiente solo usa derivadas primeras.

El gradiente te dice en qué dirección dar el paso. No te dice cuán grande debe ser ese paso. Un gradiente pronunciado en un valle amplio y plano pide un paso grande. El mismo gradiente pronunciado cerca de un acantilado afilado pide uno pequeño. Las derivadas primeras por sí solas no distinguen entre ambos casos.

Ahí entran las segundas derivadas.

Curvatura y tamaño de paso

La curvatura describe lo rápido que cambia el propio gradiente. Alta curvatura significa que la superficie de pérdida se dobla bruscamente: pequeños pasos en el espacio de parámetros producen cambios grandes en el gradiente. Baja curvatura significa que la superficie es plana y el gradiente cambia lentamente.

Si ignoras la curvatura y usas una tasa de aprendizaje fija, estás adivinando. Demasiado grande y te pasas en regiones de alta curvatura. Demasiado pequeña y avanzas a rastras por las planas.

Los métodos de optimización de segundo orden como el método de Newton usan la curvatura para ajustar automáticamente los tamaños de paso. Dividen el gradiente por la curvatura, dando pasos más grandes donde la superficie es plana y más pequeños donde es afilada.

Dónde encaja el laplaciano

El laplaciano es la traza del hessiano: un único escalar que resume la curvatura total en un punto. No capta la imagen completa como el hessiano, pero es barato de calcular y útil como señal.

Aquí tienes una explicación en lenguaje llano de lo que debes recordar:

  • Un laplaciano grande y positivo de la pérdida en un punto significa que estás cerca de un mínimo local: la pérdida se curva hacia arriba en todas las direcciones
  • Un valor negativo indica que estás cerca de un máximo
  • Cerca de cero indica una región plana o de silla, que es justo donde el descenso por gradiente tiende a atascarse

Estabilidad y regularización

La curvatura también se relaciona con la estabilidad del entrenamiento. Los mínimos afilados —regiones con alta curvatura— suelen generalizar peor que los planos. Un modelo que converge a un mínimo afilado es sensible a pequeños cambios en la entrada.

Algunas técnicas de regularización penalizan directamente la curvatura para empujar la optimización hacia regiones más planas de la superficie de pérdida. El laplaciano aparece también aquí, como forma de medir y limitar lo bruscamente que cambian las predicciones del modelo en el espacio de entrada.

Entender la curvatura te ayuda a comprender por qué tu optimizador se atasca, por qué la tasa de aprendizaje importa tanto y por qué algunos mínimos generalizan mejor que otros.

El laplaciano de grafo y la matriz laplaciana

Hasta ahora, el laplaciano vivía en el mundo de las funciones continuas. Pero ¿qué pasa cuando tus datos no son una superficie suave, sino un grafo?

Ahí entra el laplaciano de grafo. Toma la misma idea central —medir cómo difiere el valor en un punto respecto a sus vecinos— y la aplica a nodos y aristas.

La fórmula

El laplaciano de grafo L se define como:

Graph Laplacian formula (simplified)

Fórmula del laplaciano de grafo (simplificada)

Dos matrices. Eso es todo. Veamos qué significa cada una.

La matriz de adyacencia

La matriz de adyacencia A codifica qué nodos están conectados. Para un grafo con n nodos, A es una matriz n × n donde A_ij = 1 si hay una arista entre el nodo i y el nodo j, y 0 en caso contrario.

Para un grafo simple no dirigido con 3 nodos donde el nodo 1 se conecta con los nodos 2 y 3, pero 2 y 3 no se conectan entre sí:

The adjacency matrix

La matriz de adyacencia

La matriz de grados

La matriz de grados D es una matriz diagonal. Cada entrada diagonal D_ii es el grado del nodo i: el número de aristas conectadas a él. Todas las entradas fuera de la diagonal son cero.

Esta es la fórmula para el mismo grafo:

The degree matrix

La matriz de grados

El nodo 1 tiene grado 2 (conectado a dos nodos). Los nodos 2 y 3 tienen grado 1 cada uno.

Juntándolo todo

Resta A de D y obtienes L:

Subtracting adjacency matrix from the degree matrix

Restando la matriz de adyacencia de la matriz de grados

Cada entrada diagonal te dice cuántas conexiones tiene un nodo. Cada entrada fuera de la diagonal L_ij es -1 si los nodos i y j están conectados, y 0 si no lo están.

Si multiplicas L por un vector de valores asignados a cada nodo, el resultado mide cuánto difiere el valor de cada nodo del de sus vecinos. Es la versión discreta de la misma intuición de curvatura de antes, solo que aplicada a un grafo en lugar de a una superficie continua.

Qué te dicen los autovalores de un grafo

El verdadero poder de L viene de sus autovalores y autovectores:

  • El autovalor más pequeño de L es siempre 0. El autovector correspondiente es constante: cada nodo recibe el mismo valor. Tiene sentido: una función constante no tiene "variación" en el grafo.

  • El número de autovalores cero es igual al número de componentes conexas del grafo. Si tu grafo tiene tres clústeres desconectados, L tiene tres autovalores cero. Es una forma directa de leer la conectividad del grafo a partir de una matriz.

  • Los autovalores pequeños no nulos corresponden a autovectores que cambian lentamente a través del grafo: los nodos cercanos reciben valores similares. Los autovalores grandes corresponden a autovectores que oscilan rápidamente entre nodos conectados.

Dato curioso: Este espectro de autovalores es lo que da nombre a los métodos espectrales.

Clustering espectral y detección de comunidades

El clustering espectral usa los autovectores de L para encontrar clústeres en datos con estructura de grafo. La idea es que los autovectores asociados a autovalores pequeños asignan valores similares a nodos densamente conectados y diferentes a los débilmente conectados.

Para encontrar k clústeres, tomas los k autovectores correspondientes a los k autovalores no nulos más pequeños de L, los apilas en una matriz y ejecutas k-means sobre las filas. Cada fila es un nodo, y su posición en este espacio de baja dimensión refleja su vecindario en el grafo.

Esto funciona para detectar comunidades en redes sociales, clustering de documentos, segmentación de imágenes y en cualquier otro lugar donde tus datos tengan una estructura natural de grafo. Dos nodos fuertemente conectados acaban cerca en el espacio de autovectores. Dos nodos de comunidades distintas acaban lejos.

El laplaciano de grafo convierte un problema combinatorio difícil —encontrar los clústeres de un grafo— en un problema de álgebra lineal fácil de resolver.

El laplaciano en el clustering espectral

El clustering espectral es donde el laplaciano de grafo pasa de ser matemáticas interesantes a una herramienta práctica de ML.

La idea central es que, en lugar de agrupar los puntos de datos en bruto directamente, los agrupas en un espacio definido por los autovectores de L. Ese espacio captura la estructura del grafo, de modo que puedes ver qué nodos están fuertemente conectados, cuáles débilmente y cuáles pertenecen a comunidades separadas.

Cómo los autovectores definen clústeres

Toma los k autovectores correspondientes a los k autovalores no nulos más pequeños de L. Apílalos como columnas en una matriz. Cada fila de esa matriz es un nodo, ahora representado como un punto en un espacio de dimensión k.

Los autovectores asociados a autovalores pequeños cambian lentamente a través del grafo. Los nodos densamente conectados acaban con valores similares en estos autovectores —y valores similares implican filas similares— y filas similares hacen que caigan cerca entre sí en el nuevo espacio.

Laplaciano no normalizado frente a normalizado

Hay dos versiones del laplaciano de grafo que verás en la práctica.

El laplaciano no normalizado es el directo L = D - A. Funciona bien cuando los nodos tienen grados más o menos similares —es decir, cuando la mayoría de nodos tienen un número parecido de conexiones

El laplaciano normalizado ajusta los desequilibrios de grado. Hay varias variantes, pero la más común es:

Normalized Laplacian formula

Fórmula del laplaciano normalizado

Esto reescala la contribución de cada nodo por su grado. En grafos reales —redes sociales, la web, redes de citación— algunos nodos tienen cientos de conexiones y otros solo una o dos. Sin normalización, los nodos de alto grado dominan los autovectores y el clustering se resiente.

Usa el laplaciano normalizado por defecto salvo que sepas que tu grafo tiene una distribución de grados uniforme.

Aplicaciones prácticas

El clustering espectral con el laplaciano de grafo aparece en un amplio abanico de tareas de machine learning. Algunas son:

  • Segmentación de imágenes: los píxeles son nodos, los pesos de las aristas codifican similitud y los clústeres se corresponden con regiones de la imagen
  • Clustering de documentos: los documentos son nodos, las aristas codifican términos compartidos o citas
  • Análisis de redes sociales: los usuarios son nodos, las aristas codifican conexiones y los clústeres revelan comunidades
  • Sistemas de recomendación: los ítems o usuarios forman un grafo y los métodos espectrales encuentran grupos con comportamientos similares

Siempre que tus datos tengan una estructura natural de grafo, o puedas construirla a partir de similitudes por pares, el clustering espectral te da una forma rigurosa de encontrar grupos que los métodos basados solo en distancias no detectan.

El laplaciano en procesamiento de imagen y visión por computador

El laplaciano es una de las herramientas más antiguas en visión por computador, y sigue muy vigente hoy.

En procesamiento de imágenes, la intensidad del píxel es la función. El laplaciano mide cómo difiere la intensidad de un píxel respecto a la de sus vecinos. Donde la intensidad cambia lentamente, el laplaciano está cerca de cero. Donde cambia bruscamente —en un borde— el laplaciano produce una respuesta fuerte.

Esa es la base de la detección de bordes con laplaciano.

Por qué las segundas derivadas encuentran bordes

Una derivada primera encuentra dónde cambia la intensidad. Una segunda derivada encuentra dónde cambia ese cambio —es decir, dónde la tasa de cambio alcanza un pico y luego cae.

En un borde, la intensidad sube y luego se estabiliza. La derivada primera se dispara en la rampa. La segunda derivada —el laplaciano— cruza cero justo en el pico de ese impulso. Estos cruces por cero marcan la ubicación exacta del borde, lo que hace que el laplaciano sea más preciso para localizar bordes que métodos de primera derivada como el filtro de Sobel.

El kernel laplaciano discreto

En la práctica, las imágenes son rejillas de píxeles, no funciones continuas. El laplaciano continuo se aproxima usando un kernel de convolución: una matriz pequeña que deslizas por la imagen.

El kernel laplaciano discreto estándar de 3×3 es este:

Kernel laplaciano discreto 3x3

El peso central es -4 y los cuatro vecinos directos valen +1. Cuando aplicas este kernel a un píxel, estás calculando la diferencia entre la intensidad de ese píxel y la media de sus cuatro vecinos: la versión discreta de la misma pregunta de antes: "cómo se compara este punto con su entorno".

Aspectos prácticos

El filtrado laplaciano en bruto es sensible al ruido. Un solo píxel ruidoso produce un pico de intensidad pronunciado y el laplaciano lo marcará como borde.

La solución estándar es suavizar primero la imagen con un desenfoque gaussiano y luego aplicar el laplaciano. Esta combinación se llama Laplacian of Gaussian (LoG). El gaussiano suprime el ruido y el laplaciano encuentra los bordes reales.

En deep learning, las redes neuronales convolucionales aprenden sus propios filtros de detección de bordes a partir de datos, pero esos filtros aprendidos suelen parecerse al kernel laplaciano. Así que, en cierto modo, las matemáticas que hicieron útil al laplaciano en la visión por computador clásica son las mismas que las redes neuronales redescubren por sí solas.

Laplaciano discreto vs. continuo

El laplaciano son tres ideas relacionadas que aparecen en contextos distintos.

Entender con qué versión estás trabajando te ahorra mucha confusión cuando pasas entre libros de cálculo, código numérico y artículos de ML en grafos.

El laplaciano continuo

El laplaciano continuo es el del cálculo. Para una función suave f definida sobre un espacio continuo, es la suma de las segundas derivadas parciales:

El laplaciano continuo

Esta versión asume que tu función es suave y derivable en todas partes. Es la base teórica, pero los datos reales nunca son continuos. No puedes calcular derivadas exactas en una rejilla de píxeles o en una tabla de mediciones.

El laplaciano discreto

Cuando pasas de funciones continuas a datos muestreados, las derivadas se sustituyen por diferencias finitas: aproximaciones calculadas a partir de los valores vecinos.

Para una función 1D muestreada en puntos equiespaciados, la segunda derivada discreta en el punto i es:

The discrete Laplacian

El laplaciano discreto

Estás comparando el valor en i con sus dos vecinos. La misma idea se extiende a rejillas 2D (imágenes), volúmenes 3D y más. Los kernels de convolución de la sección de procesamiento de imágenes son exactamente esto: aproximaciones por diferencias finitas del laplaciano continuo, aplicadas a una rejilla de píxeles.

Esta discretización hace que el laplaciano sea computable en métodos numéricos y en pipelines de ML. Cada vez que aplicas un filtro laplaciano en código, estás ejecutando una aproximación por diferencias finitas, no el operador exacto del cálculo.

El laplaciano de grafo

El laplaciano de grafo lleva la discretización un paso más allá. En lugar de una rejilla regular con espaciado uniforme, tienes un conjunto arbitrario de nodos conectados por aristas con pesos variables.

Aquí no hay noción de "píxel vecino": solo nodos y las conexiones entre ellos. El laplaciano de grafo L = D - A sustituye la estructura de diferencias finitas por la estructura de adyacencia. La pregunta central sigue siendo: ¿cómo se compara el valor de un nodo con el de sus vecinos? Pero ahora "vecinos" lo define el grafo, no la proximidad espacial.

Por qué esto importa en ML

La mayoría de los datos de ML no viven en una rejilla regular. Moléculas, redes sociales, grafos de conocimiento y nubes de puntos 3D tienen estructuras irregulares. No puedes aplicarles un laplaciano estándar de diferencias finitas.

El laplaciano de grafo resuelve esto haciendo explícita la estructura de vecindad a través de la matriz de adyacencia. Es la razón por la que las redes neuronales en grafos y los métodos espectrales pueden aplicar operaciones basadas en el laplaciano a datos sin un sistema de coordenadas natural.

Ejemplo resuelto: cálculo de un laplaciano

Hagámoslo concreto con dos ejemplos: uno continuo y otro basado en grafos.

Ejemplo 1: laplaciano continuo de f(x, y) = x² + y²

Toma la función f(x, y) = x² + y². Es un paraboloide sencillo: una forma de cuenco que se curva hacia arriba en todas las direcciones.

Para calcular el laplaciano, necesitas la segunda derivada parcial respecto a cada variable.

Primero, respecto a x:

Continuous Laplacian computation (1)

Cálculo del laplaciano continuo (1)

Luego respecto a y:

Continuous Laplacian computation (2)

Cálculo del laplaciano continuo (2)

Y ahora solo hay que sumarlas:

Continuous Laplacian computation (3)

Cálculo del laplaciano continuo (3)

El laplaciano es una constante 4 en todas partes. Tiene sentido, porque un paraboloide tiene la misma curvatura en cada punto. El valor positivo indica que la función se curva hacia arriba en todas las direcciones, coherente con la forma de cuenco.

Ejemplo 2: laplaciano de grafo para un grafo pequeño

Toma un grafo con 4 nodos y las siguientes aristas:

  • El nodo 1 se conecta con los nodos 2 y 3
  • El nodo 2 se conecta con los nodos 1 y 4
  • El nodo 3 se conecta con el nodo 1
  • El nodo 4 se conecta con el nodo 2

La matriz de adyacencia A codifica las conexiones:

Graph Laplacian computation (1)

Cálculo del laplaciano de grafo (1)

La matriz de grados D pone el número de conexiones de cada nodo en la diagonal:

Graph Laplacian computation (2)

Cálculo del laplaciano de grafo (2)

Los nodos 1 y 2 tienen 2 conexiones cada uno. Los nodos 3 y 4 tienen 1 cada uno.

Por último, resta para obtener L = D - A:

Graph Laplacian computation (3)

Cálculo del laplaciano de grafo (3)

Cómo leer esta matriz: la fila 1 dice: el nodo 1 tiene grado 2, y está conectado con los nodos 2 y 3 (las entradas -1). La fila 3 dice: el nodo 3 tiene grado 1, conectado solo con el nodo 1. Los ceros te indican qué pares de nodos no comparten arista.

También puedes calcularlo en Python para verificarlo:

import numpy as np

A = np.array([
    [0, 1, 1, 0],
    [1, 0, 0, 1],
    [1, 0, 0, 0],
    [0, 1, 0, 0]
])

D = np.diag(A.sum(axis=1))
L = D - A

print(L)

Cálculo del laplaciano de grafo en Python

Confusiones habituales

El laplaciano se parece a otros conceptos y las diferencias no siempre son obvias por el nombre. En esta sección, intentaré despejar todos los puntos de confusión.

Laplaciano vs. gradiente

El gradiente ∇f es un vector. Apunta en la dirección de máximo incremento y su magnitud indica a qué velocidad crece la función. Usa derivadas primeras.

El laplaciano ∇²f es un escalar. No te dice en qué dirección moverte; te cuenta la forma de la función en un punto. Se construye con derivadas segundas.

Laplaciano vs. hessiano

Este es el que más suele liar.

El hessiano H es una matriz de todas las segundas derivadas parciales. Para una función con n entradas, es una matriz n × n que captura cómo cambia el gradiente a lo largo de cada par de ejes. Te da la imagen completa de la curvatura.

El laplaciano es la traza del hessiano: la suma de sus entradas diagonales. Pierdes la información de curvatura fuera de la diagonal, pero obtienes un único número rápido de calcular.

Usa el hessiano cuando necesites el desglose completo de la curvatura. Usa el laplaciano cuando baste un resumen escalar.

Laplaciano de grafo vs. operador diferencial

Comparten nombre e intuición central, pero operan sobre objetos completamente distintos.

El laplaciano diferencial actúa sobre funciones suaves y continuas. Requiere derivadas, lo que implica que asume que tu función es derivable en todas partes.

El laplaciano de grafo L = D - A actúa sobre grafos: estructuras discretas con nodos y aristas. No hay derivadas. Mide cómo difiere el valor en cada nodo del de sus vecinos mediante operaciones matriciales.

La conexión es conceptual, no computacional. Ambos miden la desviación local respecto a la media del vecindario, pero son totalmente distintos.

Convenciones de signo

Algunos campos definen el laplaciano con un signo negativo: -∇²f. Lo verás en física y en algunos artículos de ML sobre redes neuronales en grafos. El laplaciano negativo −L es semidefinido positivo, lo que tiene propiedades más agradables para ciertos problemas de optimización y simplifica el análisis espectral.

Cuando leas un artículo y los autovalores del laplaciano sean todos no negativos, comprueba si usan L o -L. Las matemáticas son equivalentes, pero mezclar convenciones puede llevarte a conclusiones erróneas.

Por qué el laplaciano importa en data science

A estas alturas, has visto el laplaciano en cálculo, teoría de grafos, procesamiento de imágenes y optimización. El mismo operador resuelve el mismo problema fundamental en distintos contextos: medir cómo se relaciona el valor en un punto con su entorno.

Aquí es donde aparece en data science:

  • ML basado en grafos: el laplaciano de grafo L = D - A es la base de los métodos espectrales. Siempre que tus datos tengan una estructura natural de grafo, el laplaciano te da una matriz que codifica todo el patrón de conectividad en una forma sobre la que puedes hacer álgebra lineal

  • Clustering: el clustering espectral usa los autovectores de L para encontrar grupos que los métodos puramente basados en distancias pasan por alto. Funciona bien cuando los clústeres no son convexos ni linealmente separables

  • Aprendizaje semisupervisado: muchos métodos semisupervisados usan el laplaciano de grafo para propagar etiquetas de nodos etiquetados a no etiquetados. La suposición es que los nodos conectados probablemente compartan etiqueta, y el laplaciano cuantifica cuán suavemente deben variar las etiquetas a través del grafo

  • Aprendizaje de variedades (manifold learning): algoritmos como Laplacian Eigenmaps usan el laplaciano de grafo para encontrar representaciones de baja dimensión de datos de alta dimensión. Los autovectores de L mapean puntos cercanos en el espacio original a puntos cercanos en el espacio reducido

  • Extracción de características en imágenes: el laplaciano discreto detecta bordes y regiones de cambio rápido de intensidad. Esas características alimentan tanto pipelines clásicos de visión por computador como priors en arquitecturas de deep learning

En resumen, el laplaciano es una de las pocas herramientas matemáticas que escala desde una simple ecuación de cálculo hasta grandes redes neuronales en grafos.

Conclusión

El laplaciano empieza como un operador del cálculo, una forma de medir la curvatura en funciones continuas. Cuando llegas al ML basado en grafos, es una matriz que codifica la estructura de toda una red. La idea central es exactamente la misma; solo cambia la forma.

Inscríbete en nuestro curso Linear Algebra for Data Science in R para poner en práctica muchos de los conceptos y temas tratados en este artículo.


Dario Radečić's photo
Author
Dario Radečić
LinkedIn
Científico de Datos Senior con base en Croacia. Top Tech Writer con más de 700 artículos publicados, generando más de 10M de visitas. Autor del libro Automatización del aprendizaje automático con TPOT.

FAQs

¿Qué es el laplaciano en términos sencillos?

El laplaciano es un operador matemático que mide cómo se compara el valor de una función en un punto con el valor medio de sus vecinos. Si el laplaciano es positivo, el punto está por debajo de su entorno. Si es negativo, está por encima. Es un único número que resume la curvatura local de una función.

¿Cuál es la diferencia entre el laplaciano y el gradiente?

El gradiente es un vector que apunta en la dirección de mayor incremento: te dice hacia dónde moverte. El laplaciano es un escalar que te habla de la forma de la función en un punto, no de su dirección. Ambos se construyen con derivadas, pero responden a preguntas completamente diferentes.

¿Dónde se usa el laplaciano en machine learning?

El laplaciano aparece en una amplia gama de tareas de ML: el clustering espectral, el aprendizaje semisupervisado, el aprendizaje de variedades y la detección de bordes en imágenes dependen de él de una forma u otra. En métodos basados en grafos, la matriz laplaciana codifica la estructura de una red y alimenta algoritmos como Laplacian Eigenmaps y las redes neuronales en grafos. Es una de las pocas herramientas matemáticas que escala desde una ecuación hasta grandes sistemas de ML del mundo real.

¿Qué es el laplaciano de grafo y cómo se calcula?

El laplaciano de grafo es una matriz definida como L = D - A, donde D es la matriz de grados y A es la matriz de adyacencia de un grafo. Cada entrada diagonal contiene el número de conexiones de un nodo, y cada entrada fuera de la diagonal es -1 si dos nodos están conectados y 0 si no lo están. Los autovalores y autovectores de esta matriz revelan la estructura de clústeres del grafo, que es justo lo que explotan los métodos de clustering espectral.

¿Cuál es la diferencia entre el laplaciano de grafo normalizado y el no normalizado?

El laplaciano no normalizado L = D - A funciona bien cuando los nodos de tu grafo tienen números de conexiones más o menos similares. El laplaciano normalizado corrige los desequilibrios de grado reescalando la contribución de cada nodo: esto importa en grafos reales como redes sociales, donde algunos nodos tienen cientos de conexiones y otros solo una o dos. Sin normalización, los nodos de alto grado dominan los autovectores y el clustering se resiente, por lo que la versión normalizada es la opción más segura por defecto en la mayoría de aplicaciones prácticas.

Temas

Aprende con DataCamp

Curso

Álgebra lineal para data science en R

4 h
20.7K
Este curso es una introducción al álgebra lineal, uno de los temas matemáticos más importantes que sustentan la ciencia de datos.
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado

blog

Clasificación en machine learning: Introducción

Aprende sobre la clasificación en machine learning viendo qué es, cómo se utiliza y algunos ejemplos de algoritmos de clasificación.
Zoumana Keita 's photo

Zoumana Keita

14 min

blog

La maldición de la dimensionalidad en el aprendizaje automático: Retos, repercusiones y soluciones

Explore la maldición de la dimensionalidad en el análisis de datos y el aprendizaje automático, incluidos sus retos, efectos en los algoritmos y técnicas como PCA, LDA y t-SNE para combatirla.
Abid Ali Awan's photo

Abid Ali Awan

7 min

MachineLearningLifecycle

blog

Explicación del ciclo de vida del machine learning

Conoce los pasos de un proyecto estándar de machine learning mientras exploramos los entresijos del ciclo de vida del machine learning utilizando CRISP-ML(Q).
Abid Ali Awan's photo

Abid Ali Awan

10 min

Tutorial

Una introducción a los valores SHAP y a la interpretabilidad del machine learning

Los modelos de machine learning son potentes, pero difíciles de interpretar. Sin embargo, los valores SHAP pueden ayudarte a comprender cómo influyen las características del modelo en las predicciones.
Abid Ali Awan's photo

Abid Ali Awan

Tutorial

Tutorial sobre máquinas de vectores de soporte con Scikit-learn

En este tutorial, aprenderás sobre las máquinas de vectores de soporte, uno de los algoritmos de machine learning supervisado más populares y utilizados.
Avinash Navlani's photo

Avinash Navlani

Tutorial

Tutorial de K-Means Clustering en R

Aprenda qué es k-means y descubra por qué es uno de los algoritmos de agrupación más utilizados en la ciencia de datos.
Eugenia Anello's photo

Eugenia Anello

Ver másVer más