curso
Comprender las puntuaciones de propensión: Guía para reducir los sesgos en los estudios observacionales
Llevar a cabo una investigación exhaustiva es complejo y requiere una planificación cuidadosa, que incluya cómo se asignan los participantes a los grupos de tratamiento que incluyen el tratamiento (o, en otras palabras, la intervención) frente a los grupos de control en los que no lo incluyen.
Uno de estos enfoques consiste en asignar aleatoriamente a los participantes a uno u otro grupo para minimizar el sesgo. Esta asignación aleatoria ayuda a atribuir las diferencias en los resultados al tratamiento, en lugar de a otras variables. Sin embargo, las asignaciones aleatorias no siempre son posibles debido a limitaciones éticas, prácticas o logísticas. En tales casos, los investigadores recurren a alternativas, como los estudios observacionales, ya que se basan en la simple observación de lo que ocurre de forma natural en el mundo real. Aunque valiosos, estos diseños de investigación pueden dar lugar a sesgos de selección, lo que influye en los resultados del estudio.
Para abordar el problema del sesgo de selección, los investigadores suelen utilizar puntuaciones de propensión, y ése es el tema central de este post. Cuando termines, espero que también sigas nuestro curso Inferencia causal con R - Regresión, que es un gran recurso con mucha práctica aplicada. Realizar los ejercicios te convertirá en un analista de datos, un científico de datos o un estadístico más fuerte. Ahora, ¡empecemos!
¿Qué es una puntuación de propensión?
Entendemos que hay situaciones en las que la asignación aleatoria no es una opción. Además, debemos abordar también el sesgo de selección. Aquí se utiliza un método llamado puntuación de propensión para equilibrar los grupos en los estudios observacionales. Una puntuación de propensión es la probabilidad de que un participante reciba un tratamiento concreto en función de sus características observadas.
Cómo funciona
Este método fue desarrollado por Rosenbaum y Rubin en los años 80 y se ha utilizado ampliamente en sanidad, ciencias sociales y economía. Funciona así:
- Los investigadores recogen datos sobre diversas características (por ejemplo, edad, educación, ingresos) que podrían influir en que un participante reciba o no el tratamiento. A continuación, se calcula una puntuación de propensión para cada participante que destaca su probabilidad de ser asignado al grupo de tratamiento en función de estas características.
- Ahora, los investigadores pueden emparejar a los participantes con puntuaciones de propensión similares entre los grupos de tratamiento y control o aplicar métodos de ponderación. Este proceso crea grupos más comparables en cuanto a sus características de base.
- Estos grupos equilibrados facilitan a los investigadores una evaluación más precisa del impacto del tratamiento, controlando al mismo tiempo los factores de confusión que, de otro modo, podrían sesgar los resultados.
¿Qué es la confusión?
Antes de seguir adelante, entendamos qué significa confusión. La confusión se produce cuando una variable externa, conocida como variable de confusión o factor de confusión, influye tanto en la variable independiente (tratamiento) como en la variable dependiente (resultado), lo que puede llevar a conclusiones incorrectas sobre la relación entre ambas.
Por ejemplo, el ejercicio físico es un factor de confusión para un estudio que examine si beber café (variable independiente) está asociado a una mayor productividad (variable dependiente). Esto se debe a que las personas que hacen más ejercicio también pueden beber más café y tener una mayor productividad, lo que hace difícil saber si el café por sí solo influye en la productividad o si el ejercicio es en parte responsable.
En este caso, el ejercicio, el factor de confusión, podría inducir a error a los investigadores al sugerir falsamente una relación más fuerte de la que podría existir entre el café y la productividad.
Métodos clave para utilizar las puntuaciones de propensión
Los cuatro métodos principales para aplicar puntuaciones de propensión en estudios observacionales son el emparejamiento, la estratificación, la ponderación de probabilidad inversa y el ajuste de covariables. Hablemos de cada uno de ellos en detalle.
Emparejamiento por puntuación de propensión
El emparejamiento de puntuaciones de propensión empareja a los participantes del grupo de tratamiento con participantes del grupo de control que tienen puntuaciones de propensión similares. Este proceso de emparejamiento tiene en cuenta que los grupos sean lo más parecidos posible, reduciendo así la posibilidad de sesgo. En otras palabras, los individuos con probabilidades comparables de recibir el tratamiento se emparejan para crear una muestra equilibrada.
El emparejamiento es ideal cuando el objetivo es crear grupos directamente comparables y reducir al máximo las diferencias de características. Es preferible tener un tamaño de muestra de moderado a grande, ya que facilita encontrar buenas coincidencias.
En un estudio que evalúe el impacto del trabajo a distancia en la productividad de los empleados, los investigadores podrían emparejar a los empleados que trabajan a distancia (tratamiento) con empleados similares que trabajan in situ (control) basándose en variables como la función laboral, los años de experiencia y las métricas de rendimiento anteriores. Esto permitiría a los investigadores comparar los resultados de productividad reduciendo al mismo tiempo el impacto de las diferencias de fondo.
Estratificación
La estratificación es el proceso de dividir a los participantes en grupos distintos, también llamados estratos, basándose en sus puntuaciones de propensión. A menudo, estos grupos se dividen en quintiles, es decir, en cinco partes iguales. Cada estrato contiene participantes con puntuaciones de propensión similares, y los resultados dentro de cada estrato se comparan entre los grupos de tratamiento y de control.
Este método es eficaz cuando el tamaño de la muestra es lo suficientemente grande como para crear varios estratos significativos, ya que un menor número de participantes por estrato podría no dar lugar a comparaciones eficaces.
Para evaluar la eficacia de un nuevo medicamento en el marco de un estudio sanitario, se puede estratificar a los pacientes en quintiles basándose en puntuaciones de propensión calculadas a partir de los datos demográficos y las condiciones de salud basales. Cada estrato puede incluir pacientes con características similares, lo que conduce a comparaciones más precisas del efecto del tratamiento dentro de cada grupo.
Ponderación de la probabilidad inversa de tratamiento (IPTW)
IPW asigna ponderaciones basadas en puntuaciones de propensión para dar más "importancia" a determinadas observaciones al estimar los efectos del tratamiento. A los participantes con menor probabilidad de estar en sus respectivos grupos se les da más peso para equilibrar las diferencias en las características de los grupos.
Teniendo en cuenta que aprovecha proporcionalmente los datos de ambos grupos, el IPW es preferible cuando los investigadores necesitan generalizar los resultados a toda la población de la muestra.
En un estudio de salud pública que evalúe una intervención comunitaria, el IPW podría aplicarse para tener en cuenta las diferencias demográficas y socioeconómicas entre las comunidades que recibieron la intervención y las que no. Esto permite obtener conclusiones generalizables sin crear pares emparejados. Aquí tienes los pasos:
1. Calcula la puntuación de propensión
- En primer lugar, estima la puntuación de propensión para cada individuo del estudio, que representa su probabilidad de estar en el grupo de tratamiento en función de las características basales.
- Según un modelo de regresión logística, la puntuación de propensión de un participante que recibe el tratamiento es 0,8, es decir, el 80%.
2. Calcular pesos
A continuación, calculamos las ponderaciones basándonos en la inversa de la puntuación de propensión, como se muestra a continuación:
- Para los individuos del grupo de tratamiento (que reciben la intervención), el peso es:
- Para los individuos del grupo de control (que no reciben la intervención), la ponderación es :
En nuestro ejemplo, para el individuo con una puntuación de propensión de 0,8:
- Si están en el grupo de tratamiento, su peso será:
- Si están en el grupo de control, su peso será:
3. Aplicar pesos
Ahora, aplica estos pesos a cada individuo del estudio para crear una "pseudopoblación" en la que la influencia de cada individuo en el análisis se ajuste por su peso. Esta pseudopoblación equilibra las características basales entre los grupos de tratamiento y de control. En la pseudopoblación resultante, la probabilidad de que un individuo esté en el grupo de tratamiento o de control es independiente de sus características basales, lo que reduce los factores de confusión.
Como nota, el IPTW puede utilizarse para abordar un gran número de variables de confusión. También puede aplicarse a estudios longitudinales para tener en cuenta los factores de confusión dependientes del tiempo.
Otras consideraciones importantes al utilizar el IPTW son:
- Evaluar el equilibrio entre los grupos expuestos y no expuestos para todas las características basales antes y después de la ponderación
- Tratamiento de pesos extremos mediante estabilización o truncamiento del peso
Ajuste de covariables
En el ajuste de covariables, utilizamos las puntuaciones de propensión como variable covariable adicional en un modelo de regresión para controlar los factores de confusión. Este ajuste mejora la estimación del efecto del tratamiento al ajustar las puntuaciones de propensión dentro del modelo estadístico, teniendo así en cuenta los factores de confusión.
Por ejemplo, al estudiar el efecto de un programa de formación en el lugar de trabajo sobre el rendimiento de los empleados, los investigadores podrían utilizar puntuaciones de propensión como covariables en un modelo de regresión para ajustar factores como la edad o los años de experiencia.
Ventajas del uso de las puntuaciones de propensión
Hasta ahora, hemos hablado de diferentes diseños de investigación, incluyendo la aleatorización y los métodos de investigación por observación (cuando la aleatorización no es factible). En el caso de los estudios de observación, discutimos la importancia de las puntuaciones de propensión y sus cuatro métodos. Analicemos ahora las ventajas de utilizar puntuaciones de propensión.
Mejora el equilibrio de las covariables
Las puntuaciones de propensión proporcionan una comparación más equilibrada entre los grupos de tratamiento y control al igualar las covariables, o características de fondo, entre los grupos. Esto permite a los investigadores crear una comparación más justa con distribuciones similares de variables clave (como la edad, el estatus socioeconómico o las condiciones de salud), lo que permite estimar con precisión el efecto del tratamiento.
Al estudiar el impacto del aprendizaje en línea en los resultados de los estudiantes, el emparejamiento de puntuaciones de propensión podría equilibrar el rendimiento académico previo de los estudiantes, el acceso a Internet y los niveles de motivación entre los grupos de aprendizaje en línea y tradicional. Esto ayuda a garantizar que las diferencias en los resultados se deban más al método de aprendizaje que a las diferencias en los antecedentes de los alumnos.
Reduce el sesgo
Las puntuaciones de propensión ajustan las diferencias en las características observadas, reduciendo así el sesgo de los análisis. Esto es especialmente valioso en los estudios no aleatorizados, en los que los investigadores no pueden controlar la asignación del tratamiento.
Versatilidad
Las puntuaciones de propensión son flexibles y pueden utilizarse tanto con tratamientos binarios (p. ej., preguntas de sí/no sobre si alguien recibió el tratamiento) como con tratamientos continuos (p. ej., qué cantidad de un tratamiento recibió alguien).
Limitaciones de las puntuaciones de propensión
Aunque las puntuaciones de propensión son potentes, también es importante tener en cuenta sus limitaciones, como:
Dependencia de las covariables observadas
Las puntuaciones de propensión sólo pueden ajustar las covariables observadas, es decir, las variables que los investigadores han medido e incluido en el modelo. Pero eso no tiene en cuenta necesariamente los factores de confusión ocultos que podrían ser no observados o no medidos. Inevitablemente, sigue dejando sin abordar sesgos ocultos que aún podrían afectar al resultado.
Por ejemplo, al comparar los efectos de dos tipos de terapia en los resultados de salud mental, los investigadores pueden disponer de datos sobre la edad, el sexo y el estado de salud inicial de los pacientes. Sin embargo, si no se tienen en cuenta factores no medidos, como el apoyo social o los mecanismos individuales de afrontamiento, aún podrían influir en los resultados de la terapia.
Requiere muestras de gran tamaño
Los métodos de puntuación de la propensión funcionan mejor con grandes conjuntos de datos para garantizar que haya suficiente solapamiento entre los grupos de tratamiento y de control. Las muestras más pequeñas suelen conducir a una falta de suficientes participantes con puntuaciones de propensión similares en todos los grupos, lo que dificulta lograr buenas coincidencias o una ponderación significativa.
Mala especificación del modelo de propensión
Seleccionar la variable adecuada y la forma funcional del modelo es crucial para especificar correctamente el modelo de propensión, lo que repercute aún más en su precisión. No incluir las variables relevantes o una especificación inadecuada del modelo puede dar lugar a estimaciones sesgadas, pero lo peor es que problemas como éstos son difíciles incluso de detectar.
Técnicas avanzadas: Enfoques Doblemente Robustos y Bayesianos
Se han desarrollado técnicas avanzadas para abordar algunas de las limitaciones de los métodos tradicionales de puntuación de la propensión.
Métodos doblemente robustos
Los métodos doblemente robustos son un enfoque de dos pasos, en el que los investigadores estiman primero las puntuaciones de propensión y emparejan o ponderan a los participantes en consecuencia. A continuación, ajustan un modelo de regresión para predecir el resultado basándose en el tratamiento y otras covariables. La estimación final del efecto del tratamiento se obtiene ajustando tanto la puntuación de propensión como el modelo de regresión.
Puntuaciones de propensión bayesianas
En los métodos bayesianos, la incertidumbre se incorpora a la estimación de las puntuaciones de propensión. Esto nos permite hacer estimaciones más precisas, sobre todo en situaciones con tamaños de muestra más pequeños o mayor incertidumbre sobre los datos. Si te interesan los enfoques bayesianos, que cada vez son más comunes, cursa nuestro curso Fundamentos del análisis bayesiano de datos en R.
Errores comunes en el análisis de puntuación de propensión
Al utilizar puntuaciones de propensión, hay errores comunes que debes evitar.
Equilibrio insuficiente de covariables
Tras aplicar los métodos de puntuación de la propensión, es importante comprobar si las covariables están equilibradas entre los grupos de tratamiento y control. Sin un equilibrio suficiente, nuestros resultados podrían estar sesgados.
Especificación incorrecta del modelo
La especificación del modelo es fundamental a la hora de calcular las puntuaciones de propensión, ya que una especificación inadecuada puede dar lugar a sesgos significativos en las estimaciones del efecto del tratamiento. Los investigadores suelen cometer errores, ya sea por sobreajustar el modelo (incluyendo demasiadas covariables) o por omitir importantes factores de confusión.
Equilibrar las características de los grupos de tratamiento y de control nos ayuda a minimizar el sesgo y a proporcionar estimaciones más fiables de los efectos del tratamiento. Sin embargo, como cualquier método estadístico, deben aplicarse con cuidado, prestando atención a las posibles limitaciones y errores.
Reflexiones finales
Espero que aprecies las puntuaciones de propensión, que son un método importante para minimizar el sesgo en los estudios observacionales, porque hacen un buen trabajo equilibrando los grupos de tratamiento y control en función de sus características respectivas. Técnicas como el emparejamiento, la estratificación y la ponderación ayudan a garantizar unas inferencias causales más precisas al abordar los factores de confusión.
Para aplicar eficazmente estos métodos, sigue nuestro curso de Inferencia causal con R - Regresión, que ofrece formación práctica utilizando el paquete MatchIt
. Este magnífico curso guía a los alumnos en la aplicación del emparejamiento de puntuaciones de propensión y otras técnicas para que puedas realizar investigaciones más fiables e imparciales en estudios observacionales. También sugiero nuestra carrera completa de Estadístico en R. Aunque no estés pensando en ser estadístico, el curso sigue siendo un gran recurso con mucho aprendizaje para convertirte en un gran analista o científico de datos.

Transformadora de Datos y Estratega de IA | Conferenciante Internacional | Ética de la IA | Inventora | Mujer Logradora Global | Autora
Preguntas frecuentes sobre la puntuación de propensión
¿Qué son las puntuaciones de propensión y por qué se utilizan en los estudios observacionales?
Las puntuaciones de propensión representan la probabilidad de que un participante reciba un tratamiento concreto en función de sus características observadas. Se utilizan en los estudios observacionales para minimizar el sesgo de selección y hacer que los grupos de tratamiento y control sean más comparables, ya que la asignación aleatoria puede no ser factible.
¿Cómo abordan las puntuaciones de propensión los factores de confusión en la investigación?
Las puntuaciones de propensión ayudan a equilibrar los grupos controlando las variables de confusión, que son factores externos que pueden afectar tanto al tratamiento como al resultado. Al emparejar o ponderar a los participantes con puntuaciones de propensión similares, los investigadores pueden reducir los factores de confusión y aislar mejor el efecto del tratamiento.
¿Cuáles son los principales métodos para aplicar puntuaciones de propensión en la investigación?
Los cuatro métodos principales son:
- A juego: Empareja a los participantes de los grupos de tratamiento y control con puntuaciones de propensión similares.
- Estratificación: Divide a los participantes en estratos en función de sus puntuaciones para hacer comparaciones dentro del grupo.
- Ponderación de Probabilidad Inversa (IPW): Asigna pesos a los individuos en función de sus puntuaciones para equilibrar las características del grupo.
- Ajuste de covariables: Incluye las puntuaciones de propensión como covariables en los modelos de regresión.
¿Cuáles son las ventajas de utilizar puntuaciones de propensión?
Las puntuaciones de propensión mejoran el equilibrio de las covariables entre los grupos de tratamiento y de control, reducen el sesgo ajustándose a las características observadas y ofrecen flexibilidad en estudios con tratamientos tanto binarios como continuos, lo que las hace muy versátiles para la investigación observacional.
¿Cuáles son las limitaciones de las puntuaciones de propensión en la investigación?
Las puntuaciones de propensión sólo se ajustan a las covariables observadas, lo que deja sin abordar los sesgos no medidos u ocultos. También requieren muestras de gran tamaño para que el emparejamiento o la ponderación sean eficaces, y los errores en la especificación del modelo, como la exclusión de variables clave, pueden dar lugar a estimaciones inexactas del efecto del tratamiento.
Aprende con DataCamp
curso
Introduction to Regression with statsmodels in Python
curso
Hypothesis Testing in Python
blog
Intervalos de confianza frente a intervalos de predicción: Comprender la diferencia

Arun Nanda
25 min
tutorial
Comprender la asimetría y la curtosis y cómo trazarlas
tutorial
Tutorial de tablas de contingencia en R
tutorial
Pruebas de hipótesis fáciles

Vinod Chugani
9 min
tutorial
Comprender la regresión logística en el tutorial de Python

Avinash Navlani
10 min