Ir al contenido principal

Curso

Fundamentos de la inferencia en R

IntermedioNivel de habilidad

Actualizado 7/2024

Aprende a sacar conclusiones sobre una población a partir de una muestra de datos mediante un proceso conocido como inferencia estadística.

Comienza el curso gratis

RProbability & Statistics

4 h

17 vídeos

58 Ejercicios

4,350 XP

38,720

Certificado de logros

Preferido por estudiantes en miles de empresas

¿Formando un equipo?

Prueba para empresas

Descripción del curso

Uno de los aspectos fundamentales del análisis estadístico es la inferencia, es decir, el proceso de extraer conclusiones sobre una población más amplia a partir de una muestra de datos. Aunque pueda parecer contraintuitivo, la práctica habitual consiste en intentar refutar una afirmación de investigación que no es la que nos interesa. Por ejemplo, para mostrar que un tratamiento médico es mejor que otro, podemos asumir que ambos tratamientos producen tasas de supervivencia iguales y después usar los datos para refutar esa suposición. Además, introducimos la idea del valor p, o el grado de desacuerdo entre los datos y la hipótesis. También profundizamos en los intervalos de confianza, que miden la magnitud del efecto de interés (por ejemplo, cuánto mejor es un tratamiento frente a otro).

Requisitos previos

Introduction to Regression in R Hypothesis Testing in R

1

Introducción a las ideas de inferencia

En este capítulo, investigarás cómo pueden variar las muestras repetidas extraídas de una población. Es la variabilidad de las muestras lo que te permite hacer afirmaciones sobre la población de interés. Recuerda que las afirmaciones de investigación se centran en la población, mientras que la información disponible proviene únicamente de los datos muestrales.

¡Bienvenido al curso!

Hipótesis (1)

Hipótesis (2)

Distribuciones aleatorizadas

Trabajar con los datos de NHANES

Calcular la estadística de interés

Datos aleatorizados bajo el modelo nulo de independencia

Estadísticos aleatorizados y diagrama de puntos

Densidad de aleatorización

Usar la distribución de aleatorización

¿Proceden los datos de la población?

¿Qué puedes concluir?

Conclusiones del estudio

Iniciar capítulo

2

Completar una prueba de aleatorización: discriminación de género

En este capítulo, adquirirás las herramientas y conocimientos para completar una prueba de hipótesis completa. Es decir, dado un conjunto de datos, sabrás si es apropiado rechazar o no la hipótesis nula en favor de la afirmación de investigación de interés.

Ejemplo: discriminación de género

Hipótesis sobre discriminación de género

Resumen de la discriminación de género

Paso a paso por la permutación

Aleatorizando la discriminación de género

Distribución de estadísticas

Reflexiona sobre el análisis

Región crítica

Región crítica bilateral

¿Por qué 0,05?

¿Cómo afecta el tamaño de la muestra a los resultados?

Tamaño de muestra en la distribución de aleatorización

Tamaño de muestra para la región crítica

¿Qué es un valor p?

Calcular los p-values

Practica el cálculo de p-valores

Cálculo de p-valores bilaterales

Resumen sobre la discriminación de género

Iniciar capítulo

3

Errores en pruebas de hipótesis: coste de oportunidad

Seguirás aprendiendo sobre las pruebas de hipótesis con un nuevo ejemplo y la misma estructura de pruebas de aleatorización. En este capítulo, sin embargo, el foco estará en distintos errores (tipo I y tipo II), cómo se cometen, cuándo uno es peor que otro y cómo aspectos como el tamaño de muestra y el tamaño del efecto influyen en las tasas de error.

Ejemplo: coste de oportunidad

Resumir el coste de oportunidad (1)

Representar el coste de oportunidad

Aleatorizando el coste de oportunidad

Resumiendo el coste de oportunidad (2)

Conclusión sobre el coste de oportunidad

Errores y sus consecuencias

Elección diferente de la tasa de error

Errores para hipótesis bilaterales

p-valor para hipótesis bilaterales: costes de oportunidad

Resumen de los costes de oportunidad

Iniciar capítulo

4

Intervalos de confianza

Como complemento a las pruebas de hipótesis, los intervalos de confianza te permiten estimar un parámetro poblacional. Recuerda que tu interés siempre recae en alguna característica de la población, pero solo dispones de información incompleta para estimar el parámetro usando datos muestrales. Aquí, el parámetro es la proporción verdadera de éxitos en una población. Se utiliza bootstrapping para estimar la variabilidad necesaria para construir el intervalo de confianza.

Parámetros e intervalos de confianza

¿Cuál es el parámetro?

¿Prueba de hipótesis o intervalo de confianza?

Bootstrapping

Re-muestreo a partir de una muestra

Visualizar la variabilidad de p sombrero

Vuelve a muestrear siempre el número original de observaciones

Variabilidad de p sombrero

Regla empírica

Intervalo t de confianza con bootstrap

Intervalo percentil de bootstrap

Interpretación de los IC y condiciones técnicas

Efectos del tamaño muestral en los IC por bootstrap

Efectos del valor de la proporción muestral en los IC bootstrap

Efecto del percentil en los IC por bootstrap

Resumen de la inferencia estadística

Iniciar capítulo

Fundamentos de la inferencia en R

Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.Inscríbete ahora

¡Únete a 19 millones de estudiantes y empieza Fundamentos de la inferencia en R hoy mismo!

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.