Skip to content
1 hidden cell
Introduction to Statistics in Python
Introduction to Statistics in Python
Run the hidden code cell below to import the data used in this course.
1 hidden cell
Take Notes
Add notes about the concepts you've learned and code cells with code you want to keep.
Add your notes here
# Subset for Belgium and USA only
be_and_usa = food_consumption[(food_consumption['country'] == "Belgium") | (food_consumption['country'] == 'USA')]
# Group by country, select consumption column, and compute mean and median
print(be_and_usa.groupby('country')['consumption'].agg([np.mean, np.median]))Variância = distância média de cada ponto de dados até a média geral dos dados Cálculo da variância:
- Calcular a distância entre cada ponto de dados e a média
- Calcular raiz quadrada de cada distância individual
- Somar todos os valores
- Dividir a soma pelo número de pontos de dados -1
Quanto maior a variância, mais espalhados estão os dados.
Desvio padrão
- Raiz quadrada da variância
np.random.seed(10)
sales_counts.sample()
sales_counts.sample(5, replacement=True)