Skip to content

Introduction to Statistics in Python

Run the hidden code cell below to import the data used in this course.


1 hidden cell

Take Notes

Add notes about the concepts you've learned and code cells with code you want to keep.

Add your notes here

# Subset for Belgium and USA only
be_and_usa = food_consumption[(food_consumption['country'] == "Belgium") | (food_consumption['country'] == 'USA')]

# Group by country, select consumption column, and compute mean and median
print(be_and_usa.groupby('country')['consumption'].agg([np.mean, np.median]))

Variância = distância média de cada ponto de dados até a média geral dos dados Cálculo da variância:

  1. Calcular a distância entre cada ponto de dados e a média
  2. Calcular raiz quadrada de cada distância individual
  3. Somar todos os valores
  4. Dividir a soma pelo número de pontos de dados -1

Quanto maior a variância, mais espalhados estão os dados.

Desvio padrão

  1. Raiz quadrada da variância
np.random.seed(10)
sales_counts.sample()
sales_counts.sample(5, replacement=True)