Data Manipulation with pandas
Run the hidden code cell below to import the data used in this course.
# Import the course packages
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Import the four datasets
avocado = pd.read_csv("datasets/avocado.csv")
homelessness = pd.read_csv("datasets/homelessness.csv")
temperatures = pd.read_csv("datasets/temperatures.csv")
walmart = pd.read_csv("datasets/walmart.csv")
DataFrames are Tabular data structures, where each observation is a row and each variable is a column.
Creating and Visualizing DataFrames
Transforming Data Frames
()
- Para Métodos
Un método, es una función que se encuentra dentro de una clase o instancia de una clase. Los métodos realizan una acción específica en el objeto o en la clase a la que pertenece. Por ejemplo, en una clase "Persona", los métodos pueden ser "caminar", "hablar", "correr", etc.
sin ()
- Para Atributos.
Un atributo es una variable que se encuentra dentro de una clase o instancia de una clase. Los atributos almacenan información y representan las propiedades del objeto. Por ejemplo, en un objeto de una clase "Persona", los atributos pueden ser "nombre", "edad", "altura", etc.
La principal diferencia entre un método y un atributo es que un método realiza una acción específica en un objeto o en la clase, mientras que un atributo es una propiedad del objeto que almacena información.
Exploring DataFrames
.head()
This method allows you to view the first few rows of a DataFrame. It is useful for quickly exploring the data and getting a general understanding of the data structure. Additionally, you can specify the number of rows you would like to view.
homelessness.head() #You can add a number inside of head to get a Specific number of rows like .head(8)
.info ()
This method provides important information on the data set such as the number of rows, columns, the data type of each column, and the number of non-null values in each column.
homelessness.info()
.shape
This method returns a tuple representing the number of rows and columns in the DataFrame.
homelessness.shape #rows, and columns
.describe()
This method returns the summary statistics of numeric columns in the DataFrame. It is useful for understanding the distribution of your data.