Saltar al contenido principal
InicioTutorialesPython

Tutorial de Python para principiantes

Obtén una guía paso a paso sobre cómo instalar Python y utilizarlo para las funciones básicas de la ciencia de datos.
Actualizado 11 sept 2024  · 12 min leer

Python es el lenguaje de programación más popular hoy en día y se utiliza ampliamente en todos los sectores, desde el desarrollo de software y web hasta el desarrollo de juegos, IoT y más. Y lo que es más importante, se ha convertido en el lenguaje de programación de facto para la ciencia de datos y el aprendizaje automático. Esta entrada del blog explicará por qué y cuándo utilizar Python, cómo instalarlo, la sintaxis y funcionalidad básicas de Python, una introducción al análisis sencillo de datos y mucho más.

Cuándo y por qué utilizar Python

Python es un lenguaje muy versátil con muchos casos de uso en todos los sectores. Al igual que muchos lenguajes de programación, Python es de código abierto y de uso gratuito, y contiene una gran biblioteca de herramientas y paquetes (¡más adelante hablaremos de los paquetes!) que simplifican el trabajo con una gran variedad de tareas. He aquí algunas verticales en las que Python es útil:

Desarrollo de software para ordenadores de sobremesa y móviles

Ya se trate de construir aplicaciones informáticas sencillas, como calculadoras, o editores de documentos y redes sociales. Python ofrece una plétora de herramientas para crear prototipos, desarrollar y ejecutar aplicaciones de escritorio o móviles.

Desarrollo web

¿Sabías que aplicaciones web como Uber, Netflix y Spotify se crearon con Python? Hay una gran variedad de frameworks web en Python que simplifican el desarrollo de sitios web.

Desarrollo de juegos

Puede que te sorprenda, pero juegos como Los Sims 4 y Civilization IV se crearon con Python. Existen muchas bibliotecas Python que agilizan la creación de prototipos y el desarrollo de juegos.

Internet de las Cosas (IoT)

El auge de los sistemas embebidos y del Internet de las cosas (IoT) ha catalizado la innovación y la mejora de los procesos empresariales en todos los ámbitos. Python ofrece un conjunto de paquetes que facilitan el diseño, la creación y el despliegue de un dispositivo IoT en Arduino, Raspberry Pi y otros dispositivos IoT como Alexa y Google Home.

Ciencia de datos y aprendizaje automático

El aumento de la popularidad de Python puede atribuirse a su rico conjunto de paquetes y herramientas para la ciencia de datos y el aprendizaje automático. Python puede utilizarse en todo el flujo de trabajo de la ciencia de datos, desde el análisis exploratorio de datos, el preprocesamiento de datos, la construcción y despliegue de modelos y, por último, la interpretación y comunicación de resultados. Dado que Python se utiliza en todo el flujo de trabajo de la ciencia de datos, lo emplean una gran variedad de funciones de datos, desde analistas de datos, científicos de datos, ingenieros de datos, ingenieros de aprendizaje automático, etc.

Cómo instalar Python

Python puede instalarse por varias vías, dependiendo de si tienes un Mac o Windows, o de si quieres instalarlo con Anaconda. Dado que Windows y Mac se instalan de forma similar, las siguientes instrucciones pueden aplicarse a ambos sistemas operativos. Si quieres profundizar en la instalación de Python para la ciencia de datos, consulta este artículo.

Mac y Windows

Ve al sitio web de Python, que te enviará a la página de descargas, como se ve en la captura de pantalla siguiente. Elige Windows o Mac y haz clic en el botón de descarga para acceder al paquete de instalación.

Página de descargas de Python

Anaconda

Una de las formas más cómodas de instalar Python para la ciencia de datos es instalando una distribución Anaconda, que también instala todos los paquetes relevantes para la ciencia de datos. Sigue el enlace anterior para instalarlo en Mac, Windows o Linux. Para profundizar en la instalación de Anaconda, consulta estas entradas de blog para MacOs y Windows.

Descarga de la edición individual del kit de herramientas de ciencia de datos

Cómo empezar con Python para la ciencia de datos

En esta sección, veremos cómo abrir Python en Mac y Windows, cómo iniciar el terminal, los conceptos básicos de Python como las sentencias de impresión y los operadores, las variables y la asignación de valores, los tipos de datos, los paquetes y cómo instalarlos, así como la popular biblioteca de ciencia de datos pandas y cómo instalarla.

1. Iniciar Python

Terminal de Lanzamiento

Para lanzar Python, primero tendrás que lanzar tu terminal. Tanto para Mac como para Windows, sólo tienes que buscarlo en tu ordenador. En Mac, la forma más sencilla es hacer una búsqueda en Spotlight, que es el icono en forma de lupa de la esquina superior derecha del escritorio.

Búsqueda por terminal

Del mismo modo, para Windows, buscarás el símbolo del sistema a través del menú de inicio, como se describe en un artículo de DataCamp Cómo ejecutar scripts de Python. También puedes iniciar el nuevo Terminal de Windows después de instalarlo y buscarlo como se menciona en la entrada del blog de Windows Presentación del Terminal de Windows. Después de lanzarlo, esto es lo que verás:

Iniciar el terminal de Windows

Cómo abrir Python en Mac + Windows

Una vez completada la instalación de Python, puedes iniciar tu terminal simplemente escribiendo la palabra "python". Esto iniciará Python y te mostrará la versión actual que tienes instalada. Si las tres flechas apuntan a la derecha, ¡estás listo para codificar en Python!

Tres flechas Pitón

También puedes optar por utilizar un IDE como Visual Studio Code para interactuar con Python. Aquí tienes una guía útil sobre cómo configurar VS Code para que funcione con Python.

2. Sintaxis básica de Python

En los siguientes comandos sintácticos, escribirás el comando y luego pulsarás enter o return en tu teclado para ver los resultados.

Imprimir declaraciones

A continuación, puedes iniciar tu primer comando en Python. Empezaremos con la declaración print(), que consistirá en escribir la palabra print, seguida de un paréntesis. La salida se escribirá dentro de esos mismos paréntesis y entre comillas.

print("Hello, World")
Hello, World

Operarios

A continuación, puedes realizar operaciones, como +, - y *. Como puedes ver, el + suma los dos números, el - resta el segundo número del primero, el * multiplica ambos números.

5 + 5
10
5 - 5
0
5 * 5
25

Booleanos

El siguiente comando sirve para comparar dos valores. En el caso siguiente, vamos a comparar los dos mismos números, cinco y cinco. El comando pregunta si 5 es mayor que 5, lo cual, por supuesto, no es así, por lo que la salida devuelta es False. Para los booleanos, esperamos que la salida sea verdadero o falso.

5 > 5
False

Crear variables y asignarlas

En esta sección, vemos que puedes asignar un número al nombre variable_1, y luego devolverlo llamando a ese mismo variable_1 para obtener el valor que le habías asignado:

variable_1 = 100
variable_1
100

Listas

my_list = ['potato', 3, 4.02]
my_list[0]
‘potato’

Una lista es una estructura de datos en la que se pueden almacenar valores y acceder a ellos. Lo bueno de las listas es que no tienen por qué ser todas del mismo tipo de datos. A continuación, podemos ver que tenemos un str, un int y un float, respectivamente. Para acceder a los elementos de la lista de modo que aparezcan en la salida, puedes escribir el nombre de la lista seguido de paréntesis con el lugar del elemento que desees. Por ejemplo, añadimos [0] a nuestro nombre de lista para obtener el primer elemento de la lista, como se ve a continuación.

Para profundizar en las listas de Python, consulta el artículo Índice de listas de Python().

Tipos de datos

Los valores de Python pueden tener diversas formas, como int, float y str. Por ejemplo, int representa números enteros, float representa números decimales y str representa "cadenas", o más generalmente texto.

Utilizando la función type(), podremos comprobar el tipo de nuestros valores. En este caso, estamos viendo tres valores, que incluyen 10, 10,06 y la palabra "tutorial". El primero es un número entero, mientras que el segundo es un flotador y el último es una cadena. A continuación, podemos ver el comando y su tipo de datos de salida respetado.

type(10)
<class 'int'>
type(10.06)
<class 'float'>
type('tutorial')
<class 'str'>

Para profundizar en los tipos de datos y cómo convertirlos, puedes leer el siguiente blog, Tutorial de conversión de tipos de datos en Python.

Paquetes e instalación

Los paquetes son herramientas potentes que tienen funcionalidades conservadas. Por ejemplo, pandas es un paquete que te permite trabajar con datos tabulares en Python. Piensa en ellas como aplicaciones que descargas en Python y que proporcionan una funcionalidad específica. Querrás salir de Python en tu terminal tecleando Ctrl + D, y a continuación teclear el siguiente comando (para usuarios de Mac). Aquí vamos a instalar un paquete de muestra llamado CiertoPaquete sólo para ilustrar la instalación.

Instalación del paquete de muestra

Instalar pandas y Jupyter Notebook

pandas es quizás la biblioteca de ciencia de datos más utilizada en Python. Te permite trabajar con datos tabulares en Python y realizar diversas operaciones. En cierto sentido, puedes considerarlo como el Excel o las hojas de cálculo de Python. Los desarrolladores de pandas lo describen como "una herramienta de análisis y manipulación de datos de código abierto, rápida, potente, flexible y fácil de usar, construida sobre el lenguaje de programación Python".

El cuaderno Jupyter es una aplicación web que interpreta código, guarda texto y muestra visualizaciones. Tanto Jupyter como pandas están disponibles para su lanzamiento si has descargado Anaconda, o puedes instalarlos ejecutando los siguientes comandos en el terminal:

pip install pandas
pip install notebooks

3. Ciencia de datos básica con Python

En esta sección veremos cómo importar un popular paquete de Python asignándole un alias, cómo leer un archivo CSV, cómo mostrar tus datos en algo llamado DataFrame y cómo visualizar una columna utilizando una determinada función de trazado. Ya hemos aprendido a instalar pandas más arriba, y como Jupyter Notebook es fácil de usar y funciona en varios tipos de ordenador, utilizaremos esa aplicación web para mostrar las siguientes funciones de ciencia de datos con pandas.

Puedes iniciar un cuaderno Jupyter simplemente escribiendo jupyter notebook en tu terminal.

Iniciar Jupyter Notebook

Importar paquetes con un alias

Antes de empezar a trabajar con pandas, necesitamos importarlo a nuestro entorno. Igual que lanzar una aplicación después de instalarla, importar un paquete es sencillo. Podemos importar pandas y asignarle un alias más corto que el nombre original para que sea más fácil trabajar con este paquete. En su lugar, asignaremos a los pandas las letras pd para abreviar la notación; este cambio es puramente opcional.

import pandas as pd

Importar tus datos leyendo un archivo CSV

Después de haber importado pandas como pd, puedes utilizar pd para leer tus datos, que pueden ser un archivo CSV. Esta función consiste en encerrar la ruta del archivo CSV entre comillas, dentro del paréntesis de pd.read_csv(). A continuación, puedes almacenar tu CSV en un marco de datos con la operación =. Ahora podrás imprimir tu marco de datos, pero sólo querrás ver las primeras filas en lugar de todas. Los datos, en este caso, proceden del rendimiento de las acciones del año pasado, con los campos fecha, apertura, máximo, mínimo, cierre, volumen y nombre, que describen características de las acciones populares diarias. Sin embargo, es importante tener en cuenta que aquí puedes utilizar cualquier archivo CSV para ilustrar la importación de datos.

Función cabeza de la trama de datos

Mostrar las primeras filas de tus datos es importante para comprobar si has importado el CSV correcto, así como para ver si los datos tienen buen aspecto en general. La forma de hacerlo es llamando a tu marco de datos y adjuntando el método .head() al final del mismo. Esta función devolverá por defecto las 5 primeras filas de tus datos. Si quieres mostrar más, puedes poner ese valor entre los paréntesis de .head().

import pandas as pd
stocks_df = pd.read.csv('/documents/data/stock_data.csv')
stocks_df.head()
Primeras 5 filas de datos CSV

Visualiza la columna con la función trazar

El método .plot() es útil para mostrar las columnas de tu marco de datos. En este ejemplo, muestro el eje x como la columna "fecha", y el importe de la columna "cierre" como el eje y, visualizado mediante un gráfico de líneas.

stocks_df.plot(x="date", y="close")
<AxesSubplot:xlabel='date'>
Gráfico lineal de columnas del marco de datos

4. Sugerencias para aplicaciones prácticas:

Esta visión general de Python para la ciencia de datos sólo ha arañado la superficie. Hay un montón de aplicaciones prácticas que puedes emplear con Python en la ciencia de datos en varios sectores, como la pérdida de clientes, la previsión de ventas, la clasificación de imágenes, la clasificación de productos, el análisis de sentimientos, la detección de fraudes con tarjetas de crédito y los sistemas de recomendación. Tutorial para principiantes de DataCamp: Sistemas de Recomendación en Python demuestra cómo recomendar con éxito películas a la gente basándose en una variedad de factores con el uso del aprendizaje automático. Otro caso de uso popular de la ciencia de datos en el sector financiero es la detección del fraude con tarjetas de crédito, que se explica en Detección del fraude con tarjetas de crédito mediante un algoritmo de aprendizaje automático. Como puedes ver, no sólo hay un montón de casos de uso específicos de la ciencia de datos, sino que también hay casos de uso específicos de la industria.

Para una introducción más profunda a Python, consulta el curso Introducción a Python de DataCamp, o descubre más cosas sobre cómo aprender Python en nuestro blog, donde puedes leer sobre las mejores certificaciones de Python y encontrar algunas alternativas que ofrece DataCamp. 

Temas

Cursos superiores

Certificación disponible

Course

Introducción a Python

4 hr
5.5M
Domina los fundamentos del análisis de datos con Python en sólo cuatro horas. Este curso online introducirá la interfaz de Python y explorará paquetes populares.
See DetailsRight Arrow
Start Course
Ver másRight Arrow
Relacionado

blog

Tutorial: cómo instalar Python en macOS y Windows

Aprende a instalar Python en tu equipo personal con este tutorial paso a paso. Tanto si eres usuario de Windows como de macOS, descubre varios métodos para iniciarte en Python en tu equipo.
Richie Cotton's photo

Richie Cotton

14 min

blog

Cómo aprender Python desde cero en 2024: Guía del experto

Descubre cómo aprender Python, sus aplicaciones y la demanda de conocimientos de Python. Comienza hoy tu andadura en Python ​con nuestra guía completa.
Matt Crabtree's photo

Matt Crabtree

19 min

tutorial

Tutorial de funciones de Python

Un tutorial sobre funciones en Python que cubre cómo escribir funciones, cómo invocarlas y mucho más.
Karlijn Willems's photo

Karlijn Willems

14 min

tutorial

Tutorial de pandas en Python: la guía definitiva para principiantes

¿Todo preparado para comenzar tu viaje de pandas? Aquí tienes una guía paso a paso sobre cómo empezar.
Vidhi Chugh's photo

Vidhi Chugh

15 min

tutorial

Tutorial de Excel en Python: La guía definitiva

Aprende a leer e importar archivos Excel en Python, a escribir datos en estas hojas de cálculo y a encontrar los mejores paquetes para hacerlo.
Natassha Selvaraj's photo

Natassha Selvaraj

30 min

tutorial

Tutorial de visualización de datos con Python y Tableau

Aprende a utilizar Python para ampliar las funciones de visualización de datos de Tableau.
Abid Ali Awan's photo

Abid Ali Awan

15 min

See MoreSee More