Course
Tutorial de Python para principiantes
Python es el lenguaje de programación más popular hoy en día y se utiliza ampliamente en todos los sectores, desde el desarrollo de software y web hasta el desarrollo de juegos, IoT y más. Y lo que es más importante, se ha convertido en el lenguaje de programación de facto para la ciencia de datos y el aprendizaje automático. Esta entrada del blog explicará por qué y cuándo utilizar Python, cómo instalarlo, la sintaxis y funcionalidad básicas de Python, una introducción al análisis sencillo de datos y mucho más.
Cuándo y por qué utilizar Python
Python es un lenguaje muy versátil con muchos casos de uso en todos los sectores. Al igual que muchos lenguajes de programación, Python es de código abierto y de uso gratuito, y contiene una gran biblioteca de herramientas y paquetes (¡más adelante hablaremos de los paquetes!) que simplifican el trabajo con una gran variedad de tareas. He aquí algunas verticales en las que Python es útil:
Desarrollo de software para ordenadores de sobremesa y móviles
Ya se trate de construir aplicaciones informáticas sencillas, como calculadoras, o editores de documentos y redes sociales. Python ofrece una plétora de herramientas para crear prototipos, desarrollar y ejecutar aplicaciones de escritorio o móviles.
Desarrollo web
¿Sabías que aplicaciones web como Uber, Netflix y Spotify se crearon con Python? Hay una gran variedad de frameworks web en Python que simplifican el desarrollo de sitios web.
Desarrollo de juegos
Puede que te sorprenda, pero juegos como Los Sims 4 y Civilization IV se crearon con Python. Existen muchas bibliotecas Python que agilizan la creación de prototipos y el desarrollo de juegos.
Internet de las Cosas (IoT)
El auge de los sistemas embebidos y del Internet de las cosas (IoT) ha catalizado la innovación y la mejora de los procesos empresariales en todos los ámbitos. Python ofrece un conjunto de paquetes que facilitan el diseño, la creación y el despliegue de un dispositivo IoT en Arduino, Raspberry Pi y otros dispositivos IoT como Alexa y Google Home.
Ciencia de datos y aprendizaje automático
El aumento de la popularidad de Python puede atribuirse a su rico conjunto de paquetes y herramientas para la ciencia de datos y el aprendizaje automático. Python puede utilizarse en todo el flujo de trabajo de la ciencia de datos, desde el análisis exploratorio de datos, el preprocesamiento de datos, la construcción y despliegue de modelos y, por último, la interpretación y comunicación de resultados. Dado que Python se utiliza en todo el flujo de trabajo de la ciencia de datos, lo emplean una gran variedad de funciones de datos, desde analistas de datos, científicos de datos, ingenieros de datos, ingenieros de aprendizaje automático, etc.
Cómo instalar Python
Python puede instalarse por varias vías, dependiendo de si tienes un Mac o Windows, o de si quieres instalarlo con Anaconda. Dado que Windows y Mac se instalan de forma similar, las siguientes instrucciones pueden aplicarse a ambos sistemas operativos. Si quieres profundizar en la instalación de Python para la ciencia de datos, consulta este artículo.
Mac y Windows
Ve al sitio web de Python, que te enviará a la página de descargas, como se ve en la captura de pantalla siguiente. Elige Windows o Mac y haz clic en el botón de descarga para acceder al paquete de instalación.
Anaconda
Una de las formas más cómodas de instalar Python para la ciencia de datos es instalando una distribución Anaconda, que también instala todos los paquetes relevantes para la ciencia de datos. Sigue el enlace anterior para instalarlo en Mac, Windows o Linux. Para profundizar en la instalación de Anaconda, consulta estas entradas de blog para MacOs y Windows.
Cómo empezar con Python para la ciencia de datos
En esta sección, veremos cómo abrir Python en Mac y Windows, cómo iniciar el terminal, los conceptos básicos de Python como las sentencias de impresión y los operadores, las variables y la asignación de valores, los tipos de datos, los paquetes y cómo instalarlos, así como la popular biblioteca de ciencia de datos pandas
y cómo instalarla.
1. Iniciar Python
Terminal de Lanzamiento
Para lanzar Python, primero tendrás que lanzar tu terminal. Tanto para Mac como para Windows, sólo tienes que buscarlo en tu ordenador. En Mac, la forma más sencilla es hacer una búsqueda en Spotlight, que es el icono en forma de lupa de la esquina superior derecha del escritorio.
Del mismo modo, para Windows, buscarás el símbolo del sistema a través del menú de inicio, como se describe en un artículo de DataCamp Cómo ejecutar scripts de Python. También puedes iniciar el nuevo Terminal de Windows después de instalarlo y buscarlo como se menciona en la entrada del blog de Windows Presentación del Terminal de Windows. Después de lanzarlo, esto es lo que verás:
Cómo abrir Python en Mac + Windows
Una vez completada la instalación de Python, puedes iniciar tu terminal simplemente escribiendo la palabra "python". Esto iniciará Python y te mostrará la versión actual que tienes instalada. Si las tres flechas apuntan a la derecha, ¡estás listo para codificar en Python!
También puedes optar por utilizar un IDE como Visual Studio Code para interactuar con Python. Aquí tienes una guía útil sobre cómo configurar VS Code para que funcione con Python.
2. Sintaxis básica de Python
En los siguientes comandos sintácticos, escribirás el comando y luego pulsarás enter
o return
en tu teclado para ver los resultados.
Imprimir declaraciones
A continuación, puedes iniciar tu primer comando en Python. Empezaremos con la declaración print()
, que consistirá en escribir la palabra print, seguida de un paréntesis. La salida se escribirá dentro de esos mismos paréntesis y entre comillas.
print("Hello, World")
Hello, World
Operarios
A continuación, puedes realizar operaciones, como +, - y *. Como puedes ver, el + suma los dos números, el - resta el segundo número del primero, el * multiplica ambos números.
5 + 5
10
5 - 5
0
5 * 5
25
Booleanos
El siguiente comando sirve para comparar dos valores. En el caso siguiente, vamos a comparar los dos mismos números, cinco y cinco. El comando pregunta si 5 es mayor que 5, lo cual, por supuesto, no es así, por lo que la salida devuelta es False
. Para los booleanos, esperamos que la salida sea verdadero o falso.
5 > 5
False
Crear variables y asignarlas
En esta sección, vemos que puedes asignar un número al nombre variable_1
, y luego devolverlo llamando a ese mismo variable_1
para obtener el valor que le habías asignado:
variable_1 = 100
variable_1
100
Listas
my_list = ['potato', 3, 4.02]
my_list[0]
‘potato’
Una lista es una estructura de datos en la que se pueden almacenar valores y acceder a ellos. Lo bueno de las listas es que no tienen por qué ser todas del mismo tipo de datos. A continuación, podemos ver que tenemos un str, un int y un float, respectivamente. Para acceder a los elementos de la lista de modo que aparezcan en la salida, puedes escribir el nombre de la lista seguido de paréntesis con el lugar del elemento que desees. Por ejemplo, añadimos [0] a nuestro nombre de lista para obtener el primer elemento de la lista, como se ve a continuación.
Para profundizar en las listas de Python, consulta el artículo Índice de listas de Python().
Tipos de datos
Los valores de Python pueden tener diversas formas, como int
, float
y str
. Por ejemplo, int
representa números enteros, float
representa números decimales y str
representa "cadenas", o más generalmente texto.
Utilizando la función type()
, podremos comprobar el tipo de nuestros valores. En este caso, estamos viendo tres valores, que incluyen 10, 10,06 y la palabra "tutorial". El primero es un número entero, mientras que el segundo es un flotador y el último es una cadena. A continuación, podemos ver el comando y su tipo de datos de salida respetado.
type(10)
<class 'int'>
type(10.06)
<class 'float'>
type('tutorial')
<class 'str'>
Para profundizar en los tipos de datos y cómo convertirlos, puedes leer el siguiente blog, Tutorial de conversión de tipos de datos en Python.
Paquetes e instalación
Los paquetes son herramientas potentes que tienen funcionalidades conservadas. Por ejemplo, pandas
es un paquete que te permite trabajar con datos tabulares en Python. Piensa en ellas como aplicaciones que descargas en Python y que proporcionan una funcionalidad específica. Querrás salir de Python en tu terminal tecleando Ctrl + D, y a continuación teclear el siguiente comando (para usuarios de Mac). Aquí vamos a instalar un paquete de muestra llamado CiertoPaquete sólo para ilustrar la instalación.
Instalar pandas y Jupyter Notebook
pandas es quizás la biblioteca de ciencia de datos más utilizada en Python. Te permite trabajar con datos tabulares en Python y realizar diversas operaciones. En cierto sentido, puedes considerarlo como el Excel o las hojas de cálculo de Python. Los desarrolladores de pandas lo describen como "una herramienta de análisis y manipulación de datos de código abierto, rápida, potente, flexible y fácil de usar, construida sobre el lenguaje de programación Python".
El cuaderno Jupyter es una aplicación web que interpreta código, guarda texto y muestra visualizaciones. Tanto Jupyter como pandas están disponibles para su lanzamiento si has descargado Anaconda, o puedes instalarlos ejecutando los siguientes comandos en el terminal:
pip install pandas
pip install notebooks
3. Ciencia de datos básica con Python
En esta sección veremos cómo importar un popular paquete de Python asignándole un alias, cómo leer un archivo CSV, cómo mostrar tus datos en algo llamado DataFrame y cómo visualizar una columna utilizando una determinada función de trazado. Ya hemos aprendido a instalar pandas más arriba, y como Jupyter Notebook es fácil de usar y funciona en varios tipos de ordenador, utilizaremos esa aplicación web para mostrar las siguientes funciones de ciencia de datos con pandas.
Puedes iniciar un cuaderno Jupyter simplemente escribiendo jupyter notebook
en tu terminal.
Importar paquetes con un alias
Antes de empezar a trabajar con pandas, necesitamos importarlo a nuestro entorno. Igual que lanzar una aplicación después de instalarla, importar un paquete es sencillo. Podemos importar pandas y asignarle un alias más corto que el nombre original para que sea más fácil trabajar con este paquete. En su lugar, asignaremos a los pandas las letras pd
para abreviar la notación; este cambio es puramente opcional.
import pandas as pd
Importar tus datos leyendo un archivo CSV
Después de haber importado pandas como pd
, puedes utilizar pd
para leer tus datos, que pueden ser un archivo CSV. Esta función consiste en encerrar la ruta del archivo CSV entre comillas, dentro del paréntesis de pd.read_csv()
. A continuación, puedes almacenar tu CSV en un marco de datos con la operación =. Ahora podrás imprimir tu marco de datos, pero sólo querrás ver las primeras filas en lugar de todas. Los datos, en este caso, proceden del rendimiento de las acciones del año pasado, con los campos fecha, apertura, máximo, mínimo, cierre, volumen y nombre, que describen características de las acciones populares diarias. Sin embargo, es importante tener en cuenta que aquí puedes utilizar cualquier archivo CSV para ilustrar la importación de datos.
Función cabeza de la trama de datos
Mostrar las primeras filas de tus datos es importante para comprobar si has importado el CSV correcto, así como para ver si los datos tienen buen aspecto en general. La forma de hacerlo es llamando a tu marco de datos y adjuntando el método .head()
al final del mismo. Esta función devolverá por defecto las 5 primeras filas de tus datos. Si quieres mostrar más, puedes poner ese valor entre los paréntesis de .head()
.
import pandas as pd
stocks_df = pd.read.csv('/documents/data/stock_data.csv')
stocks_df.head()
Visualiza la columna con la función trazar
El método .plot() es útil para mostrar las columnas de tu marco de datos. En este ejemplo, muestro el eje x como la columna "fecha", y el importe de la columna "cierre" como el eje y, visualizado mediante un gráfico de líneas.
stocks_df.plot(x="date", y="close")
<AxesSubplot:xlabel='date'>
4. Sugerencias para aplicaciones prácticas:
Esta visión general de Python para la ciencia de datos sólo ha arañado la superficie. Hay un montón de aplicaciones prácticas que puedes emplear con Python en la ciencia de datos en varios sectores, como la pérdida de clientes, la previsión de ventas, la clasificación de imágenes, la clasificación de productos, el análisis de sentimientos, la detección de fraudes con tarjetas de crédito y los sistemas de recomendación. Tutorial para principiantes de DataCamp: Sistemas de Recomendación en Python demuestra cómo recomendar con éxito películas a la gente basándose en una variedad de factores con el uso del aprendizaje automático. Otro caso de uso popular de la ciencia de datos en el sector financiero es la detección del fraude con tarjetas de crédito, que se explica en Detección del fraude con tarjetas de crédito mediante un algoritmo de aprendizaje automático. Como puedes ver, no sólo hay un montón de casos de uso específicos de la ciencia de datos, sino que también hay casos de uso específicos de la industria.
Para una introducción más profunda a Python, consulta el curso Introducción a Python de DataCamp, o descubre más cosas sobre cómo aprender Python en nuestro blog, donde puedes leer sobre las mejores certificaciones de Python y encontrar algunas alternativas que ofrece DataCamp.
Cursos superiores
Course
Introducción a la Ciencia de Datos en Python
Course
Introducción a Python para Finanzas
blog
Tutorial: cómo instalar Python en macOS y Windows
blog
Cómo aprender Python desde cero en 2024: Guía del experto
tutorial
Tutorial de funciones de Python
tutorial
Tutorial de pandas en Python: la guía definitiva para principiantes
tutorial
Tutorial de Excel en Python: La guía definitiva
tutorial