curso
Visualización de datos con Power BI
Nuestro objetivo como analistas de datos es organizar las percepciones de nuestros datos de forma que todo el que los vea sea capaz de comprender sus implicaciones y actuar en consecuencia.
Power BI es un servicio de análisis empresarial basado en la nube de Microsoft que permite a cualquiera visualizar y analizar datos, con mayor rapidez y eficacia. Es una herramienta de BI potente y flexible para conectar con una gran variedad de datos y analizarlos. Muchas empresas incluso lo consideran indispensable para el trabajo relacionado con la ciencia de datos. La facilidad de uso de Power BI se debe a que tiene una interfaz de arrastrar y soltar. Esta función ayuda a realizar tareas como ordenar, comparar y analizar, de forma muy fácil y rápida. Power BI también es compatible con múltiples fuentes, como Excel, SQL Server y repositorios de datos basados en la nube, lo que lo convierte en una excelente opción para los Científicos de Datos.
1. Visión general de Power BI
Visión general
Power BI ofrece la posibilidad de analizar y explorar datos tanto in situ como en la nube. Power BI ofrece la posibilidad de colaborar y compartir cuadros de mando personalizados e informes interactivos entre colegas y organizaciones, de forma fácil y segura.
Visión general de Power BI. Fuente: Microsoft
Componentes de Power BI
Power BI consta de varios componentes que están disponibles en el mercado por separado y pueden utilizarse de forma exclusiva.
Componentes de Power BI. Fuente: Wikipedia
Elegir con qué componente trabajar depende principalmente del proyecto o de un equipo. Nosotros, sin embargo, trabajaremos con Power BI desktop, ya que se trata de un componente utilizado principalmente para la generación de informes empresariales y la creación de escritorios. Además, todos los demás trabajos suelen comenzar en el escritorio de Power BI, donde tiene lugar la creación del informe.
Introducción a Power BI
Para una gran introducción práctica sobre cómo navegar por la plataforma Power BI, sigue el curso de DataCamp, Introducción a Power BI.
2. Ventajas de utilizar Power BI
Power BI proporciona ciertas ventajas que lo hacen superior a las herramientas analíticas existentes:
- Ofrece una interfaz basada en la nube y otra de escritorio.
- Proporciona funciones como el almacenamiento de datos, el descubrimiento de datos y los cuadros de mando interactivos.
- Capacidad para cargar visualizaciones personalizadas, y
- Fácilmente escalable en toda la organización.
3. Power BI Desktop
Power BI es una aplicación gratuita que se puede descargar e instalar en el sistema. Puede conectarse a múltiples fuentes de datos. Normalmente, un trabajo de análisis comienza en Power BI Desktop, donde tiene lugar la creación del informe. A continuación, el informe se publica en el servicio Power BI, desde donde se puede compartir con las aplicaciones móviles de Power BI para que la gente pueda ver los informes incluso en los móviles.
Power BI Desktop. Fuente: Microsoft
Instalación
Power BI sólo funciona en máquinas Windows. Los usuarios de Mac pueden crear una máquina virtual de Windows en Azure y cargar Power BI en ella o utilizar Turbo.net, que puede transmitir Power BI al Mac directamente desde la nube.
Power BI puede utilizarse de dos formas:
- Como una aplicación de la tienda de Microsoft y sólo tienes que iniciar sesión para empezar. Esta es la versión online de la herramienta.
- Descarga el software localmente y luego instálalo. Asegúrate de leer todas las instrucciones de instalación.
Según el producto elegido, descarga el software en el ordenador. Tras aceptar el acuerdo de licencia, comprueba la instalación haciendo clic en el icono/App de Power BI. Si aparece la siguiente pantalla, ya puedes continuar.
4. Cómo empezar
Ahora vamos a hacernos una idea de cómo trabajar con Power BI Desktop. En esta sección, lo exploraremos un poco para acostumbrarnos a su interfaz.
Espacio de trabajo de Power BI
La siguiente imagen muestra los principales componentes del espacio de trabajo de Power BI.
Vistas básicas
-
Ver informe: Esta es la vista principal donde se crea el Cuadro de Mando.
-
Vista de datos: La vista de datos ofrece una vista previa de todos los datos.
- Vista de la relación: La vista de relación muestra la relación entre varios objetos.
Conectarse a una fuente de datos
Power BI puede conectarse a varias fuentes de datos. El icono Obtener datos muestra todas las posibles opciones disponibles desde las que se pueden importar datos a Power BI.
Veamos algunas de las fuentes de datos más utilizadas:
Excel data
Vamos a conectarnos a una fuente de datos de Excel. Los libros de trabajo constan de algunos datos financieros falsos. Descarga el archivo desde aquí. Power BI Desktop carga el libro de trabajo y lee su contenido, y te muestra los datos del archivo mediante la ventana Navegador.
Una vez cargados, los datos pueden verse en el panel Campos.
Web
También puedes utilizar los datos de la web. He aquí un conjunto de datos que presenta los mejores y los peores estados para la jubilación en EE.UU.
enlace: https://www.bankrate.com/retirement/best-and-worst-states-for-retirement/
Sólo tienes que seleccionar Web
como opción en Get Data
e introducir el nombre de la url.
Prueba también a experimentar con otras fuentes de datos.
5. Transformación de datos
Una vez cargados los datos, serán visibles en la pestaña Fields
. Desde aquí, podemos modificar nuestros conjuntos de datos con ayuda del Editor de consultas. El editor de consultas puede utilizarse para modificar conjuntos de datos, independientemente de su origen. Podemos hacer manipulaciones como renombrar un conjunto de datos, eliminar una o varias columnas, etc. en el editor de consultas. Puedes acceder al Editor de Consultas haciendo clic en el botón Edit Queries
de la Cinta de Inicio.
Crear una columna personalizada
Utilizando los mismos datos Financieros, que utilizamos anteriormente, vamos a dar forma a los datos para satisfacer nuestras necesidades. Vamos a crear una columna personalizada llamada New Manufacturing Price
, que es igual a:
([manufacturing Price])*3
Cambiar los tipos de datos de las columnas
Los tipos de datos de las columnas también se pueden cambiar fácilmente. La columna Units Sold
tiene un tipo de dato de coma flotante que puede ajustarse a un número entero.
Eliminar columnas
Eliminar columnas también es fácil. Sólo tienes que seleccionar la columna que desees y elegir la opción Remove Columns
, como se muestra en la figura siguiente. Deshagámonos de la columna Discount
, ya que no añade ningún valor a nuestro conjunto de datos.
Del mismo modo, hay otras multitud de funciones que se pueden llevar a cabo, como eliminar y añadir filas, transponer, pivotar y dividir, que se pueden realizar fácilmente mediante el editor de consultas. Ten en cuenta que todos los pasos que das para transformar tus datos también aparecen en el panel Query Settings
.
6. Informes
Los informes son un conjunto de visualizaciones que pueden crearse en una o varias páginas. Estas visualizaciones suelen estar relacionadas entre sí.
7. Cuadro de mandos
Un cuadro de mando es una colección de varias vistas, que permite comparar diversos datos simultáneamente. Mientras que el informe puede abarcar varias páginas, un Cuadro de Mando es una interfaz de una sola página.
Crear un cuadro de mando
Una vez que tengamos listo el conjunto de datos con todas las manipulaciones realizadas, podemos proceder al proceso de creación del Cuadro de Mando. Un cuadro de mando de Power BI, también conocido como lienzo, consta de muchas visualizaciones en una sola página que ayudan a contar una historia. Estas visualizaciones, llamadas mosaicos, se anclan al panel de control desde los informes.
Intentemos ahora comprender qué perspectivas podemos obtener utilizando el conjunto de datos de la supertienda:-
- Ventas por país
- Ventas y beneficios por segmentos
- Ventas y beneficios por mes
- Ventas por Producto
- Beneficios por banda de descuento
El Cuadro de Mando creado es interactivo, lo que significa que un cambio en una baldosa afecta a las demás.
8. Integración de Power BI con R y Python
Aparte de las diversas ventajas de visualización que ofrece Power BI, también tiene una asombrosa capacidad de conexión inmediata. Power BI puede integrarse fácilmente con lenguajes como Python, R, e incluso con SGBD como SQL. Esto ofrece mayores ventajas en términos de funcionalidades y resulta muy útil para los Científicos de Datos que están acostumbrados a trabajar en Python o R. Pueden importar directamente los scripts de R y Python en el espacio de trabajo y aprovechar sus visualizaciones, que son muy superiores a las de estos lenguajes.
En esta sección aprenderemos a trabajar con scripts Python y R en R. Para aprender sobre la integración de SQL con Power BI, consulta nuestro tutorial SQL con Power BI.
Power BI y R
R es un popular lenguaje estadístico que se utiliza para realizar análisis sofisticados y análisis predictivos, como modelización lineal y no lineal, pruebas estadísticas, análisis de series temporales, clasificación, agrupación, etc. El uso de Power BI junto con R proporciona a los usuarios acceso a una colección rica y en constante expansión de bibliotecas de análisis estadístico y minería de datos para ayudarles a obtener una visión más profunda de sus datos.
Requisitos previos
Asegúrate de que tienes lo siguiente instalado y funcionando en tus sistemas locales:
- R
- Un entorno de desarrollo integrado (IDE) de R independiente, como R Studio.
También es importante señalar que:
- Sólo se importan tramas de datos
- Cualquier script de R que se ejecute durante más de 30 minutos se desconecta automáticamente.
Comprueba que R y R studio están instalados en tu sistema. Inicia Power BI y ve a Options and Settings -> Options
En Opciones, ve a la pestaña R Scripting y asegúrate de que puedes ver la versión correcta de R.
Uso de R Scripts en Power BI
Trabajar con scripts R en Power BI es un excelente recurso sobre este tema. A continuación encontrarás un resumen de la misma fuente.
1. Scripts R para importar datos
Puede haber ocasiones en las que no quieras importar un conjunto de datos completo, sino una parte de él. Puedes escribir un script en R para seleccionar sólo columnas o filas específicas de todo el conjunto de datos que se cargarán en Power BI.
Para esta demostración, trabajaremos con el conocido conjunto de datos Iris que se incluye en la distribución CRAN.
Los conjuntos de datos también se pueden importar desde archivos. Aquí tienes un ejemplo que muestra cómo cargar un archivo CSV en el espacio de trabajo con el siguiente script. Descarga el archivo desde aquí.
iris_csv <- read.csv(file="C:/Users/Parul/Desktop/Iris", header=TRUE, sep=",")
La mera importación de datos con un script de R no sirve para mucho. El uso real es cuando podemos manipular los datos durante la importación. El siguiente script utiliza las funciones summarize y group_by disponibles en el paquete R dplyr para agrupar y agregar los datos antes de importarlos:
Inicia R Studio e instala los siguientes paquetes:
install.packages("dplyr")
install.packages("data.table")
install.packages("ggplot2")
Ahora, utiliza el siguiente script R para importar los datos de Iris. Obtendremos un nuevo conjunto de datos llamado iris_mean que contiene la media de cada una de las cuatro medidas, agrupadas según los valores de la columna Especies (Fuente: Introducción a Power BI).
library(dplyr)
iris_mean <- summarize(group_by(iris, Species),
slength = mean(Sepal.Length), swidth = mean(Sepal.Width),
plength = mean(Petal.Length), pwidth = mean(Petal.Width))
2. Scripts R para transformar datos
Los scripts de R resultan útiles cuando queremos manipular datos que ya están importados en el espacio de trabajo. Supongamos que queremos aplicar las funciones summarize
y groupby
después de haber importado todos los datos. Esto se puede conseguir ejecutando R Script en el Editor de Consultas de la siguiente manera:
3. Scripts R para crear visualizaciones
Con la ayuda de los scripts de R, puedes crear visualizaciones en Power BI. Simplemente escribe el script y carga las librerías necesarias, y obtendrás visualizaciones similares a las de cualquier IDE de R. Repasemos los pasos:
- Importa el conjunto de datos Iris al espacio de trabajo.
- Haz clic en '
R script Visual
' en la pestaña de visualización, y aparecerá una imagen visual R de marcador de posición en el lienzo y un editor de scripts en la parte inferior. - Selecciona los campos que quieres incluir en el guión. Seleccionemos
PetalLengthCm ,PetalWidthCm
ySpecies
. Los campos seleccionados aparecen en la pestañaValues
, y el script R precargado aparece en el editor R. - El script crea un marco de datos llamado
dataset
con las columnas seleccionadas. Ahora puedes escribir aquí tu guión o hacer cambios en el existente. Peguemos el siguiente código que importa la biblioteca ggplot y crea un gráfico de dispersión.
library(ggplot2)
ggplot(data=dataset, aes(x=PetalWidthCm, y=PetalLengthCm)) +
geom_point(aes(color=Species), size=2) +
ggtitle("Petal Widths and Lengths") +
labs(x="Petal Width", y="Petal Length") +
theme_bw() +
theme(title=element_text(size=15, color="blue3"))
Power BI y Python
Python es un lenguaje de programación de uso general muy extendido, y se dispone de un gran número de bibliotecas de Python para realizar análisis estadísticos, modelos predictivos mediante algoritmos de aprendizaje automático.
Microsoft ha hecho posible recientemente integrar scripts de Python en Power BI, lo que permite ejecutar scripts de Python y obtener visuales de Python en Power BI. Veamos los pasos necesarios para hacer lo mismo. Pero antes hay algunos requisitos previos:
- Asegúrate de que Python está funcionando en tus sistemas locales.
- También deben cargarse todos los paquetes y bibliotecas necesarios, como pandas, matplotlib, etc.
- Actualmente, sólo se admite el marco de datos pandas.
- Cualquier script de Python que se ejecute durante más de 30 minutos se desconecta automáticamente.
- Es necesario activar Python para poder utilizarlo. Inicia Power BI y ve a
Options and Settings -> Options
En Options
, ve a la pestaña Preview Features
y activa "Soporte Python".
Reinicia Power BI y obtendrás el icono de Python tanto en la visualización como en la pestaña Transform
.
Hay varias formas de ejecutar scripts de Python en Power BI.
1. Ejecutar scripts Python exclusivamente
Pasos:
- Para ejecutar tu script Python, selecciona
Get Data > More>Other > Python script
como se muestra a continuación.
Ahora, simplemente pega aquí tu script Python en la ventana que se abre. Selecciona OK
para ejecutar el script que, a continuación, importa los conjuntos de datos resultantes al espacio de trabajo de Power BI Desktop.
2. Crear visualizaciones con Python
- Importa el conjunto de datos al espacio de trabajo. Vamos con el mismo conjunto de datos financieros, que corresponde a las finanzas de una empresa hipotética.
- Haz clic en '
Python Visuals
' en la pestaña de visualización y aparecerá una imagen visual de Python en el lienzo y un editor de scripts de Python en la parte inferior. - Selecciona los campos que quieres incluir en el guión. Seleccionemos
Sales
yProfit
. Los campos seleccionados aparecen en la pestañaValues
, y los scripts también aparecen en el editor de scripts de Python. - El script crea un marco de datos pandas llamado
dataset
con las columnas seleccionadas. Ahora puedes escribir aquí tu guión o hacer cambios en el existente. Peguemos el siguiente código que importa matplotlib y crea un gráfico.import matplotlib.pyplot as plt dataset.plot() plt.title("Sales Vs Profit") plt.show()
- Ejecuta el script y la visualización aparecerá en el lienzo. La visualización aparece como lo haría en cualquier IDLE de Python.
- A continuación, vamos a crear un gráfico de correlación. Selecciona
Discounts, gross Sales,
yUnits sold
además de los campos anteriores y sustituye el guión por este nuevo guión:import matplotlib.pyplot as plt plt.matshow(dataset.corr('pearson')) plt.show()
-
También podemos importar otras bibliotecas. Vamos a importar la biblioteca Seaborn, pero asegúrate de que está instalada en tu sistema. El conjunto de datos se llama "Consejos" y suele venir precargado con seaborn. Descarga el conjunto de datos desde aquí y cárgalo en el espacio de trabajo. A continuación, pega el siguiente código en el editor de scripts y obtendrás las tramas seaborn.
import matplotlib.pyplot as plt import seaborn as sns sns.set(style="darkgrid") sns.relplot(x="total_bill", y="tip", data=dataset) sns.relplot(x="total_bill", y="tip", hue="smoker", data=dataset); sns.relplot(x="total_bill", y="tip", hue="smoker",col="time", data=dataset); plt.show()
El Panel de Control con todas las visualizaciones de Python aparecerá finalmente así.
Panel Python
9. Guardar y publicar
Guardar y exportar archivos
Puedes guardar tus archivos como plantillas de Power BI. Las visualizaciones también se pueden exportar como archivos PDF.
Publicación
Los datos sólo son útiles cuando pueden compartirse entre personas u organizaciones. El cuadro de mando o los informes generados también se pueden compartir publicándolos en el Servicio Power BI. A continuación, podemos utilizar las aplicaciones Power BI para ver o interactuar con los cuadros de mando/informes.
10. Conclusión
Eso es todo lo que necesitamos saber para crear una buena visualización en Power BI aunque, uno puede encontrarse haciendo muchas más revisiones en cada etapa de las que hemos hecho aquí. Así, con la experimentación y la práctica, Power BI nos resultará mucho más familiar y dará rienda suelta a funciones asombrosas que nos ayudarán a analizar y presentar datos.
Conviértete en Analista de Datos de Power BI
Domina la herramienta de inteligencia empresarial más popular del mundo.
Cursos de Power BI
curso
Visualización de datos en Power BI
curso