Ir al contenido principal

Tutorial de BigQuery para principiantes: de la configuración a tu primera consulta

Descubre qué es BigQuery, cómo funciona, en qué se diferencia de los data warehouses tradicionales y cómo usar la consola de BigQuery para consultar datasets públicos de Google.
Actualizado 21 may 2026  · 9 min leer

Mi contacto con el big data empezó hace más de 10 años, cuando trabajaba como ingeniero de software en Ad-Tech. Por entonces, los datasets crecían sin freno. Era una gran oportunidad, pero también un reto: las consultas para responder preguntas básicas de reporting tardaban horas.

Como respuesta, en 2013 empecé a usar bases de datos orientadas a columnas como BigQuery. Al estar en la nube, nos permitían ejecutar cargas analíticas con buen rendimiento y a un coste razonable, además de escalar recursos cuando era necesario. En los últimos años, lideré un equipo amplio de data engineers que construyó un data warehouse en BigQuery de más de 10 PB para dar soporte a un catálogo de productos para el hogar en rápido crecimiento y a necesidades analíticas en aumento.

Ahora, como CTO de DataCamp, dirijo equipos de ingeniería y de contenido que ayudan a nuestros usuarios a aprender y practicar precisamente estas habilidades (entre muchas otras). Estoy convencido de que los data warehouses en la nube como BigQuery hacen muchos flujos de trabajo mucho más eficientes. Por eso quiero compartir mi experiencia contigo en este tutorial.

En esta guía aprenderás qué es BigQuery, cómo funciona y en qué se diferencia de los data warehouses tradicionales. Verás cómo usar la consola de BigQuery para consultar datasets públicos de Google con un ejemplo práctico consultando Google Trends para descubrir temas populares.

TL;DR

  • BigQuery es el data warehouse totalmente gestionado y sin servidores de Google Cloud que te permite consultar petabytes de datos usando SQL estándar
  • Separa el almacenamiento del cómputo, de modo que cada uno escala de forma independiente sin gestionar infraestructura
  • El sandbox gratuito te ofrece 1 TiB de consultas al mes y acceso a datasets públicos sin necesidad de tarjeta de crédito
  • BigQuery usa un formato de almacenamiento columnar optimizado para cargas analíticas (OLAP), a diferencia de las bases de datos orientadas a filas para OLTP
  • BigQuery ML te permite crear y desplegar modelos de machine learning directamente en el warehouse usando SQL

¿Qué es BigQuery?

BigQuery es un data warehouse totalmente gestionado y serverless desarrollado por Google para almacenar y analizar datos a gran escala. Las organizaciones lo usan para ejecutar consultas analíticas sobre petabytes de datos con SQL, sin tener que gestionar ninguna infraestructura.

Puedes interactuar con BigQuery desde la consola de Google Cloud, la herramienta de línea de comandos bq o las librerías cliente para Python, Java, Go, Node.js, C#, PHP y Ruby.

BigQuery también incluye machine learning integrado (BigQuery ML), que te permite crear y ejecutar modelos de ML directamente en el warehouse usando SQL. También puedes importar modelos entrenados externamente desde Vertex AI u otros frameworks.

Este tutorial está pensado para data analysts, data engineers y administradores de data warehouses que empiezan con BigQuery. Si después quieres profundizar, nuestro curso Introduction to BigQuery cubre optimización de consultas y flujos de trabajo avanzados. También puedes explorar nuestra guía de BigQuery Sandbox y el tutorial completo de data warehousing en GCP

Data warehouse tradicional vs en la nube

Un data warehouse tradicional se despliega on‑premise, normalmente con altos costes iniciales, un equipo experto para gestionarlo y una planificación rigurosa para crecer con la demanda debido a la rigidez al escalar recursos en centros de datos tradicionales.

Un data warehouse en la nube, en cambio, lo gestiona y aloja un proveedor de servicios cloud. Algunos ejemplos son Google BigQuery, Amazon Redshift y Snowflake.

Ventajas de los data warehouses en la nube

Por lo general, un data warehouse en la nube ofrece varias ventajas frente a los tradicionales:

  • Están diseñados para escalar y aprovechar la flexibilidad del entorno cloud
  • Mayor velocidad y rendimiento
  • Precios flexibles y un entorno cloud que permiten optimizar costes (por ejemplo, reducir capacidad en periodos de baja demanda)
  • Pueden estar totalmente o parcialmente gestionados, lo que reduce costes operativos

Bases de datos orientadas a filas vs a columnas

Ejemplo de base de datos orientada a filas:

image20.jpg

Ejemplo de base de datos orientada a columnas:

image17.png

Las bases de datos orientadas a filas funcionan muy bien para búsquedas de filas completas, inserciones y actualizaciones. Pero se resienten con cargas analíticas.

Por ejemplo, si consultas tres columnas de una tabla con 50, una base de datos orientada a filas sigue leyendo las 50 columnas de cada fila. Una base orientada a columnas lee solo las tres que necesitas, lo que es mucho más rápido para analítica como previsión de productos o reporting ad‑hoc.

Las bases orientadas a filas suelen ser adecuadas para el procesamiento de transacciones en línea (OLTP) y las orientadas a columnas para el procesamiento analítico en línea (OLAP).

OLTP vs OLAP

  • OLTP es un tipo de sistema de base de datos usado en aplicaciones orientadas a transacciones. "Online" implica que se espera que respondan a las solicitudes del usuario y las procesen en tiempo real (es decir, procesen transacciones).
  • El término contrasta con el procesamiento analítico en línea (OLAP), que se centra en el análisis de datos.

Resumen de la comparación:

 

Base orientada a filas

Base orientada a columnas

Almacenamiento

Por fila

Por columna

Recuperación de datos

Registros completos

Columnas relevantes

Aplicación típica

OLTP

OLAP

Operaciones rápidas

Inserciones, actualizaciones, búsquedas

Consultas para reporting

Carga de datos

Normalmente registro a registro

Normalmente por lotes

Opciones populares

Postgres, MySQL, Oracle, Microsoft SQL Server

Snowflake, Google BigQuery, Amazon Redshift

¿Cómo funciona BigQuery?

BigQuery separa el motor de cómputo del almacenamiento, de modo que cada uno puede escalar por separado. Resultado: puedes consultar terabytes en segundos y petabytes en minutos.

Cuando BigQuery ejecuta una consulta, el motor distribuye el trabajo en paralelo, escanea las tablas relevantes en almacenamiento, combina los resultados y devuelve el conjunto final de datos.

image13.png

Funciones clave de BigQuery en 2026

Desde su lanzamiento, Google ha añadido varias funciones que llevan BigQuery más allá de un data warehouse tradicional:

  • BigQuery ML — Crea, entrena y despliega modelos de machine learning usando SQL. Compatible con regresión lineal, clasificación, previsión de series temporales y más.
  • Gemini en BigQuery — Asistencia con IA para escribir consultas, entender esquemas y generar insights en lenguaje natural.
  • BigQuery Studio — Un espacio de trabajo unificado para SQL, notebooks de Python y Spark dentro de la consola de BigQuery.
  • Consultas federadas — Consulta datos en Cloud SQL, Cloud Storage, Bigtable y otras fuentes sin moverlos a BigQuery.
  • BigQuery Omni — Ejecuta analítica de BigQuery sobre datos almacenados en AWS o Azure sin copiarlos a Google Cloud.

Cómo empezar con BigQuery

El sandbox de BigQuery te permite probar BigQuery sin tarjeta de crédito ni cuenta de facturación. En esta sección te explico cómo acceder a BigQuery y configurar tu primer proyecto usando el sandbox.

Puedes acceder a BigQuery desde la Google Cloud Console. Tendrás que iniciar sesión con una cuenta de Google (o crear una). Una vez dentro, verás una pantalla de bienvenida:

image4.png

Encontrarás BigQuery en el menú de la izquierda. Al hacer clic, irás a la siguiente pantalla:

image1.png

Usar el sandbox de BigQuery

Para usar el sandbox de BigQuery, primero crea un proyecto haciendo clic en «Select Project».

image14.png

Después, haz clic en «New Project»:

image3.png

Tendrás que indicar un nombre de proyecto; para esta guía usamos datacamp-guide-project

image7.png

Ahora verás un aviso del sandbox en la página de BigQuery que confirma que has activado correctamente el sandbox de BigQuery.

image16.png

Con el sandbox de BigQuery activado, ya puedes usar tu nuevo proyecto para cargar y consultar datos, así como para consultar datasets públicos de Google.

Crear un dataset y una tabla

Antes de crear una tabla, necesitas crear un dataset en tu nuevo proyecto. Un dataset es un contenedor de nivel superior que se usa para organizar y controlar el acceso a un conjunto de tablas y vistas. Para crearlo, haz clic en el icono «Actions» del proyecto:

image18.png

Para esta guía, rellenaremos «Dataset ID» con «main».

image8.png

Puedes crear una tabla con SQL. BigQuery usa GoogleSQL, compatible con ANSI.

CREATE TABLE datacamp-guide-project.main.users (
  id INT64 NOT NULL,
  first_name STRING NOT NULL,
  middle_name STRING,
  last_name STRING NOT NULL,
  active_account BOOL NOT NULL
);

También puedes usar la interfaz de la consola de BigQuery:

image19.png

Nota: No es posible insertar datos en el entorno de sandbox. Si quieres probar inserciones, debes activar la prueba gratuita. Las siguientes secciones se centran en consultar los datasets públicos que ofrece Google Cloud.

Consultar un dataset público con la consola de BigQuery

Para consultar un dataset público, sigue estos pasos:

1. Haz clic en «Add» junto a Explorer.

image10.png

2. Luego, elige un dataset.

image2.png

3. Busca «Google Trends» y elige Google Trends, y luego haz clic en el botón «View dataset».

image6.png

4. bigquery-public-data aparecerá con una larga lista de datasets. Pon una estrella a bigquery-public-data para que quede «fijo» en el explorador

image5.png

Usaremos la tabla top_terms:

image12.png

Haz clic en la tabla top_terms para abrirla y revisa las pestañas Details y Preview para conocer mejor los datos de top_terms.

image9.png

image21.png

Puedes consultar el dataset; por ejemplo, para obtener los términos que han ocupado la primera posición en las dos últimas semanas:

SELECT
  term
FROM
  bigquery-public-data.google_trends.top_terms
WHERE
  rank = 1
  AND refresh_date >= DATE_SUB(CURRENT_DATE(), INTERVAL 2 WEEK)
GROUP BY
  term

Resultados (variarán):

image11.png

Precios de BigQuery

La tarificación de BigQuery tiene dos componentes principales: cómputo (procesamiento de consultas) y almacenamiento.

Componente Gratuito Precio
Consultas bajo demanda 1 TiB al mes 6,25 $ por TiB
Almacenamiento (activo) 10 GiB 0,02 $ por GiB/mes
Almacenamiento (a largo plazo) 10 GiB 0,01 $ por GiB/mes
Inserciones en streaming N/D 0,05 $ por 200 MB

Para equipos con cargas de trabajo predecibles, BigQuery también ofrece precio fijo mediante reservas de capacidad (BigQuery Editions). Consulta la página oficial de precios para ver las tarifas actuales.

Conclusiones

BigQuery es una de las puertas de entrada más accesibles al data warehousing en la nube. El sandbox te da un entorno sin riesgo para experimentar, y el 1 TiB de consultas gratuitas al mes te permite explorar datasets públicos sin gastar nada. Cuando necesites más, la prueba gratuita de Google Cloud incluye 300 $ en créditos.

Si quieres seguir aprendiendo, te recomiendo el curso Introduction to BigQuery en DataCamp, que cubre optimización de consultas y trabajo con datasets más grandes. Para una visión más amplia de data engineering, el itinerario Data Engineer in Python abarca todo el pipeline, desde la ingesta hasta el warehousing.

También puedes comparar BigQuery con alternativas en nuestras guías BigQuery vs Redshift y BigQuery vs Snowflake, o prepararte para entrevistas con nuestra guía de preguntas de entrevista sobre BigQuery.


Eduardo Oliveira's photo
Author
Eduardo Oliveira
LinkedIn

Director de Tecnología de DataCamp y Director General de la Plataforma de Aprendizaje. En mi puesto, dirijo los equipos que se centran en crear la tecnología y el plan de estudios que impulsan la experiencia de los alumnos de DataCamp.

Temas

¡Empieza hoy con data engineering!

programa

Ingeniero de Datos Asociado en SQL

30 h
¡Aprende los fundamentos de la ingeniería de datos: diseño de bases de datos y almacenamiento de datos, trabajando con tecnologías como PostgreSQL y Snowflake!
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado

blog

¿Qué es la gestión de datos? Guía práctica con ejemplos

Aprende los conceptos y teorías fundamentales de la gestión de datos, junto con algunos ejemplos prácticos. Utiliza estas habilidades en tu trabajo diario de ciencia de datos para generar datos limpios y útiles para tus modelos.
Tim Lu's photo

Tim Lu

12 min

Tutorial

Tutorial de Power BI para principiantes

Aprende los fundamentos de Power BI y a crear un informe básico con este tutorial paso a paso.
DataCamp Team's photo

DataCamp Team

Tutorial

Tutorial de Modelado de datos en Power BI

Descubre qué es el modelado de datos en Power BI y cómo unas buenas prácticas de modelado de datos pueden llevar tus informes de Power BI al siguiente nivel.
Joleen Bothma's photo

Joleen Bothma

Tutorial

Primeros pasos con AWS Athena: Guía práctica para principiantes

Esta guía práctica te ayudará a empezar a utilizar AWS Athena. Explora su arquitectura y características y aprende a consultar datos en Amazon S3 utilizando SQL.
Tim Lu's photo

Tim Lu

Tutorial

Ejemplos y tutoriales de consultas SQL

Si quiere iniciarse en SQL, nosotros le ayudamos. En este tutorial de SQL, le presentaremos las consultas SQL, una potente herramienta que nos permite trabajar con los datos almacenados en una base de datos. Verá cómo escribir consultas SQL, aprenderá sobre
Sejal Jaiswal's photo

Sejal Jaiswal

Tutorial

Tutorial de Power BI DAX para principiantes

Aprende qué es DAX y descubre la sintaxis y las funciones DAX fundamentales que necesitarás para llevar tus conocimientos de Power BI al siguiente nivel.
Joleen Bothma's photo

Joleen Bothma

Ver másVer más