O SQL é uma habilidade imprescindível para qualquer aspirante a profissional de dados. Muitas empresas modernas armazenam grandes quantidades de dados em várias tabelas de bancos de dados relacionais. Para extrair os dados necessários de um banco de dados para posterior manipulação e análise de dados, você deve ter um bom conhecimento de SQL.
A criação de projetos SQL pode beneficiar você de pelo menos três maneiras:
- Pratique suas habilidades atuais em SQL
- Desenvolver novas habilidades
- Crie seu portfólio de dados para mostrar suas habilidades em SQL a possíveis empregadores.
Este artigo discutirá várias ideias para projetos SQL prontos para o portfólio. Quer você seja um iniciante em SQL ou um profissional mais avançado, encontrará vários tópicos interessantes para explorar.
Torne-se um engenheiro de dados
Projetos SQL para iniciantes
Se você já está familiarizado com os conceitos básicos de SQL, está pronto para seu primeiro projeto de SQL. Certifique-se de que você tenha as seguintes habilidades:
- Realização de operações matemáticas
- Agregação e descrição de dados (mínimo, máximo, média, contagem e soma)
- Filtragem de dados com base em uma determinada condição ou em várias condições
- Agrupamento de dados
- Dados do pedido
- Limitação dos dados de saída
- União de registros simples (uniões internas)
- Aliasing de colunas ou tabelas
Para uma rápida atualização, dê uma olhada na nossa Folha de consulta de noções básicas de SQL.
No início, não há problema algum em realizar projetos simples de manipulação de dados com uma única tarefa. Você sempre pode melhorar e expandir esses projetos mais tarde, quando tiver mais conhecimento de SQL e adquirir novas habilidades.
1. Análise das emissões de carbono do setor
No projeto Analyzing Industry Carbon Emissions (Analisando as emissões de carbono do setor ), você usará o conjunto de dados disponível sobre as emissões de carbono de produtos (que compõem mais de 75% das emissões globais e representam um sério problema ecológico) para explorar a pegada de carbono de vários setores do ano mais recente e determinar os setores com maior emissão.
Embora este seja um projeto introdutório de tarefa única, talvez você precise passar pelas lições do curso Intermediate SQL: Resumindo subconjuntos e filtrando dados agrupados.
2. Analisando a saúde mental dos alunos no SQL
No projeto Analyzing Students' Mental Health in SQL, você usará suas habilidades em PostgreSQL para analisar os dados dos alunos de uma universidade internacional japonesa e identificar um dos fatores que mais influenciam a saúde mental dos alunos internacionais.
A pesquisa realizada pela universidade demonstrou que os principais desafios para os alunos internacionais são a conexão social e o estresse associado ao ingresso em uma nova cultura. Sua tarefa específica para esse projeto SQL para iniciantes será concentrar-se em um fator contribuinte específico - o tempo de permanência e como ele afeta as pontuações médias de diagnóstico dos alunos internacionais.
3. Análise das vendas de peças de motocicletas
No projeto SQL Analyzing Motorcycle Part Sales, você analisará os dados de uma empresa que vende peças de motocicletas para obter insights sobre suas vendas no atacado ao longo do tempo em três locais de depósito e ajudá-la a entender seus fluxos de receita. Mais precisamente, você determinará a receita líquida que a empresa gera em suas linhas de produtos por mês e por depósito.
Para este projeto, você também precisará de habilidades sólidas de geração de relatórios, além de suas habilidades em SQL. O curso Data-Driven Decision Making in SQL pode ajudar você a aprimorar suas habilidades nessa área.
Projetos SQL intermediários
Embora a criação de projetos SQL curtos de tarefa única seja um bom começo, em algum momento da sua jornada de aprendizado, você chegará ao ponto em que desejará criar algo mais interessante e explorar os dados de vários ângulos. A boa notícia é que, para esses projetos multitarefa, ter as mesmas habilidades essenciais de SQL listadas no início do capítulo anterior ainda é suficiente.
4. Quais são e onde estão as empresas mais antigas do mundo?
No projeto SQL What and Where are the World's Oldest Businesses (O que e onde estão as empresas mais antigas do mundo ), você examinará os dados do BusinessFinancing.co.uk para descobrir as empresas mais antigas do mundo - aquelas que sobreviveram às mudanças nas condições do mercado por centenas de anos e ainda estão em operação. Você obterá muitas descobertas curiosas:
- O intervalo dos anos de fundação das empresas mais antigas do mundo
- A empresa mais antiga do mundo e o setor ao qual ela pertence
- Quantas empresas - e quais delas - foram fundadas antes do ano 1000 d.C.?
- Os setores mais comuns aos quais pertencem as empresas mais antigas
- As empresas mais antigas por continente
- Os setores mais comuns para as empresas mais antigas de cada continente
Como os dados desse projeto SQL intermediário estão contidos em várias tabelas de banco de dados diferentes, para muitas tarefas, você precisará usar técnicas de união para mesclar os dados necessários para muitas tarefas. Você pode consultar o curso Unindo dados com SQL para saber como fazer isso.
5. Análise das pontuações dos resultados dos testes das escolas públicas de Nova York
No projeto Analyzing NYC Public School Test Result Scores, você trabalhará com um banco de dados SQL que contém as pontuações do SAT (Scholastic Aptitude Test) das escolas públicas da cidade de Nova York para determinar o desempenho nos testes dessas escolas. Você examinará os seguintes aspectos:
- Quantas escolas não relatam informações
- Quais (ou quantas) escolas são as melhores/piores em cada um dos três componentes do SAT - leitura, matemática e redação
- As melhores/piores pontuações para diferentes componentes do SAT
- As 10 melhores escolas por pontuação média total no SAT
- Como o desempenho do teste varia de acordo com o bairro
- As 5 melhores escolas por pontuação média no SAT em todos os três componentes (ou em um determinado componente) em um bairro selecionado
Sempre que você tiver dúvidas sobre qual comando usar (e como usá-lo) em cada caso específico para esse projeto de SQL intermediário, fique à vontade para consultar este tutorial abrangente -Comandos SQLpara cientistas de dados.
6. Analisar estatísticas de dívidas internacionais
No projeto Analyze International Debt Statistics (Analisar estatísticas da dívida internacional ), você investigará os dados da dívida internacional coletados pelo Banco Mundial, uma organização global que financia países para administrar suas economias. Você revelará alguns fatos e números interessantes, incluindo:
- O número de países com dívida
- O valor total da dívida de todos os países
- O país com a maior dívida e o valor de sua dívida
- O valor médio da dívida dos países em diferentes indicadores de dívida
- O indicador de dívida mais comum
Projetos SQL para nível avançado
Para prosseguir com projetos SQL mais avançados que possam efetivamente ajudá-lo a se destacar da multidão, você deve estar confortável com técnicas mais avançadas, além das essenciais listadas na primeira seção. Verifique se você sabe como fazer as seguintes coisas no SQL:
- Usar todos os tipos de uniões (incluindo uniões automáticas)
- Correspondência e extração de padrões
- Como lidar com a lógica if/then/else no SQL
- Criando visualizações
- Criação de consultas aninhadas complexas
- Uso de expressões de tabela comuns
- Aplicação de funções de janela SQL
- Truncando dados
- Dados de rotulagem
- Aplicação de operadores de conjunto
- Trabalhar com datas e horários
7. Análise de empresas unicórnio
No projeto Analisando empresas unicórnio, sua tarefa será descobrir quantas empresas atingiram uma avaliação de mais de 1 bilhão de dólares em diferentes setores em um determinado período de tempo.
Especificamente, você precisará identificar os três setores com melhor desempenho com base no número de novas empresas de alto crescimento criadas nesse período, encontrar o número de unicórnios que surgiram nesses setores por ano, o ano em que cada uma dessas empresas se tornou um unicórnio e sua avaliação média em bilhões de dólares. E todas essas informações você pode obter em apenas uma consulta!
Para este projeto, você usará um banco de dados PostgreSQL com várias tabelas. Para se atualizar em algumas habilidades importantes, você pode encontrar estes cursos: Funções para manipulação de dados no PostgreSQL e limpeza de dados em bancos de dados PostgreSQL.
8. Otimização da receita de varejo de esportes on-line
No projeto Otimização da receita de varejo de esportes on-line, você analisará os dados de produtos de uma empresa de roupas esportivas on-line com o objetivo final de desenvolver recomendações para que a empresa maximize sua receita. Você lidará com uma grande variedade de informações mantidas em várias tabelas. As informações incluem preços, descontos, receita, classificações, resenhas, descrições de produtos e tráfego do site. Você responderá a perguntas como:
- Qual é a diferença entre os preços dos produtos da Nike e da Adidas?
- Há alguma diferença no valor do desconto oferecido entre as marcas?
- Existe alguma correlação entre receita e avaliações? E, em caso afirmativo, qual é a força dele?
- O tamanho da descrição de um produto influencia a classificação e as avaliações do produto?
- Há alguma tendência ou lacuna no volume de revisões por mês?
- Quanto do estoque da empresa consiste em itens de calçados? Qual é a receita média gerada por esses produtos?
- Qual é a diferença entre a receita média dos calçados e a dos produtos de vestuário?
Neste projeto, você precisará aplicar habilidades avançadas de SQL, como agregação, resumo, truncamento, limpeza, rotulagem, conversão, expressões de tabela comuns, correlação e trabalho com datas e horas. Todas essas técnicas são abordadas no curso Exploratory Data Analysis in SQL.
9. Quando foi a era de ouro dos videogames?
Na seção Quando foi a era de ouro dos videogames? SQL, você analisará os 400 videogames mais vendidos lançados desde 1977 para identificar se o mercado de jogos melhorou ou não com o tempo e quando foi a época mais próspera. Para isso, você trabalhará com anos de lançamento de videogames, pontuações de críticos e usuários e dados de vendas. Você pesquisará os seguintes insights:
- Os 10 videogames mais vendidos de todos os tempos e o período em que foram lançados
- Os 10 anos com as maiores médias de crítica e muitos sucessos produzidos
- Os 10 anos com as maiores pontuações médias de usuários e muitos acessos produzidos
- Os anos com as maiores pontuações médias de críticos e jogadores e muitos sucessos produzidos
- O número de jogos vendidos naqueles anos
Para executar as tarefas acima neste projeto de SQL para usuários avançados, você precisará usar vários tipos de junções e operadores de conjunto, portanto, certifique-se de aprimorar essas habilidades com a Folha de dicas de junções de SQL.
10. Análise das tendências americanas de nomes de bebês
No projeto Analisando as tendências de nomes de bebês americanos, você estudará os dados fornecidos pelo U.S. Social Security Administration contendo nomes próprios, que foram dados a mais de 5.000 bebês americanos a cada ano durante o período de 101 anos. O principal objetivo é entender como os gostos dos nomes de bebês americanos mudaram, investigando as tendências de popularidade. Em especial, você descobrirá:
- Nomes americanos clássicos há mais de 100 anos
- O tipo de popularidade de cada nome: atemporal vs. moderno
- Os 10 principais nomes femininos
- O nome feminino mais popular terminado em "a" desde 2015
- Os nomes masculinos mais populares por ano
- O nome masculino mais popular pelo maior número de anos
Para esse projeto avançado, você pode achar útil o curso Manipulação de dados em SQL.
Considerações finais
Neste artigo, delineamos várias ideias de projetos SQL para todos os níveis de competência em SQL. Além disso, apresentamos uma visão geral das habilidades que você precisará para cada projeto e os recursos de aprendizado para adquiri-las e aperfeiçoá-las.
Agora que você está totalmente pronto para começar a criar esses projetos SQL e aumentar seu portfólio profissional. Nunca é muito cedo ou muito tarde para você começar a dominar e mostrar suas habilidades!
Depois de ter seu portfólio de projetos SQL pronto para ser usado, você também deve se familiarizar com as principais perguntas de entrevista sobre SQL para impressionar os possíveis empregadores na fase de entrevista.
Torne-se certificado em SQL
Cientista de Dados Certificado pela IBM (2020), anteriormente Geólogo de Petróleo/Geomodelador de campos de petróleo e gás em todo o mundo com mais de 12 anos de experiência de trabalho internacional. Você é proficiente em Python, R e SQL. Áreas de especialização: limpeza de dados, manipulação de dados, visualização de dados, análise de dados, modelagem de dados, estatística, storytelling, machine learning. Ampla experiência no gerenciamento de comunidades de ciência de dados e na redação/revisão de artigos e tutoriais sobre ciência de dados e tópicos de carreira.
blog
6 projetos do Tableau para ajudar a desenvolver suas habilidades
blog
Um guia abrangente para a certificação SQL no DataCamp
blog
8 projetos do Power BI para desenvolver suas habilidades
blog
Mais de 60 projetos Python para todos os níveis de conhecimento
Bekhruz Tuychiev
16 min
blog
O que é SQL? - A linguagem essencial para o gerenciamento de bancos de dados
Summer Worsley
16 min
tutorial