Accéder au contenu principal

10 projets SQL pour tous les niveaux, prêts à être portés au portfolio

Choisissez votre premier ou prochain projet SQL pour mettre en pratique vos compétences SQL actuelles, en développer de nouvelles et créer un portfolio professionnel exceptionnel.
Actualisé 11 nov. 2024  · 11 min de lecture

SQL est une compétence indispensable pour tout scientifique ou ingénieur de données en herbe. De nombreuses entreprises modernes stockent de grandes quantités de données dans diverses tables de bases de données relationnelles. Pour extraire les données nécessaires d'une base de données en vue d'une manipulation et d'une analyse ultérieures, vous devez avoir une bonne maîtrise du langage SQL.

La mise en place de projets SQL peut vous apporter au moins trois avantages :

  1. Pratiquez vos compétences SQL actuelles
  2. Développer de nouvelles compétences
  3. Constituez votre portefeuille de données pour présenter vos compétences en SQL à des employeurs potentiels.

Cet article présente plusieurs idées de projets SQL prêts à être portés à l'actif de votre entreprise. Que vous soyez un débutant en SQL ou un praticien plus avancé, vous trouverez de nombreux sujets intéressants à explorer.

Projets SQL pour les débutants

Si vous êtes déjà familiarisé avec les concepts SQL de base, vous êtes prêt pour votre premier projet SQL. Assurez-vous de posséder les compétences suivantes :

  • Effectuer des opérations mathématiques
  • Agrégation et description des données (minimum, maximum, moyenne, nombre et somme)
  • Filtrer les données sur la base d'une ou de plusieurs conditions
  • Regroupement des données
  • Références de commande
  • Limitation des données de sortie
  • Jointure simple d'enregistrements (jointure interne)
  • Alias de colonnes ou de tables

Pour une mise à jour rapide, consultez notre aide-mémoire sur les bases du langage SQL.

Au tout début, il est tout à fait possible de réaliser des projets simples de manipulation de données à tâche unique. Vous pourrez toujours améliorer et développer ces projets plus tard, lorsque vous aurez acquis davantage de connaissances SQL et de nouvelles compétences.

1. Analyse des émissions de carbone de l'industrie

image1.jpg

Dans le cadre du projet " Analyse des émissions de carbone de l'industrie", vous utiliserez les données disponibles sur les émissions de carbone des produits (qui représentent plus de 75 % des émissions mondiales et constituent un grave problème écologique) pour étudier l'empreinte carbone de diverses industries au cours de l'année la plus récente et déterminer les industries qui émettent le plus de gaz à effet de serre.

Bien qu'il s'agisse d'un projet d'introduction à une tâche unique, il se peut que vous deviez suivre les leçons du cours SQL intermédiaire : Récapitulation des sous-ensembles et filtrage des données groupées.

2. Analyse de la santé mentale des étudiants dans SQL

image5.png

Dans le projet Analyse de la santé mentale des étudiants en SQL, vous utiliserez vos compétences en PostgreSQL pour analyser les données des étudiants d'une université internationale japonaise et repérer l'un des facteurs les plus influents sur la santé mentale des étudiants internationaux.

L'enquête menée par l'université a montré que les principales difficultés rencontrées par les étudiants étrangers sont les liens sociaux et le stress lié à l'intégration d'une nouvelle culture. Votre tâche particulière pour ce projet SQL débutant sera de vous concentrer sur un facteur contributif spécifique - la durée du séjour et son impact sur les résultats diagnostiques moyens des étudiants internationaux.

3. Analyse des ventes de pièces détachées pour motocycles

image3.jpg

Dans le projet SQL Analyse des ventes de pièces détachées de mot os, vous explorerez les données d'une entreprise qui vend des pièces détachées de motos afin d'obtenir des informations sur leurs ventes en gros au fil du temps sur trois sites d'entrepôt et de les aider à comprendre leurs flux de revenus. Plus précisément, vous déterminerez le montant des recettes nettes générées par l'entreprise pour l'ensemble de ses lignes de produits, par mois et par entrepôt.

Pour ce projet, vous aurez également besoin de solides compétences en matière de reporting, en plus de vos compétences en SQL. Le cours Data-Driven Decision Making in SQL peut vous aider à améliorer vos compétences dans ce domaine.

Projets SQL intermédiaires

Bien que l'élaboration de projets SQL courts à tâche unique soit un bon début, à un moment donné de votre parcours d'apprentissage, vous souhaiterez créer quelque chose de plus excitant et explorer les données sous de nombreux angles. La bonne nouvelle, c'est que pour de tels projets multitâches, il suffit de posséder les mêmes compétences SQL essentielles que celles énumérées au début du chapitre précédent.

4. Quelles sont les plus anciennes entreprises du monde et où se trouvent-elles ?

image10.jpg

Dans le projet SQL " Où et quoi sont les plus vieilles entreprises du monde", vous examinerez les données de BusinessFinancing.co.uk pour découvrir les plus vieilles entreprises du monde, celles qui ont survécu aux conditions changeantes du marché pendant des centaines d'années et qui sont toujours en activité. Vous obtiendrez de nombreux résultats curieux :

  • L'éventail des années de fondation des plus anciennes entreprises du monde
  • La plus ancienne entreprise du monde et son secteur d'activité
  • Combien d'entreprises - et lesquelles - ont été créées avant l'an 1000 ?
  • Les secteurs d'activité les plus courants auxquels appartiennent les entreprises les plus anciennes
  • Les plus anciennes entreprises par continent
  • Les secteurs d'activité les plus courants pour les entreprises les plus anciennes sur chaque continent

Étant donné que les données de ce projet SQL intermédiaire sont contenues dans plusieurs tables de base de données différentes, vous devrez utiliser des techniques de jonction pour fusionner les données nécessaires à de nombreuses tâches. Vous pouvez vous référer au cours Jointure de données avec SQL pour apprendre à le faire.

5. Analyse des résultats des tests des écoles publiques de New York

image2.jpg

Dans le projet Analyse des résultats des tests des écoles publiques de New York, vous travaillerez avec une base de données SQL contenant les résultats du SAT (Scholastic Aptitude Test) des écoles publiques de la ville de New York afin de déterminer les performances des tests dans ces écoles. Vous examinerez les aspects suivants :

  • Combien d'écoles ne communiquent pas d'informations
  • Quelles (ou combien d'écoles) sont les meilleures ou les pires dans chacune des trois composantes du SAT (lecture, mathématiques et écriture) ?
  • Les meilleurs et les pires scores pour les différentes composantes du SAT
  • Les 10 meilleures écoles en fonction de la moyenne des scores SAT
  • Les performances des tests varient selon les arrondissements
  • Les 5 meilleures écoles selon la moyenne des scores SAT pour les trois composantes (ou pour une certaine composante) pour un arrondissement sélectionné.

Si vous avez des doutes sur la commande à utiliser (et comment l'utiliser) dans chaque cas particulier pour ce projet SQL intermédiaire, n'hésitez pas à consulter ce tutoriel complet -Commandes SQLpour les scientifiques de données.

6. Analyser les statistiques de la dette internationale

image7.jpg

Dans le cadre du projet " Analyser les statistiques de la dette internationale", vous étudierez les données relatives à la dette internationale collectées par la Banque mondiale, une organisation mondiale qui finance les pays pour qu'ils gèrent leurs économies. Vous allez découvrir des faits et des chiffres intéressants :

  • Le nombre de pays ayant une dette
  • Le montant total de la dette de tous les pays
  • Le pays le plus endetté et le montant de sa dette
  • Montant moyen de la dette des pays selon différents indicateurs de la dette
  • L'indicateur de dette le plus courant

Projets SQL pour le niveau avancé

Pour réaliser des projets SQL plus avancés qui vous aideront à vous démarquer, vous devez être à l'aise avec des techniques plus avancées, en plus des techniques essentielles énumérées dans la première section. Vérifiez si vous savez faire les choses suivantes en SQL :

  • Utilisation de toutes sortes de jointures (y compris les jointures automatiques)
  • Correspondance et extraction de modèles
  • Gérer la logique if/then/else en SQL
  • Création de vues
  • Créer des requêtes complexes imbriquées
  • Utilisation d'expressions courantes dans les tableaux
  • Application des fonctions de la fenêtre SQL
  • Troncature des données
  • Données d'étiquetage
  • Application des opérateurs ensemblistes
  • Travailler avec des dates et des heures

7. Analyser les licornes

image9.jpg

Dans le cadre du projet " Analyser les entreprises licornes", votre tâche consistera à déterminer combien d'entreprises ont atteint une valeur supérieure à 1 milliard de dollars dans différents secteurs d'activité au cours d'une période donnée.

Plus précisément, vous devrez identifier les trois secteurs les plus performants sur la base du nombre de nouvelles entreprises à forte croissance créées au cours de cette période, trouver le nombre de licornes qui ont émergé dans ces secteurs par année, l'année où chacune de ces entreprises est devenue une licorne, et leur évaluation moyenne en milliards de dollars. Et toutes ces informations peuvent être obtenues en une seule requête !

Pour ce projet, vous allez utiliser une base de données PostgreSQL contenant plusieurs tables. Pour une remise à niveau de certaines compétences clés, vous pouvez trouver ces cours : Fonctions de manipulation des données dans PostgreSQL et de nettoyage des données dans les bases de données PostgreSQL.

8. Optimiser le chiffre d'affaires des magasins de sport en ligne

image11.jpg

Dans le cadre du projet Optimisation du chiffre d'affaires des magasins de sport en ligne, vous examinerez les données relatives aux produits d'une entreprise de vêtements de sport en ligne dans le but de formuler des recommandations permettant à l'entreprise de maximiser son chiffre d'affaires. Vous aurez à traiter une grande variété d'informations conservées dans plusieurs tableaux. Ces informations comprennent les prix, les remises, les revenus, les évaluations, les critiques, les descriptions de produits et le trafic sur le site web. Vous allez répondre à des questions telles que

  • Quelle est la différence de prix entre les produits Nike et Adidas ?
  • Y a-t-il une différence dans le montant de la remise offerte entre les marques ?
  • Existe-t-il une corrélation entre les recettes et les commentaires ? Et si oui, quelle est sa force ?
  • La longueur de la description d'un produit influe-t-elle sur l'évaluation et les commentaires ?
  • Existe-t-il des tendances ou des lacunes dans le volume d'examens par mois ?
  • Quelle est la part des articles chaussants dans le stock de l'entreprise ? Quel est le revenu médian généré par ces produits ?
  • En quoi le revenu médian des chaussures diffère-t-il de celui des produits d'habillement ?

Dans ce projet, vous devrez appliquer des compétences SQL avancées telles que l'agrégation, le résumé, la troncature, le nettoyage, l'étiquetage, la distribution, les expressions de table communes, la corrélation et le travail avec des dates et des heures. Toutes ces techniques sont abordées dans le cours Exploratory Data Analysis in SQL.

9. Quel a été l'âge d'or des jeux vidéo ?

image4.png

Dans la rubrique " Quand l'âge d'or des jeux vidéo a-t-il eu lieu ? SQL, vous analyserez les 400 jeux vidéo les plus vendus depuis 1977 afin de déterminer si le marché des jeux s'est amélioré avec le temps et à quelle époque il a été le plus florissant. Pour ce faire, vous travaillerez avec les années de sortie des jeux vidéo, les notes des critiques et des utilisateurs, et les données de vente. Vous allez rechercher les informations suivantes :

  • Les 10 jeux vidéo les plus vendus de tous les temps et leur période de sortie
  • Les 10 meilleures années avec les scores moyens les plus élevés des critiques et de nombreux succès produits
  • Les 10 années les plus performantes en termes de scores moyens des utilisateurs et de nombre d'occurrences produites
  • Les années où les critiques et les joueurs ont obtenu les notes moyennes les plus élevées et où de nombreux succès ont été produits.
  • Le nombre de jeux vendus au cours de ces années

Pour effectuer les tâches ci-dessus dans le cadre de ce projet SQL pour utilisateurs avancés, vous devrez utiliser différents types de jointures et d'opérateurs d'ensemble, alors assurez-vous de vous familiariser avec ces compétences grâce à l' aide-mémoire sur les jointures SQL.

10. Analyse des tendances américaines en matière de noms de bébés

image6.jpg

Dans le cadre du projet " Analyser les tendances des noms de bébés américains ", vous étudierez les données fournies par les autorités américaines. Administration de la sécurité sociale contenant les prénoms qui ont été donnés à plus de 5 000 bébés américains chaque année pendant une période de 101 ans. L'objectif principal est de comprendre comment les goûts des Américains en matière de prénoms ont évolué en étudiant les tendances de popularité. En particulier, vous allez découvrir :

  • Des noms américains classiques depuis plus de 100 ans
  • Le type de popularité de chaque nom : intemporel ou branché
  • Les 10 premiers prénoms féminins
  • Les prénoms féminins se terminant par "a" les plus populaires depuis 2015
  • Les prénoms masculins les plus populaires par année
  • Le prénom masculin le plus populaire pour le plus grand nombre d'années

Pour ce projet avancé, vous pouvez trouver utile le cours Manipulation de données en SQL.

Autres idées de projets SQL

Si vous êtes toujours à la recherche d'idées de projets SQL supplémentaires, pensez à un projet de cette liste. Je pense que toutes ces idées de projet sont pratiquement réalisables en SQL, mais le niveau de faisabilité dépendra de l'ensemble des données disponibles. Je pense que beaucoup de ces idées seraient utiles pour les projets d'analyse de données SQL en particulier.

  • Analyse de la fidélisation de la clientèle : Analysez les taux de rétention des clients et identifiez les facteurs clés influençant la fidélité des clients en explorant l'historique des transactions.
  • Prédiction de l'attrition des employés : Élaborez un projet d'analyse des données relatives aux employés afin de trouver des modèles et de prévoir les départs. Vous pouvez penser à des facteurs tels que la satisfaction au travail et l'ancienneté dans l'entreprise.
  • Optimisation des stocks pour le commerce électronique : Utilisez les données historiques des ventes pour optimiser les niveaux de stock d'une entreprise en prévoyant la demande.
  • Analyse des sentiments dans les médias sociaux : Effectuez une analyse des sentiments sur les messages ou les avis publiés sur les médias sociaux afin d'identifier les tendances de l'opinion publique pour une marque ou un sujet spécifique.
  • Analyse du marché immobilier : Analyser les données immobilières pour déterminer les quartiers les plus performants en fonction de l'évolution de la valeur des biens immobiliers et des taux de location.
  • Analyse du classement des films : Explorez les données d'une base de données de films pour trouver des tendances dans les classements et les genres au fil du temps, en identifiant des modèles dans les préférences du public.
  • Analyse de l'impact de la promotion de la vente au détail : Examinez l'impact de certaines promotions ou remises sur le volume des ventes.
  • Analyse des taux de réadmission à l'hôpital : Analyser les données relatives aux soins de santé afin d'identifier les tendances en matière de taux de réadmission des patients.
  • Tendances de l'utilisation des transports publics : Étudier les schémas d'utilisation des transports publics afin d'identifier les heures de pointe et les itinéraires sous-utilisés.
  • Détection de la fraude financière : Développez un projet qui identifie les transactions financières potentiellement frauduleuses sur la base de facteurs tels que le montant et la fréquence des transactions.

Réflexions finales

Dans cet article, nous avons présenté plusieurs idées de projets SQL pour tous les niveaux de compétence SQL. En outre, nous avons passé en revue les compétences dont vous aurez besoin pour chaque projet et les ressources d'apprentissage qui vous permettront de les acquérir et de les perfectionner.

Maintenant que vous êtes fin prêt à construire ces projets SQL et à développer votre portefeuille professionnel. Il n'est jamais trop tôt ni trop tard pour commencer à maîtriser et à mettre en valeur vos compétences !

Une fois votre portefeuille de projets SQL prêt à l'emploi, vous devrez également vous familiariser avec les meilleures questions d'entretien SQL afin de vous assurer d'impressionner les employeurs potentiels lors de la phase d'entretien.

Devenez certifié SQL

Prouvez que vos compétences en SQL sont prêtes à l'emploi grâce à une certification.
Booster ma carrière

Elena Kosourova's photo
Author
Elena Kosourova
LinkedIn

IBM Certified Data Scientist (2020), auparavant géologue pétrolier/géomodélisateur de champs pétroliers et gaziers dans le monde entier avec plus de 12 ans d'expérience professionnelle internationale. Maîtrise de Python, R et SQL. Domaines d'expertise : nettoyage de données, manipulation de données, visualisation de données, analyse de données, modélisation de données, statistiques, narration, apprentissage automatique. Vaste expérience de la gestion des communautés de science des données et de la rédaction/révision d'articles et de tutoriels sur la science des données et les sujets de carrière.

Sujets