SQL ist ein Muss für jeden angehenden Datenexperten. Viele moderne Unternehmen speichern große Mengen ihrer Daten in verschiedenen Tabellen relationaler Datenbanken. Um die notwendigen Daten aus einer Datenbank zu extrahieren und sie weiter zu bearbeiten und zu analysieren, brauchst du gute SQL-Kenntnisse.
Der Aufbau von SQL-Projekten kann dir auf mindestens drei Arten nützen:
- Übe deine aktuellen SQL-Kenntnisse
- Neue Fähigkeiten entwickeln
- Baue dein Datenportfolio auf, um deine SQL-Kenntnisse bei potenziellen Arbeitgebern zu präsentieren.
In diesem Artikel werden verschiedene Ideen für portfoliotaugliche SQL-Projekte vorgestellt. Egal, ob du SQL-Anfänger oder Fortgeschrittener bist, du wirst viele interessante Themen finden, die du erforschen kannst.
Werde Dateningenieur
SQL-Projekte für Einsteiger
Wenn du bereits mit den grundlegenden SQL-Konzepten vertraut bist, bist du bereit für dein erstes SQL-Projekt. Achte darauf, dass du die folgenden Fähigkeiten hast:
- Ausführen von mathematischen Operationen
- Aggregieren und Beschreiben von Daten (Minimum, Maximum, Durchschnitt, Anzahl und Summe)
- Filtern von Daten auf der Grundlage einer bestimmten Bedingung oder mehrerer Bedingungen
- Daten gruppieren
- Bestelldaten
- Begrenzung der Ausgabedaten
- Einfache Datensatzverknüpfung (Inner Joins)
- Aliasing von Spalten oder Tabellen
Für eine schnelle Auffrischung wirf einen Blick auf unser Spickzettel für SQL-Grundlagen.
Am Anfang ist es völlig in Ordnung, einfache Projekte zur Datenmanipulation durchzuführen. Du kannst solche Projekte später immer noch verbessern und erweitern, wenn du mehr SQL-Kenntnisse und neue Fähigkeiten erworben hast.
1. Analyse der Kohlenstoffemissionen der Industrie
Im Projekt " Analyse der Kohlenstoffemissionen der Industrie " nutzt du den verfügbaren Datensatz über Kohlenstoffemissionen von Produkten (die mehr als 75 % der weltweiten Emissionen ausmachen und ein ernstes ökologisches Problem darstellen), um den Kohlenstoff-Fußabdruck verschiedener Industrien aus dem letzten Jahr zu untersuchen und die Branchen mit den höchsten Emissionen zu ermitteln.
Auch wenn es sich um ein Einführungsprojekt mit einer Aufgabe handelt, musst du eventuell die Lektionen des SQL-Kurses für Fortgeschrittene durcharbeiten: Zusammenfassen von Teilmengen und Filtern von gruppierten Daten.
2. Analyse der psychischen Gesundheit von Schülern in SQL
Im Projekt "Analyzing Students' Mental Health in SQL " setzt du deine PostgreSQL-Kenntnisse ein, um die Studierendendaten einer japanischen internationalen Universität zu analysieren und einen der wichtigsten Einflussfaktoren auf die psychische Gesundheit internationaler Studierender zu ermitteln.
Die von der Hochschule durchgeführte Umfrage hat gezeigt, dass die größten Herausforderungen für internationale Studierende die sozialen Kontakte und der Stress sind, der mit dem Eintritt in eine neue Kultur verbunden ist. Deine Aufgabe in diesem SQL-Anfängerprojekt besteht darin, einen bestimmten Faktor zu untersuchen - die Dauer des Aufenthalts und wie sie sich auf die durchschnittlichen diagnostischen Ergebnisse internationaler Schüler/innen auswirkt.
3. Analyse des Motorradteileverkaufs
Im SQL-Projekt Analyzing Motorcycle Part Sales (Analyse der Motorradteile-Verkäufe ) untersuchst du die Daten eines Unternehmens, das Motorradteile verkauft, um Einblicke in die Großhandelsverkäufe an drei Lagerstandorten zu erhalten und die Umsatzströme zu verstehen. Genauer gesagt, ermittelst du, wie viel Nettoumsatz das Unternehmen über seine Produktlinien hinweg pro Monat und Lager erzielt.
Für dieses Projekt brauchst du neben deinen SQL-Kenntnissen auch solide Kenntnisse im Berichtswesen. Der Kurs Data-Driven Decision Making in SQL kann dir helfen, dich in diesem Bereich weiterzubilden.
SQL-Projekte für Fortgeschrittene
Kurze SQL-Projekte mit nur einer Aufgabe sind zwar ein guter Anfang, aber irgendwann kommst du auf deiner Lernreise an den Punkt, an dem du etwas Spannenderes erstellen und die Daten aus vielen Blickwinkeln erforschen möchtest. Die gute Nachricht ist, dass für solche Multitasking-Projekte die gleichen grundlegenden SQL-Kenntnisse ausreichen, die am Anfang des vorherigen Kapitels aufgeführt sind.
4. Was und wo sind die ältesten Unternehmen der Welt?
Im SQL-Projekt What and Where are the World's Oldest Businesses (Was und wo sind die ältesten Unternehmen der Welt ) untersuchst du die Daten von BusinessFinancing.co.uk, um die ältesten Unternehmen der Welt zu finden - diejenigen, die seit Hunderten von Jahren wechselnde Marktbedingungen überlebt haben und immer noch aktiv sind. Du wirst eine Menge neugieriger Erkenntnisse erhalten:
- Die Bandbreite der Gründungsjahre der ältesten Unternehmen der Welt
- Das älteste Unternehmen der Welt und die Branche, zu der es gehört
- Wie viele Unternehmen - und welche - wurden vor 1000 n. Chr. gegründet?
- Die häufigsten Branchen, denen die ältesten Unternehmen angehören
- Die ältesten Unternehmen nach Kontinent
- Die häufigsten Branchen für die ältesten Unternehmen auf jedem Kontinent
Da die Daten für dieses SQL-Zwischenprojekt in mehreren verschiedenen Datenbanktabellen enthalten sind, musst du für viele Aufgaben Join-Techniken verwenden, um die erforderlichen Daten zusammenzuführen. Wie das geht, erfährst du im Kurs "Daten verknüpfen mit SQL".
5. Analyse der Testergebnisse an öffentlichen Schulen in NYC
Im Projekt "Analyzing NYC Public School Test Result Scores" arbeitest du mit einer SQL-Datenbank, die die SAT-Ergebnisse (Scholastic Aptitude Test) der öffentlichen Schulen von New York City enthält, um die Testleistungen dieser Schulen zu ermitteln. Du wirst dir die folgenden Aspekte ansehen:
- Wie viele Schulen versäumen es, Informationen zu melden
- Welche (oder wie viele) Schulen in den drei Komponenten des SAT - Lesen, Mathematik und Schreiben - am besten/schlechtesten sind
- Die besten/schlechtesten Ergebnisse für verschiedene SAT-Komponenten
- Die 10 besten Schulen nach durchschnittlicher SAT-Punktzahl
- Wie sich die Testleistung nach Stadtbezirk unterscheidet
- Die 5 besten Schulen nach durchschnittlicher SAT-Punktzahl für alle drei Komponenten (oder für eine bestimmte Komponente) für einen ausgewählten Bezirk
Wenn du dir nicht sicher bist, welchen Befehl du im Einzelfall für dieses SQL-Zwischenprojekt verwenden sollst (und wie du ihn verwenden sollst), kannst du dir dieses umfassende Tutorial ansehen -SQL-Befehle für Datenwissenschaftler.
6. Analysiere internationale Schuldenstatistiken
Im Projekt "Analyze International Debt Statistics" (Internationale Schuldenstatistiken analysieren ) untersuchst du internationale Schuldendaten, die von der Weltbank gesammelt werden, einer globalen Organisation, die Länder finanziell unterstützt, um ihre Volkswirtschaften zu verwalten. Du wirst einige interessante Fakten und Zahlen enthüllen, darunter:
- Die Anzahl der Länder mit Schulden
- Der Gesamtbetrag der Schulden aller Länder
- Das Land mit der höchsten Verschuldung und die Höhe der Schulden
- Der durchschnittliche Schuldenstand der Länder nach verschiedenen Schuldenindikatoren
- Der häufigste Schuldenindikator
SQL-Projekte für Fortgeschrittene
Um mit fortgeschritteneren SQL-Projekten fortzufahren, mit denen du dich effektiv von der Masse abheben kannst, solltest du zusätzlich zu den im ersten Abschnitt aufgeführten grundlegenden Techniken auch mit fortgeschritteneren Techniken vertraut sein. Überprüfe, ob du weißt, wie man die folgenden Dinge in SQL macht:
- Verwendung aller Arten von Joins (einschließlich Self-Joins)
- Muster abgleichen und extrahieren
- Der Umgang mit der if/then/else-Logik in SQL
- Ansichten erstellen
- Komplexe verschachtelte Abfragen erstellen
- Gemeinsame Tabellenausdrücke verwenden
- Anwenden von SQL-Fensterfunktionen
- Daten abschneiden
- Kennzeichnungsdaten
- Anwendung von Mengenoperatoren
- Arbeiten mit Daten und Zeiten
7. Analyse von Einhorn-Unternehmen
Im Projekt "Einhorn-Unternehmen analysieren" ist es deine Aufgabe, herauszufinden, wie viele Unternehmen in verschiedenen Branchen in einem bestimmten Zeitraum eine Bewertung von über 1 Milliarde Dollar erreicht haben.
Konkret musst du die drei wachstumsstärksten Branchen anhand der Anzahl der in diesem Zeitraum neu gegründeten wachstumsstarken Unternehmen ermitteln, die Anzahl der Einhörner, die in diesen Branchen im jeweiligen Jahr entstanden sind, das Jahr, in dem jedes dieser Unternehmen ein Einhorn wurde, und ihre durchschnittliche Bewertung in Milliarden Dollar. Und all diese Informationen kannst du mit nur einer Abfrage erhalten!
Für dieses Projekt wirst du eine PostgreSQL-Datenbank mit mehreren Tabellen verwenden. Zur Auffrischung einiger Schlüsselqualifikationen findest du diese Kurse: Funktionen zur Manipulation von Daten in PostgreSQL und zur Bereinigung von Daten in PostgreSQL-Datenbanken.
8. Optimierung der Umsätze im Online-Sporthandel
Im Projekt "Optimierung der Umsätze im Online-Sporthandel" wirst du dich mit den Produktdaten eines Online-Sportbekleidungsunternehmens beschäftigen, um Empfehlungen für das Unternehmen zu entwickeln, wie es seinen Umsatz maximieren kann. Du wirst mit einer Vielzahl von Informationen zu tun haben, die in verschiedenen Tabellen gespeichert sind. Zu den Informationen gehören Preise, Rabatte, Umsätze, Bewertungen, Rezensionen, Produktbeschreibungen und Website-Verkehr. Du wirst Fragen beantworten wie:
- Wie unterscheiden sich die Preispunkte von Nike- und Adidas-Produkten?
- Gibt es einen Unterschied in der Höhe der Rabatte zwischen den Marken?
- Gibt es einen Zusammenhang zwischen Einnahmen und Bewertungen? Und wenn ja, wie stark ist sie?
- Beeinflusst die Länge der Produktbeschreibung die Bewertung und die Rezensionen eines Produkts?
- Gibt es irgendwelche Trends oder Lücken in der Anzahl der Überprüfungen pro Monat?
- Wie viel des Lagerbestands des Unternehmens besteht aus Schuhen? Wie hoch ist der durchschnittliche Umsatz, der mit diesen Produkten erzielt wird?
- Wie unterscheidet sich der durchschnittliche Umsatz von Schuhen von dem von Bekleidungsprodukten?
In diesem Projekt musst du fortgeschrittene SQL-Kenntnisse anwenden, z. B. Aggregation, Zusammenfassung, Trunkierung, Bereinigung, Beschriftung, Casting, allgemeine Tabellenausdrücke, Korrelation und die Arbeit mit Daten und Zeiten. All diese Techniken werden im Kurs " Explorative Datenanalyse in SQL " behandelt.
9. Wann war das goldene Zeitalter der Videospiele?
In der Rubrik Wann war das Goldene Zeitalter der Videospiele? SQL-Projekt analysierst du die 400 meistverkauften Videospiele, die seit 1977 veröffentlicht wurden, um herauszufinden, ob sich der Spielemarkt im Laufe der Zeit verbessert hat und wann seine blühendste Epoche war. Zu diesem Zweck arbeitest du mit den Erscheinungsjahren von Videospielen, Kritiker- und Nutzerbewertungen und Verkaufsdaten. Du wirst nach den folgenden Erkenntnissen suchen:
- Die Top 10 der meistverkauften Videospiele aller Zeiten und der Zeitraum, in dem sie veröffentlicht wurden
- Die Top 10 Jahre mit den höchsten durchschnittlichen Kritikerbewertungen und vielen Hits produzierten
- Die Top 10 Jahre mit den höchsten durchschnittlichen Nutzerbewertungen und vielen Treffern haben
- Die Jahre mit den höchsten Durchschnittsnoten von Kritikern und Spielern und vielen Hits brachten
- Die Anzahl der verkauften Spiele in diesen Jahren
Um die oben genannten Aufgaben für dieses SQL-Projekt für Fortgeschrittene zu erledigen, musst du verschiedene Arten von Joins und Set-Operatoren verwenden, also solltest du diese Kenntnisse mit dem SQL Joins Cheat Sheet auffrischen.
10. Analyse der Trends bei amerikanischen Babynamen
Im Projekt "Analyzing American Baby Name Trends" untersuchst du Daten, die von der U.S.. Die Sozialversicherungsbehörde enthält die Vornamen, die über einen Zeitraum von 101 Jahren jedes Jahr an über 5.000 amerikanische Babys vergeben wurden. Das Hauptziel ist es, zu verstehen, wie sich der Geschmack amerikanischer Babynamen verändert hat, indem die Trends der Popularität untersucht werden. Vor allem wirst du entdecken:
- Klassische amerikanische Namen seit über 100 Jahren
- Die Art der Popularität der einzelnen Namen: zeitlos oder trendy
- Die Top 10 der weiblichen Namen
- Der beliebteste weibliche Name, der auf "a" endet, seit 2015
- Die beliebtesten männlichen Namen nach Jahr
- Der beliebteste männliche Name für die größte Anzahl von Jahren
Für dieses fortgeschrittene Projekt kannst du den Kurs Datenmanipulation in SQL nutzen.
Schlussgedanken
In diesem Artikel haben wir verschiedene Ideen für SQL-Projekte für alle Stufen der SQL-Kompetenz vorgestellt. Außerdem haben wir uns einen Überblick über die Fähigkeiten verschafft, die du für jedes Projekt brauchst, und über die Lernressourcen, mit denen du sie erlangen und verbessern kannst.
Jetzt bist du bereit, diese SQL-Projekte aufzubauen und dein professionelles Portfolio zu erweitern. Es ist nie zu früh oder zu spät, damit anzufangen, deine Fähigkeiten zu meistern und zu präsentieren!
Wenn du dein Portfolio an SQL-Projekten fertig hast, solltest du auch die wichtigsten SQL-Interviewfragen auffrischen, damit du potenzielle Arbeitgeber beim Vorstellungsgespräch beeindrucken kannst.
Werde SQL-zertifiziert
Der Blog