Wie du ein großartiges Data Science Portfolio aufbaust (mit Beispielen)
Data Science ist eines der spannendsten und am schnellsten wachsenden Felder der letzten 10 Jahre. Daher gibt es viele Universitätsprogramme, Data Science Bootcamps und Online-Kurse für alle, die in diesem Bereich Fuß fassen wollen. Diese Programme sind eine hervorragende Möglichkeit, die erforderlichen Fähigkeiten zu erlernen, aber wenn es darum geht, eine Stelle zu bekommen, ist es wichtig zu zeigen, dass du die richtigen Fähigkeiten hast, denn viele Arbeitgeber suchen nach praktischer Erfahrung. Mit einem aussagekräftigen Portfolio kannst du deinem potenziellen Arbeitgeber zeigen, dass du über die nötigen Fähigkeiten verfügst, um in einer Data-Science-Stelle erfolgreich zu sein.
Die meisten Datenwissenschaftler/innen haben heute ein Portfolio, aber nur sehr wenige stechen heraus. Wenn dein Portfolio zu allgemein aussieht, keine interessanten Projekte enthält oder Erklärungen fehlt, kann es für deine Leser/innen schwer sein, mitzukommen und interessiert zu bleiben. Um sicherzustellen, dass deine harte Arbeit von deinem Publikum in vollem Umfang gewürdigt wird, findest du hier einige einfache Tipps, wie du ein gutes Portfolio in ein außergewöhnliches verwandeln kannst.
Warum in ein Data Science-Portfolio investieren?
Als angehender Datenwissenschaftler gibt es einen offensichtlichen Grund, in ein Portfolio zu investieren: Es soll dir helfen, eine Stelle zu bekommen, indem du deine Fähigkeiten unter Beweis stellst, noch bevor dich ein Personalverantwortlicher einem technischen Test unterzieht. Eine neue Rolle zu finden, ist jedoch eine externe Belohnung. Es ist wichtig, eine interne Motivation zu finden, damit die Zufriedenheit, die du aus der Entwicklung eines Portfolios ziehst, von dir selbst abhängt und nicht von einem Bewerbungsprozess, den du nicht kontrollieren kannst. Außerdem wirkt dein Portfolio dadurch echter und motiviert dich, deine besten Arbeiten zu präsentieren.
Hier sind einige wichtige Gründe, warum der Aufbau eines hochwertigen Portfolios deine Zeit wert ist.
Deine Traumrolle an Land ziehen
Ein Portfolio ist oft ein wichtiges Instrument im Einstellungsprozess für Data Science. Technische Personalverantwortliche und Datenwissenschaftler, die ein Vorstellungsgespräch mit dir führen, werden es sich ansehen, um deine Fähigkeiten, Erfahrungen und Interessen einzuschätzen, und dir eventuell Fragen dazu stellen.
Du bekommst wichtige praktische Erfahrungen
Das Erlernen der Theorie hinter einem Algorithmus des maschinellen Lernens ist zwar ein wichtiger Schritt auf dem Weg in die Datenwissenschaft, aber die eigentliche Prüfung ist die Anwendung der erlernten Fähigkeiten auf einen Anwendungsfall. Wenn du ein Projekt als Ganzes durcharbeitest, wird das Gelernte gefestigt und du kannst selbstbewusst darüber sprechen.
Die Datengemeinschaft kennenlernen
Datenwissenschaftler schauen sich gerne an, was andere Datenwissenschaftler gemacht haben. Es gibt nicht den einen "richtigen" Weg, alles zu tun, und die Förderung und Diskussion deines Projekts mit der Community ist eine gute Möglichkeit, interessante Lösungen für ein Problem zu entwickeln.
Dein eigenes Vergnügen
Das ist einer der wichtigsten Gründe, ein Portfolio zu erstellen; schließlich macht Datenwissenschaft Spaß! Wenn dir das Projekt, an dem du arbeitest, wirklich Spaß macht, wirst du motiviert sein, dein Bestes zu geben, und andere werden deine Leidenschaft wahrscheinlich eher teilen.
Was sind die verschiedenen Arten von Portfolio-Projekten?
Bei Portfolioprojekten geht es nicht nur um technische Fähigkeiten, wie z.B. die Demonstration deiner Programmierfähigkeiten. Inhaltliche Projekte sind auch eine fantastische Möglichkeit, dein Verständnis eines Themas und deine Kommunikationsfähigkeiten unter Beweis zu stellen - wichtige Eigenschaften, auf die Interviewer achten. Eigentlich sollte jedes technische Portfolio-Projekt eine klare Erklärung haben, die sich an ein nicht-technisches Publikum richtet. Im Folgenden findest du einige Beispiele für die verschiedenen Arten von Portfolio-Projekten. Eine Kombination aus beidem in deinem Portfolio ist wichtig, um die vielseitigen Fähigkeiten zu demonstrieren, die für eine Stelle in der Datenwissenschaft oft erforderlich sind.
Codebasierte Projekte
Codebasierte Projekte sind die häufigste Art von Portfolio-Projekten. Kurz gesagt: Es bildet reale Data-Science-Projekte nach, indem es einen Datensatz nimmt und damit ein Problem löst. Beispiele für codebasierte Projekte sind:
- Scraping eines Datensatzes und Durchführung einer Analyse oder Training eines Modells
- Aufbau eines Dashboards zu einem bestimmten Datensatz oder Thema
- Eine Website oder App erstellen, mit der jemand interagieren kann.
- Analysieren von Daten zu einem Trendthema wie einer beliebten Fernsehsendung oder Nachrichtenmeldung
Inhaltsbezogene Projekte
Inhaltsbezogene Projekte werden in der Regel weniger als Portfolioprojekte angesehen, sind aber äußerst effektiv, um deine Kommunikations- und Schreibfähigkeiten zu zeigen. Beispiele für inhaltsbezogene Projekte sind
- Blogbeiträge und Programmier-Tutorials, die Konzepte für andere Datenwissenschaftler oder ein nichttechnisches Publikum erklären
- Video-Tutorials, die zeigen, wie ein bestimmtes Werkzeug funktioniert
- An einem Podcast teilnehmen - oder deinen eigenen veranstalten, in dem du Datenwissenschaftler und Praktiker interviewst
Baue dein Datenportfolio auf
Präsentiere deine Fähigkeiten und Projekte in wenigen Minuten.

7 Wege, um ein hervorragendes Datenportfolio zu erstellen
1. Sei authentisch und verfolge deine Leidenschaft
Die besten Portfolio-Projekte sind nicht die, die die neuesten oder komplexesten Tools und Modelle verwenden. Wenn du in mühevoller Kleinarbeit einen Datensatz für eine bestimmte Aufgabe ausgewertet, eine fesselnde Geschichte geschrieben oder etwas geschaffen hast, das der Welt von deiner Leidenschaft erzählt, werden die Leute das erkennen. Nick Singh, Co-Autor von "Acing the Data Science Interview", geht in dieser Folge von DataFramed noch einen Schritt weiter und schlägt vor, dass die Leidenschaft für die eigene Arbeit so ansteckend sein kann, dass Personalverantwortliche glauben, dass du dich für alles begeistern kannst, was mit Data Science zu tun hat, einschließlich ihres Unternehmens und der Stelle, für die du dich bewirbst.
Data-Science-Portfolio-Projekte sind nicht einfach zu beenden. Du stößt auf mehrere Mauern, musst mit anderen Verpflichtungen jonglieren und die letzten 10 % abzuschließen kann sich anfühlen, als würde man das ganze Projekt noch einmal machen. Wenn du an einer Sache arbeitest, die dir am Herzen liegt, kannst du deine Schwierigkeiten überwinden und ein Projekt schaffen, auf das du stolz bist.
2. Eine Geschichte erzählen
Wenn du Zeit und Leidenschaft in ein Projekt steckst, kannst du zum Experten werden, aber es ist wichtig, dass deine Leser/innen deinen Weg von Anfang bis Ende mit den von dir zur Verfügung gestellten Inhalten verfolgen können. Denke daran, dass viele Leute dein Portfolio durchsehen werden, ohne deine Projekte zu kennen und ohne die Zeit zu haben, zusätzliche Recherchen anzustellen. Deshalb ist eine prägnante, aber fesselnde Geschichte für ein Portfolio-Projekt unerlässlich. Egal, ob du sie auf der Readme-Seite eines GitHub-Repos oder unter dem Titel eines Dashboards veröffentlichst, stelle sicher, dass du deutlich machst, warum sich der Leser für dein Projekt interessieren sollte, was deine Motivation für die Arbeit ist und welche Frage es beantwortet. Dies dient auch dazu, die Aufmerksamkeit der Leserinnen und Leser zu gewinnen und sie auf dein Heft, dein Modell oder dein Armaturenbrett aufmerksam zu machen.
Eine fesselnde Geschichte ist einer der wichtigsten Teile eines Portfolios, denn sie zeigt dein echtes Einfühlungsvermögen, deine Neugierde und deine Leidenschaft. Wenn du die Leser auf eine spannende Reise mitnimmst, heben sich deine Projekte von anderen ab.
3. Zeige dein technisches Können - aber vermeide, dass du dich überschätzt
Ein gutes Portfolioprojekt zeigt deine technischen Fähigkeiten, aber das bedeutet nicht, dass du alle technischen Fähigkeiten anwenden musst. Wenn du z.B. schon Stunden damit verbracht hast, ein fortschrittliches Scraping-Tool zu entwickeln, musst du den Umfang deines Projekts nicht noch weiter ausdehnen, um moderne Modellierungstechniken unterzubringen.
Ein guter Ansatz ist es, dein Projekt auf einen technischen Bereich zu konzentrieren und die Grundlagen im Rest deines Projekts anzuwenden. Wenn das Ziel deines Projekts beispielsweise darin besteht, deine Fähigkeiten bei der Datenbereinigung und -erfassung zu demonstrieren, ist es in Ordnung, wenn du nicht die bestmögliche Vorhersagegenauigkeit mit den modernsten Modellen erzielst. Wenn du den Umfang deines Projekts einschränkst, kannst du eine prägnante, aber interessante Geschichte erzählen, die verschiedene Aspekte deiner technischen Fähigkeiten deutlich macht.
Eine weitere gute Möglichkeit, dein technisches Können unter Beweis zu stellen, ist, dafür zu sorgen, dass dein Code auch lesbar und gut dokumentiert ist. Achte darauf, dass die Notizbücher Titel und Erklärungen haben und gehe deinen Code durch und füge Kommentare zu Funktionen hinzu. Wer sich die Zeit nimmt, ein Notizbuch durchzusehen, wird sich Kommentare und eindeutige Variablennamen merken.
4. Projekte von der Stange vermeiden
Datensätze wie Titanic, MNIST oder Iris sollten nach Möglichkeit vermieden werden. Das sind großartige Datensätze, um daraus zu lernen und Modelle zu testen, aber sie werden häufig von Anfängern und Online-Kursen für Datenwissenschaftler/innen verwendet, so dass Personalverantwortliche annehmen könnten, dass du schon viel weiter bist, als du tatsächlich bist. Außerdem helfen sie dir nicht, deine Leidenschaft für Data Science und die Art von Projekten zu zeigen, an denen du wirklich interessiert wärst.
Es ist riskant, ein häufig durchgeführtes Projekt in deinem Portfolio zu zeigen. Viele Leute, die sich dein Portfolio ansehen, haben das Projekt vielleicht schon selbst gemacht, was dazu führen könnte, dass sie das Interesse verlieren - vor allem, weil es viele öffentlich zugängliche Anleitungen zu diesen Datensätzen gibt.
5. Vernachlässige deine Soft Skills nicht
Tolles Storytelling ist nicht die einzige "Soft Skill", die du in einem Portfolio-Projekt vermitteln solltest. Ein komplexes Problem einfach und prägnant zu erklären, ist eine wichtige Fähigkeit für jeden Arbeitsplatz - und eine, die in deinen Portfolio-Projekten hervorgehoben werden sollte. Außerdem kannst du mit deinem Portfolio einen Beitrag zur Data Science Community leisten und deinen Lesern neue Fähigkeiten vermitteln. Eine weitere wichtige Eigenschaft in der Datenwissenschaft ist die Neugier, denn oft muss man sich durch Papiere oder Blogbeiträge wühlen, um Lösungen für ein bestimmtes Problem zu finden, und das ist etwas, was die Arbeitgeber suchen.
Erkenntnisse aus neuen Datensätzen zu gewinnen und zu erklären, wie du die einzigartigen Herausforderungen in deinem Portfolio-Projekt gelöst hast, sind fantastische Möglichkeiten, deine Neugier und Kreativität unter Beweis zu stellen; Fähigkeiten, die schwer zu erlernen sind.
6. Design für deine Leser
Das Nutzererlebnis deiner Leser ist für dein Portfolio genauso wichtig wie für jede App oder Website. Es ist wichtig, die Leser/innen zu den relevanten Informationen zu führen, ohne sie zu überfordern, und ihnen gleichzeitig die Möglichkeit zu geben, tiefer zu gehen, wenn sie das möchten.
Spare nicht an der Gestaltung deines Projekts: Eine auffällige Ästhetik weckt das Interesse des Lesers und trägt dazu bei, dass dein Portfolio heraussticht. Ein sauberes Portfolio kann sogar Lesern, die mit der Fachterminologie nicht vertraut sind, helfen, deiner Geschichte zu folgen. Außerdem kannst du den Designstil deines Projekts als Vorlage für künftige Projekte verwenden und sie miteinander verknüpfen, um die Nutzer nahtlos zu weiteren Inhalten zu führen.
7. Vermarkte deine persönliche Marke
Dein Portfolio ist nicht die einzige Information, die andere über dich finden können. Eine einfache Google-Suche führt dich wahrscheinlich zu deinem LinkedIn-Profil, deiner Website, deinem Blog, GitHub und anderen sozialen Medien. Du musst sicherstellen, dass dein Image, dein Schreibstil und dein Inhalt auf allen Kanälen einheitlich sind und dass sie alle miteinander verlinkt sind. Achte darauf, dass du in deiner E-Mail-Signatur und in deinem Lebenslauf Links zu deinem Portfolio angibst. Eine starke persönliche Marke hilft dir, dich als Individuum zu profilieren. Eine gute persönliche Marke sollte deine Schlüsselqualifikationen und deine Erfolge hervorheben und den Menschen zeigen, was du tust.
Beispiele für ein gutes Data Science Portfolio
Wenn du wissen willst, wie diese Prinzipien in der Praxis umgesetzt werden, findest du hier eine Liste mit erstklassigen Data-Science-Portfolios und Projekten, die dich inspirieren können:
Nikolaos Christoforidis: Leidenschaft für Sport
Nikolaos' Projekt ist von Anfang an code-lastig und zeigt deutlich seine hohe Kompetenz mit Pandas und Scikit-learn. Er schafft es auch, ein ansprechendes Notizbuch zu erstellen, indem er mit einem Datensatz arbeitet, der einem breiten Publikum vertraut ist. Viele von uns begeistern sich für Sport und heutzutage gibt es eine Fülle interessanter Datensätze. Ein Projekt über eine Sportart kann Gleichgesinnte leicht dazu bringen, bis zum Ende zu lesen, vor allem, wenn es einen interessanten Datensatz und eine Frage mit coolen Visualisierungen kombiniert, die Elemente des Sports selbst einfangen. Das ist auch eine gute Möglichkeit, um sicherzustellen, dass deine Leidenschaft in deiner Arbeit deutlich zum Ausdruck kommt, was sogar das Interesse von Menschen wecken kann, die den Sport nicht verfolgen!
Yan Holtz: Fantastisches Design
Wenn du nach Inspiration für die Gestaltung deines Portfolios suchst, bist du hier genau richtig. Das Design von Yans Portfolio strahlt Leidenschaft und Raffinesse aus, vor allem die Animation oben auf der Seite, die auf deinen Mauszeiger reagiert. Es ist unmöglich, nicht weiter zu scrollen, bis du zu einigen der Projekte selbst gelangst. Jedes Projekt hat eine einzigartige Visualisierung, die dich weiter in den Bann zieht, während ein Klick zu einer kurzen Erklärung führt.
Samuel Verevis: Persönlichkeit
Obwohl Weindatensätze in Portfolios üblich sind, bringt Samuel durch humorvolle Kapitelüberschriften und außergewöhnliche Visualisierungen etwas völlig Neues in die Geschichte ein. Die Diagramme hier kombinieren Coolness mit Klarheit und zeigen ein klares Verständnis dafür, wie man eine Geschichte erzählt und das Interesse des Lesers weckt. Das ist eine großartige Möglichkeit, um Authentizität, Fähigkeiten und Leidenschaft zu zeigen, selbst bei einem Datensatz, der oft in anderen Portfolio-Projekten verwendet wird.
Philipp Schöttler: Viral werden
Bitcoin-Daten und ansprechende Portfolio-Projekte - das passt perfekt zusammen. Phillipp ist eindeutig ein leidenschaftlicher und sachkundiger Kenner des Themas und hat es geschafft, eine gründliche und interessante Lektüre über Bitcoin zu verfassen und gleichzeitig sein tiefes Verständnis der Finanzmärkte unter Beweis zu stellen. Dies ist ein großartiges Beispiel dafür, wie man Inhalte zu einem beliebten Thema erstellt und gleichzeitig einen Mehrwert für verschiedene Zielgruppen wie andere Datenwissenschaftler, Investoren, Blockchain-Enthusiasten und Lernwillige bietet.
Mehr erfahren
Auch wenn du dich von Beispielen inspirieren lassen kannst und Leitfäden wie dieser dir helfen können, den richtigen Weg einzuschlagen, ist das Wichtigste, was du beachten solltest, dass dein Portfolio dich widerspiegeln sollte - deine Fähigkeiten, deine Interessen und deine Persönlichkeit. Schließlich ist das deine Reise in die Datenwissenschaft. Im Folgenden findest du weitere Ressourcen, die dich auf deinem Weg begleiten: