Course
Python ist eine der wichtigsten Programmiersprachen, die du lernen musst, wenn du Datenwissenschaftler/in werden willst. Um Python wirklich zu beherrschen, ist es jedoch wichtig, dass du es selbst ausprobierst. Hier kommen die Python-Projekte ins Spiel.
Die Erstellung von Python-Projekten hilft dir, Vertrauen in die erlernten Fähigkeiten aufzubauen, ein Portfolio zu entwickeln, das dir bei der Jobsuche hilft, und dabei auch noch Spaß zu haben. In diesem Artikel stellen wir dir mehr als 60 Python-Projektideen vor, mit denen du deine Lernreise über alle Qualifikationsstufen und Bereiche hinweg beschleunigen kannst.
Python-Projekte für alle Niveaus
Bevor du mit einem Python-Projekt beginnst
Wenn du bereits mit Python vertraut bist, kannst du mit diesen Projekten sofort loslegen. Wenn du dir jedoch die nötigen Grundkenntnisse aneignen möchtest, um mit Python-Projekten zu beginnen, schau dir die Liste der über 140 Python-Kurse von DataCamp an. Alle unsere Kurse sind interaktiv und darauf ausgelegt, dir zu helfen, die Programmierbarriere zu überwinden und deine Python-Kenntnisse zu verbessern.
Wenn du bereit bist, mit der Arbeit an Projekten zu beginnen, schau dir DataLab an und beginne mit der Bearbeitung und Veröffentlichung deiner Projekte im vollständig konfigurierten DataCamp Daten-Notizbuch, direkt im Browser.
Python-Projekte für Anfänger
Als Anfängerin oder Anfänger solltest du Python-Projekte nutzen, um das Gelernte zu behalten und neue Fähigkeiten zu erwerben. Bei diesen Projekten geht es meist um explorative Datenanalyseaufgaben sowie um einfache Modellierungs- und Prognoseaufgaben für relevante reale Datensätze.
1. Datenanalyse der Diamantenpreise
Diamanten werden anhand der Struktur ihrer Kohlenstoffatome in fünf Verunreinigungsarten unterteilt. Der Diamanten-Datensatz von Kaggle gibt dir noch mehr Informationen - Schliff, Reinheit, Farbe und Preis. Entwickle deine Fähigkeiten zur Datenvisualisierung mit einigen explorativen Datenanalysen.
2. Alter der Abalone-Schalen Datenanalyse
Dies ist ein einzigartiger Datensatz aus der Zoologie. Abalonenschalen sind Wunder der Natur, und du kannst ihr Alter bestimmen, indem du die Kreise in ihren Schalen zählst. Kannst du mit deinen Python-Datenanalysefähigkeiten das Alter von Abalonenschalen bestimmen?
3. Datenanalyse der Premier League
Ein Fußballdatensatz, mit dem du Ereignisse aus der Saison 2018-2019 der englischen Premier League untersuchen, analysieren und visualisieren kannst. Der Soccer Data-Datensatz ist ein hervorragendes Python-Einsteigerprojekt für die Datenanalyse. Mit einer Vielzahl von Merkmalen, die von grundlegenden Spieldetails bis hin zu komplizierten Statistiken reichen, bietet der Datensatz zahlreiche Möglichkeiten zur Datenerforschung, Visualisierung und statistischen Analyse. Das Projekt wird mit einem übersichtlichen Datenwörterbuch und angeleiteten Herausforderungen geliefert, die es auch für Neulinge zugänglich machen. Außerdem enthält es reale Szenarien, die das Projekt nicht nur interessanter machen, sondern auch als umfassende Übung dienen, die in ein Portfolio aufgenommen werden kann. Es ist ein vielseitiges Projekt, das angeleitetes Lernen mit offener Erkundung verbindet und damit ideal für die Entwicklung von Fähigkeiten ist.
Daten aus einem Python-Anfängerprojekt zur Analyse von Fußballtrends
4. Telekommunikationsabwanderungsprognose
Kundenabwanderung ist eines der grundlegendsten Probleme des maschinellen Lernens. Mit diesem Kundendatensatz kannst du die Abwanderung eines Telekommunikationsanbieters anhand der Nutzungsdaten seiner Kunden vorhersagen. Der Datensatz enthält eine Vielzahl von Merkmalen, wie z. B. Gesprächsabbrüche, Abonnementlänge und Kundenwert, und ist damit eine reichhaltige Ressource für tiefgreifende Analysen. Das Einsteigerprojekt enthält angeleitete Herausforderungen, die sich auf die Datenerforschung, Visualisierung und statistische Analyse konzentrieren und einen strukturierten Lernpfad bieten. Das reale Szenario fügt eine zusätzliche Ebene der Komplexität und Relevanz hinzu, indem es dich bittet, die Kundenabwanderung angesichts eines neuen Wettbewerbers auf dem Markt vorherzusagen.
5. Analyse und Vorhersage von Aktienkursen
Willst du den Grund für den 100%igen Anstieg der Tesla-Aktien vor zwei Jahren herausfinden? Wenn ja, ist der Datensatz der Tech-Aktien 2010-2021 die erste Anlaufstelle.
6. NBA Schießdaten
Aus welcher Entfernung erzielen Basketballspieler am ehesten einen Treffer? In diesem NBA-Schussdatensatz aus den NBA-Playoffs 2021 kannst du genau diese Frage beantworten.
7. Prognose der E-Commerce-Verkäufe
Nutze diesen E-Commerce-Datensatz eines Online-Händlers, um mit Hilfe von Datenvisualisierung und Prognosetechniken zukünftige Verkäufe vorherzusagen. Der Datensatz ist sehr umfangreich und umfasst Bestellungen aus mehreren Ländern über ein Jahr hinweg und enthält eine Vielzahl von Variablen wie Rechnungsnummern, Lagercodes, Mengen und Stückpreise. Dies ermöglicht eine facettenreiche Analyse, die Zeitreihentrends, Kundensegmentierung und Produktkategorisierung umfassen kann. Die Herausforderungen regen dich dazu an, Datenanomalien wie negative Bestellmengen zu untersuchen, Gewinne in verschiedenen Zeiträumen zu visualisieren und Bestellgrößen zwischen Ländern zu vergleichen. Diese Aufgaben helfen dir nicht nur dabei, wichtige Data-Science-Fähigkeiten zu trainieren, sondern stellen auch reale Fragen aus der Geschäftswelt nach. Das Szenario fügt eine weitere Ebene der Komplexität hinzu, indem es dich auffordert, über 4000 einzigartige Produkte anhand verschiedener Merkmale zu kategorisieren, eine Aufgabe, die in der E-Commerce-Branche von großer Bedeutung ist.
Ein weiteres Python-Projekt für Anfänger, das sich mit eCommerce-Daten beschäftigt
8. Analysiere Airbnb-Angebote
Dies ist ein hervorragender Datensatz, um die Dynamik hinter Airbnb-Vermietungen zu verstehen. Mit der explorativen Datenanalyse und -visualisierung kannst du herausfinden, welche Stadtteile die beliebtesten Angebote haben, das Verhältnis zwischen Preis und Zimmertyp verstehen und vieles mehr.
9. BIP-Daten analysieren
Das Bruttoinlandsprodukt ist einer der stärksten Indikatoren für die wirtschaftliche Gesundheit einer Region oder Nation. Analysiere in diesem Datensatz, wie sich das BIP der Länder in den letzten 50 Jahren entwickelt hat.
10. Olympische Datenanalyse
Wer ist das erfolgreichste Land im Judo? Wie wirkt sich die Körpergröße eines Sportlers auf den Erfolg in einer Sportart aus? Mit der explorativen Analyse des Olympia-Datensatzes kannst du diese und weitere Fragen beantworten.
Ein Beispiel für die Ergebnisse des Olympiaprojekts
Python-Projekte für Fortgeschrittene
Diese Python-Projekte gehen über Anfängeraufgaben und Datensätze hinaus und fordern dich heraus, indem du mit nicht-tabellarischen Datensätzen (z. B. Bilder, Audio) arbeitest und deine Fähigkeiten im maschinellen Lernen an verschiedenen Problemen testest.
1. Song-Genres aus Audiodaten klassifizieren
Bist du ein echter Musikliebhaber? Dann wirst du in diesem Audioerkennungsprojekt Spaß daran haben, Musikgenres mit maschinellem Lernen anhand eines Musikdatensatzes vorherzusagen. Dieses Python-Projekt für Fortgeschrittene deckt die gesamte Data-Science-Pipeline ab, von der Datenexploration und dem Feature-Engineering bis hin zur Implementierung und Evaluierung verschiedener Machine-Learning-Algorithmen. Das Projekt befasst sich auch mit fortgeschrittenen Themen wie dem Umgang mit unausgewogenen Daten und Modellbewertungstechniken wie der Kreuzvalidierung. Dieses mehrstufige, bibliotheksintensive Projekt ist eine hervorragende Lernerfahrung und ein Portfolio für diejenigen, die ihre Fähigkeiten verbessern wollen.
2. Analysiere und visualisiere Uber-Abholungen in New York
Es macht immer Spaß, Datensätze mit Geostandorten zu analysieren und auf einer Karte zu visualisieren. Dieser Uber-Pick-up-Datensatz mit mehr als 20 Millionen Fahrten in New York City ist da keine Ausnahme.
3. Erkennung handschriftlicher Zeichen
Die MNIST-Ziffernerkennung ist ein guter Ausgangspunkt für das Üben von Deep Learning. Dieser Datensatz stellt jedoch eine zusätzliche Herausforderung dar, weil du englische handgeschriebene Buchstaben vorhersagen musst.
4. Erkennung von Kreditkartenbetrug
Kreditkartenbetrug ist immer eine Herausforderung - vor allem, weil es in den Daten ein starkes Klassenungleichgewicht geben wird. Das Projekt ist für fortgeschrittene Python-Benutzer geeignet, die sich für Data Science und maschinelles Lernen in den Bereichen Finanzen und Sicherheit interessieren. Das Projekt beinhaltet eine umfassende Analyse von Kreditkartentransaktionen, um betrügerische Aktivitäten zu erkennen. Er deckt ein breites Spektrum an Fähigkeiten ab, von der explorativen Datenanalyse, einschließlich der Erstellung von Geodatenplots, bis hin zur prädiktiven Modellierung. Das Projekt stellt uns auch vor reale Herausforderungen, wie z.B. den Umgang mit unausgewogenen Klassen und die ethischen Überlegungen zu falsch positiven Ergebnissen bei der Betrugserkennung. Das macht es zu einer vielseitigen Lernerfahrung, die nicht nur die technischen Fähigkeiten verbessert, sondern auch das kritische Denken über die Auswirkungen von maschinellen Lernmodellen in sensiblen Bereichen wie der finanziellen Sicherheit fördert.
Ein Beispiel für geospatiales Plotten aus diesem Python-Zwischenprojekt
5. Geschlechtervorhersage mit Hilfe von Geräuschen
In diesem Audiodatenprojekt wirst du das Fuzzy-Paket verwenden, um das Geschlecht von Namen anhand von Phonemen und deren Klang zu kategorisieren.
6. Stornogebühren für Hotelbuchungen
Wenn du dich für Immobilien interessierst, ist dies ein hervorragender Datensatz, mit dem du spielen kannst, um die Stornierungsraten von Hotelbuchungen zu verstehen. Mit einfachen Techniken des maschinellen Lernens kannst du versuchen, die Wahrscheinlichkeit von Hotelstornierungen auf der Grundlage von historischen Daten vorherzusagen.
7. Gesichtserkennung in Bildern
Hast du dich schon mal gefragt, warum dein iPhone kleine Kästchen um dein Gesicht legt? Das liegt daran, dass es unter der Haube eine Gesichtserkennung durchführt. Du kannst eine ähnliche Funktion mit diesem kleinen Datensatz von kommentierten Bildern mit Gesichtern erstellen.
8. Bestimme die Bienenarten anhand von Bildern
Kann ein maschineller Lernalgorithmus die Bienenart anhand eines Bildes erkennen? In diesem Projekt zur Bilderkennung wirst du genau das tun.
9. Analysiere und prognostiziere die Bike-Sharing-Nachfrage
Dieser Bikesharing-Datensatz enthält eine Fülle von Informationen über Fahrradfahrten für ein Bikesharing-Startup. In diesem Zwischenprojekt wird Python verwendet, um einen Datensatz zu analysieren, der verschiedene Faktoren wie Wetterbedingungen, Tageszeit und Feiertage enthält, um die Nachfrage nach Fahrradverleihern in Seoul vorherzusagen. Es bietet eine umfassende Lernerfahrung, die Fähigkeiten von der explorativen Datenanalyse bis zur prädiktiven Modellierung abdeckt. Zu den Herausforderungen des Projekts gehören der Vergleich der Verleihmuster zu verschiedenen Tages- und Jahreszeiten, die Visualisierung der Auswirkungen der Temperatur auf die Fahrradvermietung und die Ermittlung der einflussreichsten Variablen für die Fahrradnachfrage. Das macht es zu einem ausgezeichneten Projekt für diejenigen, die ihre Fähigkeiten in der Datenmanipulation, der Visualisierung und dem maschinellen Lernen verbessern und gleichzeitig Einblicke in die betrieblichen Herausforderungen eines skalierenden Startups gewinnen wollen.
Ein Beispiel aus dem Python-Projekt zum Fahrradverleih
10. Einen Tweet-Klassifikator erstellen
Unterschiedliche Persönlichkeiten haben unterschiedliche Tweetstile. In diesem Projekt zur Analyse sozialer Medien nutzt du maschinelles Lernen und natürliche Sprachverarbeitung, um zu erkennen, ob Tweets von Donald Trump oder Justin Trudeau verfasst wurden.
Fortgeschrittene Python-Projekte
Diese fortgeschrittenen Projekte gehen über komplexe Datensätze hinaus und fordern dich heraus, kreative Lösungen für interessante Probleme anzuwenden. Egal, ob es darum geht, Filmempfehlungssysteme zu erstellen, Netzwerke zwischen Charakteren in Büchern zu analysieren oder Zeichensprache mit maschinellem Lernen zu interpretieren - diese Projekte bieten dir genug Komplexität, um neue Fähigkeiten zu erlernen.
1. Baue ein Filmempfehlungssystem
Streaming-Plattformen bieten detaillierte Empfehlungen, die darauf basieren, wie du und andere wie du mit den Inhalten interagieren. In diesem Projekt für ein Empfehlungssystem lernst du, wie du ein Empfehlungssystem für Filme erstellen kannst.
2. Erkennung der amerikanischen Zeichensprache
Die Amerikanische Gebärdensprache ist die Hauptsprache, die von vielen Gehörlosen in Nordamerika verwendet wird. In diesem Projekt zur Bilderkennung wirst du Deep Learning einsetzen, um ASL-Buchstaben zu erkennen.
3. Nummernschilderkennung in Echtzeit
Ein großartiges Projekt zur Erkennung von Nummernschildern in Echtzeit mit Hilfe von Deep Learning auf Videodatensätzen. Schau dir das GitHub-Projekt an, das den Datensatz und den Code enthält.
Ein fortgeschrittenes Python-Projekt zur Nummernschilderkennung - Quelle
4. Stimmungsanalyse in den Schlagzeilen von Börsennachrichten
Die Stimmung der Anleger ist ein unglaublich wichtiger Indikator, wenn es darum geht, Hinweise auf die zukünftige Entwicklung einer Aktie zu finden. Mit natürlicher Sprachverarbeitung und maschinellem Lernen kannst du in diesem Projekt zur natürlichen Sprachverarbeitung automatisch Stimmungen aus Nachrichtenschlagzeilen extrahieren.
5. SMS-Spam-Erkennung
Die Spam-Erkennung ist ein Eckpfeiler der Datenwissenschaft und erfordert eine Kombination aus natürlicher Sprachverarbeitung und maschinellen Lernverfahren. Erstelle ein Tool zur Spam-Erkennung mit diesem SMS-Datensatz.
6. Netzwerkanalyse von Game of Thrones
Auch wenn Game of Thrones inzwischen etwas in die Jahre gekommen ist, hat es wie keine andere Serie die Fantasie der Welt erobert. Bei einer so großen Anzahl von Charakteren und Überlieferungen, war der wichtigste von ihnen überhaupt? In diesem Projekt zur Netzwerkanalyse wirst du genau diese Frage beantworten.
7. Mit maschinellem Lernen die Sterblichkeit im Verkehr reduzieren
In diesem Projekt zur Verkehrssterblichkeit untersuchst du historische Daten zur Verkehrssterblichkeit in den USA nach Bundesstaaten und wendest maschinelles Lernen an, um Ähnlichkeiten und Unterschiede zwischen den Staaten zu finden und detaillierte politische Empfehlungen zu geben. Du kannst dir unsere anderen Projekte zum maschinellen Lernen in einem separaten Artikel ansehen.
8. Filmähnlichkeit in Plot-Zusammenfassungen
Bei so vielen Filmen, die es gibt, ist es leicht, an Filme zu denken, die einander ähnlich sind. Was wäre, wenn du natürliche Sprachverarbeitung und maschinelles Lernen nutzen könntest, um Filme auf der Grundlage ihrer Handlungszusammenfassungen zu kategorisieren? Mit diesem Datensatz zur Filmähnlichkeit kannst du genau das tun. Dieses fortgeschrittene Python-Projekt bietet Herausforderungen in den Bereichen explorative Datenanalyse, Textmining und Trendanalyse. Die fortgeschrittenste Aufgabe besteht darin, einen Netzwerkgraphen zu erstellen, um die beruflichen Beziehungen zwischen Darstellern und Regisseuren zu analysieren, was Kenntnisse in komplexer Datenmanipulation und Graphentheorie erfordert. Dieses Projekt bietet eine robuste Plattform für die Anwendung fortschrittlicher Data Science-Techniken auf reale Daten.
Ein fortgeschrittenes Python-Projekt über Filmdaten
9. Filmgenre-Klassifizierung mit Multi-Label-Ausgabe
Ein Film kann verschiedene Genres kombinieren. Mit diesem Netflix-Filmdatensatz kannst du eine Multi-Label-Klassifizierung anwenden, um die vielen Genres eines Films anhand seiner Beschreibung, Bewertung und mehr vorherzusagen.
10. Erstellen und Bereitstellen einer Pipeline für maschinelles Lernen
Auch wenn es sich hier nicht um ein spezielles Projekt handelt, ist die Bereitstellung und Wartung der anderen Projekte auf dieser Liste eine unglaublich nützliche Fähigkeit, die du bei Arbeitgebern vorzeigen kannst. In diesem Tutorial erfährst du genau, wie du das machen kannst.
Lustige Python-Projekte zum Aufbau deiner Python-Kenntnisse
Diese Projekte sind zwar nicht die komplexesten, aber sie bieten interessante und ansprechende Datensätze, die du erforschen und mit denen du anfangen kannst, um dein Python-Lernen zu beschleunigen.
1. Gespenstische Autorenidentifikation
Klassifiziere die Werke von Krimiautoren. Finde heraus, ob ein Auszug entweder zu Edgar Allen Poe, HP Lovecraft oder Mary Shelley gehört.
2. Verkaufsprognose für Videospiele
Wartest du auf ein neues Spiel von Activision oder EA? Versuche vorherzusagen, wie gut es sich verkaufen würde, indem du die Daten von mehr als 16k vergangenen Videospielen verwendest.
3. Myers-Briggs (MBTI) Persönlichkeitstyp-Vorhersage
Nach dem MBTI-Indikator gibt es 16 Persönlichkeitstypen. Anstatt es zu googeln, kannst du mit diesem Datensatz deine Persönlichkeit vorhersagen.
4.Explore Bitcoin Preisdaten
Die Preise von Kryptowährungen haben die Welt mit ihrer extremen Volatilität in ihren Bann gezogen. In diesem Projekt wendest du die Techniken der Zeitreihenanalyse und Datenvisualisierung auf Bitcoin-Preise an.
5. Song Popularitätsvorhersage
In diesem großen Datensatz mit Liedern aus den 50er Jahren kannst du die Popularität eines Liedes anhand verschiedener Merkmale vorhersagen.
6. Analysiere Fitness-Tracker-Daten
Mit der Verbreitung von Fitness-Trackern kommt eine Fülle von Daten, die du analysieren kannst. In diesem Datenanalyse-Projekt analysierst und visualisierst du die Daten des Runkeeper-Fitnesstrackers.
7. Mit Daten gegen Mythen vorgehen
Eine Studie aus dem Jahr 1991 ergab, dass Linkshänder im Durchschnitt neun Jahre früher sterben als Rechtshänder. Ist das wirklich wahr? Finde es in diesem Projekt zur statistischen Analyse heraus.
8. Analysiere die Daten des Beatmungsgeräts
Mithilfe von Daten, die von Atemalkoholmessgeräten im Bundesstaat Iowa gesammelt wurden, kannst du die Trunkenheit in Iowa visualisieren und analysieren und Muster erkennen, die zu besseren politischen Entscheidungen führen können.
9. Auf den Musikplakaten ganz oben sein
Mit diesem Spotify-Datensatz von ca. 600 Liedern aus den Jahren 2010 bis 2019 kannst du untersuchen und analysieren, wie sich beliebte Genres in den letzten zehn Jahren entwickelt haben, das Genre eines Liedes anhand von Schlüsselattributen vorhersagen und vieles mehr.
10. Analysiere eine Lego-Datenbank
Auch wenn dieses Projekt einige SQL-Kenntnisse erfordert, kannst du mit dieser Lego-Datenbank Tausende von Lego-Verkäufen im Laufe des Jahres durchforsten und herausfinden, welche Lego-Sets am meisten Umsatz machen.
Zusätzliche angeleitete und ungeleitete Python-Projekte für die Praxis
In diesem Artikel haben wir auf viele DataCamp-Projekte und -Datensätze verlinkt. Das DataCamp bietet eine Vielzahl von geführten und ungeführten Projekten, je nachdem, welchen Schwierigkeitsgrad du anstrebst. Hier ist eine Liste mit zusätzlichen Projekten für die Praxis
Angeleitetes Python-Projekt für die Praxis
1. Vorhersage von Kreditkartengenehmigungen
Automatisierte Kreditkartengenehmigungen sind ein wichtiger Anwendungsfall für maschinelles Lernen im Bankwesen. In diesem Projekt über Kartengenehmigungen lernst du, wie du vorhersagen kannst, ob ein Kreditkartenantrag von den Banken angenommen oder abgelehnt wird.
2. Entdecke aktuelle Themen in der Machine Learning Forschung
Mithilfe dieses Datensatzes zu Trendthemen wirst du maschinelles Lernen anwenden, um die Zukunft der Forschungstrends im Bereich des maschinellen Lernens zu entdecken, indem du die Arbeiten der letzten zehn Jahre zu Neural Information Processing Systems analysierst.
3. Klassifizierung von Blutspendern
Blutspenden sind Lebensretter. In diesem Projekt zu Blutspendern analysierst du die Muster bei Blutspenden und sagst voraus, ob eine Person in Zukunft wieder spenden wird.
4. Vergleich von Kosmetika nach Inhaltsstoffen
Die Wahl eines Kosmetikprodukts, das die Gesundheit deiner Haut nicht gefährdet, ist schwer. In diesem angeleiteten Projekt lernst du, die Inhaltsstoffe von Kosmetika zu verarbeiten, um eine fundiertere Entscheidung darüber zu treffen, ob ein neues Kosmetikum gut für dich ist.
5. Eine visuelle Geschichte der Nobelpreisträger
Fast jeder in der Forschung träumt davon, einmal im Leben einen Nobelpreis zu bekommen. Aber haben dein Alter, deine Ethnie und dein Geschlecht Einfluss auf deine Chancen? Finde es heraus, indem du die Daten der Gewinner seit 1901 analysierst.
6. Die GitHub-Geschichte der Sprache Scala
Laut dem TIOBE-Index ist Scala die 34. beliebteste Programmiersprache. Wie es dazu kam, erfährst du, indem du die Geschichte des GitHub-Repositorys in diesem angeleiteten Projekt analysierst.
7. Die Entwicklung von Linux erforschen
Versionskontrollsysteme wie Git speichern umfangreiche Informationen über die Entwicklung eines Softwareprojekts. In diesem Projekt zur Linux-Evolution analysierst und transformierst du das echte Git-Repository des Linux-Kernels und verstehst, wie 700K+ Commits eines der meistgenutzten Betriebssysteme der Welt geschaffen haben.
8. Nachbau der Geisterkarte von John Snow
Doktor John Snow (nicht die Figur aus Game of Thrones) kartierte die Cholerafälle per Hand und ermittelte die Ursachen für die Ausbrüche in seinem Gebiet. In diesem historischen Projekt stellst du seine Arbeit und seine berühmte Karte nach.
9. Eine neue Ära der Datenanalyse im Baseball
Moneyball läutete die Ära der Sportanalyse ein. In diesem Projekt analysierst du MLB Statcast-Daten, um verschiedene Baseballspieler zu vergleichen und zu verstehen, was Home Runs antreibt.
10. Keywords für Google Ads generieren
Die Erstellung von Keywords für Suchanzeigen ist ein unglaublich akribischer und mühsamer Prozess. Was wäre, wenn du diese Aufgabe mit Python automatisieren könntest? In diesem Google Ads Keyword-Projekt erfährst du, wie du genau das tun kannst.
11. Mobile Spiele A/B-Tests
A/B-Tests sind die Grundlage für den Erfolg vieler digitaler Produkte und Dienstleistungen, und Handyspiele sind der beste Beweis dafür. In diesem Projekt wirst du die Auswirkungen eines Experiments im beliebten Spiel Cookie Cats auf die Nutzerbindung verstehen.
12. Forderungseinzug mit maschinellem Lernen priorisieren
Zahlungsausfälle sind ein großes Problem für Banken und Finanzinstitute. In diesem Projekt verwendest du maschinelles Lernen und Regressionen, um herauszufinden, wie eine Bank den Forderungseinzug priorisieren kann.
13. Buchempfehlungssystem von Charles Darwin
Charles Darwin war ein begeisterter Leser und hatte eine umfangreiche Bibliographie. In diesem Projekt nutzt du die Lieblingsbücher von Charles Darwin, um ein Empfehlungssystem zu erstellen, das Buchempfehlungen auf der Grundlage seiner Vorlieben gibt.
Ungeleitete Python-Projekte für die Praxis
1. Untersuchen von Netflix-Filmen und Gaststars im Büro
In diesem Projekt über The Office manipulierst und visualisierst du die Leistung der Netflix-Filme und der Gaststars in der kulturellen Phänomen-Serie "The Office".
2. Entdecke die Geschichte von Lego
Jede Sekunde werden etwa 1140 Lego-Teile produziert. Finde heraus, wie die beliebteste Spielzeugmarke der Welt so dominant wurde, indem du ihre historischen Verkaufsdaten analysierst.
3. Die Entdeckung des Händewaschens
Händewaschen ist für uns alle eine Selbstverständlichkeit, aber das war in der Vergangenheit nicht immer so. Tatsächlich entdeckte der ungarische Arzt Ignaz Semmelweis die Vorteile des Händewaschens, indem er die Sterblichkeitsdaten von Patienten in Krankenhäusern analysierte. Erstelle seine Datenanalyse mit diesem Datensatz nach.
4. Der Android App Market in Google Play
Der Markt für Android-Apps ist riesig und hart umkämpft. Analysiere und visualisiere diesen Datensatz aus dem Google Play Store, um herauszufinden, was eine gute App ausmacht.
5. Worthäufigkeit in klassischen Romanen
In diesem Projekt scrappst du einen Roman von der Website Projekt Gutenberg und analysierst dann die Verteilung der Wörter in einem großen Korpus von Büchern.
6. Schlechte Passwörter und die NIST-Richtlinien
Fast jede Website verlangt ein Passwort. Woher weißt du also, ob du das beste verwendest? In diesem Projekt erstellst du ein System, das automatisch überprüft, ob dein Passwort mit dem National Institute of Standards and Technology übereinstimmt.
7. Vergleich des Suchinteresses mit Google Trends
Google stellt seine Trends-API in Python zur Verfügung, damit die Nutzer das Suchinteresse für jedes beliebige Stichwort herausfinden können. Sie ist eine hervorragende Quelle für Zeitreihendaten mit Aufzeichnungen, die bis ins Jahr 2004 zurückreichen. In diesem Projekt erkundest du das weltweite Suchinteresse in fünf großen Internetbrowsern.
8. Den Airbnb-Markt in NYC erkunden
Nutze die Datenbereinigung und -manipulation, um Einblicke in den Airbnb-Markt von New York City zu erhalten.
Wie du wählst, welche Python-Projekte du in deinen Lebenslauf aufnimmst
Wie wählst du bei dieser langen Liste von Python-Projekten eines aus, das du in deinen Lebenslauf aufnehmen kannst? Laut Nick Singh, dem Autor des Bestsellers "Ace the Data Science Interview", gibt es vier wichtige Grundsätze, die du beachten solltest, wenn du Python-Projekte verfolgst.
1. Projekte sollten aus echtem Interesse entstehen
Wenn du ein Projekt zu einem Thema durchführst, das dich interessiert, wird der gesamte Prozess für dich interessanter und deine Chancen auf einen Abschluss steigen. Dieser Enthusiasmus überträgt sich auch, wenn du mit einem Personalverantwortlichen über dein Projekt sprichst.
2. Einfachheit übertrumpft Komplexität
Heutzutage ist es leicht, sich von ausgefallenen Tools und modernsten Techniken ablenken zu lassen. Die Datenwissenschaft in der realen Welt erfordert jedoch einen einfachen, pragmatischen Ansatz zur Lösungsentwicklung. Eines der Ziele eines Projekts ist es, deine Fähigkeit unter Beweis zu stellen, mit relativ einfachen Techniken nützliche Data Science-Lösungen zu entwickeln.
3. Schließe dein Projekt immer ab
Bei einem Projekt kann es leicht passieren, dass der Umfang zu groß wird. Als Faustregel gilt: Suche dir immer ein Projekt aus, von dem du weißt, dass du es von A bis Z abschließen kannst - selbst wenn es sich nur um eine einfache Datenanalyse handelt.
4. Das Projekt sollte eine quantifizierbare Wirkung haben
Sobald ein Projekt abgeschlossen ist, solltest du deine Arbeit mit anderen teilen und Feedback von der Gemeinschaft einholen, das sich in Zahlen ausdrücken lässt. Ob GitHub-Sterne, LinkedIn-Shares oder Reddit-Erwähnungen - das Teilen deiner Arbeit ist der beste Weg, um potenziellen Personalverantwortlichen die quantifizierbare Wirkung deines Projekts zu zeigen.
Bringe dein Python-Lernen auf die nächste Stufe
Wir hoffen, dass dir diese Liste von Python-Projekten gefallen hat und dass sie deine Python-Lernreise beschleunigen kann. Wenn du loslegen möchtest und zunächst eine Auffrischung in Python gebrauchen kannst, solltest du dir den Python-Lehrplan von DataCamp und die zusätzlichen Ressourcen unten ansehen.
Erfahre mehr über Python
Course
Intermediate Python
Course
Data Manipulation with pandas
Der Blog