Accéder au contenu principal
AccueilPython

Projet

Find Movie Similarity from Plot Summaries

Débutant
Actualisé 09/2024
Use NLP and clustering on movie plot summaries from IMDb and Wikipedia to quantify movie similarity.
Démarrer le projet gratuitement

Inclus avecPremium or Teams

PythonData ManipulationData VisualizationMachine LearningProbability & Statistics45 minutes12 Tasks1,500 XP6,961

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du projet

Find Movie Similarity from Plot Summaries

Natural Language Processing (NLP) is an exciting field of study for data scientists where they develop algorithms that can make sense out of conversational language used by humans. In this Project, you will use NLP to find the degree of similarity between movies based on their plots available on IMDb and Wikipedia.The dataset contains the titles of the top 100 movies on IMDb as well as each movie's plot summary from both IMDb and Wikipedia.

Find Movie Similarity from Plot Summaries

Use NLP and clustering on movie plot summaries from IMDb and Wikipedia to quantify movie similarity.
Démarrer le projet gratuitement
  • 1

    Import and observe dataset

  • 2

    Combine Wikipedia and IMDb plot summaries

  • 3

    Tokenization

  • 4

    Stemming

  • 5

    Club together Tokenize & Stem

  • 6

    Create TfidfVectorizer

  • 7

    Fit transform TfidfVectorizer

  • 8

    Import KMeans and create clusters

  • 9

    Calculate similarity distance

  • 10

    Import Matplotlib, Linkage, and Dendrograms

  • 11

    Create merging and plot dendrogram

  • 12

    Which movies are most similar?

Rejoignez plus de 16 millions d’apprenants et commencer Find Movie Similarity from Plot Summaries dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.