본문으로 바로가기
Python

강의

Python으로 배우는 NLP 피처 엔지니어링

고급기술 수준
업데이트됨 2024. 11.
텍스트에서 유용한 정보를 추출하고, 머신러닝에 적합한 형식으로 가공하는 기법을 학습합니다.
무료로 강의 시작
PythonMachine Learning4시간15 동영상52 연습 문제4,200 XP28,897성취 증명서

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개 기업의 학습자들이 사랑하는

Group

2명 이상을 교육하시나요?

DataCamp for Business 체험

강의 설명

이 강의에서는 텍스트에서 유용한 정보를 추출하고 ML 모델에 적용하기 적합한 형식으로 처리하는 기법을 학습해요. 구체적으로 POS 태깅, 개체명 인식(NER), 가독성 점수, n-gram과 tf-idf 모델을 배우고, 이를 scikit-learn과 spaCy로 구현하는 방법을 익힙니다. 또한 두 문서가 서로 얼마나 유사한지도 계산해 볼 거예요. 실습을 통해 영화 리뷰의 감성을 예측하고, 영화와 TED Talk 추천 시스템을 만들어 봅니다. 강의를 마치고 나면 어떤 텍스트에서도 핵심 피처를 설계해 내고, 데이터 사이언스의 까다로운 문제들을 해결할 수 있게 될 거예요!

선수 조건

Introduction to Natural Language Processing in PythonSupervised Learning with scikit-learn
1

Basic features and readability scores

Learn to compute basic features such as number of words, number of characters, average word length and number of special characters (such as Twitter hashtags and mentions). You will also learn to compute readability scores and determine the amount of education required to comprehend a piece of text.
챕터 시작
2

Text preprocessing, POS tagging and NER

In this chapter, you will learn about tokenization and lemmatization. You will then learn how to perform text cleaning, part-of-speech tagging, and named entity recognition using the spaCy library. Upon mastering these concepts, you will proceed to make the Gettysburg address machine-friendly, analyze noun usage in fake news, and identify people mentioned in a TechCrunch article.
챕터 시작
3

N-Gram models

4

TF-IDF and similarity scores

Python으로 배우는 NLP 피처 엔지니어링
강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 자격증을 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 Python으로 배우는 NLP 피처 엔지니어링을(를) 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.