Curs
Reducerea dimensionalității în R
De bazăNivel de competențe
Actualizat 12.2024
RMachine Learning4 h16 videoclipuri56 Exerciții4,600 XP2,745Certificat de realizare
Creează-ți contul gratuit
Continuă cu GoogleArată mai multe opțiunisau
Continuând, accepți Termenii de utilizare, Politica de confidențialitate și că datele tale sunt stocate în SUA.
Îndrăgit de cursanți din mii de companii
Formare pentru o echipă?
Încearcă pentru afaceriDescrierea cursului
De ce să înveți reducerea dimensionalității?
Trăim în era informației—o epocă a supraîncărcării cu informații. Arta de a extrage informații esențiale din date este o abilitate căutată pe piață. Modelele se antrenează mai rapid pe date reduse. În producție, modelele mai mici înseamnă timp de răspuns mai rapid. Poate cel mai important, datele și modelele mai mici sunt adesea mai ușor de înțeles. Reducerea dimensionalității este briciul lui Occam în știința datelor.
Ce vei învăța în acest curs?
Diferența dintre selecția caracteristicilor și extragerea caracteristicilor! Folosind R, vei învăța cum să identifici și să elimini caracteristicile cu informații reduse sau redundante, păstrând caracteristicile cu cea mai multă informație. Asta este selecția caracteristicilor. Vei învăța, de asemenea, cum să extragi combinații de caracteristici sub formă de componente condensate care conțin informații maxime. Asta înseamnă extragerea caracteristicilor!
Dar, cel mai important, folosind noul pachet tidymodel din R, vei folosi date din lumea reală pentru a construi modele cu mai puține caracteristici, fără a sacrifica semnificativ performanța.
Cerințe prealabile
Modeling with tidymodels in R1
Bazele reducerii dimensionalității
Pregătește-te să simplifici seturi mari de date! Vei învăța despre informație, cum să evaluezi importanța atributelor și vei exersa identificarea atributelor cu informație redusă. La finalul capitolului, vei înțelege diferența dintre selecția atributelor și extracția atributelor – cele două abordări ale reducerii dimensionalității.
2
Selecția atributelor după importanță
Învață să identifici atributele bogate în informație și pe cele sărace în informație folosind ratele valorilor lipsă, varianța și corelația. Apoi vei descoperi cum să construiești rețete tidymodels pentru a selecta atribute pe baza acestor indicatori de informație.
3
Selecția atributelor pentru performanța modelului
Capitolul trei prezintă diferența dintre abordările nesupervizate și cele supervizate de selecție a atributelor. Vei recapitula cum să folosești fluxurile de lucru tidymodels pentru a construi modele. Apoi vei efectua selecția supervizată a atributelor folosind regresia lasso și modele de tip random forest.
4
Extracția atributelor și performanța modelului
În acest capitol final, vei dobândi o înțelegere solidă a extracției atributelor, explorând modul în care componentele principale extrag și combină cele mai importante informații din diferite atribute. Vei învăța și vei aplica trei tipuri de extracție a atributelor: analiza componentelor principale (PCA), t-SNE și UMAP. Vei descoperi cum poți folosi aceste metode de extracție ca etapă de preprocesare în procesul de construire a modelelor cu tidymodels.
Reducerea dimensionalității în R
Curs finalizat
Obține diploma de absolvire
Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumatDistribuie pe rețelele de socializare și în evaluarea ta de performanțăÎnscrie-te acum
Alătură-te celor peste 19 de milioane de cursanți și începe Reducerea dimensionalității în R astăzi!
Creează-ți contul gratuit
Continuă cu GoogleArată mai multe opțiunisau
Continuând, accepți Termenii de utilizare, Politica de confidențialitate și că datele tale sunt stocate în SUA.
Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil
Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.