Vai al contenuto principale

Feature Engineering nel Machine Learning: una guida pratica

Impara il feature engineering con questa guida pratica. Esplora tecniche come encoding, scaling e gestione dei valori mancanti in Python.
Aggiornato 3 giu 2026  · 15 min leggi

Il feature engineering consiste nel selezionare o creare feature significative che migliorano le prestazioni di un modello. Qualunque sia il tuo algoritmo di ML, è probabile che farai affidamento su tecniche di feature engineering per la preparazione dei dati.

In questo articolo esploreremo il feature engineering e i suoi metodi e capiremo come applicarli con un esempio pratico di previsione dei prezzi delle case. 

Cos'è il Feature Engineering nel Machine Learning?

Ricordo di aver costruito un modello per migliorare i tassi di consegna puntuale per un progetto di time-in-transit sul lavoro. Invece di addestrare complessi modelli ensemble, abbiamo usato un semplice algoritmo di regressione con solo tre feature aggiuntive derivate dai dati esistenti.

Solo questo approccio ha migliorato il nostro tasso di consegna puntuale dal 48% al 56%. È un enorme miglioramento, considerando 10 milioni di record. È questa la differenza che tecniche di feature engineering, come l'estrazione di feature, possono fare!

In poche parole, feature engineering significa selezionare le feature giuste a partire dai dati esistenti. 

Considera un dataset meteorologico con colonne per temperatura, località, mese, anno e data. La colonna della data potrebbe non aggiungere valore significativo per catturare le tendenze di stagionalità, dato che la colonna del mese fornisce già quell'informazione. Rimuovere la colonna della data può ridurre la dimensionalità del dataset senza impattare negativamente l'accuratezza delle previsioni meteo.

Tipi di feature nel Machine Learning

Prima di addentrarci nelle diverse tecniche di feature engineering, capiamo innanzitutto i tipi di feature disponibili.

Feature numeriche 

Come suggerisce il nome, le feature numeriche rappresentano i dati in numeri. Sono variabili quantitative continue. Esempi includono altezza, età e stipendio. 

Feature categoriche

Una colonna categorica può contenere solo feature discrete. Per esempio, il genere di una persona è una colonna categorica, poiché può avere solo alcuni tipi di genere. Il mese di nascita è un altro esempio perché i valori devono rientrare tra gennaio e dicembre. 

Le variabili categoriche sono ulteriormente suddivise in binarie e non binarie. Le variabili binarie hanno due possibili categorie, mentre le feature non binarie possono avere più categorie. 

Feature testuali e di serie temporali 

Le colonne testuali contengono solo dati di testo. Esempi includono recensioni di prodotti o colonne con descrizioni di prodotti in un dataset retail. 

Le feature di serie temporali, invece, rappresentano dati nel tempo, come vendite settimanali o fluttuazioni dei prezzi azionari nel corso di un anno.

Tipi di feature nel machine learning

Immagine dell'autore

Tecniche di Feature Engineering

Il feature engineering offre varie tecniche potenti per convertire colonne grezze in feature desiderabili. Qui ne discutiamo alcune tra le più rilevanti. 

Gestione dei valori mancanti

I valori mancanti possono distorcere le prestazioni del modello, quindi gestirli correttamente è fondamentale. Esistono due approcci principali:

  • Imputazione: L'imputazione è il processo di riempimento dei valori mancanti utilizzando le informazioni disponibili. Ad esempio, puoi usare media, moda e mediana per sostituire i valori mancanti. 
  • Eliminazione: Questo metodo rimuove le righe con valori mancanti ed è più adatto quando i dati mancanti sono meno del 10% della dimensione del dataset. 

Per una guida approfondita sulla gestione dei dati mancanti, leggi questo tutorial sulle tecniche per gestire i valori mancanti o esplora questo corso Dealing with Missing Data in Python.

Gestione degli outlier 

Gli outlier sono valori anomali significativamente diversi dal resto dei punti dati. Per esempio, se hai un dataset di stipendi con la maggior parte delle osservazioni tra 90.000 $ e 120.000 $, uno stipendio come 400.000 $ o 10.000 $ è un outlier. 

  • Sostituzione: puoi sostituire gli outlier con un valore statistico come il massimo o il minimo della colonna.
  • Trasformazioni: applica trasformazioni come log o radice quadrata per ridurne l'impatto. 
  • Modelli robusti: usa modelli meno sensibili agli outlier. Gli alberi decisionali, il gradient boosting e la regressione ridge sono meno influenzati dagli outlier. 
  • Eliminazione: se nessuno dei metodi funziona, eliminare gli outlier dal dataset è l'ultima opzione.

Codifica delle variabili categoriche

I modelli di machine learning non possono elaborare direttamente variabili categoriche, quindi devono essere convertite in rappresentazioni numeriche. Di seguito discutiamo alcune tecniche di encoding popolari. 

  • One-hot encoding: ogni categoria in una feature categorica è rappresentata come una colonna separata, con valore 1 se la categoria è presente nel campione e 0 per tutte le altre colonne. L'esempio seguente lo spiega.

Considera un dataset con la seguente feature categorica:

Nome 

Genere

John 

Maschio

Rachel

Femmina

Emma 

Femmina

Usando il one-hot encoding, creiamo colonne separate per ogni categoria possibile nella feature Gender feature:

Nome

Femmina

Maschio

John

0

1

Richale

1

0

Emma

1

0

Poiché John è Maschio, la colonna "Maschio" ottiene un 1, mentre la colonna "Femmina" resta 0. Allo stesso modo, Rachel ed Emma sono Femmina, quindi la colonna "Femmina" vale 1 e la colonna "Maschio" 0.

Per un tutorial completo sul one-hot encoding in Python, dai un'occhiata a questo One-Hot Encoding Tutorial.

  • Label encoding: Il label encoding assegna un valore numerico univoco a ciascuna categoria in una feature categorica. Questo approccio è utile per dati ordinali (dove le categorie hanno un ordine significativo) ma può introdurre problemi nelle variabili categoriche non ordinali, poiché il modello potrebbe interpretare erroneamente i valori numerici come se avessero una gerarchia intrinseca.

Considera un dataset con una colonna Location contenente valori categorici:

Località 

Valore codificato

New York 

1

California 

2

Texas

3

California

2

Texas

3

A ogni località univoca viene assegnato un valore numerico distinto. Tuttavia, poiché California (2) non è intrinsecamente "tra" New York (1) e Texas (3), usare il label encoding per dati non ordinali può portare ad assunzioni fuorvianti del modello. In questi casi, il one-hot encoding è spesso preferito per evitare di implicare una relazione numerica indesiderata tra categorie.

  • Ordinal encoding: L'ordinal encoding è simile al label encoding ma viene utilizzato specificamente quando i valori categorici hanno un ordine significativo. Invece di assegnare valori numerici arbitrari, mappa le categorie in base al loro ranking. Questo assicura che i valori più alti corrispondano a categorie di rango più elevato.

Considera una colonna Education level con le seguenti categorie:

Livello di istruzione

Valore codificato

UG (Undergraduate)

1

PG (Postgraduate)

2

PhD

3

Poiché un PhD rappresenta un livello di istruzione più alto di un PG, che a sua volta è più alto di UG, i valori numerici assegnati riflettono questa graduatoria.

  • Target encoding: Sostituisce ciascun valore categorico con la media dei corrispondenti valori della variabile target. La variabile target è la variabile dipendente che il modello sta cercando di prevedere. Questa tecnica è particolarmente utile quando si gestiscono feature categoriche ad alta cardinalità (cioè con molti valori unici), poiché aiuta a ridurre la dimensionalità mantenendo al contempo informazioni rilevanti.

Considera un dataset in cui Location è una feature categorica e la Target variable rappresenta un qualche esito numerico:

Località

Variabile target

New York 

2

California 

3

Texas

5

California

1

Texas

4

Per codificare la colonna Location, calcoliamo la media della Target variable per ogni categoria unica:

  • California: (3 + 1) / 2 = 2
  • Texas: (5 + 4) / 2 = 4,5
  • New York: un solo valore (2), quindi resta 2

Località

Valore codificato

New York 

2

California 

2

Texas

4,5

California

2

Texas

4,5

Se cerchi una guida più ampia sulla gestione dei dati categorici, questo tutorial sulla gestione dei dati categorici offre ulteriori approfondimenti.

Feature scaling 

Il feature scaling assicura che le feature numeriche rientrino in un intervallo standardizzato, evitando che alcune feature dominino il processo di apprendimento a causa dei loro valori più grandi.

I modelli di machine learning che si basano su calcoli di distanza (ad esempio, regressione lineare, k-nearest neighbors e reti neurali) possono essere influenzati quando le feature hanno scale molto diverse.

Per esempio, considera un dataset di dipendenti con le seguenti feature:

  • L'età varia da 20 a 60
  • Il reddito varia da 30.000 $ a 150.000 $

Poiché il reddito ha valori molto più grandi dell'età, un modello potrebbe attribuire maggiore importanza al reddito semplicemente per via della scala, non perché sia effettivamente più rilevante.

Ecco alcune tecniche comuni:

  • Normalizzazione (min-max scaling): questo metodo scala tutti i valori delle feature affinché rientrino tra 0 e 1. Sottrae il valore minimo della colonna da ogni dato e poi lo divide per il range di quella colonna, ovvero la differenza tra il valore massimo e minimo. La formula è questa:

Valore scalato =( datapoint - min(colonna))/(max(colonna) - min(colonna))

  • Standardizzazione (Z-score scaling): trasforma tutte le feature affinché abbiano media 0 e deviazione standard 1. La formula è: si sottrae la media di una colonna a ciascun dato di quella colonna e il residuo si divide per la deviazione standard di quella feature. 

Valore scalato =( datapoint - mean(colonna))/(std(colonna))

Per un confronto dettagliato tra normalizzazione e standardizzazione, dai un'occhiata a questa guida Normalization vs. Standardization.

Creazione di nuove feature

Creare nuove feature significative a partire dai dati esistenti offre insight più logici per il modello. 

Per esempio, in un dataset di previsione dei prezzi delle case, se hai le colonne length e breadth separatamente, puoi derivare una nuova feature: area = length * breath, che può essere direttamente correlata alla variabile target, price. Fornire questa feature area al modello semplifica la scoperta di pattern nascosti. 

Selezione delle feature

La selezione delle feature mantiene solo le feature rilevanti rimuovendo le colonne non necessarie. Concentrarsi sui dati più informativi aiuta a prevenire l'overfitting, ridurre la complessità computazionale e migliorare le prestazioni del modello. Ecco alcune tecniche:

  • Metodi filtro: questo metodo seleziona feature importanti in base alle loro proprietà statistiche. Ad esempio, possiamo rimuovere feature che trasmettono la stessa informazione usando una heatmap di correlazione. Altre tecniche includono il test Chi-quadro, ANOVA e i metodi di Information Gain.
  • Metodi wrapper: questi metodi addestrano iterativamente un modello predittivo usando diverse combinazioni di sottoinsiemi di feature, e si sceglie il sottoinsieme migliore con prestazioni ottimizzate del modello. Selezione in avanti, selezione all'indietro ed eliminazione ricorsiva rientrano in questa categoria. 

Feature Engineering in Python: un esempio pratico

Il feature engineering si comprende al meglio tramite l'implementazione pratica.

Il dataset "house price prediction" è grande e reale, con 81 colonne. L'ho selezionato per l'ampia gamma di feature, che può aiutarti a comprendere meglio le tecniche di feature engineering in pratica.

Per iniziare:

  1. Scarica il dataset da Kaggle.
  2. Caricalo in un DataFrame Pandas per analisi e feature engineering.

Gestione dei valori mancanti categorici

Il seguente codice identifica le colonne categoriche nel dataset e sostituisce i loro valori mancanti con la categoria più frequente:

import pandas as pd

# Load dataset (replace 'your_file.csv' with the actual file name)
df = pd.read_csv('your_file.csv')

# Select categorical columns
categorical_cols = df.select_dtypes(include=['object']).columns

# Replace missing values with the most frequent category (mode)
for col in categorical_cols:
    mode = df[col].mode()[0]  # Get the most common value
    df[col].fillna(mode, inplace=True)  # Fill missing values

Gestione dei valori mancanti numerici

Gestiamo i valori mancanti numerici sostituendoli con media o mediana. La media è un'opzione più comune per dati distribuiti statisticamente, mentre la mediana funziona bene quando la colonna ha outlier. Quindi, controlleremo la presenza di outlier e decideremo il metodo. 

Per visualizzare potenziali outlier, possiamo usare i box plot, che aiutano a identificare i valori estremi. Di seguito un'implementazione Python per rilevare outlier in alcune colonne numeriche selezionate:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

features = ['LotFrontage', 'MasVnrArea', 'GarageYrBlt']  

# Plot box plots
df[features]=np.log(df[features])
df[features].boxplot(figsize=(8, 4))

plt.title('Box Plot for Outlier Detection')
plt.ylabel('Values')
plt.xticks(rotation=45)
plt.show()

Output:

Box plot per il rilevamento degli outlier

I boxplot sopra mostrano punti fuori dai baffi: questi sono chiamati outlier. Quindi, sostituiamo i valori mancanti con la mediana.

Codice per sostituire i null con valori mediani:

import pandas as pd
# Select numerical columns
numerical_columns = df.select_dtypes(include=['number']).columns
for col in numerical_columns:
    median = df[col].median()  
    df[col].fillna(median, inplace=True)  # Replace nulls with median

Creazione di nuove feature

Colonne come YearBuilt, YearRemodAdd, GarageYrBlt e YrSold contengono anni (ad es., 2001, 1976) che non influenzano direttamente la variabile target. Sebbene questi valori assoluti degli anni possano non impattare direttamente i prezzi delle case, possiamo ricavare insight più utili calcolando quanti anni ha la casa o la ristrutturazione al momento della vendita.

Per esempio, invece di usare YearBuilt, possiamo creare una nuova feature: House Age=YrSoldYearBuilt

Codice per creare queste nuove feature:

# Get columns that contain 'Yr' or 'Year'
year_columns = [feature for feature in numerical_columns if 'Yr' in feature or 'Year' in feature]

# Convert year values into age-related features
for col in year_columns:
    df[col] = df['YrSold'] - df[col]

Trasformazione delle feature

Nel machine learning, feature numeriche asimmetriche possono influire negativamente sulle prestazioni del modello, specialmente per modelli che assumono una distribuzione normale (ad es., regressione lineare). Per correggere questo aspetto, applichiamo la trasformazione logaritmica.

Prima di applicare una trasformazione logaritmica, dobbiamo identificare le feature asimmetriche. Tuttavia, escludiamo le colonne contenenti zeri poiché il logaritmo di zero non è definito.

Ecco un'implementazione in Python per identificare le colonne asimmetriche:

import pandas as pd

# Get numerical columns
numerical_columns = df.select_dtypes(include=['number']).columns

# Identify columns containing zeros
numerical_0s = df.loc[:, (df == 0).any()].select_dtypes(include=['number']).columns

# Remove columns that contain zeros from consideration
numerical_columns = numerical_columns.difference(numerical_0s)

# Calculate skewness for the remaining numerical columns
skewness = df[numerical_columns].skew()

# Set threshold for skewness (e.g., absolute value > 1 indicates high skewness)
skewed_columns = skewness[abs(skewness) > 1]

# Display skewed columns
print("Skewed Columns:")
print(skewed_columns)

Output:

Useremo la distribuzione lognormale per convertire queste cinque colonne asimmetriche in una distribuzione gaussiana:

import numpy as np

# The list of highly skewed features identified earlier
skew_features = ['LotFrontage', 'LotArea', '1stFlrSF', 'GrLivArea', 'SalePrice']

# Apply log transformation to each skewed feature
for col in skew_features:
    df[col] = np.log(df[col])

Convertire le feature categoriche in valori numerici

Abbiamo precedentemente discusso diverse tecniche di encoding; in questo esempio, applicheremo il target encoding.

# Select categorical variables
categorical_columns = df.select_dtypes(include=['object', 'category']).columns

# Apply target encoding
for col in categorical_columns:
    # Compute mean SalePrice for each category
    labels_ordered = df.groupby([col])['SalePrice'].mean().sort_values().index
    
    # Assign numerical values based on target variable mean
    labels_ordered = {x: i for i, x in enumerate(labels_ordered, 0)}
    
    # Map encoded values back to the dataframe
    df[col] = df[col].map(labels_ordered)

Nel codice sopra, la variabile target è SalePrice, quindi abbiamo raggruppato i dati per ciascuna colonna categorica e calcolato la media di SalePrice per ogni gruppo. Questi valori medi sono stati quindi assegnati ai corrispondenti valori categorici in quella colonna.

Il nostro dataset è ora pronto per il machine learning! 

Se vuoi rafforzare la comprensione dei concetti di apprendimento supervisionato e di come i modelli utilizzino le feature ingegnerizzate, questo corso Supervised Learning with Scikit-Learn è un'eccellente risorsa.

Strumenti e librerie per il Feature Engineering

In questa sezione, passeremo in rassegna le librerie Python e gli strumenti di automazione più usati per implementare il feature engineering. 

Pandas

Pandas è il framework Python più usato per la gestione di dati strutturati. Esegue molte fasi di feature engineering, come trasformazione, aggregazione dei dati ed estrazione di feature. Pandas rende anche semplice la pulizia e la manipolazione dei dati.

Se sei alle prime armi con pandas, questo corso Data Manipulation with pandas è un ottimo punto di partenza.

Scikit-Learn

Scikit-learn è una potente libreria di machine learning con vari strumenti per il feature engineering. Contiene metodi come OneHotEncoder e LabelEncoder per convertire variabili categoriche in numeriche. Offre anche metodi di feature scaling come StandardScaler e Minmaxscaler

Feature-Engine

Feature-engine è una libreria Python open-source che offre una varietà di transformer per semplificare il feature engineering. Questi transformer sono strumenti specializzati per compiti specifici, come imputazione dei dati mancanti, gestione degli outlier, selezione delle feature e discretizzazione. Pienamente compatibili con scikit-learn, questi transformer possono essere passati come parametri di input per l'ottimizzazione degli iperparametri.

Strumenti di feature engineering automatizzato

  • Featuretools: Featuretools è una libreria open-source per automatizzare il feature engineering. Il framework è utilizzato principalmente per creare nuove feature da un database relazionale. Si basa sull'algoritmo DFS (deep feature synthesis), che costruisce nuove feature a partire da operazioni di trasformazione e aggregazione. 
  • TSFresh: TSFresh, noto come Time Series Feature Extraction based on Scalable Hypothesis Tests, è progettato appositamente per estrarre feature significative da dati di serie temporali. La libreria effettua test d'ipotesi per selezionare le feature statisticamente significative per la previsione. 
  • Autofeat: La libreria Autofeat automatizza selezione, creazione e trasformazione delle feature per migliorare l'accuratezza dei modelli lineari. Ad esempio, invece di fit(), la libreria offre un metodo fit_transform() che esegue simultaneamente le operazioni di fit e transform sui dati in input. Inoltre, sono disponibili i modelli FeatureSelector e AutoFeatLight per selezione e scaling delle feature.

Best practice per il Feature Engineering

Per implementare efficacemente il feature engineering, concentrati su queste best practice.

Conosci i tuoi dati

Capire il significato e la rilevanza di ogni feature rende molto più semplice eseguire tecniche come selezione o estrazione di feature. Ti suggerisco di fare ricerca sui tuoi dati e sulla conoscenza del dominio per un feature engineering efficace.

Conduci un'analisi esplorativa dei dati (EDA)

Utilizza librerie Python come Pandas e Matplotlib per condurre una analisi esplorativa dei dati completa, ad esempio esplorando informazioni statistiche, visualizzazioni e correlazioni per trovare pattern e potenziali relazioni nei dati.  

Crea feature di interazione

Creare feature di interazione implica identificare relazioni tra feature esistenti e derivarne di nuove. Per esempio, nella previsione dei prezzi delle case, calcolare l'età di una casa sottraendo l'anno di costruzione dall'anno corrente mette in evidenza tendenze, come la diminuzione del prezzo con il passare del tempo. 

Scegli in anticipo il tuo modello

Diversi modelli di machine learning richiedono diversi passaggi di feature engineering. Per esempio, modelli come regressione lineare o multipla, SVM e KNN beneficiano spesso della standardizzazione delle feature, ma questa tecnica non aiuta i modelli basati su alberi. 

Quindi, decidere in anticipo il tuo modello può aiutarti a costruire una pipeline di feature engineering efficace per il tuo caso d'uso. 

Conclusione

Il feature engineering è una parte integrante della costruzione di soluzioni di machine learning, che ti consente di sfruttare le feature nel modo più efficiente. Il processo è svolto da data scientist o ML engineer quando lavorano con qualsiasi dataset. Se sei un professionista dei dati o aspiri a diventarlo, padroneggiare tutte le tecniche menzionate in questo articolo ti aiuterà a far progredire la tua carriera!

Per esplorare queste tecniche più in dettaglio, dai un'occhiata ai corsi di DataCamp su feature engineering per il machine learning e feature engineering per l'NLP. C'è anche un corso su feature engineering per programmatori R.

FAQs

In cosa il feature engineering è diverso dalla feature selection?

Il feature engineering consiste nel creare nuove feature o trasformare quelle esistenti per migliorare le prestazioni del modello. La feature selection, invece, è il processo di scelta delle feature più rilevanti e di scarto di quelle irrilevanti o ridondanti per prevenire l'overfitting e ridurre la complessità del modello.

Il feature engineering può essere automatizzato?

Sì! Strumenti di Feature Engineering automatizzato come FeatureTools, librerie AutoML (ad es., Auto-sklearn, H2O.ai) e AutoML Tables di Google possono creare e trasformare feature automaticamente, risparmiando tempo e fatica. Tuttavia, la conoscenza del dominio resta fondamentale per interpretare e selezionare le migliori feature.

In che modo il feature engineering influisce sull'interpretabilità del modello?

Il feature engineering può migliorare o ridurre l'interpretabilità, a seconda delle tecniche utilizzate. Per esempio:

  • Creare feature significative (ad es., "House Age" invece di "YearBuilt") migliora l'interpretabilità.
  • Applicare trasformazioni come la PCA (Principal Component Analysis) può rendere le feature meno interpretabili ma migliorare le prestazioni del modello.

Il feature engineering dipende dal tipo di modello di machine learning?

Sì! Modelli diversi beneficiano di diverse tecniche di feature engineering:

  • Modelli lineari (ad es., Regressione Lineare, Regressione Logistica) – Richiedono il feature scaling e spesso beneficiano di trasformazioni polinomiali delle feature.
  • Modelli basati su alberi (ad es., Decision Tree, Random Forest, XGBoost) – Gestiscono bene dati non scalati e spesso beneficiano più della selezione delle feature che delle trasformazioni.
  • Modelli di deep learning – Preferiscono feature grezze, e trasformazioni come gli embedding aiutano con i dati categorici.

Cos'è il feature crossing e quando dovrei usarlo?

Il feature crossing è il processo di combinare due o più feature per crearne una nuova che catturi le interazioni tra di esse. Esempio:

  • Invece di usare "Age" e "Income" separatamente, crea "Income-to-Age Ratio" per catturare la stabilità finanziaria nei diversi gruppi d'età.
  • Usa il feature crossing quando le relazioni tra variabili influenzano la variabile target in modo non lineare.

Come posso valutare se una feature migliora le prestazioni del modello?

Puoi valutare l'importanza delle feature usando:

  • Permutation Importance – Misura come il rimescolamento di una feature influisce sull'accuratezza del modello.
  • Feature Importance nei modelli ad albero – Molti modelli come le Random Forest forniscono punteggi di importanza delle feature integrati.
  • Prestazioni in cross-validation – Confronta l'accuratezza del modello con e senza una feature.

Cos'è l'interaction feature engineering?

L'interaction feature engineering consiste nel creare nuove feature basate sulle interazioni tra feature esistenti. Questo può includere:

  • Moltiplicazione (Product Features): combinare due feature (ad es., "Height × Weight" per il BMI).
  • Rapporti: dividere una feature per un'altra (ad es., "Prezzo al metro quadro").
  • Feature polinomiali: elevare le feature a una potenza (ad es., "Age²" per relazioni non lineari).

Come gestisci variabili categoriche ad alta cardinalità?

Per variabili categoriche con molti valori unici (ad es., CAP, ID utente):

  • Target Encoding: sostituisci le categorie con la media della variabile target.
  • Layer di embedding (per il Deep Learning): apprendono rappresentazioni a dimensionalità inferiore delle categorie.
  • Hashing Encoding: assegna le categorie a bucket usando una funzione di hashing.

Srujana Maddula's photo
Author
Srujana Maddula
LinkedIn

Srujana è una tech writer freelance con una laurea quadriennale in Informatica. Scrivere di vari argomenti, tra cui data science, cloud computing, sviluppo, programmazione, sicurezza e molti altri, le viene naturale. Ama la letteratura classica ed esplorare nuove destinazioni.

Argomenti

Scopri di più sul machine learning con questi corsi!

Corso

Machine Learning for Time Series Data in Python

4 h
53.2K
This course focuses on feature engineering and machine learning for time series data.
Vedi dettagliRight Arrow
Inizia il corso
Mostra altroRight Arrow
Correlato

blog

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Guida al preprocessing NLP nel machine learning. Copriamo spaCy, i transformer di Hugging Face e come funziona la tokenizzazione in casi d'uso reali.
Abid Ali Awan's photo

Abid Ali Awan

10 min

blog

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

Esplora le basi di Snowflake, la piattaforma dati cloud. Scopri la sua architettura, le sue funzionalità e come integrarla nelle tue pipeline di dati.
Tim Lu's photo

Tim Lu

12 min

blog

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Scopri i 15 migliori server MCP remoti che stanno trasformando lo sviluppo AI nel 2026. Scopri come migliorano automazione, ragionamento, sicurezza e velocità dei workflow.
Abid Ali Awan's photo

Abid Ali Awan

15 min

Mostra altroMostra altro