Guida completa al Data Augmentation

Scopri tecniche, applicazioni e strumenti di data augmentation con un tutorial su TensorFlow e Keras.

Aggiornato 3 giu 2026 · 15 min leggi

Esplora con l'AI

Apri in ChatGPT Apri in Claude Apri in Perplexity

I modelli sono validi solo quanto i dati su cui vengono addestrati, ma raccogliere dataset ampi e diversificati richiede molto lavoro.

La data augmentation offre una soluzione: creando versioni modificate dei dati esistenti, puoi ampliare artificialmente il set di training, ridurre l’overfitting e costruire modelli che generalizzano meglio.

Questa guida copre le principali tecniche di data augmentation per immagini, testo e audio. Troverai anche una panoramica degli strumenti standalone più usati da integrare nel tuo workflow.

Che cos’è la Data Augmentation?

La data augmentation è una tecnica per aumentare artificialmente il set di training creando copie modificate di un dataset a partire dai dati esistenti. Comprende piccole modifiche al dataset o l’uso del deep learning per generare nuovi punti dati.

Dati aumentati vs. dati sintetici

Data augmentation e generazione di dati sintetici sono tecniche distinte ma complementari nel machine learning:

Dati aumentati: consiste nel creare versioni modificate dei dati esistenti per aumentare la diversità del dataset. Ad esempio, nell’elaborazione di immagini, applicare trasformazioni come rotazioni, ribaltamenti o regolazioni del colore alle immagini esistenti può aiutare i modelli a generalizzare meglio.
Dati sintetici: si riferisce a dati generati artificialmente, che consentono a ricercatori e sviluppatori di testare e migliorare gli algoritmi senza mettere a rischio la privacy o la sicurezza dei dati reali.

Nota: le tecniche di augmentation non sono limitate alle immagini. Puoi aumentare anche audio, video, testo e altri tipi di dati.

Perché la data augmentation è importante?

La data augmentation aiuta i modelli di machine learning a performare meglio sfruttando al massimo i dati esistenti. Previene l’overfitting, migliora l’accuratezza e crea diversità nei dati di training, aspetto cruciale quando i dataset sono piccoli o sbilanciati. Simulando variazioni del mondo reale, rende i modelli più robusti e affidabili—senza dover ricorrere a una costosa raccolta dati. In breve, è un modo semplice e potente per aiutare i modelli a imparare e generalizzare in modo efficace.

Quando dovresti usare la data augmentation?

Per prevenire l’overfitting dei modelli.
Il set di training iniziale è troppo piccolo.
Per migliorare l’accuratezza del modello.
Per ridurre i costi operativi di etichettatura e pulizia del dataset grezzo.

Limitazioni della data augmentation

I bias presenti nel dataset originale persistono anche nei dati aumentati.
La garanzia di qualità per la data augmentation è costosa.
Sono necessari ricerca e sviluppo per costruire un sistema con applicazioni avanzate. Ad esempio, generare immagini ad alta risoluzione con le GAN può essere complesso.
Trovare un approccio di data augmentation efficace può essere difficile.

Tecniche di Data Augmentation

In questa sezione vedremo tecniche di data augmentation per audio, testo, immagini e approcci avanzati.

Data augmentation per l’audio

Iniezione di rumore: aggiungi rumore gaussiano o casuale al dataset audio per migliorare le prestazioni del modello.
Shifting: sposta l’audio a sinistra (avanzamento veloce) o a destra di un numero casuale di secondi.
Variazione della velocità: dilata la serie temporale con un tasso fisso.
Variazione dell’intonazione: cambia casualmente il pitch dell’audio.

Data augmentation per il testo

Shuffle di parole o frasi: cambia casualmente la posizione di una parola o di una frase.
Sostituzione di parole: sostituisci parole con sinonimi.
Manipolazione dell’albero sintattico: parafrasa la frase usando le stesse parole.
Inserimento casuale di parole: inserisce parole in posizioni casuali.
Eliminazione casuale di parole: elimina parole in modo casuale.

Image augmentation

Approfondisci trasformazioni e manipolazioni di immagini con esercizi pratici nel nostro percorso di abilità Image Processing with Python.

Trasformazioni geometriche: ribalta, ritaglia, ruota, deforma e applica zoom alle immagini in modo casuale. Fai attenzione ad applicare più trasformazioni sulla stessa immagine, perché potrebbe ridurre le prestazioni del modello.
Trasformazioni dello spazio colore: modifica casualmente i canali RGB, il contrasto e la luminosità.
Filtri a kernel: varia casualmente la nitidezza o la sfocatura dell’immagine.
Cancellazione casuale: rimuovi una parte dell’immagine iniziale.
Mix di immagini: combina e miscela più immagini.

Tecniche avanzate

Generative adversarial networks (GAN): usate per generare nuovi punti dati o immagini. Non richiede dati esistenti per generare dati sintetici.
Neural Style Transfer: una serie di layer convoluzionali addestrati per scomporre le immagini e separare contenuto e stile.

Applicazioni della Data Augmentation

La data augmentation può essere applicata a tutte le applicazioni di machine learning in cui è difficile acquisire dati di qualità. Inoltre, può aiutare a migliorare robustezza e prestazioni del modello in tutti i campi di studio.

Sanità

Acquisire ed etichettare dataset di imaging medico è dispendioso in termini di tempo e costi. Serve anche un esperto di dominio per validare il dataset prima dell’analisi. Usare trasformazioni geometriche e altre tecniche può aiutarti ad addestrare modelli di machine learning robusti e accurati.

Ad esempio, nel caso della classificazione della polmonite, puoi usare ritagli casuali, zoom, stretching e trasformazioni dello spazio colore per migliorare le prestazioni del modello. Tuttavia, presta attenzione a certe augmentations perché possono produrre l’effetto opposto. Per esempio, rotazioni casuali e riflessioni lungo l’asse x non sono consigliate per i dataset di radiografie.

Immagine da ibrahimsobh.github.io | kaggle-COVID19-Classification

Auto a guida autonoma

I dati disponibili sulle auto a guida autonoma sono limitati e le aziende usano ambienti simulati per generare dati sintetici tramite reinforcement learning. Questo può aiutarti ad addestrare e testare applicazioni di machine learning in cui la sicurezza dei dati è un problema.

Immagine di David Silver | Autonomous Visualization System from Uber ATG

Le possibilità dei dati aumentati come simulazione sono infinite, perché possono essere usati per generare scenari reali.

Elaborazione del linguaggio naturale

La data augmentation per il testo è usata in genere quando i dati di qualità sono limitati e migliorare la metrica di performance è prioritario. Puoi applicare sinonimia, word embedding, scambio di caratteri, inserimento ed eliminazione casuale. Queste tecniche sono preziose anche per le lingue con poche risorse.

Immagine da Papers With Code | Selective Text Augmentation with Word Roles for Low-Resource Text Classification.

I ricercatori usano l’augmentation per i modelli linguistici in scenari con alto tasso di errore di riconoscimento, generazione sequenza-a-sequenza e classificazione del testo.

Riconoscimento vocale automatico

Nella classificazione dei suoni e nel riconoscimento vocale, la data augmentation fa miracoli. Migliora le prestazioni del modello anche in lingue con poche risorse.

Immagine di Edward Ma | Noise Injection

L’iniezione di rumore casuale, lo shifting e la variazione dell’intonazione possono aiutarti a produrre modelli speech-to-text all’avanguardia. Puoi anche usare le GAN per generare suoni realistici per un’applicazione specifica.

Implicazioni etiche della Data Augmentation

Sebbene la data augmentation sia uno strumento potente per potenziare i modelli di machine learning, solleva diverse questioni etiche che richiedono attenzione:

Amplificazione dei bias: aumentare dataset faziosi può replicare e accentuare disuguaglianze esistenti, portando a modelli che performano male per gruppi sottorappresentati.
Rischi per la privacy: la generazione di dati sintetici può trattenere involontariamente dettagli sensibili dal dataset originale, mettendo a rischio la conformità alle normative sulla privacy.
Autenticità dei dati: augmentations applicate male possono produrre punti dati irrealistici o fuorvianti, compromettendo prestazioni e fiducia nel modello.
Trasparenza: è fondamentale documentare chiaramente le tecniche di augmentation e garantire che gli stakeholder comprendano come i dati vengono trasformati o generati.
Equità: assicurarsi che i dati aumentati riflettano popolazioni e scenari diversi è essenziale per evitare bias involontari e garantire prestazioni robuste.
Conformità normativa: i dataset aumentati devono rispettare le leggi sulla protezione dei dati e le linee guida etiche per evitare rischi legali e reputazionali.

Per sfruttare responsabilmente la data augmentation, chi la utilizza dovrebbe convalidare i dati aumentati, affrontare i bias e garantire la conformità agli standard etici e legali pertinenti.

Data Augmentation con Keras e TensorFlow

In questo tutorial impareremo ad aumentare i dati di immagine usando Keras e TensorFlow. Inoltre, vedrai come usare i dati aumentati per addestrare un semplice classificatore binario. Il codice riportato sotto è una versione modificata dell’esempio ufficiale di TensorFlow.

Ti consigliamo di seguire il tutorial scrivendo il codice in autonomia. Il sorgente con output è disponibile in questo DataLab workbook.

Per iniziare

Useremo TensorFlow e Keras per la data augmentation e matplotlib per visualizzare le immagini.

%%capture
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential

Caricamento dei dati

La collezione di TensorFlow Dataset è enorme. Trovi dataset di testo, audio, video, grafi, serie temporali e immagini. In questo tutorial useremo il dataset cats_vs_dogs. Il dataset pesa 786,68 MiB, applicheremo varie tecniche di image augmentation e addestreremo un classificatore binario.

Nel codice seguente abbiamo caricato l’80% per il training, il 10% per la validazione e il 10% per il test, con etichette e metadati.

%%capture
(train_ds, val_ds, test_ds), metadata = tfds.load(
    'cats_vs_dogs',
    split=['train[:80%]', 'train[80%:90%]', 'train[90%:]'],
    with_info=True,
    as_supervised=True,
)

Analisi dei dati

Nel dataset ci sono due classi: “cat” e “dog”.

num_classes = metadata.features['label'].num_classes
print(num_classes)

Useremo degli iteratori per estrarre solo quattro immagini casuali con etichette dal training set e visualizzarle con la funzione `.imshow()` di matplotlib.

try:
    get_label_name = metadata.features['label'].int2str
    train_iter = iter(train_ds)
    fig = plt.figure(figsize=(7, 8))
    for x in range(4):
        image, label = next(train_iter)
        fig.add_subplot(1, 4, x + 1)
        plt.imshow(image)
        plt.axis('off')
        plt.title(get_label_name(label))
except StopIteration:
    print("Dataset iterator is empty!")

Come possiamo vedere, abbiamo ottenuto varie immagini di cani e una di gatto.

Data augmentation con keras.Sequential()

Di solito usiamo keras.Sequential() per costruire il modello, ma possiamo anche usarlo per aggiungere i layer di augmentation.

Ridimensiona e riscalare

Nell’esempio ridimensioniamo e riscaliamo l’immagine usando Keras Sequential e i layer di image augmentation. Prima ridimensioniamo l’immagine a 180x180 e poi la riscalamo di 1/255. La dimensione ridotta aiuta a risparmiare tempo, memoria e calcolo.

Come si vede, abbiamo passato correttamente l’immagine attraverso il layer di augmentation e l’output finale è ridimensionato e riscalato.

IMG_SIZE = 180

resize_and_rescale = keras.Sequential([
  layers.Resizing(IMG_SIZE, IMG_SIZE),
  layers.Rescaling(1./255)
])

result = resize_and_rescale(image)
plt.axis('off')
plt.imshow(result);

Rotazione e flip

Applichiamo flip e rotazione casuali alla stessa immagine. Useremo un loop, subplot e imshow per visualizzare sei immagini con augmentations geometriche casuali.

data_augmentation = keras.Sequential([
  layers.RandomFlip("horizontal_and_vertical"),
  layers.RandomRotation(0.4),
])


plt.figure(figsize=(8, 7))
for i in range(6):
  augmented_image = data_augmentation(image)
  ax = plt.subplot(2, 3, i + 1)
  plt.imshow(augmented_image.numpy()/255)
  plt.axis("off")

Nota: se visualizzi l’avviso “WARNING:matplotlib.image:Clipping input data to the valid range for imshow with RGB data ([0..1] for floats or [0..255] for integers).”, prova a convertire l’immagine in numpy e a dividerla per 255. Otterrai un output nitido invece di un’immagine slavata.

Oltre alle semplici augmentations, puoi applicare anche RandomContrast, RandomCrop, CenterCrop e RandomZoom alle immagini.

Aggiunta diretta nel layer del modello

Ci sono due modi per applicare le augmentations alle immagini. Il primo è aggiungere direttamente i layer di augmentation al modello.

model = keras.Sequential([
  # Add the preprocessing layers you created earlier.
  resize_and_rescale,
  data_augmentation,
  # Add the model layers
  layers.Conv2D(16, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Flatten(),
  layers.Dense(128, activation='relu'),
  layers.Dense(64, activation='relu'),
  layers.Dense(1,activation='sigmoid')
])

Nota: la data augmentation è inattiva durante la fase di test. Funziona solo con Model.fit, non con Model.evaluate o Model.predict.

Applicare la funzione di augmentation con .map

Il secondo metodo è applicare la data augmentation all’intero train set usando Dataset.map.

aug_ds = train_ds.map(lambda x, y: (data_augmentation(x, training=True), y))

Pre-processing dei dati

Creeremo una funzione di pre-processing per processare train, validation e test set.

La funzione:

Applica ridimensionamento e riscalamento all’intero dataset.
Se shuffle è True, mescola il dataset.
Converte i dati in batch con batch size pari a 32.
Se augment è True, applica la funzione di data augmentation a tutti i dataset.
Infine, usa Dataset.prefetch per sovrapporre l’addestramento del modello su GPU all’elaborazione dei dati.

batch_size = 32
AUTOTUNE = tf.data.AUTOTUNE

def prepare(ds, shuffle=False, augment=False):
  # Resize and rescale all datasets.
  ds = ds.map(lambda x, y: (resize_and_rescale(x), y),
              num_parallel_calls=AUTOTUNE)

  if shuffle:
    ds = ds.shuffle(1000)

  # Batch all datasets.
  ds = ds.batch(batch_size)

  # Use data augmentation only on the training set.
  if augment:
    ds = ds.map(lambda x, y: (data_augmentation(x, training=True), y),
                num_parallel_calls=AUTOTUNE)

  # Use buffered prefetching on all datasets.
  return ds.prefetch(buffer_size=AUTOTUNE)


train_ds = prepare(train_ds, shuffle=True, augment=True)
val_ds = prepare(val_ds)
test_ds = prepare(test_ds)

Costruzione del modello

Creeremo un modello semplice con layer convoluzionali e densi. Assicurati che l’input shape corrisponda alla forma dell’immagine.

model = keras.Sequential([
    layers.Conv2D(32, (3, 3), input_shape=(180,180,3), padding='same', activation='relu'),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Flatten(),
    layers.Dense(32, activation='relu'),
    layers.Dense(1,activation='softmax')
])

Addestramento e valutazione

Ora compileremo il modello e lo addestreremo per un’epoca. L’optimizer è Adam, la loss è la Binary Cross Entropy e la metrica è l’accuratezza.

Come si può osservare, abbiamo ottenuto il 51% di accuratezza in validazione in una singola esecuzione. Puoi addestrarlo per più epoche e ottimizzare gli iperparametri per ottenere risultati migliori.

La parte di costruzione e training del modello serve solo a darti un’idea di come aumentare le immagini e addestrare il modello.

model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])
epochs=1
history = model.fit(
  train_ds,
  validation_data=val_ds,
  epochs=epochs
)

582/582 [==============================] - 98s 147ms/step - loss: 0.6993 - accuracy: 0.4961 - val_loss: 0.6934 - val_accuracy: 0.5185

loss, acc = model.evaluate(test_ds)

73/73 [==============================] - 4s 48ms/step - loss: 0.6932 - accuracy: 0.5013

Impara a condurre analisi di immagini e a costruire, addestrare e valutare reti convoluzionali seguendo il corso Image Processing with Keras.

Data augmentation usando tf.image()

In questa sezione impareremo ad aumentare le immagini con TensorFlow per avere un controllo più fine della data augmentation.

Caricamento dei dati

Caricheremo nuovamente il dataset cats_vs_dogs con etichette e metadati.

%%capture
(train_ds, val_ds, test_ds), metadata = tfds.load(
    'cats_vs_dogs',
    split=['train[:80%]', 'train[80%:90%]', 'train[90%:]'],
    with_info=True,
    as_supervised=True,
)

Invece dell’immagine del gatto useremo quella del cane e applicheremo varie tecniche di augmentation.

image, label = next(iter(train_ds))
plt.imshow(image)
plt.title(get_label_name(label));

Flip da sinistra a destra

Creeremo la funzione visualize() per mostrare la differenza tra immagine originale e aumentata.

La funzione è piuttosto semplice. Prende in input l’immagine originale e la funzione di augmentation e visualizza la differenza con matplotlib.

def visualize(original, augmented):
    fig = plt.figure()
    plt.subplot(1,2,1)
    plt.title('Original image')
    plt.imshow(original)
    plt.axis("off")
 
    plt.subplot(1,2,2)
    plt.title('Augmented image')
    plt.imshow(augmented)
    plt.axis("off")

Come si vede, abbiamo ribaltato l’immagine da sinistra a destra usando la funzione tf.image. È molto più semplice di keras.Sequential().

flipped = tf.image.flip_left_right(image)
visualize(image, flipped)

Scala di grigi

Convertiamo l’immagine in scala di grigi usando tf.image.rgb_to_grayscale().

grayscaled = tf.image.rgb_to_grayscale(image)
visualize(image,  tf.squeeze(grayscaled))

Regolazione della saturazione

Puoi anche regolare la saturazione con un fattore pari a 3.

saturated = tf.image.adjust_saturation(image, 3)
visualize(image, saturated)

Regolazione della luminosità

Regola la luminosità fornendo un fattore di brightness.

bright = tf.image.adjust_brightness(image, 0.4)
visualize(image, bright)

Ritaglio centrale

Ritaglia l’immagine dal centro usando una frazione centrale di 0,5.

cropped = tf.image.central_crop(image, central_fraction=0.5)
visualize(image, cropped)

Rotazione di 90 gradi

Ruota l’immagine di 90 gradi usando la funzione tf.image.rot90().

rotated = tf.image.rot90(image)
visualize(image, rotated)

Applicare una luminosità casuale

Come i layer di Keras, anche tf.image() dispone di funzioni di augmentation casuali. Nell’esempio seguente applicheremo una luminosità casuale all’immagine e mostreremo più risultati.

Come si vede, la prima immagine è un po’ più scura e le due successive sono più luminose.

for i in range(3):
  seed = (i, 0)  # tuple of size (2,)
  stateless_random_brightness = tf.image.stateless_random_brightness(
      image, max_delta=0.95, seed=seed)
  visualize(image, stateless_random_brightness)

Applicare la funzione di augmentation

Come in Keras, possiamo applicare una funzione di data augmentation all’intero dataset usando Dataset.map().

def augment(image, label):
  image = tf.cast(image, tf.float32)
  image = tf.image.resize(image, [IMG_SIZE, IMG_SIZE])
  image = (image / 255.0)
  image = tf.image.random_crop(image, size=[IMG_SIZE, IMG_SIZE, 3])
  image = tf.image.random_brightness(image, max_delta=0.5)
  return image, label


train_ds = (
    train_ds
    .shuffle(1000)
    .map(augment, num_parallel_calls=AUTOTUNE)
    .batch(batch_size)
    .prefetch(AUTOTUNE)
)

Data Augmentation con ImageDataGenerator

ImageDataGenerator() di Keras è ancora più semplice. Funziona al meglio quando carichi i dati da una directory locale o da un CSV.

Nell’esempio scaricheremo e caricheremo un piccolo dataset CIFAR10 dalla libreria predefinita dei dataset Keras.

Dopodiché applicheremo l’augmentation usando keras.preprocessing.image.ImageDataGenerator(). La funzione ruoterà casualmente, varierà altezza e larghezza e farà il flip orizzontale delle immagini.

Infine, faremo il fit di ImageDataGenerator() sul training set e mostreremo sei immagini con augmentations casuali.

Nota: la dimensione delle immagini è 32x32, quindi la visualizzazione è a bassa risoluzione.

(x_train, y_train), (x_test, y_test) = keras.datasets.cifar10.load_data()

datagen = keras.preprocessing.image.ImageDataGenerator(rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
    validation_split=0.2)

datagen.fit(x_train)

for X_batch, y_batch in datagen.flow(x_train,y_train, batch_size=6):
    for i in range(0, 6):
        plt.subplot(2,3,i+1)
        plt.imshow(X_batch[i]/255)
        plt.axis('off')
    break

Strumenti per la Data Augmentation

In questa sezione vedremo altri strumenti open source che puoi usare per applicare varie tecniche di data augmentation e migliorare le prestazioni del modello.

Pytorch

Le trasformazioni per immagini sono disponibili nel modulo torchvision.transforms. Come in Keras, puoi aggiungere i layer di trasformazione all’interno di torch.nn.Sequential o applicare separatamente una funzione di augmentation al dataset.

Augmentor

Augmentor è un pacchetto Python per l’augmentation e la generazione artificiale di immagini. Puoi eseguire Perspective Skewing, Elastic Distortions, Rotating, Shearing, Cropping e Mirroring. Augmentor include anche funzionalità di base per il pre-processing delle immagini.

Albumentations

Albumentations è uno strumento Python veloce e flessibile per l’augmentation di immagini. È ampiamente usato in competizioni di machine learning, nell’industria e nella ricerca per migliorare le prestazioni delle reti neurali convoluzionali profonde.

Imgaug

Imgaug è uno strumento open source per l’augmentation di immagini. Supporta un’ampia varietà di tecniche, come rumore gaussiano, contrasto, nitidezza, ritaglio, trasformazioni affini e flip. Ha un’interfaccia stocastica semplice ma potente e include keypoint, bounding box, heatmap e mappe di segmentazione.

OpenCV

OpenCV è un’enorme libreria open source per computer vision, machine learning ed elaborazione di immagini. È generalmente utilizzata per costruire applicazioni in tempo reale. Puoi usare OpenCV per aumentare immagini e video senza complicazioni.

Conclusione

Le funzioni di image augmentation offerte da TensorFlow e Keras sono comode. Ti basta aggiungere un layer di augmentation, tf.image() o ImageDataGenerator() per eseguire l’augmentation. Oltre ai framework di deep learning, puoi usare strumenti standalone come Augmentor, Albumentations, OpenCV e Imgaug per applicare la data augmentation.

In questo tutorial abbiamo visto vantaggi, limitazioni, applicazioni e tecniche della data augmentation. Inoltre, abbiamo applicato l’image augmentation al dataset cats_vs_dogs usando Keras e TensorFlow. Se vuoi approfondire l’elaborazione di immagini, consulta il nostro percorso di abilità Image Processing with Python. Ti insegnerà le basi della trasformazione e manipolazione delle immagini, l’analisi di immagini medicali e l’image processing avanzato con Keras.

Cosa significa data augmentation?

La data augmentation migliora l’accuratezza?

Qual è lo svantaggio della data augmentation?

Qual è un esempio di data augmentation?

Quali sono alcune tecniche di data augmentation?

Che cos’è la data augmentation nelle CNN?

Argomenti

Machine Learning

Python

Corsi principali

Corso

Lavorare con i dati geospaziali in Python

4 h

17.8K

Questo corso ti insegnerà come integrare i dati spaziali nel tuo flusso di lavoro di Python Data Science.

Vedi dettagli

Inizia Il Corso

Corso

Image Modeling with Keras

4 h

39.8K

Impara a fare analisi delle immagini usando Keras con Python creando, addestrando e valutando reti neurali convoluzionali.

Vedi dettagli

Inizia Il Corso

Corso

Elaborazione di immagini in Python

4 h

56.3K

Impara a lavorare, trasformare e modificare le immagini come vuoi.

Vedi dettagli

Inizia Il Corso

Mostra altro

Correlato

blog

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Guida al preprocessing NLP nel machine learning. Copriamo spaCy, i transformer di Hugging Face e come funziona la tokenizzazione in casi d'uso reali.

Abid Ali Awan

10 min

blog

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

Esplora le basi di Snowflake, la piattaforma dati cloud. Scopri la sua architettura, le sue funzionalità e come integrarla nelle tue pipeline di dati.

Tim Lu

12 min

blog

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Scopri i 15 migliori server MCP remoti che stanno trasformando lo sviluppo AI nel 2026. Scopri come migliorano automazione, ragionamento, sicurezza e velocità dei workflow.

Abid Ali Awan

15 min

Mostra Altro Mostra Altro

Che cos’è la Data Augmentation?

Dati aumentati vs. dati sintetici

Perché la data augmentation è importante?

Quando dovresti usare la data augmentation?

Limitazioni della data augmentation

Tecniche di Data Augmentation

Data augmentation per l’audio

Data augmentation per il testo

Image augmentation

Tecniche avanzate

Applicazioni della Data Augmentation

Sanità

Auto a guida autonoma

Elaborazione del linguaggio naturale

Riconoscimento vocale automatico

Implicazioni etiche della Data Augmentation

Data Augmentation con Keras e TensorFlow

Per iniziare

Caricamento dei dati

Analisi dei dati

Data augmentation con keras.Sequential()

Ridimensiona e riscalare

Rotazione e flip

Aggiunta diretta nel layer del modello

Applicare la funzione di augmentation con .map

Pre-processing dei dati

Costruzione del modello

Addestramento e valutazione

Data augmentation usando tf.image()

Caricamento dei dati

Flip da sinistra a destra

Scala di grigi

Regolazione della saturazione

Regolazione della luminosità

Ritaglio centrale

Rotazione di 90 gradi

Applicare una luminosità casuale

Applicare la funzione di augmentation

Data Augmentation con ImageDataGenerator

Strumenti per la Data Augmentation

Pytorch

Augmentor

Albumentations

Imgaug

OpenCV

Conclusione

Domande frequenti sulla Data Augmentation

Qual è lo svantaggio della data augmentation?

Qual è un esempio di data augmentation?

Quali sono alcune tecniche di data augmentation?

Che cos’è la data augmentation nelle CNN?

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Lavorare con i dati geospaziali in Python

Image Modeling with Keras

Elaborazione di immagini in Python

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Lavorare con i dati geospaziali in Python