Ein vollständiger Leitfaden zur Datenerweiterung

Lerne in einem TensorFlow- und Keras-Tutorial Techniken, Anwendungen und Werkzeuge zur Datenerweiterung kennen.

Aktualisierte 11. Sept. 2024 · 15 Min. Lesezeit

Was ist Datenerweiterung?

Die Datenerweiterung ist eine Technik, mit der die Trainingsmenge künstlich vergrößert wird, indem modifizierte Kopien eines Datensatzes mit vorhandenen Daten erstellt werden. Dazu gehören kleine Änderungen am Datensatz oder die Verwendung von Deep Learning, um neue Datenpunkte zu generieren.

Augmented vs. Synthetische Daten

Die erweiterten Daten werden aus den Originaldaten mit einigen kleinen Änderungen erstellt. Bei der Bildvergrößerung nehmen wir geometrische und Farbraumtransformationen vor (Spiegeln, Größenänderung, Zuschneiden, Helligkeit, Kontrast), um die Größe und Vielfalt der Trainingsmenge zu erhöhen.

Synthetische Daten werden künstlich erzeugt, ohne dass der Originaldatensatz verwendet wird. Dabei werden oft DNNs (Deep Neural Networks) und GANs (Generative Adversarial Networks) verwendet, um synthetische Daten zu erzeugen.

Hinweis: Die Erweiterungsmethoden sind nicht auf Bilder beschränkt. Du kannst auch Audio-, Video-, Text- und andere Datentypen anreichern.

Wann solltest du Datenerweiterung nutzen?

Um eine Überanpassung der Modelle zu verhindern.
Die anfängliche Trainingsmenge ist zu klein.
Um die Genauigkeit des Modells zu verbessern.
Senkung der Betriebskosten für die Kennzeichnung und Bereinigung des Rohdatensatzes.

Beschränkungen der Datenerweiterung

Die Verzerrungen des ursprünglichen Datensatzes bleiben in den erweiterten Daten erhalten.
Die Qualitätssicherung für die Datenerweiterung ist teuer.
Forschung und Entwicklung sind notwendig, um ein System mit fortschrittlichen Anwendungen zu entwickeln. So kann es zum Beispiel eine Herausforderung sein, mit GANs hochauflösende Bilder zu erzeugen.
Einen effektiven Ansatz zur Datenerweiterung zu finden, kann eine Herausforderung sein.

Werde ein ML-Wissenschaftler

Beherrsche Python, um ein Wissenschaftler für maschinelles Lernen zu werden

Kostenloses Lernen beginnen

Techniken zur Datenerweiterung

In diesem Abschnitt lernen wir Audio-, Text-, Bild- und erweiterte Datenerweiterungstechniken kennen.

Erweiterung der Audiodaten

Rauschinjektion: Füge dem Audiodatensatz gaußförmiges oder zufälliges Rauschen hinzu, um die Modellleistung zu verbessern.
Shifting: Verschiebe Audio nach links (schneller Vorlauf) oder rechts mit zufälligen Sekunden.
Ändern der Geschwindigkeit: Dehnt die Zeitreihe um einen festen Wert.
Tonhöhe ändern: Ändere die Tonhöhe der Audiodaten nach dem Zufallsprinzip.

Textdatenerweiterung

Wort- oder Satzverschiebung: zufällige Änderung der Position eines Wortes oder Satzes.
Wortersatz: Ersetze Wörter durch Synonyme.
Syntaxbaum-Manipulation: Umschreibe den Satz mit demselben Wort.
Zufällige Worteinfügung: Fügt Wörter nach dem Zufallsprinzip ein.
Zufällige Wortlöschung: Löscht Wörter nach dem Zufallsprinzip.

Bildvergrößerung

Lerne mehr über Bildtransformation und -manipulation mit praktischen Übungen in unserem Skill Track Bildverarbeitung mit Python.

Geometrische Transformationen: Bilder nach dem Zufallsprinzip spiegeln, beschneiden, drehen, strecken und zoomen. Du musst vorsichtig sein, wenn du mehrere Transformationen auf dieselben Bilder anwendest, da dies die Leistung des Modells verringern kann.
Farbraumtransformationen: Ändere zufällig RGB-Farbkanäle, Kontrast und Helligkeit.
Kernel-Filter: verändern zufällig die Schärfe oder Unschärfe des Bildes.
Zufälliges Löschen: Lösche einen Teil des Ausgangsbildes.
Bilder mischen: Mehrere Bilder überblenden und mischen.

Fortgeschrittene Techniken

Generative adversarial networks (GANs): werden verwendet, um neue Datenpunkte oder Bilder zu generieren. Es benötigt keine vorhandenen Daten, um synthetische Daten zu erzeugen.
Neuronaler Stil-Transfer: eine Reihe von Faltungsschichten, die darauf trainiert sind, Bilder zu dekonstruieren und Kontext und Stil zu trennen.

Anwendungen zur Datenerweiterung

Die Datenerweiterung kann bei allen Anwendungen des maschinellen Lernens eingesetzt werden, bei denen die Beschaffung hochwertiger Daten eine Herausforderung darstellt. Außerdem kann sie dazu beitragen, die Robustheit und Leistungsfähigkeit von Modellen in allen Bereichen zu verbessern.

Gesundheitswesen

Das Erfassen und Beschriften medizinischer Bilddaten ist zeitaufwändig und teuer. Außerdem brauchst du einen Fachexperten, der den Datensatz validiert, bevor du die Datenanalyse durchführst. Mit geometrischen und anderen Transformationen kannst du robuste und genaue Machine-Learning-Modelle trainieren.

Bei der Klassifizierung von Lungenentzündungen kannst du zum Beispiel zufälliges Zuschneiden, Zoomen, Dehnen und Farbraumtransformationen verwenden, um die Leistung des Modells zu verbessern. Allerdings musst du bei bestimmten Vergrößerungen vorsichtig sein, da sie zu gegenteiligen Ergebnissen führen können. Zum Beispiel sind zufällige Drehungen und Spiegelungen entlang der x-Achse für den Röntgenbilddatensatz nicht zu empfehlen.

Bild von ibrahimsobh.github.io | kaggle-COVID19-Classification

Selbstfahrende Autos

Es gibt nur wenige Daten über selbstfahrende Autos, und die Unternehmen nutzen simulierte Umgebungen, um mithilfe von Reinforcement Learning synthetische Daten zu erzeugen. Es kann dir helfen, Anwendungen für maschinelles Lernen zu trainieren und zu testen, bei denen Datensicherheit ein Thema ist.

Bild von David Silver | Autonomes Visualisierungssystem von Uber ATG

Die Möglichkeiten von Augmented Data als Simulation sind endlos, denn sie können genutzt werden, um reale Szenarien zu erzeugen.

Natürliche Sprachverarbeitung

Die Textdatenerweiterung wird in der Regel in Situationen verwendet, in denen die Qualität der Daten begrenzt ist und die Verbesserung der Leistungskennzahl Vorrang hat. Du kannst Synonymerweiterung, Worteinbettung, Zeichentausch und zufälliges Einfügen und Löschen anwenden. Diese Techniken sind auch für ressourcenarme Sprachen nützlich.

Image from Papers With Code | Selective Text Augmentation with Word Roles for Low-Resource Text Classification.

Forscher nutzen die Texterweiterung für die Sprachmodelle in Szenarien mit hoher Fehlerquote, bei der Generierung von Sequenz-zu-Sequenz-Daten und bei der Textklassifizierung.

Automatische Spracherkennungssysteme

Bei der Geräuschklassifizierung und Spracherkennung wirkt die Datenerweiterung wahre Wunder. Sie verbessert die Leistung des Modells auch bei Sprachen mit geringen Ressourcen.

Bild von Edward Ma | Noise Injection

Die Zufallsgeräuschinjektion, das Verschieben und Ändern der Tonhöhe kann dir helfen, hochmoderne Sprache-zu-Text-Modelle zu erstellen. Du kannst GANs auch verwenden, um realistische Klänge für eine bestimmte Anwendung zu erzeugen.

Datenerweiterung mit Keras und TensorFlow

In diesem Tutorial lernen wir, wie man Bilddaten mit Keras und Tensorflow anreichert. Außerdem lernst du, wie du mit deinen erweiterten Daten einen einfachen binären Klassifikator trainieren kannst. Der unten stehende Code ist die modifizierte Version des offiziellen TensorFlow-Beispiels.

Wir empfehlen dir, das Kodiertutorial zu befolgen und selbst zu üben. Der Quellcode mit den Ausgaben ist in dieser DataLab-Arbeitsmappe verfügbar.

Erste Schritte

Wir werden TensorFlow und Keras für die Datenerweiterung und Matplotlib für die Darstellung der Bilder verwenden.

%%capture
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds

from keras import layers
import keras

Daten laden

Die TensorFlow-Datensatzsammlung ist riesig. Du kannst Text-, Audio-, Video-, Grafik-, Zeitreihen- und Bilddatensätze finden. In diesem Lernprogramm verwenden wir den Datensatz "cats_vs_dogs". Der Datensatz hat eine Größe von 786,68 MB, und wir werden verschiedene Bildvergrößerungen anwenden und den binären Klassifikator trainieren.

Im folgenden Code haben wir 80 % Trainings-, 10 % Validierungs- und 10 % Testdatensatz mit Labels und Metadaten geladen.

%%capture
(train_ds, val_ds, test_ds), metadata = tfds.load(
    'cats_vs_dogs',
    split=['train[:80%]', 'train[80%:90%]', 'train[90%:]'],
    with_info=True,
    as_supervised=True,
)

Datenanalyse

Im Datensatz gibt es zwei Klassen: "Katze" und "Hund".

num_classes = metadata.features['label'].num_classes
print(num_classes)

Wir werden Iteratoren verwenden, um nur vier zufällige Bilder mit Beschriftungen aus der Trainingsmenge zu extrahieren und sie mit der Matplotlib-Funktion `.imshow()` anzuzeigen.

get_label_name = metadata.features['label'].int2str
train_iter = iter(train_ds)
fig = plt.figure(figsize=(7, 8))
for x in range(4):
  image, label = next(train_iter)
  fig.add_subplot(1, 4, x+1)
  plt.imshow(image)
  plt.axis('off')
  plt.title(get_label_name(label));

Wie wir sehen können, haben wir verschiedene Hundebilder und ein Katzenbild.

Datenerweiterung mit Keras Sequential

Normalerweise verwenden wir keras.Sequential(), um das Modell zu erstellen, aber wir können es auch verwenden, um Erweiterungsschichten hinzuzufügen.

Größe und Skalierung ändern

In diesem Beispiel ändern wir die Größe und Skalierung des Bildes mithilfe von Keras Sequential und Image Augmentation Layern. Wir verkleinern das Bild zunächst auf 180X180 und skalieren es dann um 1/255. Die kleine Bildgröße hilft uns, Zeit, Speicherplatz und Rechenleistung zu sparen.

Wie wir sehen können, haben wir das Bild erfolgreich durch die Augmentierungsschicht geleitet und die endgültige Ausgabe ist in der Größe verändert und neu skaliert.

IMG_SIZE = 180

resize_and_rescale = keras.Sequential([
  layers.Resizing(IMG_SIZE, IMG_SIZE),
  layers.Rescaling(1./255)
])

result = resize_and_rescale(image)
plt.axis('off')
plt.imshow(result);

Zufälliges Drehen und Spiegeln

Wenden wir nun eine zufällige Spiegelung und Drehung auf dasselbe Bild an. Wir verwenden Loop, Subplot und Imshow, um sechs Bilder mit zufälligen geometrischen Erweiterungen anzuzeigen.

data_augmentation = keras.Sequential([
  layers.RandomFlip("horizontal_and_vertical"),
  layers.RandomRotation(0.4),
])


plt.figure(figsize=(8, 7))
for i in range(6):
  augmented_image = data_augmentation(image)
  ax = plt.subplot(2, 3, i + 1)
  plt.imshow(augmented_image.numpy()/255)
  plt.axis("off")

Hinweis: Wenn die Meldung "WARNING:matplotlib.image:Clipping input data to the valid range for imshow with RGB data ([0..1] for floats or [0..255] for integers)." auftritt, versuche dein Bild in Numpy zu konvertieren und durch 255 zu teilen. Es zeigt dir das klare Ergebnis anstelle eines verwaschenen Bildes.

Neben der einfachen Vergrößerung kannst du auch RandomContrast, RandomCrop, HeightCrop, WidthCrop und RandomZoom auf die Bilder anwenden.

Direktes Hinzufügen zur Modellebene

Es gibt zwei Möglichkeiten, die Bilder zu vergrößern. Die erste Methode besteht darin, die Erweiterungsschichten direkt zum Modell hinzuzufügen.

model = keras.Sequential([
  # Add the preprocessing layers you created earlier.
  resize_and_rescale,
  data_augmentation,
  # Add the model layers
  layers.Conv2D(16, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Flatten(),
  layers.Dense(128, activation='relu'),
  layers.Dense(64, activation='relu'),
  layers.Dense(1,activation='sigmoid')
])

Hinweis: Die Datenerweiterung ist während der Testphase inaktiv. Sie funktioniert nur für Model.fit, nicht für Model.evaluate oder Model.predict.

Anwenden der Augmentierungsfunktion mit .map

Die zweite Methode besteht darin, die Datenerweiterung mit Dataset.map auf den gesamten Zugsatz anzuwenden.

aug_ds = train_ds.map(lambda x, y: (data_augmentation(x, training=True), y))

Vorverarbeitung der Daten

Wir werden eine Datenvorverarbeitungsfunktion erstellen, um Trainings-, Validitäts- und Testmengen zu verarbeiten.

Die Funktion wird:

Wende die Größenänderung und Skalierung auf den gesamten Datensatz an.
Wenn shuffle True ist, wird der Datensatz neu gemischt.
Konvertiere die Daten in Stapel mit 32 Stapelgrößen.
Wenn das Augment True ist, wird die Datenargumentationsfunktion auf alle Datensätze angewendet.
Schließlich verwendest du Dataset.prefetch, um das Training deines Modells auf der GPU mit der Datenverarbeitung zu überlappen.

batch_size = 32
AUTOTUNE = tf.data.AUTOTUNE

def prepare(ds, shuffle=False, augment=False):
  # Resize and rescale all datasets.
  ds = ds.map(lambda x, y: (resize_and_rescale(x), y),
              num_parallel_calls=AUTOTUNE)

  if shuffle:
    ds = ds.shuffle(1000)

  # Batch all datasets.
  ds = ds.batch(batch_size)

  # Use data augmentation only on the training set.
  if augment:
    ds = ds.map(lambda x, y: (data_augmentation(x, training=True), y),
                num_parallel_calls=AUTOTUNE)

  # Use buffered prefetching on all datasets.
  return ds.prefetch(buffer_size=AUTOTUNE)


train_ds = prepare(train_ds, shuffle=True, augment=True)
val_ds = prepare(val_ds)
test_ds = prepare(test_ds)

Modellbau

Wir werden ein einfaches Modell mit Faltung und dichten Schichten erstellen. Achte darauf, dass die Eingabeform der Bildform ähnlich ist.

model = keras.Sequential([
    layers.Conv2D(32, (3, 3), input_shape=(180,180,3), padding='same', activation='relu'),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Flatten(),
    layers.Dense(32, activation='relu'),
    layers.Dense(1,activation='softmax')
])

Ausbildung und Bewertung

Wir erstellen nun das Modell und trainieren es für eine Epoche. Der Optimierer ist Adam, die Verlustfunktion ist Binary Cross Entropy und die Metrik ist Genauigkeit.

Wie wir sehen können, haben wir in einem einzigen Durchgang eine Validierungsgenauigkeit von 51 % erreicht. Du kannst es für mehrere Epochen trainieren und Hyperparameter optimieren, um noch bessere Ergebnisse zu erzielen.

Der Teil über die Modellerstellung und das Training soll dir nur eine Vorstellung davon geben, wie du die Bilder erweitern und das Modell trainieren kannst.

model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])
epochs=1
history = model.fit(
  train_ds,
  validation_data=val_ds,
  epochs=epochs
)

582/582 [==============================] - 98s 147ms/step - loss: 0.6993 - accuracy: 0.4961 - val_loss: 0.6934 - val_accuracy: 0.5185

loss, acc = model.evaluate(test_ds)

73/73 [==============================] - 4s 48ms/step - loss: 0.6932 - accuracy: 0.5013

Im Kurs Bildverarbeitung mit Keras lernst du, Bildanalysen durchzuführen und Faltungsnetzwerke zu konstruieren, zu trainieren und zu bewerten.

Datenerweiterung mit tf.image

In diesem Abschnitt werden wir lernen, Bilder mit TensorFlow zu erweitern, um eine bessere Kontrolle über die Datenerweiterung zu haben.

Daten laden

Wir laden den Datensatz cats_vs_dogs erneut mit Labels und Metadaten.

%%capture
(train_ds, val_ds, test_ds), metadata = tfds.load(
    'cats_vs_dogs',
    split=['train[:80%]', 'train[80%:90%]', 'train[90%:]'],
    with_info=True,
    as_supervised=True,
)

Anstelle eines Katzenbildes verwenden wir ein Hundebild und wenden verschiedene Augmentierungstechniken an.

image, label = next(iter(train_ds))
plt.imshow(image)
plt.title(get_label_name(label));

Von links nach rechts spiegeln

Wir werden die Funktion visualisieren erstellen, um den Unterschied zwischen dem ursprünglichen und dem erweiterten Bild anzuzeigen.

Die Funktion ist ziemlich einfach. Sie nimmt das Originalbild und die Augmentierungsfunktion als Eingabe und zeigt die Differenz mithilfe von Matplotlib an.

def visualize(original, augmented):
    fig = plt.figure()
    plt.subplot(1,2,1)
    plt.title('Original image')
    plt.imshow(original)
    plt.axis("off")
 
    plt.subplot(1,2,2)
    plt.title('Augmented image')
    plt.imshow(augmented)
    plt.axis("off")

Wie wir sehen können, haben wir das Bild mit der Funktion tf.image von links nach rechts gespiegelt. Es ist viel einfacher als keras.Sequential.

flipped = tf.image.flip_left_right(image)
visualize(image, flipped)

Graustufen

Konvertieren wir das Bild mit "tf.image.rgb_to_grayscale" in Graustufen.

grayscaled = tf.image.rgb_to_grayscale(image)
visualize(image,  tf.squeeze(grayscaled))

Einstellen der Sättigung

Du kannst auch die Sättigung um den Faktor 3 anpassen.

saturated = tf.image.adjust_saturation(image, 3)
visualize(image, saturated)

Einstellen der Helligkeit

Stelle die Helligkeit ein, indem du einen Helligkeitsfaktor angibst.

bright = tf.image.adjust_brightness(image, 0.4)
visualize(image, bright)

Zentrale Ernte

Schneide das Bild von der Mitte aus mit einem Mittelteil von 0,5 zu.

cropped = tf.image.central_crop(image, central_fraction=0.5)
visualize(image, cropped)

90-Grad-Drehung

Drehe das Bild mit der Funktion `tf.image.rot90` um 90 Grad.

rotated = tf.image.rot90(image)
visualize(image, rotated)

Zufällige Helligkeit anwenden

Genau wie Keras-Layer verfügt auch tf.image über Funktionen zur zufälligen Erweiterung. Im folgenden Beispiel werden wir die Zufallshelligkeit auf das Bild anwenden und mehrere Ergebnisse anzeigen.

Wie wir sehen können, ist das erste Bild etwas dunkler und die nächsten beiden Bilder sind heller.

for i in range(3):
  seed = (i, 0)  # tuple of size (2,)
  stateless_random_brightness = tf.image.stateless_random_brightness(
      image, max_delta=0.95, seed=seed)
  visualize(image, stateless_random_brightness)

Anwendung der Erweiterungsfunktion

Genau wie bei Keras können wir mit Dataset.map eine Datenerweiterungsfunktion auf den gesamten Datensatz anwenden.

def augment(image, label):
  image = tf.cast(image, tf.float32)
  image = tf.image.resize(image, [IMG_SIZE, IMG_SIZE])
  image = (image / 255.0)
  image = tf.image.random_crop(image, size=[IMG_SIZE, IMG_SIZE, 3])
  image = tf.image.random_brightness(image, max_delta=0.5)
  return image, label


train_ds = (
    train_ds
    .shuffle(1000)
    .map(augment, num_parallel_calls=AUTOTUNE)
    .batch(batch_size)
    .prefetch(AUTOTUNE)
)

Datenerweiterung mit ImageDataGenerator

Der Keras ImageDataGenerator ist noch einfacher. Es funktioniert am besten, wenn du Daten aus einem lokalen Verzeichnis oder einer CSV-Datei lädst.

In diesem Beispiel laden wir einen kleinen CIFAR10-Datensatz aus der Keras-Standarddatensatzbibliothek herunter und laden ihn.

Danach wenden wir die Augmentierung mit dem `keras.preprocessing.image.ImageDataGenerator` an. Die Funktion dreht die Bilder nach dem Zufallsprinzip, ändert ihre Höhe und Breite und spiegelt sie horizontal.

Schließlich passen wir ImageDataGenerator an den Trainingsdatensatz an und zeigen sechs Bilder mit zufälligen Erweiterungen an.

Hinweis: Die Bildgröße beträgt 32x32, wir haben also eine niedrig aufgelöste Anzeige.

(x_train, y_train), (x_test, y_test) = keras.datasets.cifar10.load_data()


datagen = keras.preprocessing.image.ImageDataGenerator(rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
    validation_split=0.2)

datagen.fit(x_train)

for X_batch, y_batch in datagen.flow(x_train,y_train, batch_size=6):
    for i in range(0, 6):
        plt.subplot(2,3,i+1)
        plt.imshow(X_batch[i]/255)
        plt.axis('off')
    break

Tools zur Datenerweiterung

In diesem Abschnitt lernen wir weitere Open-Source-Tools kennen, mit denen du verschiedene Techniken zur Datenerweiterung anwenden und die Leistung des Modells verbessern kannst.

Pytorch

Die Bildtransformation ist im torchvision.transforms Modul verfügbar. Ähnlich wie bei Keras kannst du Transformationsschichten innerhalb von torch.nn.Sequential hinzufügen oder eine Augmentierungsfunktion separat auf den Datensatz anwenden.

Augmentor

Augmentor ist ein Python-Paket zur Bilderweiterung und künstlichen Bilderzeugung. Du kannst perspektivische Verzerrungen, elastische Verzerrungen, Drehen, Scheren, Beschneiden und Spiegeln durchführen. Augmentor verfügt auch über grundlegende Funktionen zur Bildvorverarbeitung.

Albumentationen

Albumentations ist ein schnelles und flexibles Python-Tool zur Bildvergrößerung. Es wird häufig bei Wettbewerben zum maschinellen Lernen, in der Industrie und in der Forschung eingesetzt, um die Leistung von tiefen faltigen neuronalen Netzen zu verbessern.

Imgaug

Imgaug ist ein Open-Source-Tool zur Bildverbesserung. Es unterstützt eine Vielzahl von Augmentierungstechniken wie Gaußsches Rauschen, Kontrast, Schärfe, Zuschneiden, Affinität und Spiegelung. Es hat eine einfache, aber leistungsstarke stochastische Oberfläche und verfügt über Keypoints, Bounding Boxes, Heatmaps und Segmentierungskarten.

OpenCV

OpenCV ist eine umfangreiche Open-Source-Bibliothek für Computer Vision, maschinelles Lernen und Bildverarbeitung. Sie wird im Allgemeinen bei der Entwicklung von Echtzeitanwendungen eingesetzt. Mit OpenCV kannst du Bilder und Videos mühelos erweitern.

Fazit

Die von Tensorflow und Keras bereitgestellten Funktionen zur Bildvergrößerung sind praktisch. Du musst nur einen Augmentierungslayer, ein tf.image oder einen ImageDataGenerator hinzufügen, um eine Augmentierung durchzuführen. Neben Deep Learning Frameworks kannst du auch eigenständige Tools wie Augmentor, Albumentations, OpenCV und Imgaug verwenden, um Daten zu erweitern.

In diesem Tutorium haben wir die Vorteile, Grenzen, Anwendungen und Techniken der Datenerweiterung kennengelernt. Außerdem haben wir gelernt, mit Keras und Tensorflow eine Bildverbesserung auf den Datensatz Katzen vs. Hunde anzuwenden. Wenn du mehr über Bildverarbeitung lernen möchtest, schau dir den Skill Track Bildverarbeitung mit Python an. Er vermittelt dir die Grundlagen der Bildtransformation und -manipulation, der medizinischen Bildanalyse und der fortgeschrittenen Bildverarbeitung mit Keras.

Verdiene eine Top-KI-Zertifizierung

Zeige, dass du KI effektiv und verantwortungsbewusst einsetzen kannst.

Lass dich zertifizieren, stell dich ein

Was bedeutet Datenerweiterung?

Verbessert die Datenerweiterung die Genauigkeit?

Was ist der Nachteil der Datenerweiterung?

Was ist ein Beispiel für eine Datenerweiterung?

Was sind einige Techniken zur Datenerweiterung?

Was ist eine Datenerweiterung in CNN?

Themen

Maschinelles Lernen

Python

Top Kurse

Kurs

Working with Geospatial Data in Python

4 Std.

16.5K

This course will show you how to integrate spatial data into your Python Data Science workflow.

Siehe Details

Kurs starten

Kurs

Bildmodellierung mit Keras

4 Std.

38.6K

Lerne, wie du mit Keras und Python Bilder analysierst, indem du Faltungsneuronale Netze aufbaust, trainierst und bewertest.

Siehe Details

Kurs starten

Kurs

Image Processing in Python

4 Std.

52.5K

Learn to process, transform, and manipulate images at your will.

Siehe Details

Kurs starten

Verwandt

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.

Nathaniel Taylor-Leach

4 Min.

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.

Hesam Sheikh Hassani

15 Min.

Der Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.

Nathaniel Taylor-Leach

8 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.

Nathaniel Taylor-Leach

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!

Nisha Arya Ahmed

15 Min.

Mehr anzeigen Mehr anzeigen

Was ist Datenerweiterung?

Augmented vs. Synthetische Daten

Wann solltest du Datenerweiterung nutzen?

Beschränkungen der Datenerweiterung

Werde ein ML-Wissenschaftler

Techniken zur Datenerweiterung

Erweiterung der Audiodaten

Textdatenerweiterung

Bildvergrößerung

Fortgeschrittene Techniken

Anwendungen zur Datenerweiterung

Gesundheitswesen

Selbstfahrende Autos

Natürliche Sprachverarbeitung

Automatische Spracherkennungssysteme

Datenerweiterung mit Keras und TensorFlow

Erste Schritte

Daten laden

Datenanalyse

Datenerweiterung mit Keras Sequential

Größe und Skalierung ändern

Zufälliges Drehen und Spiegeln

Direktes Hinzufügen zur Modellebene

Anwenden der Augmentierungsfunktion mit .map

Vorverarbeitung der Daten

Modellbau

Ausbildung und Bewertung

Datenerweiterung mit tf.image

Daten laden

Von links nach rechts spiegeln

Graustufen

Einstellen der Sättigung

Einstellen der Helligkeit

Zentrale Ernte

90-Grad-Drehung

Zufällige Helligkeit anwenden

Anwendung der Erweiterungsfunktion

Datenerweiterung mit ImageDataGenerator

Tools zur Datenerweiterung

Pytorch

Augmentor

Albumentationen

Imgaug

OpenCV

Fazit

Verdiene eine Top-KI-Zertifizierung

FAQs zur Datenerweiterung

Was ist der Nachteil der Datenerweiterung?

Was ist ein Beispiel für eine Datenerweiterung?

Was sind einige Techniken zur Datenerweiterung?

Was ist eine Datenerweiterung in CNN?

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Top 30 Generative KI Interview Fragen und Antworten für 2024

2022-2023 DataCamp Classrooms Jahresbericht

Q2 2023 DataCamp Donates Digest

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Working with Geospatial Data in Python

Bildmodellierung mit Keras

Image Processing in Python

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Top 30 Generative KI Interview Fragen und Antworten für 2024

2022-2023 DataCamp Classrooms Jahresbericht

Q2 2023 DataCamp Donates Digest

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Working with Geospatial Data in Python