Direkt zum Inhalt

Was ist Googles Veo 2? Zugang, Funktionen, Beispiele

Erfahre mehr über Googles neues KI-Tool zur Videoerstellung, Veo 2, seine Funktionen, wie man es benutzt und wie es im Vergleich zu Sora von OpenAI aussieht.
Aktualisierte 18. Dez. 2024  · 8 Min. Lesezeit

Mit der Ankündigung von OpenAI Sora letzte Woche angekündigt hat, ist es keine Überraschung, dass Google mit einem Upgrade seines Videogenerierungsmodells reagiert hat, Veo 2.

In diesem Blog gehe ich auf die wichtigsten Funktionen von Veo 2 ein, zeige, was es auszeichnet, stelle seine Möglichkeiten vor und erkläre, wie du es mit Googles VideoFX-Tool nutzen kannst.

Was ist Veo 2?

Veo 2 ist Googles neuestes und fortschrittlichstes KI-Tool zur Erstellung von Videos. Es wurde entwickelt, um qualitativ hochwertige, realistische Videos zu erstellen und unterstützt eine Auflösung von bis zu 4K (obwohl die aktuelle Ausgabe im VideoFX-Tool auf 720p beschränkt ist).

Veo 2 kann für jeden nützlich sein, der KI-Videos erstellen muss, z. B. für Vermarkter, Kreative, Geschäftsinhaber, Hobbyisten und möglicherweise auch für professionelle Filmemacher.

Veo 2

Quelle: Google DeepMind

Hier sind einige der Funktionen, die wir von Veo 2 erwarten können:

  • Realistische Videos: Veo 2 erzeugt detaillierte Videos mit weniger Fehlern als seine Vorgängerversion und produziert realistische, lebensechte Bilder.
  • Erweiterte Kontrolle: Die Benutzer/innen können spezifische Anweisungen geben, wie z. B. die Auswahl von Objektivtypen, Kamerawinkeln oder Spezialeffekten, um die Ausgabe anzupassen.
  • Hohe Auflösung: Veo 2 unterstützt die Erstellung von Videos mit einer Auflösung von bis zu 4K, obwohl die aktuellen Tests auf 720p beschränkt sind.
  • Sanfte Bewegung: Das Modell berücksichtigt die Physik der realen Welt und kann so natürliche und genaue Bewegungen in Szenen erzeugen.

Veo 2 kann sowohl mit einfachen als auch mit komplexen Anweisungen umgehen und Videos erstellen, die die Physik der realen Welt und verschiedene künstlerische Stile nachahmen.

Willst du mit generativer KI beginnen?

Lerne, wie du mit LLMs in Python direkt in deinem Browser arbeiten kannst

Jetzt starten

Wie du mit Veo 2 auf VideoFX loslegst

VideoFX ist die experimentelle Plattform von Google, mit der du Veo 2 ausprobieren kannst.

Auf VideoFX kann Veo 2 Videos mit einer Auflösung von 720p und einer Länge von bis zu 8 Sekunden erstellen. Während das Tool derzeit diese Grenzen hat, kann Veo 2 Videos in 4K-Auflösung und von mehreren Minuten Länge erstellen.

Veo 2 läuft auf VideoFX und du musst dich auf eine Warteliste setzen lassen

Um mit Veo 2 loszulegen:

  • Komm auf die Warteliste: Besuche Google Labs und anmelden. Der Zugang wird schrittweise eingeführt und ist derzeit auf Nutzer/innen in den USA beschränkt, die 18 Jahre oder älter sind.
  • Schreibe deine Aufforderung: Verwende eine filmische Sprache, um Veo 2 zu führen. Du könntest z.B. eine "Totale, die durch eine Szene gleitet" oder eine "Nahaufnahme eines Wissenschaftlers, der in ein Mikroskop schaut" beschreiben, um professionelle Bilder zu erhalten.
  • Experiment: Spiele mit verschiedenen Stilen, Genres, Kamerawinkeln oder Effekten. Du kannst sogar Objektive wie ein "18-mm-Objektiv" für Weitwinkelaufnahmen oder Effekte wie "geringe Schärfentiefe" zum Verwischen des Hintergrunds angeben.

Der Zugang ist vorerst begrenzt, aber Google plant, die Möglichkeiten von Veo 2 zu erweitern. Bis 2025 könnte sie für die Erstellung von Videos auf Plattformen wie YouTube Shorts und Vertex AI verfügbar sein, so dass noch mehr Menschen sie nutzen können.

Veo 2 Video Beispiele

Schauen wir uns nun einige Beispiele für Videos an, die Veo 2 aus einer Eingabeaufforderung erstellen kann (diese Beispiele wurden vom DeepMind-Team geteilt):

Wissenschaftlerin in einem Labor

Prompt: Filmische Aufnahme einer Ärztin in einem dunkelgelben Schutzanzug, beleuchtet vom grellen Neonlicht eines Labors. Die Kamera zoomt langsam an ihr Gesicht heran und schwenkt sanft, um die Sorgen und Ängste auf ihrer Stirn zu betonen. Sie sitzt über einen Labortisch gebeugt und blickt konzentriert in ein Mikroskop, während ihre behandschuhten Hände sorgfältig den Fokus einstellen. Die gedämpfte Farbpalette der Szene, die von dem kränklichen Gelb des Anzugs und dem sterilen Stahl des Labors dominiert wird, unterstreicht den Ernst der Lage und die Schwere des Unbekannten, mit dem sie konfrontiert ist. Die geringe Schärfentiefe konzentriert sich auf die Angst in ihren Augen und spiegelt den immensen Druck und die Verantwortung wider, die sie trägt.

Video-Beschreibung: Eine dramatische Nahaufnahme einer Ärztin in einem Schutzanzug, die konzentriert in ein Mikroskop schaut. Die Beleuchtung und der Kamerafokus unterstreichen die Ernsthaftigkeit ihrer Arbeit.

Cartoon in einer Küche aus den 1980er Jahren

Prompt: Diese mittelgroße Aufnahme mit geringer Schärfentiefe zeigt ein süßes Cartoon-Mädchen mit gewelltem braunem Haar, das aufrecht in einer Küche aus den 1980er Jahren sitzt. Ihr Haar ist mittellang und gewellt. Sie hat eine kleine, leicht nach oben gerichtete Nase und kleine, runde Ohren. Sie ist sehr lebhaft und aufgeregt, während sie in die Kamera spricht.

Video-Beschreibung: Eine lustige, animierte Figur erwacht in einer Retro-Küche voller Charme und bunter Nostalgie zum Leben. 

Imker auf einem Bauernhof

Prompt: Die Kamera schwebt sanft durch Reihen von pastellfarbenen hölzernen Bienenstöcken und summende Honigbienen gleiten ins Bild und wieder heraus. Die Bewegung richtet sich auf den kultivierten Landwirt, der in der Mitte steht und dessen makelloser weißer Imkeranzug im goldenen Nachmittagslicht schimmert. Er hebt ein Glas Honig an und kippt es leicht, um das Licht einzufangen. Hinter ihm wiegen sich hohe Sonnenblumen rhythmisch in der Brise, ihre Blütenblätter leuchten im warmen Sonnenlicht. Die Kamera schwenkt nach oben und zeigt ein Retro-Bauernhaus mit mintgrünen Fensterläden, dessen Wände von den Schatten der sich wiegenden Bäume beschattet werden. Aufgenommen mit einem 35-mm-Objektiv auf Kodak Portra 400 Film, erzeugt das goldene Licht reiche Texturen auf den Handschuhen des Bauern, dem Marmeladenglas und dem verwitterten Holz der Bienenstöcke.

Video-Beschreibung: Eine friedliche Szene mit Reihen von bemalten Bienenstöcken, die in der Sonne leuchten, und einem Imker, der ein Glas Honig in der Hand hält, fängt die ruhige Schönheit des Landlebens ein. 

Flamingos in einer Lagune

Prompt: Eine Aufnahme aus geringer Entfernung fängt einen Schwarm rosa Flamingos ein, die anmutig in einer üppigen, ruhigen Lagune waten. Das leuchtende Rosa ihres Gefieders bildet einen schönen Kontrast zum satten Grün der umliegenden Vegetation und dem kristallklaren türkisfarbenen Wasser. Das Sonnenlicht glitzert auf der Wasseroberfläche und erzeugt schimmernde Reflexionen, die auf dem Gefieder der Flamingos tanzen. Die eleganten, geschwungenen Hälse der Vögel sind untergetaucht, wenn sie durch das seichte Wasser laufen und ihre Bewegungen sanfte Wellen erzeugen, die sich über die Lagune ausbreiten. Die Komposition unterstreicht die Gelassenheit und natürliche Schönheit der Szene und hebt das empfindliche Gleichgewicht des Ökosystems und die Anmut dieser prächtigen Vögel hervor. Das weiche, diffuse Licht des frühen Morgens taucht die ganze Szene in ein warmes, ätherisches Licht.

Video-Beschreibung: Eine entspannende Aufnahme von Flamingos, die anmutig durch klares Wasser laufen, umgeben von üppigem Grün und leuchtend im weichen Morgenlicht.

Drehender Würfel

Prompt: Ein perfekter Würfel dreht sich in der Mitte einer weichen, nebligen Leere. Die Oberfläche wechselt zwischen verschiedenen hyper-realen Texturen - glatter Marmor, samtiges Wildleder, gehämmertes Messing und roher Beton. Jedes Material offenbart subtile Details: Marmoradern, die sich langsam ausbreiten, Wildlederfasern, die vom Wind gestreift werden, Messing, das in Zeitlupe anläuft, und Beton, der zerbröckelt und im Inneren polierten Stein offenbart. Am Ende umgibt ein sanftes Leuchten den Würfel, während er in eine glatte, spiegelnde Oberfläche übergeht, die die Unendlichkeit reflektiert.

Video-Beschreibung: Eine coole, abstrakte Animation eines Würfels, der seine Oberfläche verändert, um wie Marmor, Wildleder und andere Texturen auszusehen, in einer nebligen Atmosphäre.

Hund auf einem Poolschwimmer

Veo 2 vs. Sora vs. Anderer Wettbewerb

Veo 2 ist eines der besten Tools zur Videoerstellung auf dem Markt. Das geht aus den Bewertungen hervor, die die Nutzer in Vergleichstests abgegeben haben. 

Beim Vergleich von Veo 2 mit anderen Videotools wurden alle Videos in 720p-Auflösung gezeigt, um fair zu bleiben. Die Videolänge variierte:

  • Veo 2 waren die Videos 8 Sekunden lang.
  • VideoGen Videos waren mit 10 Sekunden etwas länger.
  • Die Videos der anderen Modelle waren mit nur 5 Sekunden kürzer.

Die Personen, die die Videos bewerteten, bekamen jedes Video in voller Länge gezeigt, um ihr Feedback abzugeben.

Um die Qualität von Veo 2 zu testen, schauten sich die Teilnehmer/innen Videos an, die mit Hilfe eines von Meta entwickelten Datensatzes namens MovieGenBench aus 1.003 Aufforderungen erstellt wurden. Hier sind die Ergebnisse:

Veo 2 BenchmarksDie Balkendiagramme zeigen, wie Veo 2 im Vergleich zu anderen KI-Videotools - Meta Movie Gen, Kling v1.5, Minimax und Sora Turbo - abschneidet, und zwar in zwei Bereichen: Gesamtpräferenz und Einhaltung der Vorgaben.

Zunächst einmal müssen wir diese Ergebnisse mit Vorsicht genießen, weil Google sie präsentiert. Die Videos von Veo 2 gefielen mehr Leuten am besten, besonders im Vergleich zu Sora Turbo (58,8%) und Minimax (54,5%).

Veo 2 war auch am besten darin, Anweisungen genau zu befolgen. Er schnitt am besten gegen Minimax (55,7%) und Sora Turbo (58,2%) ab. In den Diagrammen zeigen die grünen Balken, wo Veo 2 am besten abgeschnitten hat, die rosa Balken zeigen, wo andere Tools bevorzugt wurden, und die weißen Abschnitte zeigen Gleichstände.

Veo 2 ist jedoch nicht perfekt. Veo 2 hat große Fortschritte bei der Erstellung realistischer und detaillierter Videos gemacht, aber es gibt immer noch einige Herausforderungen. Wie auch andere KI-Videotools hat es Schwierigkeiten, in sehr komplexen Szenen oder Videos mit vielen schnellen oder detaillierten Bewegungen konsistent zu bleiben.

SynthID Watermark: Verantwortungsvolle KI-Videogenerierung

Google hat sich darauf konzentriert, Veo 2 sicher und verantwortungsvoll zu machen. Um dies zu unterstützen, enthält jedes erstellte Video ein unsichtbares SynthID-Wasserzeichen.

Das Wasserzeichen wird direkt in die Pixel der Videobilder eingebettet und bleibt auch dann erhalten, wenn das Video bearbeitet (beschnitten, gefiltert, komprimiert oder neu sortiert) wird.

Wir können das Wasserzeichen nicht sehen, also bleibt die Qualität des Videos gleich, aber Tools können es erkennen.

Das SynthID-Wasserzeichen stellt sicher, dass der Inhalt als KI-generiert identifiziert werden kann. Das hilft, Missbrauch, Fehlinformationen oder Verwirrung darüber zu vermeiden, wer das Video erstellt hat.

Du kannst mehr über SynthID erfahren hier.

Google hat jedoch nicht mitgeteilt, woher die Trainingsdaten von Veo 2 stammen. Viele glauben, dass YouTube, das zu Google gehört, eine Quelle sein könnte.

Fazit

Es wird interessant sein zu beobachten, wie Google den Zugang zu Veo 2 weiterentwickelt und ausbaut und wie es die Landschaft der Videoerstellung prägt. Die Fähigkeit, qualitativ hochwertige Videos nach detaillierten Vorgaben zu produzieren, könnte die Videoproduktion demokratisieren, aber die Bedenken über Missbrauch und Fehlinformationen bleiben bestehen. Ich hoffe, dass Google seinen Fokus auf verantwortungsvolle KI-Praktiken beibehält, während die Fähigkeiten von Veo 2 wachsen.

Verdiene eine Top-KI-Zertifizierung

Zeige, dass du KI effektiv und verantwortungsbewusst einsetzen kannst.
Themen

Lerne KI mit diesen Kursen!

Kurs

Generative AI for Business

1 hr
9.3K
Learn the role Generative Artificial Intelligence plays today and will play in the future in a business environment.
Siehe DetailsRight Arrow
Kurs starten
Mehr anzeigenRight Arrow
Verwandt

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Der Blog

Die 32 besten AWS-Interview-Fragen und Antworten für 2024

Ein kompletter Leitfaden zur Erkundung der grundlegenden, mittleren und fortgeschrittenen AWS-Interview-Fragen, zusammen mit Fragen, die auf realen Situationen basieren. Es deckt alle Bereiche ab und sorgt so für eine abgerundete Vorbereitungsstrategie.
Zoumana Keita 's photo

Zoumana Keita

30 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 Min.

See MoreSee More