Accéder au contenu principal

Qu'est-ce que Veo 2 de Google ? Comment y accéder, fonctionnalités, exemples

Découvrez Veo 2, le nouvel outil de génération de vidéos par IA de Google, ainsi que ses fonctionnalités, son mode d'emploi et sa comparaison avec Sora d'OpenAI.
Actualisé 18 déc. 2024  · 8 min de lecture

Avec l'annonce par OpenAI de Sora la semaine dernière, il n'est pas surprenant que Google ait réagi en mettant à jour son modèle de génération de vidéos, Veo 2.

Dans ce blog, j'explorerai les principales fonctionnalités de Veo 2, je soulignerai ce qui le distingue, je présenterai ses capacités et j'expliquerai comment vous pouvez commencer à l'utiliser avec l'outil VideoFX de Google.

Qu'est-ce que Veo 2 ?

Veo 2 est l'outil d'IA le plus récent et le plus avancé de Google pour la création de vidéos. Il est conçu pour réaliser des vidéos réalistes de haute qualité, avec une résolution pouvant atteindre 4K (bien que les sorties actuelles soient limitées à 720p dans l'outil VideoFX).

Veo 2 peut être utile à tous ceux qui ont besoin de générer des vidéos d'IA, y compris les spécialistes du marketing, les créateurs, les chefs d'entreprise, les amateurs et, éventuellement, les cinéastes professionnels.

Veo 2

Source : Google DeepMind

Voici quelques-unes des caractéristiques que l'on peut attendre de Veo 2 :

  • Vidéos réalistes : Veo 2 génère des vidéos détaillées avec moins d'erreurs que sa version précédente, produisant des images réalistes et réalistes.
  • Contrôle avancé : Les utilisateurs peuvent fournir des instructions spécifiques, telles que la sélection de types d'objectifs, d'angles de caméra ou d'effets spéciaux, afin de personnaliser le résultat.
  • Haute résolution : Veo 2 permet de générer des vidéos jusqu'à une résolution de 4K, bien que les tests actuels soient limités à 720p.
  • Mouvement fluide : Le modèle intègre une compréhension de la physique du monde réel, ce qui lui permet de créer des mouvements naturels et précis dans les scènes.

Veo 2 peut gérer des instructions simples et complexes tout en créant des vidéos qui imitent la physique du monde réel et différents styles artistiques.

Vous souhaitez vous lancer dans l'IA générative ?

Apprenez à travailler avec des LLM en Python directement dans votre navigateur

Commencez maintenant

Comment démarrer avec Veo 2 sur VideoFX

VideoFX est la plateforme expérimentale de Google qui vous permet de tester Veo 2.

Sur VideoFX, Veo 2 peut créer des vidéos d'une résolution de 720p et d'une durée maximale de 8 secondes. Si l'outil présente actuellement ces limites, Veo 2 peut générer des vidéos en résolution 4K et de plusieurs minutes.

Veo 2 fonctionne avec VideoFX et vous devez vous inscrire sur une liste d'attente.

Pour commencer à utiliser Veo 2 :

  • Inscrivez-vous sur la liste d'attente : Visiter Google Labs et inscrivez-vous. L'accès est mis en place progressivement et est actuellement limité aux utilisateurs américains âgés de 18 ans ou plus.
  • Rédigez votre message : Utilisez le langage cinématographique pour guider la Veo 2. Par exemple, vous pouvez décrire un "plan en contre-plongée glissant à travers une scène" ou un "gros plan d'un scientifique regardant dans un microscope" pour obtenir des images de qualité professionnelle.
  • Expérience : Jouez avec différents styles, genres, angles de caméra ou effets. Vous pouvez même spécifier des objectifs tels qu'un "objectif 18 mm" pour les plans larges ou des effets tels qu'une "faible profondeur de champ" pour rendre l'arrière-plan flou.

L'accès est limité pour l'instant, mais Google prévoit d'étendre les capacités de Veo 2. D'ici 2025, il pourrait être disponible pour la création de vidéos sur des plateformes telles que YouTube Shorts et Vertex AI, ce qui permettrait à un plus grand nombre de personnes de l'utiliser.

Exemples de vidéos Veo 2

Voyons maintenant quelques exemples de vidéos que Veo 2 peut créer à partir d'une invite (il s'agit d'exemples partagés par l'équipe DeepMind) :

Scientifique dans un laboratoire

Prompt : Plan cinématographique d'une femme médecin vêtue d'une combinaison de protection jaune foncé, éclairée par la lumière fluorescente crue d'un laboratoire. La caméra zoome lentement sur son visage, effectuant un léger panoramique pour souligner l'inquiétude et l'anxiété qui se dessinent sur son front. Elle est penchée sur un tableau de laboratoire, regardant attentivement dans un microscope, ses mains gantées ajustant soigneusement la mise au point. La palette de couleurs sourdes de la scène, dominée par le jaune maladif de la combinaison et l'acier stérile du laboratoire, souligne la gravité de la situation et le poids de l'inconnu auquel elle est confrontée. La faible profondeur de champ met l'accent sur la peur dans ses yeux, reflétant l'immense pression et la responsabilité qu'elle porte.

Description de la vidéo : Gros plan dramatique d'un médecin portant une combinaison de protection, très concentré alors qu'il regarde dans un microscope. L'éclairage et la mise au point de la caméra soulignent le sérieux de son travail.

Caricature dans une cuisine des années 1980

Prompt : Cette prise de vue moyenne, avec une faible profondeur de champ, représente une jolie petite fille de dessin animé aux cheveux bruns ondulés, assise bien droite dans une cuisine des années 1980. Ses cheveux sont mi-longs et ondulés. Elle a un petit nez légèrement retroussé et de petites oreilles arrondies. Elle est très animée et enthousiaste lorsqu'elle parle à la caméra.

Description de la vidéo : Un amusant personnage animé prend vie dans une cuisine rétro, pleine de charme et de nostalgie colorée. 

Apiculteur dans une ferme

Prompt : La caméra flotte doucement à travers des rangées de ruches en bois peintes aux couleurs pastel, les abeilles bourdonnantes glissant dans et hors du cadre. Le mouvement se fixe sur l'agriculteur raffiné qui se tient au centre, sa combinaison d'apiculteur d'un blanc immaculé brillant dans la lumière dorée de l'après-midi. Il soulève un pot de miel, l'incline légèrement pour capter la lumière. Derrière lui, de grands tournesols se balancent rythmiquement dans la brise, leurs pétales brillant dans la lumière chaude du soleil. La caméra s'incline vers le haut pour révéler une ferme rétro aux volets vert menthe, dont les murs sont ombragés par les arbres qui se balancent. Réalisée avec un objectif 35 mm sur un film Kodak Portra 400, la lumière dorée crée de riches textures sur les gants du fermier, le pot de marmelade et le bois usé par les intempéries des ruches.

Description de la vidéo : Une scène paisible montrant des rangées de ruches peintes brillant au soleil, avec un apiculteur tenant un pot de miel, capturant la beauté calme de la vie rurale. 

Flamants dans une lagune

Prompt : Une prise de vue en contre-plongée capture une volée de flamants roses pataugeant gracieusement dans un lagon luxuriant et tranquille. Le rose vif de leur plumage contraste magnifiquement avec le vert de la végétation environnante et l'eau turquoise cristalline. La lumière du soleil scintille à la surface de l'eau, créant des reflets chatoyants qui dansent sur les plumes des flamants. Le cou élégant et courbé des oiseaux est submergé lorsqu'ils marchent dans l'eau peu profonde, leurs mouvements créant de légères ondulations qui se propagent dans la lagune. La composition met en valeur la sérénité et la beauté naturelle de la scène, soulignant l'équilibre délicat de l'écosystème et la grâce inhérente à ces magnifiques oiseaux. La lumière douce et diffuse du petit matin baigne l'ensemble de la scène d'une lueur chaude et éthérée.

Description de la vidéo : Une photo relaxante de flamants roses marchant gracieusement dans l'eau claire, entourés d'une végétation luxuriante et illuminés par la douce lumière du matin.

Cube rotatif

Prompt : Un cube parfait tourne au centre d'un vide doux et brumeux. La surface oscille entre différentes textures hyperréelles - marbre lisse, daim velouté, laiton martelé et béton brut. Chaque matériau révèle des détails subtils : les veines de marbre s'étendent lentement, les fibres de daim sont effleurées par le vent, le laiton se ternit au ralenti et le béton s'effrite pour révéler la pierre polie à l'intérieur. Il se termine par une douce lueur entourant le cube qui se transforme en une surface lisse et miroitante, reflétant l'infini.

Description de la vidéo : Une animation cool et abstraite d'un cube dont la surface change pour ressembler à du marbre, du daim et d'autres textures, le tout dans une atmosphère brumeuse.

Chien sur un flotteur de piscine

Veo 2 vs. Sora vs. Autres concours

Veo 2 est l'un des meilleurs outils de génération vidéo disponibles, si l'on en croit l'évaluation de ses performances dans les tests le comparant à d'autres. 

Pour comparer Veo 2 à d'autres outils vidéo, toutes les vidéos ont été affichées en résolution 720p pour rester équitable. La durée de la vidéo est variable :

  • Veo 2 duraient 8 secondes.
  • Les vidéos de VideoGen étaient légèrement plus longues (10 secondes).
  • Les vidéos des autres modèles étaient plus courtes, avec seulement 5 secondes.

Les personnes chargées d'évaluer les vidéos ont visionné l'intégralité de chaque vidéo pour donner leur avis.

Pour tester la qualité de Veo 2, les participants ont regardé des vidéos créées à partir de 1 003 invites à l'aide d'un ensemble de données appelé MovieGenBench, développé par Meta. Voici les résultats :

Comparaison de Veo 2Les diagrammes à barres montrent comment Veo 2 se compare à d'autres outils vidéo d'IA - Meta Movie Gen, Kling v1.5, Minimax et Sora Turbo- dans deux domaines : la préférence générale et l'adhésion rapide.

Tout d'abord, nous devons prendre ces résultats avec un grain de sel, car c'est Google qui les présente. Les vidéos de Veo 2 ont été les plus appréciées, surtout par rapport à Sora Turbo (58,8%) et Minimax (54,5%).

Veo 2 a également été le meilleur pour suivre les instructions avec précision, obtenant les meilleurs résultats contre Minimax (55,7 %) et Sora Turbo (58,2 %). Dans les graphiques, les barres vertes indiquent les meilleures performances de Veo 2, les barres roses indiquent les préférences pour d'autres outils et les sections blanches indiquent les égalités.

Cependant, Veo 2 n'est pas parfait. Veo 2 a apporté de grandes améliorations dans la création de vidéos réalistes et détaillées, mais il reste encore des défis à relever. À l'instar d'autres outils vidéo d'IA, il éprouve encore des difficultés à assurer la cohérence des scènes très complexes ou des vidéos comportant de nombreux mouvements rapides ou détaillés.

SynthID Filigrane : Génération de vidéos d'IA responsables

Google s'est efforcé de rendre Veo 2 sûr et responsable. Pour vous aider, chaque vidéo créée comprend unfiligrane SynthID invisible sur .

Le filigrane est intégré directement dans les pixels des images vidéo et reste intact même si la vidéo est modifiée (recadrée, filtrée, compressée ou réorganisée).

Le filigrane n'étant pas visible, la qualité de la vidéo reste la même, mais des outils permettent de le détecter.

Le filigrane SynthID garantit que le contenu peut être identifié comme étant généré par l'IA. Cela permet d'éviter toute utilisation abusive, toute désinformation ou toute confusion quant à l'identité du créateur de la vidéo.

Vous pouvez en savoir plus sur SynthID ici.

Toutefois, Google n'a pas indiqué d'où proviennent les données de formation de Veo 2. Beaucoup pensent que YouTube, qui appartient à Google, pourrait en être la source.

Conclusion

Alors que Google continue de développer et d'élargir l'accès à Veo 2, il sera intéressant d'observer comment il façonne le paysage de la création vidéo. Sa capacité à produire des vidéos de haute qualité à partir d'instructions détaillées pourrait démocratiser la production vidéo, mais des inquiétudes subsistent quant à l'utilisation abusive et à la désinformation. J'espère que Google maintiendra son attention sur les pratiques responsables en matière d'IA à mesure que les capacités de Veo 2 s'accroîtront.

Obtenez une certification de haut niveau en matière d'IA

Démontrez que vous pouvez utiliser l'IA de manière efficace et responsable.
Sujets

Apprenez l'IA avec ces cours !

cours

Generative AI for Business

1 hr
9.3K
Learn the role Generative Artificial Intelligence plays today and will play in the future in a business environment.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Apparenté

blog

Les 32 meilleures questions d'entretien sur AWS et leurs réponses pour 2024

Un guide complet pour explorer les questions d'entretien AWS de base, intermédiaires et avancées, ainsi que des questions basées sur des situations réelles. Il couvre tous les domaines, garantissant ainsi une stratégie de préparation bien équilibrée.

Zoumana Keita

30 min

blog

Les 20 meilleures questions d'entretien pour les flocons de neige, à tous les niveaux

Vous êtes actuellement à la recherche d'un emploi qui utilise Snowflake ? Préparez-vous à répondre à ces 20 questions d'entretien sur le flocon de neige pour décrocher le poste !
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 min

See MoreSee More