cursus
Moteur physique Genesis : Un guide avec des exemples
Les nouveautés de ce mois de décembre en matière de génération de vidéos d'IA semblent infinies - après Sora et Veo 2les projecteurs sont désormais braqués sur Genesis.
Genesis est un moteur physique d'IA capable de produire des simulations très réalistes. Il est d'une rapidité impressionnante et peut générer des mondes 4D interactifs. Les principaux cas d'utilisation sont les expériences de robotique et de physique.
Dans ce blog, je vais vous donner un aperçu de Genesis, vous présenter quelques exemples et le comparer à d'autres outils de génération de vidéos comme Sora. Un tutoriel de codage sur Genesis sera bientôt disponible, alors restez à l'écoute !
Qu'est-ce que la Genèse ?
Genesis est une plateforme physique conçue pour un large éventail d'utilisations, notamment la robotique, l'IA qui interagit avec le monde réel et l'IA qui travaille avec des objets physiques. Genesis est le résultat d'une vaste collaboration entre plus de 20 laboratoires de recherche pendant deux ans.
Principaux contributeurs. Source de l'image : La genèse
Contrairement aux générateurs vidéo classiques, Genesis a été conçu spécifiquement comme un moteur physique. Il combine différents outils physiques (comme les corps rigides, les fluides et les matériaux souples) en un seul système. Il est donc capable de gérer diverses simulations du monde réel. Nous pourrions utiliser la Genèse comme un :
- Moteur physique : Il s'agit d'un simulateur de physique très avancé, capable de gérer toutes sortes de matériaux et d'événements physiques, entièrement reconstruit à partir de zéro.
- Simulateur de robotique : Il est léger, super rapide, facile à utiliser avec Python et parfait pour simuler des robots.
- Système de rendu : Il crée des images réalistes très rapidement et avec une grande qualité.
- Générateur de données : Il peut prendre des descriptions en langage naturel et les transformer en toutes sortes de données.
Développer des applications d'IA
Voici les principales caractéristiques de Genesis par rapport aux anciennes plates-formes de simulation :
- Une vitesse incroyable : Genesis est extrêmement rapide, simulant plus de 43 millions d'images par seconde (FPS) pour un bras robotique sur une RTX 4090. C'est 430 000 fois plus rapide que le temps réel ! Genesis est le moteur physique le plus rapide au monde, jusqu'à 80 fois plus rapide que d'autres simulateurs comme Isaac Gym ou Mujoco, sans perdre en précision.
- Fonctionne partout : Il fonctionne sous Linux, MacOS et Windows et prend en charge différents matériels, notamment les CPU, les GPU Nvidia, les GPU AMD et Apple Metal.
- Système physique tout-en-un : Genesis combine de nombreux outils physiques en un seul système, simulant des corps rigides, des liquides, des gaz, des objets déformables, etc. Il peut gérer une grande variété de matériaux et leur interaction.
- Prend en charge tous les robots : Bras robotiques, drones, robots mous, machines à jambes... Genesis travaille avec un large éventail d'objets et prend en charge les types de fichiers les plus courants tels que .xml, .obj, .stl et autres.
- Python : Genesis est entièrement construit en Python, ce qui est simple à utiliser et à personnaliser.
Exemples de vidéos Genesis
Genesis peut simuler des mouvements d'objets, de personnages et des interactions avec une précision incroyable. Voyons quelques exemples partagés par l'équipe de Genesis.
Créer des mondes dynamiques en 4D
Genesis utilise son moteur physique avancé et ses outils d'intelligence artificielle pour construire des mondes virtuels détaillés et réalistes qui incluent des mouvements et des interactions en 4 dimensions. Ces mondes peuvent être utilisés pour créer des vidéos, des animations et d'autres données précises pour les simulations. Il peut même générer des mouvements de caméra et des actions d'objets qui semblent naturels et cohérents.
Mouvement des personnages
Genesis peut créer des animations détaillées pour les personnages. Par exemple :
Un petit personnage de Wukong sprinte sur un tableau, saute en l'air et s'arrête en plein saut tandis que la caméra tourne autour de lui avant qu'il n'atterrisse.
Génération de politiques robotisées
Genesis permet aux robots d'acquérir des compétences et d'effectuer des tâches automatiquement dans divers scénarios. En voici un exemple :
Un bras robotisé qui réchauffe des aliments dans un micro-ondes
Génération de scènes 3D interactives
Genesis peut créer des espaces 3D détaillés, comme :
Intérieur d'une maison avec un salon, une cuisine, un bureau et une chambre.
Création d'objets dans un monde ouvert
Genesis génère des objets réalistes avec des parties mobiles (objets articulés) qui vont au-delà des objets pré-fabriqués habituels.
Simulation de robot mou
Genesis simule des robots mous ou hybrides (extérieurs mous avec un squelette rigide), tels que :
Un ver qui se déplace avec des propriétés musculaires.
Parole, animation et émotions
Genesis peut créer des animations faciales associées à la parole, montrant les transitions entre des émotions telles que la neutralité, la colère et la joie.
Démarrer avec Genesis
Bien que je travaille sur un tutoriel de codage détaillé sur Genesis, que je publierai bientôt, cette section ne couvrira que les bases.
Pour installer Genesis, lancez pip install genesis-world
dans votre terminal.
Vous devrez vous assurer que vous disposez de Python 3.9 ou plus et installer PyTorch. Pour l'installer, suivez les instructions sur le site web de site web de PyTorch.
La documentation Genesis est une ressource utile qui vous montre comment utiliser toutes les fonctionnalités de cet outil de simulation physique. est une ressource utile qui vous montre comment utiliser toutes les fonctionnalités de cet outil de simulation physique. Il commence par expliquer ce qu'est Genesis, pourquoi il a été créé et comment le mettre en place. Ensuite, il vous guide à travers les fonctionnalités de base telles que la création de visuels, le contrôle de robots et l'exécution de plusieurs simulations à la fois.
Vous trouverez également des outils pour des tâches telles que la planification des mouvements des robots, le travail avec des robots mous et l'utilisation de l'apprentissage par renforcement pour apprendre aux robots à se déplacer. Pour les utilisateurs plus expérimentés, le guide aborde des sujets tels que la gestion des collisions, l'utilisation de simulations pour effectuer des ajustements et le travail avec des drones.
Genèse vs. Sora vs. Veo 2
Comparons maintenant Genesis, Sora et Veo 2 et voyons en quoi ils sont différents les uns des autres :
But et objectif
- Genèse : Un outil de simulation de la physique, conçu pour les applications de robotique et d'intelligence artificielle.
- Sora : Un modèle qui crée des vidéos à partir de textes, en se concentrant sur des images imaginatives ou réalistes.
- Veo 2 : Un générateur vidéo avancé qui combine des images de haute qualité et des effets physiques réalistes.
Caractéristiques principales
- Résolution et longueur :
- Genesis ne génère pas de vidéos mais se concentre sur la simulation physique.
- Sora crée des vidéos jusqu'à 1080p et d'une durée de 20 secondes.
- Veo 2 prend en charge la résolution 4K et les vidéos de plus de 2 minutes.
- Simulation physique :
- Genesis est excellent pour les simulations physiques rapides et précises.
- Sora a une compréhension limitée de la physique.
- Veo 2 modélise la physique comme les fluides et les interactions entre les objets.
- Visuels :
- La Genèse donne la priorité à la précision physique plutôt qu'à l'apparence.
- Sora crée des visuels hyperréalistes ou imaginatifs.
- Veo 2 produit des vidéos très réalistes avec moins d'erreurs que Sora.
- Contrôle de l'utilisateur :
- Genesis permet un contrôle détaillé des simulations physiques.
- Sora utilise des messages textes pour créer des vidéos.
- Veo 2 offre un contrôle précis de la caméra et des effets cinématographiques.
Points forts
- Genèse : Simulations physiques ultra-rapides, combine plusieurs outils de physique, et est basé sur Python pour une utilisation facile.
- Sora : Idéal pour raconter des histoires de manière créative et imaginative.
- Veo 2 : Meilleur pour les vidéos réalistes, un contrôle fort des scènes et une excellente gestion des mouvements humains.
Applications
- Genèse : Utilisé dans les domaines de la robotique, des jeux et de la recherche sur l'intelligence artificielle nécessitant une physique précise.
- Sora : Parfait pour les industries créatives telles que la production vidéo et le divertissement.
- Veo 2 : Idéal pour la réalisation de films, la création de contenu et les vidéos scientifiques très détaillées.
Fonctionnalité |
La genèse |
Sora |
Veo 2 |
Objectif |
Simulation physique pour la robotique, l'IA incarnée et l'IA physique |
Génération de texte-vidéo |
Génération de vidéos de haute qualité avec simulation physique |
Résolution et durée |
N/A (axé sur les simulations, pas sur la génération de vidéos) |
Jusqu'à 1080p, clips de 20 secondes |
Résolution jusqu'à 4K, clips de plus de 2 minutes |
Simulation de physique |
Des simulations physiques précises et à grande vitesse |
Compréhension limitée de la physique |
Modélisation physique avancée, y compris les fluides et les interactions entre objets |
Qualité visuelle |
L'accent est mis sur la précision physique plutôt que sur l'esthétique visuelle |
Visuels hyperréalistes ou imaginatifs |
Un grand réalisme avec moins d'artefacts |
Contrôle de l'utilisateur |
Hautement personnalisable pour les simulations physiques |
Génération de texte-vidéo |
Contrôle précis de la caméra et effets cinématographiques |
Des atouts uniques |
Vitesses de simulation ultra-rapides (43 millions d'images par seconde), cadre physique unifié, basé sur Python. |
Exceller dans la narration créative |
Adhésion rapide supérieure, cinématographie améliorée, meilleure gestion des mouvements humains |
Applications |
Formation en robotique, physique des jeux, recherche en IA nécessitant une modélisation physique précise |
Industries créatives, production vidéo |
Réalisation de films, visualisation scientifique, création de contenu |
Meilleur pour |
Simulations précises et recherche sur l'IA |
La narration créative |
Génération de vidéos réalistes et de haute qualité |
Quelle est la prochaine étape pour Genesis ?
L'équipe de Genesis travaille sur de nouvelles fonctionnalités qui seront bientôt disponibles. Il s'agit notamment d'un module de capteur tactile qui utilise la physique, de simulations améliorées pour les objets rigides et d'un rendu en mosaïque qui accélère l'exécution. Ils ajoutent également des outils pour créer des mouvements de personnages et de caméras, des scènes interactives, des animations faciales et des mouvements de robots tels que la marche ou la manipulation d'objets. Les grands environnements virtuels seront également améliorés grâce à une nouvelle fonction de simulation permettant d'obtenir des résultats plus réalistes.
Certaines fonctionnalités n'ont pas encore été développées. Il s'agit notamment de la prise en charge du rendu Windows, d'une interface conviviale, d'un plus grand nombre de types de matériaux pour les simulations et de nouvelles options pour les capteurs.
Conclusion
Genesis représente sans aucun doute une avancée substantielle en matière de simulation physique et d'IA générative. J'ai été impressionné par sa rapidité, sa précision et sa capacité d'adaptation à différents cas d'utilisation.
Bien que certaines fonctionnalités soient encore en cours de développement, le potentiel de cet outil open-source est indéniable. Je pense que l'approche conviviale de Genesis et son engagement en faveur de l'amélioration continue rendront la simulation physique avancée accessible à un public plus large.
Obtenez une certification de haut niveau en matière d'IA
Apprenez l'IA avec ces cours !
cursus
Ingénieur IA associé pour les développeurs
cursus