Pular para o conteúdo principal

Mecanismo de física Genesis: Um guia com exemplos

Saiba o que é o Genesis, por que ele é um grande avanço na simulação de física de IA e como ele se compara ao Sora ou ao Veo 2.
Actualizado 20 de dez. de 2024  · 8 min de leitura

Os lançamentos de dezembro deste ano na geração de vídeos com IA parecem intermináveis - depois de Sora e Veo 2os holofotes agora se voltaram para o Gênesis.

O Genesis é um mecanismo de física de IA capaz de produzir simulações altamente realistas. Ele é incrivelmente rápido e pode gerar mundos 4D interativos. Os principais casos de uso incluem robótica e experimentos de física.

Neste blog, apresentarei uma visão geral do Genesis, mostrarei alguns exemplos e o compararei com outras ferramentas de geração de vídeo, como o Sora. Um tutorial de codificação sobre o Genesis será lançado em breve, portanto, fique atento!

O que é o Gênesis?

O Genesis é uma plataforma de física criada para uma ampla gama de usos, incluindo robótica, IA que interage com o mundo real e IA que trabalha com objetos físicos. O Genesis é o resultado de uma grande colaboração entre mais de 20 laboratórios de pesquisa durante dois anos.

Principais colaboradores para o desenvolvimento do Genesis

Colaboradores principais. Fonte da imagem: Gênesis

Diferentemente dos geradores de vídeo comuns, o Genesis foi projetado especificamente como um mecanismo de física. Ele combina diferentes ferramentas de física (como corpo rígido, fluidos e materiais macios) em um único sistema. Isso o torna capaz de lidar com várias simulações do mundo real. Poderíamos usar o Gênesis como um exemplo:

  1. Mecanismo de física: É um simulador de física superavançado que pode lidar com todos os tipos de materiais e eventos físicos, totalmente reconstruído do zero.
  2. Simulador de robótica: Ele é leve, super-rápido, fácil de usar com Python e perfeito para simular robôs.
  3. Sistema de renderização: Ele cria visuais realistas muito rapidamente e com ótima qualidade.
  4. Gerador de dados: Ele pode pegar descrições de linguagem natural e transformá-las em todos os tipos de dados.

Desenvolver aplicativos de IA

Aprenda a criar aplicativos de IA usando a API OpenAI.
Comece a Treinar Gratuitamente

Em comparação com as plataformas de simulação mais antigas, aqui estão alguns dos principais recursos do Genesis:

  1. Velocidade incrível: O Genesis é extremamente rápido, simulando mais de 43 milhões de quadros por segundo (FPS) para um braço robótico em uma RTX 4090. Isso é 430.000 vezes mais rápido do que em tempo real! O Genesis é o mecanismo de física mais rápido do mundo, até 80 vezes mais rápido do que outros simuladores, como o Isaac Gym ou o Mujoco, sem perder a precisão.
  2. Funciona em qualquer lugar: Ele é executado em Linux, MacOS e Windows e oferece suporte a diferentes hardwares, incluindo CPUs, GPUs Nvidia, GPUs AMD e Apple Metal.
  3. Sistema de física tudo em um: O Genesis combina várias ferramentas de física em um único sistema, simulando corpos rígidos, líquidos, gases, objetos deformáveis e muito mais. Ele pode lidar com uma variedade de materiais e como eles interagem.
  4. É compatível com todos os robôs: Braços robóticos, drones, robôs macios, máquinas com pernas... Se você quiser, o Genesis trabalha com uma grande variedade de objetos e suporta tipos de arquivos populares como .xml, .obj, .stl e outros.
  5. Alimentado por Python: O Genesis foi desenvolvido inteiramente em Python, que é simples de usar e personalizar.

Exemplos de vídeos do Genesis

O Genesis pode simular coisas como movimento de objetos, movimentos de personagens e interações com incrível precisão. Vamos dar uma olhada em alguns exemplos compartilhados pela equipe do Genesis.

Criação de mundos dinâmicos 4D

O Genesis usa seu avançado mecanismo de física e ferramentas de IA para criar mundos virtuais detalhados e realistas que incluem movimento e interação em quatro dimensões. Esses mundos podem ser usados para criar vídeos, animações e outros dados precisos para simulações. Ele pode até mesmo gerar movimentos de câmera e ações de objetos que parecem naturais e consistentes.

Movimento do personagem

O Genesis pode criar animações detalhadas para os personagens. Por exemplo:

Uma pequena figura de Wukong corre sobre uma mesa, salta no ar e faz uma pausa no meio do salto enquanto a câmera gira em torno dele antes de aterrissar.

Geração de políticas robóticas

O Genesis ajuda os robôs a aprender habilidades e executar tarefas automaticamente em vários cenários. Aqui está um exemplo:

Um braço robótico que aquece alimentos em um micro-ondas

Geração interativa de cenas 3D

O Genesis pode criar espaços 3D detalhados, como:

O interior de uma casa com sala de estar, cozinha, escritório e quarto

Criação de objetos de mundo aberto

O Genesis gera objetos realistas com partes móveis (objetos articulados) que vão além dos ativos pré-fabricados típicos.

https://fast.wistia.net/embed/iframe/ky8a97xikq

Simulação de robôs macios

O Genesis simula robôs macios ou híbridos (exteriores macios com um esqueleto rígido), como:

Um verme que se move com propriedades semelhantes às dos músculos.

Discurso, animação e emoções

O Genesis pode criar animações faciais emparelhadas com a fala, mostrando transições entre emoções como neutro, irritado e feliz.

Primeiros passos com o Genesis

Embora eu esteja trabalhando em um tutorial de codificação detalhado sobre o Genesis, que publicarei em breve, esta seção abordará apenas o básico.

Para instalar o Genesis, execute pip install genesis-world em seu terminal.

Você precisará ter certeza de que possui o Python 3.9 ou posterior e instalar o PyTorch. Para configurá-lo, siga as instruções no site do site do PyTorch.

A documentação do Genesis Genesis é um recurso útil que mostra a você como usar todos os recursos dessa ferramenta de simulação de física. Ele começa explicando o que é o Genesis, por que ele foi criado e como configurá-lo. Em seguida, ele orienta você sobre os recursos básicos, como criação de visuais, controle de robôs e execução de várias simulações ao mesmo tempo.

Você também encontrará ferramentas para tarefas como planejamento de movimentos de robôs, trabalho com robôs flexíveis e uso de aprendizagem por reforço para ensinar os robôs a se moverem. Para os usuários mais avançados, o guia inclui tópicos como o manuseio de colisões, o uso de simulações para fazer ajustes e o trabalho com drones.

Gênesis vs. Gênesis. Sora vs. Veo 2

Vamos agora comparar o Genesis, o Sora e o Veo 2 e ver como eles são diferentes uns dos outros:

Objetivo e foco

  • Gênesis: Uma ferramenta para simular a física, projetada para aplicativos de robótica e IA.
  • Sora: Um modelo que cria vídeos a partir de instruções de texto, com foco em visuais imaginativos ou realistas.
  • Veo 2: Um gerador de vídeo avançado que combina visuais de alta qualidade com física realista.

Principais recursos

  • Resolução e duração:
    • O Genesis não gera vídeos, mas se concentra na simulação de física.
    • O Sora cria vídeos de até 1080p e 20 segundos de duração.
    • O Veo 2 suporta resolução de até 4K e vídeos com mais de 2 minutos de duração.
  • Simulação de física:
    • O Genesis é excelente em simulações de física rápidas e precisas.
    • Sora tem uma compreensão limitada da física.
    • O Veo 2 modela a física, como fluidos e interações de objetos.
  • Recursos visuais:
    • O Genesis prioriza a precisão física em detrimento da aparência.
    • Sora cria visuais hiper-realistas ou imaginativos.
    • O Veo 2 oferece vídeos altamente realistas com menos erros em comparação com o Sora.
  • Controle do usuário:
    • O Genesis permite o controle detalhado das simulações de física.
    • O Sora usa comandos de texto para criar vídeos.
    • O Veo 2 oferece controle preciso da câmera e efeitos cinematográficos.

Pontos fortes

  • Gênesis: Simulações de física super-rápidas, combina várias ferramentas de física e é baseado em Python para facilitar o uso.
  • Sora: Excelente para contar histórias criativas e imaginativas.
  • Veo 2: O melhor para vídeos realistas, forte controle sobre as cenas e excelente manipulação de movimentos humanos.

Aplicativos

  • Gênesis: Usado em robótica, jogos e pesquisas de IA que necessitam de física precisa.
  • Sora: Perfeito para setores criativos, como produção de vídeo e entretenimento.
  • Veo 2: Ideal para filmagens, criação de conteúdo e vídeos científicos com muitos detalhes.

Recurso

Gênesis

Sora

Veo 2

Finalidade

Simulação de física para robótica, IA incorporada e IA física

Geração de texto para vídeo

Geração de vídeo de alta qualidade com simulação de física

Resolução e duração

N/A (concentra-se em simulações, não em geração de vídeo)

Até 1080p, clipes de 20 segundos

Resolução de até 4K, clipes de mais de 2 minutos

Simulação de física

Simulações físicas precisas e de alta velocidade

Conhecimento limitado de física

Modelagem física avançada, incluindo fluidos e interações de objetos

Qualidade visual

Concentra-se na precisão física em vez da estética visual

Visuais hiper-realistas ou imaginativos

Alto realismo com menos artefatos

Controle do usuário

Altamente personalizável para simulações de física

Geração de texto para vídeo

Controle preciso da câmera e efeitos cinematográficos

Pontos fortes exclusivos

Velocidades de simulação ultrarrápidas (43 milhões de FPS), estrutura de física unificada, baseada em Python

É excelente em contar histórias criativas

Aderência imediata superior, cinematografia aprimorada, melhor controle dos movimentos humanos

Aplicativos

Treinamento em robótica, física de jogos, pesquisa de IA que requer modelagem física precisa

Setores criativos, produção de vídeo

Produção de filmes, visualização científica, criação de conteúdo

Melhor para

Simulações precisas e pesquisa de IA

Narração criativa

Geração de vídeo realista e de alta qualidade

O que vem a seguir para o Genesis?

A equipe do Genesis está trabalhando em alguns novos recursos interessantes que estarão disponíveis em breve. Isso inclui um módulo de sensor de toque que usa física, simulações aprimoradas para objetos rígidos e renderização em mosaico para acelerar a execução. Eles também estão adicionando ferramentas para criar movimentos de personagens e câmeras, cenas interativas, animações faciais e movimentos de robôs, como caminhar ou manipular objetos. Grandes ambientes virtuais também ficarão melhores com um novo recurso de simulação para resultados mais realistas.

Alguns recursos ainda não estão sendo trabalhados. Isso inclui suporte para renderização no Windows, uma interface amigável, mais tipos de materiais para simulações e novas opções de sensores.

Conclusão

O Genesis representa, sem dúvida, um avanço substancial na simulação de física e na IA generativa. Fiquei impressionado com sua velocidade, precisão e adaptabilidade em vários casos de uso.

Embora alguns recursos ainda estejam em desenvolvimento, o potencial dessa ferramenta de código aberto é inegável. Acredito que a abordagem amigável do Genesis e o compromisso com a melhoria contínua tornarão a simulação de física avançada acessível a um público mais amplo.

Obtenha uma das melhores certificações de IA

Demonstre que você pode usar a IA de forma eficaz e responsável.
Temas

Aprenda IA com estes cursos!

programa

Developing AI Applications

23hrs hr
Learn to create AI-powered applications with the latest AI developer tools, including the OpenAI API, Hugging Face, and LangChain.
Ver DetalhesRight Arrow
Iniciar Curso
Ver maisRight Arrow
Relacionado

blog

Os 7 principais geradores de vídeo com IA para 2024 com vídeos de exemplo

Descubra os principais geradores de vídeo com IA disponíveis atualmente, incluindo RunwayML, Synthesia, Colossyan, Pictory, DeepBrain AI, Invideo e os altamente esperados Sora e Veo da DeepMind.

blog

O que é o Sora da Open AI? Como funciona, casos de uso, alternativas e muito mais

Descubra o Sora da OpenAI: uma IA inovadora de texto para vídeo que revolucionará a IA multimodal em 2024. Explore seus recursos, inovações e impacto potencial.

Richie Cotton

8 min

blog

O que é um modelo generativo?

Os modelos generativos usam o aprendizado de máquina para descobrir padrões nos dados e gerar novos dados. Saiba mais sobre sua importância e aplicações em IA.
Abid Ali Awan's photo

Abid Ali Awan

11 min

blog

O que é IA? Um guia rápido para iniciantes

Descubra o que realmente é inteligência artificial com exemplos, opiniões de especialistas e todas as ferramentas de que você precisa para aprender mais.
Matt Crabtree's photo

Matt Crabtree

11 min

tutorial

Visão GPT-4: Um guia abrangente para iniciantes

Este tutorial apresentará tudo o que você precisa saber sobre o GPT-4 Vision, desde o acesso a ele, passando por exemplos práticos do mundo real, até suas limitações.
Arunn Thevapalan's photo

Arunn Thevapalan

12 min

tutorial

DeepSeek-Coder-V2 Tutorial: Exemplos, instalação, padrões de referência

O DeepSeek-Coder-V2 é um modelo de linguagem de código de código aberto que rivaliza com o desempenho do GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B ou Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

8 min

See MoreSee More