Saltar al contenido principal

¿Qué es el Veo 2 de Google? Cómo acceder, características, ejemplos

Infórmate sobre la nueva herramienta de generación de vídeo por IA de Google, Veo 2, incluyendo sus características, cómo utilizarla y cómo se compara con Sora de OpenAI.
Actualizado 18 dic 2024  · 8 min de lectura

Con el anuncio de OpenAI Sora la semana pasada, no sorprende que Google haya respondido con una actualización de su modelo de generación de vídeo, Veo 2.

En este blog, exploraré las principales características de Veo 2, destacaré lo que lo diferencia, mostraré sus capacidades y explicaré cómo puedes empezar a utilizarlo con la herramienta VideoFX de Google.

¿Qué es Veo 2?

Veo 2 es la herramienta de IA más nueva y avanzada de Google para crear vídeos. Está diseñado para hacer vídeos realistas de alta calidad, con una resolución de hasta 4K (aunque las salidas actuales están limitadas a 720p en la herramienta VideoFX).

Veo 2 puede ser útil para cualquiera que necesite generar vídeos de IA, incluidos vendedores, creadores, empresarios, aficionados y, posiblemente, cineastas profesionales.

Veo 2

Fuente: Google DeepMind

Estas son algunas de las características que podemos esperar de Veo 2:

  • Vídeos realistas: Veo 2 genera vídeos detallados con menos errores que su versión anterior, produciendo visuales realistas y realistas.
  • Control avanzado: Los usuarios pueden dar instrucciones específicas, como seleccionar tipos de objetivos, ángulos de cámara o efectos especiales, para personalizar el resultado.
  • Alta resolución: Veo 2 admite la generación de vídeo con una resolución de hasta 4K, aunque las pruebas actuales se limitan a 720p.
  • Movimiento suave: El modelo incorpora una comprensión de la física del mundo real, lo que le permite crear un movimiento natural y preciso en las escenas.

Veo 2 puede manejar instrucciones sencillas y complejas a la vez que crea vídeos que imitan la física del mundo real y diferentes estilos artísticos.

¿Quieres iniciarte en la IA Generativa?

Aprende a trabajar con LLMs en Python directamente en tu navegador

Empieza Ahora

Cómo empezar con Veo 2 en VideoFX

VideoFX es la plataforma experimental de Google que te permite probar Veo 2.

En VideoFX, Veo 2 puede crear vídeos con una resolución de 720p y una duración de hasta 8 segundos. Aunque actualmente la herramienta tiene estos límites, Veo 2 puede generar vídeos en resolución 4K y de varios minutos de duración.

Veo 2 funciona con VideoFX y tienes que apuntarte a una lista de espera

Para empezar con Veo 2:

  • Apúntate a la lista de espera: Visita Laboratorios de Google y inscríbete. El acceso se está extendiendo gradualmente, y actualmente está limitado a usuarios estadounidenses mayores de 18 años.
  • Escribe tu mensaje: Utiliza el lenguaje cinematográfico para guiar a Veo 2. Por ejemplo, podrías describir un "plano de ángulo bajo deslizándose por una escena" o un "primer plano de un científico mirando por un microscopio" para conseguir efectos visuales de calidad profesional.
  • Experimenta: Juega con diferentes estilos, géneros, ángulos de cámara o efectos. Incluso puedes especificar objetivos como "objetivo de 18 mm" para tomas amplias o efectos como "poca profundidad de campo" para desenfocar el fondo.

Por ahora el acceso es limitado, pero Google tiene previsto ampliar las capacidades de Veo 2. Para 2025, podría estar disponible para crear vídeos en plataformas como YouTube Shorts y Vertex AI, lo que permitirá que lo utilice aún más gente.

Veo 2 Ejemplos de vídeo

Veamos ahora algunos ejemplos de vídeos que Veo 2 puede crear a partir de una indicación (son ejemplos compartidos por el equipo de DeepMind):

Científico en un laboratorio

Prompt: Plano cinematográfico de una doctora con un traje amarillo oscuro para materiales peligrosos, iluminada por la dura luz fluorescente de un laboratorio. La cámara se acerca lentamente a su rostro, haciendo un suave barrido para resaltar la preocupación y la ansiedad grabadas en su frente. Está encorvada sobre una mesa de laboratorio, mirando atentamente un microscopio, con las manos enguantadas ajustando cuidadosamente el enfoque. La paleta de colores apagados de la escena, dominada por el amarillo enfermizo del traje y el acero estéril del laboratorio, subraya la gravedad de la situación y el peso de lo desconocido a lo que se enfrenta. La poca profundidad de campo se centra en el miedo de sus ojos, reflejando la inmensa presión y responsabilidad que soporta.

Descripción del vídeo: Un dramático primer plano de una doctora vestida con un traje protector contra materiales peligrosos, profundamente concentrada mientras mira por un microscopio. La iluminación y el enfoque de la cámara resaltan la seriedad de su trabajo.

Dibujo animado en una cocina de los años 80

Prompt: Este plano medio, con poca profundidad de campo, retrata a una simpática niña de dibujos animados con el pelo castaño ondulado, sentada en posición vertical en una cocina de los años 80. Su pelo es de longitud media y ondulado. Tiene la nariz pequeña y ligeramente respingona, y las orejas pequeñas y redondeadas. Está muy animada y emocionada mientras habla a la cámara.

Descripción del vídeo: Un divertido personaje animado cobra vida en una cocina retro, llena de encanto y colorida nostalgia. 

Apicultor en una granja

Prompt: La cámara flota suavemente a través de hileras de colmenas de madera pintadas en colores pastel, con abejas zumbando dentro y fuera del encuadre. El movimiento se posa en el refinado granjero de pie en el centro, con su impoluto traje blanco de apicultor brillando a la luz dorada de la tarde. Levanta un tarro de miel, inclinándolo ligeramente para que capte la luz. Detrás de él, altos girasoles se mecen rítmicamente con la brisa, sus pétalos brillan bajo la cálida luz del sol. La cámara se inclina hacia arriba para mostrar una granja retro con contraventanas verde menta, cuyas paredes están moteadas por las sombras de los árboles que se mecen. Fotografiada con un objetivo de 35 mm y película Kodak Portra 400, la luz dorada crea ricas texturas en los guantes del granjero, el tarro de mermelada y la madera desgastada de las colmenas.

Descripción del vídeo: Una apacible escena que muestra hileras de colmenas pintadas brillando al sol, con un apicultor sosteniendo un tarro de miel, captando la tranquila belleza de la vida rural. 

Flamencos en una laguna

Prompt: Una toma desde un ángulo bajo capta una bandada de flamencos rosas que vadean graciosamente en una laguna exuberante y tranquila. El vibrante color rosa de su plumaje contrasta maravillosamente con el verde de la vegetación circundante y el cristalino agua turquesa. La luz del sol resplandece en la superficie del agua, creando reflejos brillantes que bailan sobre las plumas de los flamencos. Los elegantes y curvados cuellos de estas aves se sumergen mientras caminan por las aguas poco profundas, y sus movimientos crean suaves ondulaciones que se extienden por la laguna. La composición resalta la serenidad y la belleza natural de la escena, destacando el delicado equilibrio del ecosistema y la gracia inherente a estas magníficas aves. La luz suave y difusa de primera hora de la mañana baña toda la escena con un resplandor cálido y etéreo.

Descripción del vídeo: Una relajante toma de flamencos caminando graciosamente por aguas cristalinas, rodeados de exuberante vegetación y brillando bajo la suave luz de la mañana.

Cubo giratorio

Prompt: Un cubo perfecto gira en el centro de un vacío suave y brumoso. La superficie cambia entre diferentes texturas hiperrealistas: mármol liso, ante aterciopelado, latón martillado y hormigón en bruto. Cada material revela detalles sutiles: vetas de mármol que se extienden lentamente, fibras de ante que rozan con el viento, latón que se empaña a cámara lenta y hormigón que se desmorona para revelar la piedra pulida de su interior. Termina con un suave resplandor que rodea al cubo mientras éste se transforma en una suave superficie de espejo, reflejando el infinito.

Descripción del vídeo: Una animación abstracta y genial de un cubo que cambia su superficie para parecerse al mármol, la gamuza y otras texturas, ambientada en una atmósfera brumosa.

Perro en un flotador de piscina

Veo 2 vs. Sora Vs. Otros concursos

Veo 2 es una de las mejores herramientas de generación de vídeo disponibles, según la valoración de su rendimiento en pruebas comparativas con otras. 

Al comparar Veo 2 con otras herramientas de vídeo, todos los vídeos se mostraron en resolución 720p para mantener las cosas justas. La duración del vídeo variaba:

  • Veo 2 los vídeos duraban 8 segundos.
  • VideoGen eran ligeramente más largos, de 10 segundos.
  • Los vídeos de otros modelos eran más cortos, de sólo 5 segundos.

A las personas que valoraban los vídeos se les mostraba la duración completa de cada vídeo para que dieran su opinión.

Para probar la calidad de Veo 2, los participantes vieron vídeos creados a partir de 1.003 indicaciones utilizando un conjunto de datos llamado MovieGenBench, desarrollado por Meta. Aquí tienes los resultados:

Puntos de referencia de Veo 2Los gráficos de barras muestran cómo se compara Veo 2 con otras herramientas de vídeo de IA -Meta Movie Gen, Kling v1.5, Minimax y Sora Turbo- en dos áreas: preferencia general y cumplimiento puntual.

En primer lugar, debemos tomar estos resultados con cautela, ya que Google los presenta. A más gente le gustaron más los vídeos de Veo 2, sobre todo en comparación con Sora Turbo (58,8%) y Minimax (54,5%).

Veo 2 también fue el mejor a la hora de seguir instrucciones con precisión, obteniendo la mejor puntuación frente a Minimax (55,7%) y Sora Turbo (58,2%). En los gráficos, las barras verdes muestran dónde obtuvo mejores resultados Veo 2, las barras rosas muestran dónde se prefirieron otras herramientas, y las secciones blancas muestran empates.

Sin embargo, Veo 2 no es perfecto. Veo 2 ha hecho grandes mejoras en la creación de vídeos realistas y detallados, pero aún tiene algunos retos. Al igual que otras herramientas de vídeo con IA, sigue teniendo dificultades para mantener la coherencia en escenas muy complejas o vídeos con mucho movimiento rápido o detallado.

Marca de agua SynthID: Generación responsable de vídeos con IA

Google se ha centrado en hacer que el uso de Veo 2 sea seguro y responsable. Para ayudar a ello, cada vídeo que crea incluye unamarca de agua SynthID invisible en .

La marca de agua se incrusta directamente en los píxeles de los fotogramas de vídeo y permanece intacta aunque se edite el vídeo (se recorte, filtre, comprima o reordene).

No podemos ver la marca de agua, por lo que la calidad del vídeo sigue siendo la misma, pero las herramientas pueden detectarla.

La marca de agua SynthID garantiza que el contenido pueda identificarse como generado por IA. Esto ayuda a evitar el uso indebido, la desinformación o la confusión sobre quién creó el vídeo.

Puedes obtener más información sobre SynthID aquí.

Sin embargo, Google no ha compartido de dónde proceden los datos de entrenamiento de Veo 2. Muchos creen que YouTube, propiedad de Google, podría ser una fuente.

Conclusión

A medida que Google siga desarrollando y ampliando el acceso a Veo 2, será interesante observar cómo configura el panorama de la creación de vídeo. Su capacidad para producir vídeos de alta calidad a partir de indicaciones detalladas podría democratizar la producción de vídeos, pero sigue preocupando el uso indebido y la desinformación. Espero que Google siga centrándose en las prácticas responsables de IA a medida que aumenten las capacidades de Veo 2.

Obtén una certificación superior en IA

Demuestra que puedes utilizar la IA de forma eficaz y responsable.
Temas

Aprende IA con estos cursos

curso

Generative AI for Business

1 hr
9.3K
Learn the role Generative Artificial Intelligence plays today and will play in the future in a business environment.
Ver detallesRight Arrow
Comienza El Curso
Ver másRight Arrow
Relacionado

blog

Los 7 mejores generadores de vídeo de IA para 2024 con vídeos de ejemplo

Descubre los mejores generadores de vídeo de IA disponibles en la actualidad, como RunwayML, Synthesia, Colossyan, Pictory, DeepBrain AI, Invideo y el esperadísimo Sora y Veo de DeepMind.

blog

¿Qué es Sora de OpenAI? Cómo funciona, Ejemplos, Características

Descubre Sora de OpenAI a través de vídeos de ejemplo y explora sus funciones, como Remix, Re-cut, Loop, Storyboard, Blend y Style Preset.

Richie Cotton

8 min

An AI juggles tasks

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.
Abid Ali Awan's photo

Abid Ali Awan

10 min

tutorial

Visión GPT-4: Guía completa para principiantes

Este tutorial le presentará todo lo que necesita saber sobre GPT-4 Vision, desde cómo acceder a él hasta ejemplos prácticos del mundo real y sus limitaciones.
Arunn Thevapalan's photo

Arunn Thevapalan

12 min

tutorial

Tutorial de DeepSeek-Coder-V2: Ejemplos, instalación, puntos de referencia

DeepSeek-Coder-V2 es un modelo de lenguaje de código de código abierto que rivaliza con el rendimiento de GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B o Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

8 min

tutorial

Tutorial de la API de OpenAI Assistants

Una visión completa de la API Assistants con nuestro artículo, que ofrece una mirada en profundidad a sus características, usos en la industria, guía de configuración y las mejores prácticas para maximizar su potencial en diversas aplicaciones empresariales.
Zoumana Keita 's photo

Zoumana Keita

14 min

See MoreSee More