Gemini Omni: Crea y edita video a partir de cualquier entrada

Gemini Omni es el modelo multimodal de creación de Google para flujos de trabajo centrados en video. Comienza desde texto, imágenes, audio o referencias de video, y luego da forma al resultado con ediciones en lenguaje natural. La API pública aún no está disponible aquí, por lo que esta página utiliza un generador creativo temporal hasta que la integración directa de Gemini Omni esté lista.

Vista previa de generación de video AI Gemini Omni con movimiento de artes marciales

Model

Prompt

0/20000

Tamaño de imagen

Output Image Number

Image History

No images yet. Start generating!

Para qué está diseñado Gemini Omni

Gemini Omni integra el razonamiento de Gemini en un flujo de trabajo de creación de video, con énfasis en entrada multimodal, edición conversacional y continuidad de escena.

Creación de video multimodal Gemini Omni a partir de referencias de texto, imagen, audio y video

Creación de video a partir de cualquier entrada

Usa texto, imágenes, audio o video existente como referencias creativas. Gemini Omni está diseñado para combinar estas entradas en una salida de video coherente, en lugar de tratar cada referencia como un activo separado.

Flujo de trabajo de edición de video AI conversacional Gemini Omni

Edición conversacional de video

Solicita ediciones paso a paso, como cambiar la acción, reemplazar un objeto, mover la cámara, alterar el estilo o aplicar un efecto visual mientras se preserva la escena en las iteraciones.

Ejemplo de narración de video AI consciente del mundo Gemini Omni

Narración consciente del mundo

Google describe Gemini Omni como la combinación de renderizado creativo con el conocimiento del mundo de Gemini, ayudando a prompts que necesitan física, cultura, ciencia, lógica narrativa o causa y efecto realistas.

Por qué usar un flujo de trabajo Gemini Omni

Gemini Omni es más útil cuando un brief creativo necesita más que un solo prompt de texto a video: las referencias, revisiones y el razonamiento visual son importantes.

Itera sin reconstruir la escena

Refina un clip mediante ediciones en lenguaje natural en lugar de reescribir un prompt largo desde cero. Esto es útil para ajustar accesorios, movimiento, ángulo de cámara, efectos y ritmos narrativos.

Usa referencias creativas mixtas

Planifica escenas con bocetos, imágenes, referencias de voz, clips existentes y dirección escrita. Gemini Omni está diseñado para convertir entradas mixtas en un solo resultado creativo.

Conecta flujos de trabajo de consumo y producción

Úsalo para ideación rápida, contenido de formato corto, reparación de video, transformaciones estilo VFX, exploración de storyboards y flujos de trabajo de creadores que necesitan revisiones rápidas.

Prepárate para la integración con la API

Esta página mantiene la interfaz de la herramienta lista mientras se espera el acceso a la API de Gemini Omni. Cuando el acceso directo a la API esté disponible, el generador temporal podrá ser reemplazado por el flujo de tareas nativo.

Casos de uso populares de Gemini Omni

Usa Gemini Omni cuando el resultado dependa de ediciones de video, referencias mixtas o continuidad creativa a través de múltiples iteraciones.

Casos de uso de edición de escenas cinematográficas y generación de video con Gemini Omni

Ediciones de video en lenguaje natural

Cambia lo que sucede en un clip, ajusta el estilo visual, añade efectos, reemplaza objetos o redirige la escena mediante instrucciones en lenguaje sencillo.

Creación de video guiada por referencias

Combina un boceto, imagen, clip, voz o tratamiento escrito en una sola dirección para video de formato corto, conceptos de campaña, ideas de producto o storyboards.

Borradores para creadores y marketing

Prototipa publicaciones sociales, anuncios cortos, sketches de creadores, escenas explicativas, ideas musicales y ganchos visuales antes de comprometerte con un flujo de producción completo.

Cómo planificar un prompt de Gemini Omni

Step 1 Paso 1: Define la entrada inicial

Decide si la idea comienza desde texto, una imagen de referencia, un video existente, audio, un boceto o una mezcla de entradas. Gemini Omni está diseñado para flujos de trabajo de video con referencias mixtas.

Step 2 Paso 2: Describe la edición o el resultado

Escribe la acción deseada, movimiento de cámara, estilo, reglas de escena, dirección de sonido y lo que debe mantenerse consistente. Para ediciones, especifica exactamente qué debe cambiar y qué debe permanecer igual.

Step 3 Paso 3: Genera una vista previa e itera

Usa el generador temporal para redactar prompts e ideación visual ahora. Cuando el acceso a la API de Gemini Omni esté listo, esta misma página se podrá conectar a la creación y edición de video nativa.

Prueba el generador de vista previa

Cómo planificar un prompt de Gemini Omni en línea

Precios de la vista previa de Gemini Omni

Usa créditos para el generador de vista previa temporal hoy. Los precios nativos de video Gemini Omni se actualizarán después de que el acceso a la API esté disponible.

Basic

$39.9$19.9USD

Para probar borradores de prompts de Gemini Omni y vistas previas visuales ocasionales.

Incluye

1000 créditos (nunca caducan)
Generador de vista previa temporal
Redacción de prompts de texto a imagen
Flujos de trabajo con imágenes de referencia
Sin marca de agua
Enlace de descarga permanente de la imagen

¡Los créditos nunca caducan!

Max

Popular

$199.9$99.9USD

Para creadores que planean prompts de video estilo Gemini Omni y borradores visuales con frecuencia.

Todo lo de Basic, más

7500 créditos (nunca caducan)
Generación de vista previa de alto volumen
Redacción de prompts para conceptos de video
Flujos de trabajo con imágenes de referencia
Soporte prioritario
Acceso a nuevos lanzamientos

Mejor valor para creadores

Pro

$99.9$49.9USD

Un plan equilibrado para marketers, editores y equipos creativos que prueban direcciones de prompts.

Todo lo de Basic, más

3300 créditos (nunca caducan)
Más generaciones de vista previa
Borradores guiados por referencias
Sin marca de agua
Derechos de uso comercial
Enlace de descarga permanente de la imagen

Plan creativo flexible

Preguntas frecuentes sobre Gemini Omni

¿Qué es Gemini Omni?

Gemini Omni es el modelo multimodal de creación de Google para generar y editar video a partir de entradas como texto, imágenes, audio y video. Google lo describe como comenzando con video y avanzando hacia la creación a partir de cualquier entrada.

¿Esta página utiliza la API oficial de Gemini Omni?

Todavía no. El acceso a la API de Gemini Omni no está conectado en este sitio hoy. El generador de esta página es una vista previa creativa temporal basada en el generador existente del sitio, para que los usuarios puedan redactar prompts y referencias antes de que la integración nativa de la API esté lista.

¿Para qué es mejor Gemini Omni?

Gemini Omni está mejor posicionado para la edición de video en lenguaje natural, creación de video con referencias mixtas, revisiones paso a paso, transformaciones estilo VFX, storyboards, clips de creadores y flujos de trabajo de prompts que combinan referencias de texto, imagen, video o audio.

¿En qué se diferencia Gemini Omni de Veo?

Google posiciona Gemini Omni como un flujo de trabajo de razonamiento Gemini y creación multimodal que comienza con video y admite ediciones conversacionales. Veo sigue siendo la familia dedicada de generación de video de Google, mientras que Omni se enfoca en combinar referencias y edición iterativa.

¿Cuándo estará disponible aquí la generación nativa de Gemini Omni?

La integración nativa se agregará después de que el acceso estable a la API, los precios, los payloads de resultados y el comportamiento del estado de las tareas estén disponibles. Hasta entonces, esta página mantiene la página de inicio y la superficie del generador listas.