Gemini Omni: Crea y edita video a partir de cualquier entrada
Gemini Omni es el modelo multimodal de creación de Google para flujos de trabajo centrados en video. Comienza desde texto, imágenes, audio o referencias de video, y luego da forma al resultado con ediciones en lenguaje natural. La API pública aún no está disponible aquí, por lo que esta página utiliza un generador creativo temporal hasta que la integración directa de Gemini Omni esté lista.

Google Search
Use web grounding for real-time context
Para qué está diseñado Gemini Omni
Gemini Omni integra el razonamiento de Gemini en un flujo de trabajo de creación de video, con énfasis en entrada multimodal, edición conversacional y continuidad de escena.

Creación de video a partir de cualquier entrada
Usa texto, imágenes, audio o video existente como referencias creativas. Gemini Omni está diseñado para combinar estas entradas en una salida de video coherente, en lugar de tratar cada referencia como un activo separado.

Edición conversacional de video
Solicita ediciones paso a paso, como cambiar la acción, reemplazar un objeto, mover la cámara, alterar el estilo o aplicar un efecto visual mientras se preserva la escena en las iteraciones.

Narración consciente del mundo
Google describe Gemini Omni como la combinación de renderizado creativo con el conocimiento del mundo de Gemini, ayudando a prompts que necesitan física, cultura, ciencia, lógica narrativa o causa y efecto realistas.
Por qué usar un flujo de trabajo Gemini Omni
Gemini Omni es más útil cuando un brief creativo necesita más que un solo prompt de texto a video: las referencias, revisiones y el razonamiento visual son importantes.
Itera sin reconstruir la escena
Refina un clip mediante ediciones en lenguaje natural en lugar de reescribir un prompt largo desde cero. Esto es útil para ajustar accesorios, movimiento, ángulo de cámara, efectos y ritmos narrativos.
Usa referencias creativas mixtas
Planifica escenas con bocetos, imágenes, referencias de voz, clips existentes y dirección escrita. Gemini Omni está diseñado para convertir entradas mixtas en un solo resultado creativo.
Conecta flujos de trabajo de consumo y producción
Úsalo para ideación rápida, contenido de formato corto, reparación de video, transformaciones estilo VFX, exploración de storyboards y flujos de trabajo de creadores que necesitan revisiones rápidas.
Prepárate para la integración con la API
Esta página mantiene la interfaz de la herramienta lista mientras se espera el acceso a la API de Gemini Omni. Cuando el acceso directo a la API esté disponible, el generador temporal podrá ser reemplazado por el flujo de tareas nativo.
Casos de uso populares de Gemini Omni
Usa Gemini Omni cuando el resultado dependa de ediciones de video, referencias mixtas o continuidad creativa a través de múltiples iteraciones.

Ediciones de video en lenguaje natural
Cambia lo que sucede en un clip, ajusta el estilo visual, añade efectos, reemplaza objetos o redirige la escena mediante instrucciones en lenguaje sencillo.
Creación de video guiada por referencias
Combina un boceto, imagen, clip, voz o tratamiento escrito en una sola dirección para video de formato corto, conceptos de campaña, ideas de producto o storyboards.
Borradores para creadores y marketing
Prototipa publicaciones sociales, anuncios cortos, sketches de creadores, escenas explicativas, ideas musicales y ganchos visuales antes de comprometerte con un flujo de producción completo.
Cómo planificar un prompt de Gemini Omni
Step 1 Paso 1: Define la entrada inicial
Decide si la idea comienza desde texto, una imagen de referencia, un video existente, audio, un boceto o una mezcla de entradas. Gemini Omni está diseñado para flujos de trabajo de video con referencias mixtas.
Step 2 Paso 2: Describe la edición o el resultado
Escribe la acción deseada, movimiento de cámara, estilo, reglas de escena, dirección de sonido y lo que debe mantenerse consistente. Para ediciones, especifica exactamente qué debe cambiar y qué debe permanecer igual.
Step 3 Paso 3: Genera una vista previa e itera
Usa el generador temporal para redactar prompts e ideación visual ahora. Cuando el acceso a la API de Gemini Omni esté listo, esta misma página se podrá conectar a la creación y edición de video nativa.

Precios de la vista previa de Gemini Omni
Usa créditos para el generador de vista previa temporal hoy. Los precios nativos de video Gemini Omni se actualizarán después de que el acceso a la API esté disponible.
Basic
Para probar borradores de prompts de Gemini Omni y vistas previas visuales ocasionales.
Incluye
- 1000 créditos (nunca caducan)
- Generador de vista previa temporal
- Redacción de prompts de texto a imagen
- Flujos de trabajo con imágenes de referencia
- Sin marca de agua
- Enlace de descarga permanente de la imagen
¡Los créditos nunca caducan!
Max
PopularPara creadores que planean prompts de video estilo Gemini Omni y borradores visuales con frecuencia.
Todo lo de Basic, más
- 7500 créditos (nunca caducan)
- Generación de vista previa de alto volumen
- Redacción de prompts para conceptos de video
- Flujos de trabajo con imágenes de referencia
- Soporte prioritario
- Acceso a nuevos lanzamientos
Mejor valor para creadores
Pro
Un plan equilibrado para marketers, editores y equipos creativos que prueban direcciones de prompts.
Todo lo de Basic, más
- 3300 créditos (nunca caducan)
- Más generaciones de vista previa
- Borradores guiados por referencias
- Sin marca de agua
- Derechos de uso comercial
- Enlace de descarga permanente de la imagen
Plan creativo flexible
Preguntas frecuentes sobre Gemini Omni
¿Qué es Gemini Omni?
Gemini Omni es el modelo multimodal de creación de Google para generar y editar video a partir de entradas como texto, imágenes, audio y video. Google lo describe como comenzando con video y avanzando hacia la creación a partir de cualquier entrada.
¿Esta página utiliza la API oficial de Gemini Omni?
Todavía no. El acceso a la API de Gemini Omni no está conectado en este sitio hoy. El generador de esta página es una vista previa creativa temporal basada en el generador existente del sitio, para que los usuarios puedan redactar prompts y referencias antes de que la integración nativa de la API esté lista.
¿Para qué es mejor Gemini Omni?
Gemini Omni está mejor posicionado para la edición de video en lenguaje natural, creación de video con referencias mixtas, revisiones paso a paso, transformaciones estilo VFX, storyboards, clips de creadores y flujos de trabajo de prompts que combinan referencias de texto, imagen, video o audio.
¿En qué se diferencia Gemini Omni de Veo?
Google posiciona Gemini Omni como un flujo de trabajo de razonamiento Gemini y creación multimodal que comienza con video y admite ediciones conversacionales. Veo sigue siendo la familia dedicada de generación de video de Google, mientras que Omni se enfoca en combinar referencias y edición iterativa.
¿Cuándo estará disponible aquí la generación nativa de Gemini Omni?
La integración nativa se agregará después de que el acceso estable a la API, los precios, los payloads de resultados y el comportamiento del estado de las tareas estén disponibles. Hasta entonces, esta página mantiene la página de inicio y la superficie del generador listas.