Veo 3.1 Lite: generador de videos Gemini que todos esperaban
Veo 3.1 Lite es el modelo de generación de videos más económico de Google, lanzado el 31 de marzo de 2026 en la API de Gemini y Google AI Studio. Cuesta USD 0.05 por segundo a 720p y USD 0.08 por segundo a 1080p, posicionándose como la única alternativa económica a escala ahora que OpenAI discontinuó Sora el 26 de abril de 2026.
En 30 segundos
- Google lanzó Veo 3.1 Lite el 31 de marzo de 2026 con soporte Text-to-Video e Image-to-Video en resoluciones 720p y 1080p
- Cuesta USD 0.05/segundo a 720p y USD 0.08/segundo a 1080p — 50% más barato que Veo 3.1 Fast manteniendo la misma velocidad
- Está disponible en la API de Gemini, Google AI Studio (requiere suscripción pagada) y la app de escritorio/mobile de Gemini
- Soporta audio nativo sincronizado — diálogos, efectos de sonido y ambiente como feature de primera clase
- Google tiene de facto monopolio en developer APIs para generación de video tras discontinuar Sora OpenAI
Gemini es una familia de modelos de lenguaje grande multimodales desarrollados por Google DeepMind, capaces de procesar y generar texto, imágenes, audio y video. Fue anunciado en diciembre de 2023 y está disponible a través de Google AI Studio y servicios en la nube de Google.
Qué es Veo 3.1 Lite y por qué importa
Veo 3.1 Lite es un modelo de generación de videos que convierte texto e imágenes en video, desarrollado por Google DeepMind y disponible a través de la API de Gemini. El lanzamiento fue silencioso comparado con Sora de OpenAI, pero en práctica es más significativo: mientras Sora se discontinuó a los 5 meses de su lanzamiento, Lite llega al mercado ya integrada en las herramientas de developer de Google y lista para producción.
El precio es lo que hace diferente a Lite. Si querías generar video a escala hasta hace una semana, tenías una sola opción viable: Veo 3.1 Fast de Google, que costaba USD 0.10 por segundo. Lite es 50% más barato (USD 0.05/segundo a 720p) manteniendo la misma velocidad de generación. No es una versión degradada — es el mismo motor, con trade-offs en resolución nada más. Para contexto: un video de 10 segundos a 720p sale USD 0.50. Un anuncio de 60 segundos, USD 3. Un spot de 2 minutos, USD 6.
Eso sí, 1080p sigue siendo premium a USD 0.08/segundo, así que un video de 30 segundos Full HD sale USD 2.40. Sigue siendo barato comparado con producción tradicional, pero para volumen alto, 720p es el sweet spot.
Características principales de Veo 3.1 Lite
Lite soporta dos modos de generación:
- Text-to-Video: le pasas un prompt y recibís video. Soporta keywords en inglés, español y otros idiomas, aunque Google recomienda inglés para precisión máxima.
- Image-to-Video: le pasas una imagen estática y el modelo extiende el movimiento. Útil para animar screenshots, fotogramas, o assets.
Las resoluciones disponibles en preview son 720p (1280×720) y 1080p (1920×1080). No hay 4K en este lanzamiento, y según el roadmap oficial de Google, todavía no hay ETA para 4K. La duración base es 8 segundos, extensible a 140 segundos máximo usando Scene Extension (un feature separado que encadena múltiples generaciones).
Lo que sorpresa a muchos: Lite tiene audio nativo sincronizado. No es que metás un narrador después. Vos le pedís “genera un video de un developer debuggeando código con diálogos en español” y recibís video + audio con actores sintéticos hablando en el idioma que especificaste. El audio está perfectamente sincronizado con el movimiento de labios (cuando hay boca). Esto es feature de primera clase, no un agregado.
Precios y modelos de acceso
Google ofrece tres formas de acceder a Lite:
| Plataforma | Acceso | Costo por segundo | Límites |
|---|---|---|---|
| API de Gemini | REST API con autenticación | USD 0.05 (720p) / USD 0.08 (1080p) | Según plan de billing |
| Google AI Studio | Web — sin código | USD 0.05 (720p) / USD 0.08 (1080p) | Requiere Google AI Pro (USD 20/mes) o Ultra (USD 200/mes) |
| App Gemini (desktop/mobile) | Integrada en herramientas de IA | USD 0.05 (720p) / USD 0.08 (1080p) | Requiere suscripción Gemini pagada |

El pricing es transparente: generás un video, se descuenta el tiempo que durá. No hay minimums ni sorpresas. Si cancelás en medio, solo pagás lo que se generó hasta ese punto.
Para comparación de costos con producción tradicional: un video comercial de 30 segundos en Buenos Aires sale entre USD 2000-5000 si contratas agencia, sin contar post-producción. Con Lite, USD 1.50 en costos de generación. Obviamente la calidad no es la misma, pero para iterar rápido, testear ideas visuales, o generar contenido de lower-tier, Lite es imbatible.
Cómo acceder y usar Veo 3.1 Lite
En la web (Google AI Studio): vas a gemini.google.com con tu cuenta Google, clickeás en “Herramientas” en el sidebar, seleccionás “Crear video”, tipeas tu prompt, y apretás generar. Tarda 40-60 segundos dependiendo del modelo. Recibís el video en MP4, listo para descargar.
En mobile (app Gemini): en la app de Android/iOS, abrís el menú, buscás “video” o entrás en las herramientas. Mismo flow. El mobile es más lento porque depende de tu conexión.
En la API (para developers): la documentación oficial está en ai.google.dev/gemini-api/docs/video. Necesitás una API key de Google, inicializás el cliente de Gemini, y usás el método `generate_video()`. Un ejemplo mínimo en Python:
import google.generativeai as genai Te puede servir nuestra cobertura de integrar Gemini en tus proyectos.
client = genai.GenerativeModel("gemini-2.0-flash-exp")
result = client.generate_video(prompt="un developer debuggeando código")
print(result.video.mime_type)
El endpoint espera prompts en inglés para máxima precisión, aunque según los usuarios de Reddit y Stack Overflow, funciona bien en español también si especificás el idioma en el prompt.
Comparativa: Veo 3.1 Lite vs alternativas
| Modelo | Resolución máxima | Costo por segundo | Duración máxima | Acceso público | Estado |
|---|---|---|---|---|---|
| Veo 3.1 Lite | 1080p | USD 0.05-0.08 | 140 seg | Sí (API + Studio) | Disponible (31 mar 2026) |
| Veo 3.1 Fast | 1080p | USD 0.10-0.15 | 140 seg | Sí (API + Studio) | Disponible (existe) |
| Veo 3.1 (full) | 1440p | USD 0.20-0.30 | 140 seg | Limited (enterprise) | Disponible (limited) |
| Sora (OpenAI) | 1080p | USD 0.15 | 60 seg | No | Discontinuado (26 abr 2026) |
| Runway Gen-3 | 1080p | USD 0.05 | 30 seg | Sí (web) | Disponible (beta) |
La realidad es brutal: OpenAI discontinuó Sora hace 3 días (26 de abril de 2026) alegando “cambios en la estrategia de productos”. En la práctica, no logró competir con Google en precio y disponibilidad. Runway Gen-3 es la única competencia real ahora, pero tiene límites estrictos de duración (máximo 30 segundos) y la comunidad reporta que la calidad es inconsistente.
Google tiene de facto monopolio en developer APIs para video. Si querés generar video a escala y con soporte, Lite es tu única opción.
Casos de uso y aplicaciones prácticas
Donde Lite explota es en volumen y velocidad:
- Content marketing: podés generar 3-4 videos de TikTok/Instagram Reels por hora a USD 0.50 cada uno. Una agencia tradicional necesitaría un día entero. Esto es especialmente brutal para portales de noticias que necesitan assets visuales rápido.
- Ecommerce: videos de demostración de productos. Un seller puede generar 10 variantes de un mismo producto (ángulos, fondos, música) en 20 minutos y USD 5. Testea cuál convierte mejor. Con producción tradicional, es imposible.
- Educación: una plataforma de cursos puede generar explicaciones visuales para cada lección sin contratar videógrafos. Un prompt + template de Lite = video consistente.
- A/B testing visual: generás 5 variantes diferentes de un mismo concepto, cada una con Lite, probás cuál tiene mejor CTR. Con video tradicional, esto no era viable económicamente.
- Prototyping rápido: si estás pitcheando una idea y necesitás un video demo, 2 minutos y USD 3 en Lite. Sin esperar a que un colega tenga tiempo.
El patrón que emerge: Lite no compite con producción profesional de cine. Compite con NO generar video en absoluto. ¿Necesitas un video demo? Antes: “no hay presupuesto”. Hoy: USD 2 y 5 minutos.
Seguridad y watermarking con SynthID
Google embedde SynthID (su sistema de watermarking de Google DeepMind) en todos los videos generados con Lite. Es un watermark imperceptible — incrustado en píxeles, invisible al ojo humano, pero detectable con software especializado de Google.
El propósito oficial: identificar contenido AI-generado para cumplir con regulaciones emergentes (EU AI Act, potenciales requerimientos de EE.UU.). La realidad: es un mecanismo de control. Si alguien genera video deepfake con Lite, Google puede probarlo.
Para empresas en Latinoamérica, esto importa si usás Lite para contenido de alto riesgo (noticias falsas, impersonación). En jurisdicciones como Argentina o México, regulaciones sobre transparencia en contenido AI todavía son vagas. Pero el watermark te da cobertura: podés probar que fue generado con IA si alguien lo cuestiona.
Limitaciones técnicas y roadmap
No todo es perfecto. Lite tiene restricciones reales:
- Sin 4K: 1080p es el techo. Para producción de film o distribución premium, no alcanza.
- No soporta todos los estilos: Lite no entiende referencias complejas a dirección de arte. Si le pedís “estilo Wes Anderson”, probablemente no lo logra. Veo 3.1 full sí, pero es más caro y menos accesible.
- Base de 8 segundos: para Scene Extension y encadenar múltiples generaciones, el workflow es clunky. Mejor si planificás videos de 8-15 segundos nativos.
- Sin control fino de timing: el audio está sincronizado, pero si necesitás que cierto movimiento ocurra en frame X específico, es trial-and-error.
El roadmap oficial de Google es opaco. La documentación no dice cuándo llega 4K, cuándo soporta más controles, o si habrá versiones offline. (Spoiler: probablemente no — Google quiere mantener esto centralizado en su API para monetizar.) Sobre eso hablamos en el ecosistema actual de herramientas de IA.
Errores comunes al usar Veo 3.1 Lite
1. Prompts demasiado vagos
Muchos usuarios ven videos mediocres y culpan a Lite, cuando el problema es el prompt. “Genera un video de una playa” produce algo genérico. “Genera un video de una tabla de surf naranja en una playa de Fiji al atardecer, con agua turquesa y reflejos de luz dorada” es específico y Lite lo logra mejor.
2. Asumir que en una pasada sale perfecto
Lite es generativo — no siempre produce el mismo resultado. Algunos usuarios piden un video una sola vez y si no les gusta, descartan el modelo. La realidad: generás 2-3 variantes del mismo prompt, pickeas la mejor. Cobertura relacionada: todas las capacidades de Gemini.
3. No testear en mobile antes de publicar
Un video de 1080p puede verse excelente en desktop y flojo en un iPhone porque el aspect ratio cambió. Siempre probá antes de publicar en redes. Más sobre esto en otras herramientas de generación visual.
4. Esperar que el audio sea perfecto en otros idiomas
El audio nativo de Lite funciona bien en inglés. En español, tiene acento neutro (casi castellano), y en otros idiomas puede ser robótico. Si el audio es crítico, considera agregar narración real en post-producción.
5. No tener en cuenta el watermark SynthID
Si tu caso de uso requiere que el video NO sea identificable como AI-generado, Lite no es opción. El watermark está ahí y es permanente.
Preguntas Frecuentes
¿Cómo generar videos con Veo 3.1 Lite de Gemini?
Entrás a gemini.google.com, vas a Herramientas → Crear video, escribís tu prompt en inglés o español, y apretás generar. Tarda 40-60 segundos. Para API, usás la biblioteca Python de Google Generative AI con el endpoint `/video/generateVideo` pasando tu prompt.
¿Cuál es el costo de usar Veo 3.1 Lite?
USD 0.05 por segundo a 720p, USD 0.08 por segundo a 1080p. Un video de 10 segundos sale USD 0.50 en 720p, USD 0.80 en 1080p. No hay suscripción mínima ni fees ocultos. Si usás Google AI Studio, necesitás Google AI Pro (USD 20/mes) pero la generación de video no tiene costo adicional más allá del consumo de minutos.
¿En qué se diferencia Veo 3.1 Lite de Veo 3.1 Fast?
Lite cuesta 50% menos (USD 0.05 vs USD 0.10 por segundo a 720p) y genera a la misma velocidad (~40 segundos por video). Fast soporta resoluciones ligeramente mayores y mayor control de detalles en prompts complejos. Para la mayoría de casos (marketing, redes sociales, ecommerce), Lite es suficiente.
¿Veo 3.1 Lite soporta generación de videos a 4K?
No. En el lanzamiento del 31 de marzo de 2026, la resolución máxima es 1080p. No hay ETA oficial de Google para soporte de 4K. Veo 3.1 full (versión enterprise) soporta 1440p, pero no es accesible por API pública.
¿Cómo integrar Veo 3.1 Lite en mi aplicación?
Usás la API de Gemini. Iniciás el cliente con tu API key, llamás al método `generate_video()` con tu prompt, y recibís la URL del video generado. El video se almacena en Google Cloud por 24 horas automáticamente. Vos tenés que descargarlo si querés mantenerlo. La latencia típica es 40-60 segundos por generación.
Conclusión
Veo 3.1 Lite cambió las reglas del juego para quién puede generar video. Hace 3 meses, generar video a escala requería presupuesto. Hoy, requiere USD 0.05 por segundo y un prompt. Google tiene monopolio en developer APIs post-Sora, y Lite es lo más accesible que existe.
Para startups en Latinoamérica, contenido de marketing, A/B testing visual, o portales de noticias, esto es game-over. No hay razón para no generar video anymore. La pregunta ahora es cuánto volumen querés, no si querés hacerlo.
Las limitaciones existen — sin 4K, sin control fino de timing, audio que funciona mejor en inglés. Pero los casos de uso que Lite PUEDE cubrir son enormes. Y el precio es tan bajo que fallar en una generación no es riesgo, es costo de aprendizaje.
Si nunca generaste video con IA, Lite es el lugar para empezar. Si ya usás Sora o Runway, Lite es obligatorio probar por el precio. Si sos una agencia de contenido o portal de noticias, deberías estar automáticamente Utilizando Lite en tu pipeline ya.
¿Necesito saber programación para usar el generador de videos Gemini?
No. Tenés tres opciones: la web (gemini.google.com) sin código, la app Gemini en mobile, o la API de Gemini si codificás en Python/JavaScript. La opción web es la más fácil: tipeas un prompt y generás video en 40-60 segundos.
¿Veo 3.1 Lite realmente genera videos en 40 segundos?
Sí. Ese es el tiempo que tarda el modelo en procesar tu prompt (o imagen) y devolver un video MP4 listo para descargar. No hay esperas adicionales ni procesamiento backend.
¿Puedo generar videos más largos que 8 segundos con Lite?
Sí. La duración base es 8 segundos, pero podés usar Scene Extension (un feature de Google) para encadenar múltiples generaciones y llegar hasta 140 segundos máximo. Cada extensión se cobra por separado.






