Google lanza Nano Banana 2 Lite en EE. UU., generación de imágenes en solo 4 segundos
2026-07-01 13:47
Favoritos

es.wedoany.com Noticia: Google ha lanzado recientemente dos nuevos modelos dirigidos a desarrolladores: Gemini Omni Flash y Nano Banana 2 Lite. El primero integra profundamente el razonamiento multimodal con la generación y edición de video, mientras que el segundo se centra en la generación de imágenes de alta velocidad.

El modelo Gemini Omni Flash se presentó en Google I/O 2026, y su capacidad principal es integrar el razonamiento multimodal de Gemini en los procesos de generación y edición de video. Este modelo ya está disponible a través de la API de Gemini y Google AI Studio. Sus cuatro capacidades clave incluyen: edición de video conversacional, que permite a los usuarios refinar videos usando lenguaje natural; referencia multimodal, que combina entradas de imágenes, texto y video para mantener la coherencia de la escena; invocar el conocimiento de Gemini en áreas como historia, biología y lógica narrativa para construir videos; y sincronizar texto con acciones de video mediante indicaciones simples. En cuanto al precio, el costo de salida de video de Omni Flash es de 0,10 USD por segundo, igual que Veo 3.1 Fast.

Google también enumeró las limitaciones actuales del modelo: actualmente solo admite la generación de videos de hasta 10 segundos, no admite la carga de referencias de audio ni la extensión de escenas, la API admite videos de hasta 3 segundos como material de referencia, pero el modelo aún no puede procesar correctamente este tipo de entrada, y la consistencia de los personajes durante los cambios de escena y movimientos de cámara sigue siendo limitada.

El otro modelo, Nano Banana 2 Lite, denominado gemini-3.1-flash-lite-image, está optimizado para escenarios sensibles a la latencia. Su principal atractivo es que la latencia de generación de imágenes es de aproximadamente 4 segundos, una quinta parte de la de Nano Banana 2; el costo de generar una imagen de resolución 1K es de aproximadamente 0,034 USD, la mitad de Nano Banana 2 y una cuarta parte de Nano Banana Pro. En cuanto a la representación de texto y pruebas comparativas, Nano Banana 2 Lite se encuentra al mismo nivel que modelos como Grok, y es adecuado para escenarios como la generación masiva de materiales de comercio electrónico y la iteración de ideas publicitarias.

Google demostró un flujo de trabajo que conecta ambos modelos: primero, usar Nano Banana 2 Lite para generar imágenes rápidamente, luego ingresar las imágenes generadas como material de referencia en Gemini Omni Flash para convertirlas en video. Para ello, Google desarrolló tres aplicaciones de demostración: Anywhere, que permite combinar selfies o fotos subidas con lugares emblemáticos y generar clips dinámicos; Space Lift, que genera diferentes planes de decoración a partir de fotos de habitaciones y puede convertirlos en videos de recorrido espacial; y Omni Product Studio, que genera imágenes contextualizadas y videos cortos publicitarios para productos de comercio electrónico.

Enlace de referencia: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Este boletín es una compilación y reproducción de información de Internet global y socios estratégicos, y está destinado únicamente a proporcionar a los lectores la comunicación. Si hay infracción u otros problemas, por favor infórmenos a tiempo, este sitio será modificado o eliminado. Toda reproducción de este artículo sin autorización formal está estrictamente prohibida. Correo electrónico: news@wedoany.com