Google presentó Gemini Omni, una nueva herramienta de inteligencia artificial capaz de crear y editar videos a partir de texto, imágenes, audio y clips de video. El anuncio se realizó durante la conferencia anual Google I/O, donde la compañía mostró cómo esta tecnología permitirá generar contenido audiovisual mediante instrucciones conversacionales.
Gemini Omni combina la capacidad de razonamiento de Gemini con funciones avanzadas de creación multimedia. De esta manera, los usuarios podrán producir videos de alta calidad utilizando distintos tipos de contenido como referencia y editarlos mediante comandos escritos en lenguaje natural.
Durante el Google I/O, se presentó Gemini Omni, el nuevo modelo de inteligencia artificial desarrollado por Google que permite crear videos desde diferentes formatos de entrada. La plataforma puede trabajar con texto, imágenes, audio y video para generar clips coherentes y personalizados.
Omni no solo crea escenas visualmente realistas, sino que también interpreta el contexto y razona sobre cómo deberían comportarse los elementos dentro de una escena. Esto incluye movimientos, física, iluminación y continuidad narrativa.
El sistema funciona a través de instrucciones conversacionales. Los usuarios pueden describir cambios o nuevas ideas usando lenguaje natural y la inteligencia artificial modifica el video de manera progresiva.
Por ejemplo, Google mostró casos donde una persona solicita convertir una escultura en burbujas, cambiar efectos visuales o transformar objetos dentro de una escena sin perder coherencia entre tomas. También puede modificar estilos visuales, añadir personajes o alterar escenarios completos.
Otra característica destacada es la posibilidad de crear videos a partir de referencias múltiples. Un usuario puede combinar una imagen, un archivo de audio y un video base para producir una pieza audiovisual completamente nueva.
Además, Omni incorpora conocimientos del mundo real gracias a Gemini, lo que le permite generar escenas con movimientos más precisos y explicaciones visuales de conceptos complejos, como simulaciones científicas o videos educativos.
La compañía también confirmó que todos los videos generados incluirán la marca de agua digital SynthID para identificar que fueron creados con inteligencia artificial.
Disponibilidad de Gemini Omni
Google anunció el lanzamiento de Gemini Omni Flash, el primer modelo de esta nueva familia de herramientas. La función comenzará a desplegarse globalmente para suscriptores de Google AI Plus, Pro y Ultra a través de la aplicación Gemini y Google Flow.
Gemini Omni Flash estará disponible sin costo para usuarios de YouTube Shorts y YouTube Create App desde esta semana.