Gemini Omni: il nuovo modello multimodale di Google trasforma testo, immagini e audio in video

Annunciato da Sundar Pichai sul palco di Mountain View, Gemini Omni è il modello che ragiona attraverso tutti i media. Il primo membro della famiglia, Gemini Omni Flash, arriverà in estate sull'app Gemini, su YouTube Shorts e su Flow.

Google ha alzato l'asticella della generazione video. Gemini Omni è una nuova famiglia di modelli multimodali che — nelle parole del CEO Sundar Pichai — può "creare qualsiasi cosa a partire da qualsiasi input", a cominciare dal video. Combinando testo, immagini, audio e clip esistenti, Omni non si limita a giustapporre i materiali: ragiona su di essi per produrre un output coerente, con una comprensione esplicita di fisica, cultura, storia e scienza.

Cosa cambia rispetto ai modelli video precedenti

La novità non è tanto il fatto di generare video, ma il modo. Secondo quanto riportato da TechCrunch, Omni introduce l'editing conversazionale: puoi modificare personaggi, sfondi ed elementi della scena dando istruzioni a voce, come stai parlando con un montatore. Il modello permette anche di editare le foto con comandi in linguaggio naturale, in continuità con Nano Banana, lo strumento che Google aveva già introdotto in versione sperimentale.

Un'altra funzione che riprende e supera la logica dei Cameos di Sora di OpenAI: gli utenti potranno creare video con il proprio avatar digitale. L'onboarding richiede una procedura specifica — registrarsi mentre si pronunciano una sequenza di numeri — pensata per scoraggiare i deepfake non autorizzati.

SynthID e tracciabilità

Tutti i contenuti generati da Omni includeranno il watermark digitale SynthID di Google, che permette di verificare se un video è stato generato dalla famiglia Gemini. È la stessa logica che Google sta estendendo con la verifica C2PA Content Credentials nell'app Gemini, in Search e in Chrome.

Disponibilità

Gemini Omni Flash è il primo modello della famiglia ed è in grado di renderizzare clip da 10 secondi. Rollout previsto in estate su app Gemini, YouTube Shorts e lo studio creativo Flow.

← Torna a tutti gli annunci