Modelli, chip e business model: Google sceglie dove fare margine
Otto articoli che raccontano la spina dorsale industriale dell'evento. La famiglia Gemini 3.5 esce con tre annunci convergenti: Gemini 3.5 Flash come nuovo default che batte Gemini 3.1 Pro su coding e benchmark agentici a una frazione del costo; Gemini Omni come modello multimodale che produce video da testo, immagini e audio; Gemma 4 come fronte open-weight con quattro taglie. Il redesign Neural Expressive dell'app Gemini chiude il filone consumer. Sul fronte chip, Google sdoppia esplicitamente per la prima volta training e inferenza: TPU 8t per i modelli frontier, TPU 8i per gli agenti. Sul fronte business model, tre annunci dicono lo stesso: il valore non è nei modelli, è nell'infrastruttura che li fa girare. AI Ultra scende a 200 dollari, Gemini API passa da prompt/giorno a compute consumato, AI Pro include YouTube Premium Lite. Google sta costruendo il margine sull'inference.
Tra le righe del riassetto dei piani Gemini, Google ha infilato un dettaglio che vale 9 dollari al mese: chi paga AI Pro a 19,99 dollari riceve in automatico YouTube Premium Lite. Mossa di retention travestita da regalo.
Google riscrive il linguaggio visivo di Gemini con animazioni fluide, tipografia nuova e risposte che strutturano l'informazione invece di sputarla. Disponibile da subito su Android, iOS e web.
Google abbandona i limiti a numero di prompt e introduce una misurazione basata sul compute effettivamente usato. Quota che si ricarica ogni cinque ore, tetto settimanale, e se sfondi vieni dirottato sui modelli più leggeri invece di essere bloccato.
A I/O 2026 Google ha annunciato Gemma 4, la nuova generazione dei suoi modelli open-weight pensati per girare on-device o auto-ospitati. Quattro taglie da E2B a 31B, miglioramenti su code generation e instruction following, e una variante 27B ottimizzata per inferenza 4-bit su hardware consumer.
Al developer keynote di I/O 2026 Google ha richiamato i suoi nuovi TPU di ottava generazione: due chip distinti, uno per il training di modelli frontier (8t) e uno per l'inferenza degli agenti (8i). È la prima volta che l'azienda separa i due workload.
Sul palco di Mountain View Sundar Pichai ha presentato il primo modello della famiglia Gemini 3.5. Il dato che pesa: Flash supera Gemini 3.1 Pro sui benchmark agentici e di coding, costando una frazione.
Mossa di posizionamento: Google taglia di 50 dollari il piano top, e introduce un piano intermedio a 100 dollari mensili pensato per sviluppatori e knowledge worker con cinque volte i limiti del piano Pro.
Annunciato da Sundar Pichai sul palco di Mountain View, Gemini Omni è il modello che ragiona attraverso tutti i media. Il primo membro della famiglia, Gemini Omni Flash, arriverà in estate sull'app Gemini, su YouTube Shorts e su Flow.