Esplora per tema

Come evolve l'infrastruttura AI

Modelli, chip e business model: Google sceglie dove fare margine

Otto articoli che raccontano la spina dorsale industriale dell'evento. La famiglia Gemini 3.5 esce con tre annunci convergenti: Gemini 3.5 Flash come nuovo default che batte Gemini 3.1 Pro su coding e benchmark agentici a una frazione del costo; Gemini Omni come modello multimodale che produce video da testo, immagini e audio; Gemma 4 come fronte open-weight con quattro taglie. Il redesign Neural Expressive dell'app Gemini chiude il filone consumer. Sul fronte chip, Google sdoppia esplicitamente per la prima volta training e inferenza: TPU 8t per i modelli frontier, TPU 8i per gli agenti. Sul fronte business model, tre annunci dicono lo stesso: il valore non è nei modelli, è nell'infrastruttura che li fa girare. AI Ultra scende a 200 dollari, Gemini API passa da prompt/giorno a compute consumato, AI Pro include YouTube Premium Lite. Google sta costruendo il margine sull'inference.

Annunci

In questa area (8)

Google AI Pro include YouTube Premium Lite: il bundle nascosto di I/O 2026

Tra le righe del riassetto dei piani Gemini, Google ha infilato un dettaglio che vale 9 dollari al mese: chi paga AI Pro a 19,99 dollari riceve in automatico YouTube Premium Lite. Mossa di retention travestita da regalo.

2026-05-21T02:10:00+02:00 Leggi →

Come evolve l'infrastruttura AI

Neural Expressive: il redesign dell'app Gemini abbandona il muro di testo

Google riscrive il linguaggio visivo di Gemini con animazioni fluide, tipografia nuova e risposte che strutturano l'informazione invece di sputarla. Disponibile da subito su Android, iOS e web.

2026-05-20T09:30:00+02:00 Leggi →

Come evolve l'infrastruttura AI

Gemini cambia metrica: dai prompt giornalieri al compute consumato (con fallback automatico sui modelli più piccoli)

Google abbandona i limiti a numero di prompt e introduce una misurazione basata sul compute effettivamente usato. Quota che si ricarica ogni cinque ore, tetto settimanale, e se sfondi vieni dirottato sui modelli più leggeri invece di essere bloccato.

2026-05-20T09:20:00+02:00 Leggi →

Come evolve l'infrastruttura AI

Gemma 4: la famiglia di modelli aperti di Google si rinnova, da E2B a 31B

A I/O 2026 Google ha annunciato Gemma 4, la nuova generazione dei suoi modelli open-weight pensati per girare on-device o auto-ospitati. Quattro taglie da E2B a 31B, miglioramenti su code generation e instruction following, e una variante 27B ottimizzata per inferenza 4-bit su hardware consumer.

2026-05-20T08:10:00+02:00 Leggi →

Come evolve l'infrastruttura AI

TPU 8t e TPU 8i: l'ottava generazione si sdoppia e Google smette di fare un chip solo per tutto

Al developer keynote di I/O 2026 Google ha richiamato i suoi nuovi TPU di ottava generazione: due chip distinti, uno per il training di modelli frontier (8t) e uno per l'inferenza degli agenti (8i). È la prima volta che l'azienda separa i due workload.

2026-05-20T06:05:00+02:00 Leggi →

Come evolve l'infrastruttura AI

Gemini 3.5 Flash: il nuovo modello di default è quattro volte più veloce e batte 3.1 Pro sul codice

Sul palco di Mountain View Sundar Pichai ha presentato il primo modello della famiglia Gemini 3.5. Il dato che pesa: Flash supera Gemini 3.1 Pro sui benchmark agentici e di coding, costando una frazione.

2026-05-19T23:00:00+02:00 Leggi →

Come evolve l'infrastruttura AI

Google AI Ultra scende da 250 a 200 dollari al mese (e nasce il piano 100$ per sviluppatori)

Mossa di posizionamento: Google taglia di 50 dollari il piano top, e introduce un piano intermedio a 100 dollari mensili pensato per sviluppatori e knowledge worker con cinque volte i limiti del piano Pro.

2026-05-19T20:45:00+02:00 Leggi →

Come evolve l'infrastruttura AI

Gemini Omni: il nuovo modello multimodale di Google trasforma testo, immagini e audio in video

Annunciato da Sundar Pichai sul palco di Mountain View, Gemini Omni è il modello che ragiona attraverso tutti i media. Il primo membro della famiglia, Gemini Omni Flash, arriverà in estate sull'app Gemini, su YouTube Shorts e su Flow.

2026-05-19T19:30:00+02:00 Leggi →

Esplora le altre aree