Gemini 3.5 Flash: il nuovo modello di default è quattro volte più veloce e batte 3.1 Pro sul codice

Sul palco di Mountain View Sundar Pichai ha presentato il primo modello della famiglia Gemini 3.5. Il dato che pesa: Flash supera Gemini 3.1 Pro sui benchmark agentici e di coding, costando una frazione.

Pubblicato: 2026-05-19T23:00:00+02:00 Categoria: Modelli AI Tag: gemini, ai, agents

Gemini 3.5 Flash è il nuovo modello di default in AI Mode su Search ed è entrato in disponibilità generale il 19 maggio. È il primo della famiglia 3.5, ed è la classica mossa Google: prima il Flash, poi il Pro. Solo che qui Flash, secondo i dati condivisi da Google, supera Gemini 3.1 Pro su buona parte dei benchmark agentici e di coding.

I numeri

76,2% su Terminal-Bench 2.1, 83,6% su MCP Atlas, 84,2% su CharXiv Reasoning. Sul GDPval-AA — il benchmark di lavoro reale costruito da Google — Flash totalizza 1.656, mentre 3.1 Pro si fermava a 1.317. Pichai ha citato sul palco un dato di velocità: 289 token al secondo, quattro volte più rapido degli altri modelli di frontiera. Il prezzo via API è di 1,5 dollari per milione di token in input e 9 dollari in output, con finestra di contesto da 1 milione di token.

A cosa serve

Google non lo presenta come un chatbot più bravo: lo presenta come un modello costruito per agire. Pianificazione su codebase di grandi dimensioni, deploy di sub-agenti che lavorano in parallelo, sostenere workflow complessi su orizzonti lunghi. È il modello che gira sotto Antigravity, sotto Spark, sotto le nuove funzioni agentiche di Search.

Perché conta

Il fatto che un modello Flash batta il Pro della generazione precedente — e a un decimo del costo, di fatto — è il segnale che Google ha smesso di trattare la fascia Flash come un compromesso. È il modello su cui Google scommette per la fase agentica del prodotto.

Fonti

← Torna a tutti gli annunci