Gemini 3.5 Flash è il nuovo modello di default in AI Mode su Search ed è entrato in disponibilità generale il 19 maggio. È il primo della famiglia 3.5, ed è la classica mossa Google: prima il Flash, poi il Pro. Solo che qui Flash, secondo i dati condivisi da Google, supera Gemini 3.1 Pro su buona parte dei benchmark agentici e di coding.
I numeri
76,2% su Terminal-Bench 2.1, 83,6% su MCP Atlas, 84,2% su CharXiv Reasoning. Sul GDPval-AA — il benchmark di lavoro reale costruito da Google — Flash totalizza 1.656, mentre 3.1 Pro si fermava a 1.317. Pichai ha citato sul palco un dato di velocità: 289 token al secondo, quattro volte più rapido degli altri modelli di frontiera. Il prezzo via API è di 1,5 dollari per milione di token in input e 9 dollari in output, con finestra di contesto da 1 milione di token.
A cosa serve
Google non lo presenta come un chatbot più bravo: lo presenta come un modello costruito per agire. Pianificazione su codebase di grandi dimensioni, deploy di sub-agenti che lavorano in parallelo, sostenere workflow complessi su orizzonti lunghi. È il modello che gira sotto Antigravity, sotto Spark, sotto le nuove funzioni agentiche di Search.
Perché conta
Il fatto che un modello Flash batta il Pro della generazione precedente — e a un decimo del costo, di fatto — è il segnale che Google ha smesso di trattare la fascia Flash come un compromesso. È il modello su cui Google scommette per la fase agentica del prodotto.