Economia Digitale

La riscossa di Google: dall’assistente Spark al modello Omni. Tutte le novità di Google I/O

Gemini supera i 900 milioni di utenti. Quest’anno l’investimento previsto dichiara il Ceo Sundar Pichai sarà sei volte superiore, raggiungendo la cifra di 180-190 miliardi di dollari

di Luca Tremolada

19 maggio 2026

8' di lettura

English Version

8' di lettura

English Version

Non lo dicono esplicitamente, ma a questa altezza dell’evoluzione dell’AI, Google si è liberata dal fantasma di OpenAI e, dopo anni passati a inseguire, ora può mostrare l’ecosistema più maturo e coerente. Quattro anni dopo la nascita di ChatGPT e dieci dopo l’annuncio del cambio di strategia per diventare «AI First», il CEO Sundar Pichai, nel corso di un incontro in anteprima con i giornalisti pre-Google I/O 2026, ha dettato quella che sembra la nuova legge dell’era del «progresso iper-accelerato», usando i token — i «mattoni» con cui lavora un modello di intelligenza artificiale — come unità di misura. Soltanto due anni fa — ha spiegato il CEO più pagato della Silicon Valley — i server elaboravano 9,7 trilioni di token al mese; lo scorso anno la cifra era balzata a 480 trilioni. «Oggi, quel volume è cresciuto di quasi sette volte, raggiungendo la quota astronomica di oltre 3,2 quadrilioni di token mensili generati su tutte le piattaforme dell’azienda». L’ecosistema per gli addetti ai lavori non è da meno: oltre 8,5 milioni di sviluppatori costruiscono applicazioni usando i modelli Google mensilmente, e le sole API elaborano circa 19 miliardi di token al minuto.

Ma è sul fronte dell’utilizzo consumer che Google consolida il suo dominio. L’azienda vanta oggi 13 prodotti che superano il miliardo di utenti e ben cinque di questi hanno oltrepassato la soglia dei 3 miliardi. L’intelligenza artificiale non è più solo un esperimento confinato ai laboratori, ma una realtà che muove miliardi di persone e dati su scala globale.Ma è sul fronte dell’utilizzo consumer che Google consolida il suo dominio. L’azienda vanta oggi 13 prodotti che superano il miliardo di utenti, e ben cinque di questi hanno oltrepassato la soglia dei 3 miliardi.

I numeri di Google.

L’app dedicata a Gemini ha visto il proprio pubblico esplodere: dai 400 milioni di utenti attivi dell’anno scorso, oggi ha superato i 900 milioni, con un volume di richieste giornaliere moltiplicato per sette. Sul fronte creativo, i modelli di generazione di immagini, chiamati «Nano Banana», hanno già sfornato oltre 50 miliardi di immagini. Tuttavia, sostenere questa insaziabile fame di calcolo richiede risorse titaniche. Pichai ha concluso il suo quadro mettendo in luce l’enorme sforzo finanziario affrontato per l’infrastruttura. Se solo quattro anni fa, nel 2022, la spesa in conto capitale (capex) di Google si attestava a 31 miliardi di dollari, quest’anno l’investimento previsto sarà sei volte superiore, raggiungendo l’incredibile cifra di 180-190 miliardi di dollari. Un impegno colossale che getta le basi fisiche e tecnologiche per l’alba della nuova «era degli agenti». E dopo i numeri veniamo alle novità di questo Google I/O, che sono molte.

Nasce Gemini Omni per la creatività multimediale

Debutta Gemini Omni Flash, il primo nato della famiglia «Omni», un modello nativamente multimodale progettato per unire la capacità di ragionamento tipica di Gemini alla pura creazione di contenuti. La vera rivoluzione promessa da Omni risiede nell’interazione e nella flessibilità degli input. Il sistema è infatti in grado di generare video ad alta definizione partendo da qualsiasi combinazione di elementi: immagini, testo, audio o altri video preesistenti. Una volta generato il filmato, l’utente non deve fare altro che «conversare» con l’intelligenza artificiale per modificarlo. Tramite semplici comandi testuali in linguaggio naturale, è possibile trasformare lo sfondo, aggiungere nuovi personaggi, applicare stili cinematografici o alterare l’azione stessa, mantenendo una coerenza fisica dei movimenti, della gravità e dei fluidi che, a detta di Google, supera i limiti dei modelli precedenti.

Tra le funzioni che colpiscono di più spicca la possibilità di creare video utilizzando il proprio avatar digitale, in grado di parlare fedelmente con la voce dell’utente. Una tecnologia potente che solleva inevitabili interrogativi sul fronte della sicurezza; per questo motivo, il colosso di Mountain View ha annunciato l’integrazione automatica e invisibile del watermark digitale SynthID in ogni clip prodotta, consentendo di verificarne l’origine tramite l’app Gemini o Google Chrome.

La tecnologia di filigrana invisibile SynthID esce dalla fase sperimentale e viene integrata in Chrome e Ricerca Google. Per sapere se una foto, un video o un frammento audio è frutto del lavoro di una macchina, basterà cerchiare il contenuto sullo schermo del telefono o cliccare con il tasto destro nel browser. Il sistema darà una risposta immediata sull’origine sintetica del materiale, uno standard di trasparenza a cui hanno già aderito anche concorrenti come OpenAI ed Eleven Labs.

La novità di Mountain View è disponibile da oggi per gli abbonati ai piani Google AI Plus, Pro e Ultra. Gemini Omni Flash è inoltre in fase di rilascio gratuito anche per i creatori di contenuti su piattaforme di massa come YouTube Shorts e l’app YouTube Create, candidandosi a ridefinire radicalmente le regole della produzione video digitale.

Arriva Gemini 3.5 Flash per l’era degli agenti intelligenti.

Josh Woodward, VP di Google Labs, ha svelato la nuova roadmap per l’app ufficiale di Gemini, che conta ormai oltre 900 milioni di utenti mensili, introducendo una profonda ristrutturazione estetica e funzionale guidata da agenti proattivi pronti a operare 24 ore su 24. A differenza dei chatbot tradizionali, Gemini 3.5 Flash è stato presentato come un modello nato per eseguire «flussi di lavoro agentici» e compiti logici su vasta scala.

Il nuovo modello punta tutto sul concetto di «frontier intelligence with action»: non più un semplice assistente testuale, ma un vero e proprio motore in grado di pianificare, programmare e agire in autonomia per risolvere problemi reali su «orizzonti temporali lunghi». Più veloce di quattro volte rispetto ai competitor nel ragionamento logico e capace di surclassare le prestazioni del precedente Gemini 3.1 Pro nei benchmark di programmazione, Gemini 3.5 Flash debutta oggi a livello globale sia per gli sviluppatori — integrato nella nuova piattaforma Google Antigravity — sia per i consumatori.

Diventa infatti il modello predefinito dell’app Gemini e della Ricerca Google, alimentando novità assolute come Gemini Spark, un agente IA personale attivo 24 ore su 24 e 7 giorni su 7 per supportare gli utenti nella vita digitale quotidiana. Per sfruttarlo, Google ha creato Antigravity 2.0, una piattaforma desktop dotata di SDK e riga di comando, dove gli sviluppatori possono coordinare intere squadre di agenti autonomi. In questo ambiente si può ordinare a un agente di scrivere il codice del sito, a un altro di generare la grafica e a un terzo di studiare l’architettura del software.

In ambito di sicurezza interviene invece Code Mender, che usa l’IA per analizzare intere basi di codice, scovare falle di sicurezza critiche e applicare automaticamente le correzioni.

Come cambia la ricerca? Nascono gli “agenti della ricerca”.

All’evento in anteprima è intervenuta anche Liz Reid, vicepresidente della ricerca di Google. «Il motore di ricerca di Google si appresta a vivere il suo più grande aggiornamento in oltre 25 anni», ha annunciato la numero uno del search di Mountain View.

La novità è l’introduzione degli «Information Agent». Si tratta di assistenti virtuali specializzati che lavorano in background: ad esempio, se si sta cercando casa, l’agente monitora costantemente il web inviando notifiche istantanee non appena viene pubblicato un annuncio che rispecchia i requisiti impostati. L’utente può configurarli per monitorare parametri precisi, come l’andamento del mercato azionario. L’agente stabilisce in autonomia quali banche dati interrogare, tiene d’occhio la situazione 24 ore al giorno e invia un report strutturato solo nel momento in cui si verificano le condizioni richieste.

Sulla rinnovata barra di ricerca, gli utenti potranno usare la propria voce per creare istantaneamente interfacce dinamiche o piccole applicazioni, come un personal trainer virtuale collegato al meteo e al calendario per programmare gli allenamenti, il tutto senza dover scrivere una singola riga di codice.

Ma Google si spinge oltre l’informazione pura, introducendo le capacità di prenotazione automatica. Per servizi locali come riparazioni domestiche, estetica o cura degli animali, gli utenti statunitensi potranno chiedere a Google, direttamente dalla Ricerca, di effettuare vere e proprie chiamate telefoniche alle attività commerciali per conto loro.

Liz Reid, vice president, Head of Search, speaks at a Google I/O event in Mountain View, Calif., Tuesday, May 19, 2026. (AP Photo/Jeff Chiu) Associate Press/ LaPresse Only Italy and Spain

La metamorfosi tocca anche il modo in cui i dati vengono visualizzati. Sfruttando capacità di programmazione istantanea, definite «agentic coding», Google Search sarà in grado di generare al volo interfacce utente dinamiche, tabelle, grafici o simulazioni personalizzate. Per compiti complessi e continuativi — come l’organizzazione di un matrimonio o la pianificazione di un trasloco — il motore di ricerca creerà veri e propri tracker e cruscotti personalizzati, assimilabili a «mini-applicazioni» create su misura per l’esigenza del momento.

Infine, per rendere l’esperienza davvero cucita sulla vita dell’utente, Google espande globalmente, in quasi 200 Paesi, la funzione di Personal Intelligence in modalità gratuita. Il motore di ricerca potrà così connettersi in modo sicuro al contesto personale dell’utente, attingendo a Gmail, Google Foto e presto a Google Calendar, lasciando sempre a chi naviga il pieno controllo sulla privacy. Il lancio delle funzioni avanzate partirà in estate per gli abbonati Premium negli Stati Uniti, per poi estendersi progressivamente a livello globale.

Le novità sul commercio elettronico: ecco Universal Cart e AP2

Si chiamano Universal Cart e AP2: Google ha sviluppato un carrello intelligente (Universal Cart) che ci accompagna su ogni dispositivo mentre guardiamo video, navighiamo o usiamo l’app Gemini. Aggiungendo i prodotti al carrello, l’IA monitora di nascosto i cali di prezzo e cerca sconti speciali. Inoltre usa un ragionamento avanzato: se, ad esempio, l’utente inserisce i vari pezzi per assemblare un PC pescando da negozi diversi, il carrello verifica l’hardware ed emette un avviso qualora processore e scheda madre risultino incompatibili. Il protocollo Agent Payments Protocol (AP2) completa l’opera, permettendo all’intelligenza artificiale di effettuare i pagamenti e gli acquisti in totale autonomia, ma attenendosi a regole inflessibili stabilite dall’utente, come budget massimi e marchi preferiti, tracciando una ricevuta sicura in caso di reso.

Le novità della produttività: Ask YouTube e Docs Live.

La funzione Ask YouTube consente di fare una domanda specifica al sistema, che invece di limitarsi a suggerire il video giusto, porterà la riproduzione al minuto esatto che contiene l’informazione desiderata. Docs Live rivoluziona invece la scrittura dei testi: chi lavora non dovrà più destreggiarsi tra formattazioni complesse o digitazioni lunghe, perché basterà parlare al microfono, riversando pensieri confusi o istruzioni, per far sì che Gemini strutturi un documento professionale, impaginato, con informazioni estrapolate dalle email e dati riassunti ordinatamente all’interno di tabelle.

Per la vita di tutti i giorni nasce Gemini Spark

Per l’inizio della giornata debutta invece Daily Brief, un agente esclusivo per gli abbonati Premium che scansiona caselle Gmail e calendari per generare un riassunto mattutino personalizzato e interattivo, suggerendo persino le azioni immediate da compiere. Al suo finaco debutta l’agente Gemini Spark. Alimentato dal modello 3.5 Flash e basato sull’architettura cloud di Antigravity, Spark si configura come un partner attivo e indipendente. A differenza dei vecchi chatbot, continua a lavorare in background anche se l’utente chiude il laptop o blocca lo smartphone. Tra le sue capacità spiccano l’analisi automatica degli estratti conto per scovare costi nascosti, il monitoraggio delle mail scolastiche dei figli con l’estrazione delle scadenze e la creazione di flussi di lavoro complessi (es. sintetizzare note di riunioni e redigere autonomamente documenti e mail di avvio progetto). Grazie alle nuove connessioni MCP, Spark si integrerà subito con partner esterni come Canva, OpenTable e Instacart. Lavorando in background nell’ecosistema Workspace, Spark può gestire mansioni gravose: gli studenti lo usano per aggiornare dinamicamente le guide di studio mano a mano che arrivano nuovi materiali dai professori, mentre i proprietari di piccole imprese lo usano per presidiare la casella mail e non farsi sfuggire le richieste dei clienti.

Finalmente gli occhiali

Google ha mostrato la versione più concreta della sua strategia sugli occhiali intelligenti. Si tratta di dispositivi “audio” basati sulla piattaforma Android XR, sviluppata insieme a Samsung, che integrano direttamente Gemini nella montatura e che dovrebbero arrivare sul mercato entro la fine dell’autunno. I primi modelli saranno firmati da Gentle Monster e Warby Parker, mentre nei mesi successivi è prevista una gamma più ampia di prodotti.

La strategia di Google prevede due famiglie distinte di occhiali. Quelli mostrati durante il keynote sono modelli solo audio, quindi senza display integrato. Funzionano attraverso comandi vocali e speaker posizionati sopra l’orecchio: l’utente può interrogare Gemini su ciò che vede intorno a sé, ricevere indicazioni stradali in tempo reale, gestire chiamate e messaggi, scattare fotografie e tradurre testi dal vivo. Un approccio molto simile a quello già visto con i Ray-Ban Meta Smart Glasses, ma costruito attorno all’ecosistema AI di Google.

E infine lo sbarco su macOs

Sul mercato desktop è stato infine annunciato l’arrivo dell’app Gemini per macOS. Disponibile da oggi per il download, l’applicazione per Mac riceverà in estate sia l’integrazione con Gemini Spark per operare sui file locali, sia una rivoluzionaria funzione vocale in grado di ripulire il parlato da bozze, esitazioni o tic linguistici (i classici “ehm”), trasformando i flussi di pensieri ad alta voce in testi precisi e formattati esattamente nel punto in cui si trova il cursore sullo schermo.

Luca TremoladaGiornalista
- @lucatremolada
- LinkedIn
Luogo: Milano via Monte Rosa 91
Lingue parlate: Inglese, Francese
Argomenti: Tecnologia, scienza, finanza, startup, dati
Premi: Premio Gabriele Lanfredini sull’informazione; Premio giornalistico State Street, categoria "Innovation"; DStars 2019, categoria journalism
Scheda autore
Trust project