Economia Digitale

OpenAI lancia GPT-5: più veloce, più intelligente e più umano. Ecco cosa c’è da sapere

Il nuovo modello è reso disponibile gratuitamente a tutti gli utenti di ChatGPT. Tre le versioni disponibili: GPT-5, GPT-5 Mini, GPT-5 Nano.

di Luca Tremolada

6' di lettura

6' di lettura

A 32 mesi dal debutto di ChatGPT, viene alla luce GPT-5, il nuovo modello di OpenAI definito dal suo fondatore Sam Altman «un passo importante verso l’AGI (Intelligenza Artificiale Generale)», ovvero l’intelligenza artificiale generale. «Tornare a GPT-4 dopo aver provato GPT-5 sarà frustrante» ha dichiarato Altman nel corso di un briefing con i giornalisti. «La differenza è paragonabile a tornare a un vecchio telefono con schermo pixelato dopo l’iPhone. GPT-3 sembrava un liceale – ha detto – GPT-4 uno studente universitario. GPT-5 è come avere a che fare con un esperto con un PhD.»

Gpt-5 subito disponibile per tutti.

Come è accaduto per l’ultimo modello Gpt4o anche GPT-5 verrà reso disponibile gratuitamente a tutti gli utenti di ChatGPT. Tre le versioni disponibili via API: GPT-5, GPT-5 Mini, GPT-5 Nano, per bilanciare prestazioni e costi. Esistono anche per versioni Pro e versione Plus: la differenza principale riguarda i limiti di utilizzo. Quella Pro (200 dollari) offre GPT-5 illimitato; accesso a GPT-5 Pr. Quella Plus con l’abbonamento a 21 euro al mese offre limiti di utilizzo molto più elevati rispetto alla versione Free che ricordiamo offre accesso a GPT-5 & GPT-5 mini. E’ la prima volta che gli utenti Free hanno accesso a un modello di ragionamento.

Loading...

Per gli utenti Plus sarà il modello predefinito, eliminando la complessità del selettore di modelli. Inoltre, avranno anche una quantità d’uso molto maggiore di GPT-5. Quando superano il limite, passeranno a GPT-5 Mini, che è comunque molto buono.

Cosa cambia rispetto al 4o? E’ davvero una rivoluzione?

Concettualmente, GPT-5 integra molti componenti tecnologici fra cui la linea o (i cosiddetti reasoning model, e funzionalità degli agenti intelligenti. Si candida quindi a essere una sorta di «unificatore» della proposta di OpenAI. Il team di OpenAI ha sottolineato che questo è il modello più veloce, più preciso (meno allucinazioni) e più intelligente (in matematica, scienze, programmazione), e più umano. Ma è l’aspetto della programmazione quello su cui sembrano volere puntare di più. «GPT-5 - hanno ripetuto - è il modello migliore per il coding mai creato da OpenAI». «Una delle cose più incredibili è che può creare istantaneamente un intero software da zero. Credo – ha spiegato Altman – che il concetto di “software on demand” sarà un tratto distintivo dell’era GPT-5».

Siamo nell’era del Vibe coding

Nel corso della presentazione è stato mostrato un esempio di Vibe coding, che significa poter creare qualsiasi app o software semplicemente chiedendolo al modello, senza dover saper programmare. Nello specifico, hanno creato una web app per imparare il francese. «Costruire un sito del genere richiederebbe ore di lavoro a un programmatore umano. GPT-5 lo fa in pochi secondi». In pratica, GPT-5 ha generato 600 righe di codice. Inoltre, hanno mostrato che ogni volta che si dà lo stesso prompt a GPT-5, si possono ottenere risultati diversi, tutti funzionanti.

GPT-5 non mente e non simula e conosce i propri limiti

GPT-5 è stato addestrato per riconoscere quando non può completare un compito, evitare le speculazioni e spiegare meglio i propri limiti. Questo riduce drasticamente i casi di risposte inventate ma convincenti rispetto ai modelli precedenti. I ricercatori hanno spiegato che è stato addestrato per non mentire e non simulare risposte fittizie. In caso di domande potenzialmente ambigue o pericolose, GPT-5 risponde solo con contenuti generali, per ridurre i rischi. È stata inoltre introdotta una nuova funzione: il «reasoning effort parameter», che consente di scegliere quanto il modello debba «ragionare». Si potrà insomma decidere se il modello deve ragionare profondamente, o se può restare più veloce e superficiale (utile per task semplici).

Non è un dottore ma risponde alle domande sulla salute.

GPT-5, sostiene OpenAi precisando che non sostituisce un dottore, è il modello di OpenAI migliore mai realizzato per le domande relative alla salute. È più proattivo nel segnalare potenziali problemi e nel porre domande, e può aiutare a comprendere i risultati, a formulare le domande appropriate da sottoporre agli specialisti e a valutare le opzioni nel momento di prendere decisioni.

E tiene conto di dove sei

GPT-5 offre anche risposte più precise e affidabili e si adatta al contesto, al livello di conoscenza e alla posizione geografica dell’utente – fornendo così risposte più sicure e utili in un’ampia gamma di scenari.

Obiettivo: ottenere un modello non ingannevole.

Lato sicurezza, un obiettivo che si sono prefissati è quello di ottenere un modello non ingannevole. «Questo è cruciale per la sicurezza – ha spiegato Nick Turley, capo del prodotto di ChatGPT – vogliamo che il modello non menta agli utenti, sia per motivi etici sia per garantire un’esperienza utente di qualità: le persone devono potersi fidare del sistema.» Per risolvere questo, hanno addestrato GPT-5 per essere onesto. Un altro aspetto importante è evitare che gli utenti possano abusare del modello per fare del male. «In passato – ha spiegato – usavamo un sistema binario: se un prompt era considerato sicuro, il modello rispondeva. Se era pericoloso, rifiutava. Con GPT-5 usiamo un approccio chiamato “safe completions”. Il modello fornisce risposte utili, ma entro i limiti della sicurezza. Nelle domande a doppio uso, GPT-5 si limita a informazioni generali e sicure, che non possono essere usate per nuocere.» Inoltre, hanno condotto oltre 5.000 ore di test con red team esterni per assicurarsi che il sistema sia robusto contro l’abuso.

Perché ChatGpt5 è fondamentale per Sam Altman?

La sua uscita arriva mentre organizzazioni come BNY Mellon, California State University, Figma, Intercom, Lowe’s, Morgan Stanley, SoftBank, T-Mobile e altre hanno già fornito ai loro dipendenti l’intelligenza artificiale, con 5 milioni di utenti a pagamento che ora utilizzano i prodotti aziendali di ChatGPT, e hanno iniziato a ripensare le loro operazioni sull’API.

A marzo 2025 ha raccolto 40 miliardi di dollari a una valutazione di 300 miliardi di dollari ed è in corso una vendita secondaria di azioni che potrebbe portare la valutazione a 500 miliardi di dollari, rendendo OpenAI la start-up privata più preziosa al mondo. Oggi la creatura di Sam Altman ha oltre 120 milioni di utenti attivi giornalieri e circa 700 milioni di utenti attivi settimanali. Controlla una quota dominante, stimata tra il 59% e il 63%, del mercato degli assistenti AI. L’obiettivo è trasformare OpenAI in una colonna portante dell’infrastruttura digitale globale, con ricavi annuali ricorrenti in crescita: da circa 12 miliardi dollari oggi a una previsione di 20 miliardi USD entro fine 2025. Gpt 5 non è solo il più potente modello di Ai di OpenAi ma la dimostrazione che oggi ChatGpt è l’incotrastato leader nel settore. Ma come si misurano questo mercato?

Come si misurano gli assistenti virtuali?

I modelli oggi sono valutati da benchmark che misurano la loro capacità di ragionamento e le prestazioni in campi come la programmazione e la matematica. E dalle caratteristiche agentiche che hanno, cioè dalla loro capacità di orchestrare funzioni in modo autonomo. Sappiamo che non c’è modo di verificare i test che valutano l’intelligenza del modello. Come per gli altri, dobbiamo fidarci di quello che dicono i costruttori. GPT-5, scrive OpenAi, «è molto più intelligente su tutta la linea, come dimostrano le sue prestazioni nei benchmark accademici e con valutazione umana, in particolare in matematica, programmazione, percezione visiva e salute. Stabilisce un nuovo stato dell’arte in matematica (94,6% su AIME 2025 senza strumenti), nella programmazione reale (74,9% su SWE-bench Verified, 88% su Aider Polyglot), nella comprensione multimodale (84,2% su MMMU) e nel settore della salute (46,2% su HealthBench Hard) e questi miglioramenti si notano nell’uso quotidiano. Grazie al ragionamento esteso della versione Pro di GPT-5, il modello stabilisce un nuovo stato dell’arte anche su GPQA, ottenendo un punteggio dell’88,4% senza strumenti». Ricordiamo che Gemini 2.5 Deep Think ha ottenuto su benchmark come LiveCodeBench v6 (87,6%), Humanity’s Last Exam (34,8%) e la IMO 2025, dove ha raggiunto il livello medaglia di bronzo con un notevole 60,7%. In particolare nella programmazione, Opus 4.1 raggiunge il 74,5% nel benchmark SWE-bench Verified, superando la precedente generazione (Opus 4 si fermava al 72,5%).

Il problema però non sono i benchmark. Già dall’estate dell’anno scorso sono emersi i primi difetti alla legge di scala dell’Ai. All’aumentare dell’accesso ai dati non assistiamo più a un miglioramento propozionale dell’efficienza degli algoritmi. Più leggono più imparano ma non migliorano di conseguenza. Inoltre, mentre la potenza di elaborazione continua a crescere anche grazie agli ingenti investimenti delle Big tech (e alla fiducia dei mercati finanziari) i i grandi modelli linguistici faticano a trovare dataset.

Quindi adesso quanto manca all’AGI?

Quanto manca all’AGI? Sam Altman ha spiegato che GPT-5 non è ancora AGI, ma è un grande passo avanti. Per raggiungere l’AGI sarà necessario che i modelli apprendano continuamente dal mondo reale, cosa che GPT-5 ancora non fa.

Riproduzione riservata ©
  • Luca Tremolada

    Luca TremoladaGiornalista

    Luogo: Milano via Monte Rosa 91

    Lingue parlate: Inglese, Francese

    Argomenti: Tecnologia, scienza, finanza, startup, dati

    Premi: Premio Gabriele Lanfredini sull’informazione; Premio giornalistico State Street, categoria "Innovation"; DStars 2019, categoria journalism

Loading...

Brand connect

Loading...

Newsletter

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti