L’intelligenza artificiale generativa è davvero un pessimo lavoratore?

di Alessandro Longo

17 novembre 2025

4' di lettura

English Version

4' di lettura

English Version

Non è chiaro ancora quanto l’AI al momento aiuti la produttività sul lavoro. Ma una cosa è certa: se fosse un lavoratore, sarebbe terribile. Lasciata da sola, insomma, l’AI farebbe disastri. Anche nelle cose più semplici.

Lo rileva il nuovo studio Remote Labor Index, di Scale AI in collaborazione con il Center for AI Safety (Cais). Il primo a mettere alla prova i migliori agenti di intelligenza artificiale in modo sistematico, con compiti da ufficio. Risulta che Manus, Grok, Claude, Chatgpt e Gemini, sono ancora lontani dal poter rimpiazzare i lavoratori umani nel mercato del lavoro freelance online.

Solo il 3% dei compiti completati

Il test ha simulato una serie di incarichi reali presi da piattaforme come Upwork. Dalla grafica al video editing; dallo sviluppo di videogiochi alle attività amministrative.

Il risultato è inequivocabile: anche i modelli più avanzati hanno completato con successo meno del 3% dei task. Guadagnano in tutto 1.810 dollari su 143.991 potenziali.

Secondo Dan Hendrycks, direttore del Cais, il limite principale non è la capacità di generare testi o codice, ma la mancanza di memoria a lungo termine, l’incapacità di apprendere dall’esperienza e le difficoltà nel gestire processi complessi e multi-step. Questi tre punti corrispondono alle principali aree di lacuna dell’AI generativa e alle sue differenze più significative rispetto al cervello umano, per i compiti lavorativi di tipo cognitivo. Il cervello impara continuamente, si adatta e ha una flessibilità che gli (ci) permette di trovare la quadra in compiti complessi, fatti di diverse azioni disparate. “Gli agenti sanno rispondere, ma non sanno lavorare”, sintetizza Hendrycks.

In contrasto con il benchmark di OpenAI

I risultati del Remote Labor Index si pongono in netto contrasto con altri benchmark, come GDPval, sviluppato da OpenAI, secondo cui modelli di ultima generazione come Gpt-5 si avvicinano ormai alle performance umane in diversi lavori d’ufficio, specialmente nelle attività di scrittura e analisi.

La differenza, spiegano gli autori dello studio del Cais, sta nel contesto: GDPval misura la competenza linguistica e cognitiva in ambienti controllati, mentre il Remote Labor Index valuta la capacità operativa in scenari realistici, che richiedono coordinamento, pianificazione e adattamento.

Produttività aumentata, ma non sostituzione

Il messaggio che emerge è duplice. Da un lato, l’AI può potenziare la produttività dei freelance umani — accelerando la produzione di bozze, analisi e il brainstorming.

Dall’altro, la sua autonomia è ancora limitata. Le piattaforme di lavoro online, dove il successo dipende da interazioni complesse con clienti, scadenze e feedback, restano oggi un dominio eminentemente umano.

Uno studio del Mit Sloan (2024) aveva già rilevato un effetto simile: l’uso dell’AI generativa aumenta la produttività del 14% tra gli impiegati che svolgono compiti cognitivi standardizzati, ma non migliora — e talvolta peggiora — le performance nei lavori che richiedono autonomia o creatività.

In realtà sulla produttività aumentata, in affiancamento al lavoratore, non c’è una chiarezza generale ancora. Il noto studio “The GenAI Divide: State of AI in Business 2025” del MIT Project Nanda denuncia che solo il 5% delle aziende dichiara un ritorno misurabile in termini di produttività, dall’uso dell’AI generativa.

Una ricerca più recente, di Wharton-Gbk, condotta tra manager e C-level di grandi imprese, racconta una storia diverse. L’82% dei leader aziendali afferma di usare strumenti di AI generativa ogni settimana (il 46% quotidianamente), mentre il 72% misura il Roi e tre su quattro dichiara risultati positivi.

Una divergenza che dipende forse dalla maturità digitale delle aziende coinvolte: dove i processi sono già digitalizzati e il personale formato, l’AI tende a generare valore tangibile. Ma anche per il Mit, il divario tra sperimentazione e impatto reale è dovuto soprattutto a integrazioni tecnologiche incomplete, scarsa formazione del personale e mancanza di metriche chiare sull’Roi.

Insomma non è chiaro quanto il difetto di produttività dipenda dall’immaturità dello strumento e quanto dall’incapacità di usarlo da parte delle aziende.

La questione si risolverà nei prossimi mesi, probabilmente, con l’evoluzione sia della tecnologia sia dell’adozione. Al tempo stesso, alcune aziende corrono avanti. Molte aziende hanno comunicato licenziamenti o un blocco delle assunzioni; soprattutto i junior e i middle manager sembrano i più colpiti. Amazon ha annunciato 14mila licenziamenti corporate, prima ondata di un piano che arriverà a 30mila tagli. JPMorgan Chase ha appena dichiarato che la banca assumerà con più prudenza; idem Walmart, mentre Goldman Sachs prevede anche licenziamenti e tutti citano l’AI come motivo.

«Se le persone diventano più produttive, non è necessario assumere altro personale», ha dichiarato Brian Chesky, amministratore delegato di Airbnb, in un’intervista. «Vedo molte aziende che mantengono preventivamente la linea, prevedendo e sperando di poter avere una forza lavoro più ridotta».

Forse sono aziende che ritengono di poter cogliere quei vantaggi di produttività che ad altre aziende sfuggono; oppure alcune di loro usano l’AI come scusa per fare tagli motivati ma ragioni più banali come crisi o scelte passate sbagliate, secondo l’economista del Mit David Autor a Nbc News.

Anche su questo punto, come si vede, non ci sono certezze. Una costante, in questi tempi agitati dalla rivoluzione AI.

Brand connect

I prossimi eventi

Tutti gli eventi

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.