L’intelligenza artificiale generativa è davvero un pessimo lavoratore?
4' di lettura
4' di lettura
Non è chiaro ancora quanto l’AI al momento aiuti la produttività sul lavoro. Ma una cosa è certa: se fosse un lavoratore, sarebbe terribile. Lasciata da sola, insomma, l’AI farebbe disastri. Anche nelle cose più semplici.
Lo rileva il nuovo studio Remote Labor Index, di Scale AI in collaborazione con il Center for AI Safety (Cais). Il primo a mettere alla prova i migliori agenti di intelligenza artificiale in modo sistematico, con compiti da ufficio. Risulta che Manus, Grok, Claude, Chatgpt e Gemini, sono ancora lontani dal poter rimpiazzare i lavoratori umani nel mercato del lavoro freelance online.
Solo il 3% dei compiti completati
Il test ha simulato una serie di incarichi reali presi da piattaforme come Upwork. Dalla grafica al video editing; dallo sviluppo di videogiochi alle attività amministrative.
Il risultato è inequivocabile: anche i modelli più avanzati hanno completato con successo meno del 3% dei task. Guadagnano in tutto 1.810 dollari su 143.991 potenziali.
Secondo Dan Hendrycks, direttore del Cais, il limite principale non è la capacità di generare testi o codice, ma la mancanza di memoria a lungo termine, l’incapacità di apprendere dall’esperienza e le difficoltà nel gestire processi complessi e multi-step. Questi tre punti corrispondono alle principali aree di lacuna dell’AI generativa e alle sue differenze più significative rispetto al cervello umano, per i compiti lavorativi di tipo cognitivo. Il cervello impara continuamente, si adatta e ha una flessibilità che gli (ci) permette di trovare la quadra in compiti complessi, fatti di diverse azioni disparate. “Gli agenti sanno rispondere, ma non sanno lavorare”, sintetizza Hendrycks.

