Intelligenza artificiale: il codice della vita in mano agli algoritmi
Il modello Evo2 tratta il genoma come un linguaggio e genera sequenze mai esistite, ma creare organismi funzionanti resta una sfida enorme
3' di lettura
3' di lettura
L'intelligenza artificiale ora prova a scrivere il codice della vita. Non più soltanto analizzare o modificare il Dna esistente, ma generare interi genomi da zero. È il salto suggerito da Evo2, un modello di linguaggio genomico descritto su Nature che apre una prospettiva finora confinata alla fantascienza: progettare organismi artificiali partendo da sequenze create da un algoritmo.
Evo2 funziona in modo simile ai modelli linguistici usati per il linguaggio umano, ma al posto delle parole elabora nucleotidi, le lettere del Dna. È stato addestrato su circa 9mila miliardi di nucleotidi provenienti da 128mila genomi di specie diverse, vive ed estinte, e può leggere, interpretare e generare sequenze di Dna, Rna e proteine. «Il nostro sviluppo di Evo1 ed Evo2 rappresenta un momento chiave nel campo emergente della biologia generativa -, spiega Patrick Hsu, cofondatore dell'Arc Institute, un'organizzazione di ricerca no-profit con sede a Palo Alto, California, focalizzata sull'accelerazione delle scoperte biomediche -Le macchine iniziano a leggere, scrivere e pensare nel linguaggio dei nucleotidi».
Il modello è stato sviluppato dall'Arc Institute e da Nvidia, in collaborazione con le università di Stanford e di Berkeley. A differenza della versione precedente, addestrata soprattutto su organismi unicellulari, Evo2 include anche genomi di organismi pluricellulari, compresi esseri umani e piante. Questo gli consente di elaborare sequenze lunghe fino a un milione di nucleotidi e di cogliere relazioni tra parti molto distanti dello stesso genoma.
Le potenzialità non riguardano solo la biologia sintetica. Nei test con varianti del gene Brca1, associato al tumore del seno, il sistema ha raggiunto oltre il 90% di accuratezza nel distinguere mutazioni benigne da quelle potenzialmente pericolose. Strumenti di questo tipo potrebbero accelerare la ricerca sulle malattie genetiche e ridurre il numero di esperimenti necessari su cellule o animali.
Gli scienziati hanno anche utilizzato Evo2 per progettare diverse sequenze genomiche complete, tra cui una ispirata al batterio Mycoplasma genitalium, uno degli organismi con il genoma più piccolo conosciuto. Le simulazioni indicano che circa il 70% dei geni previsti appare plausibile. Ma non basta. «Non si può progettare la vita al 70% - osserva il biologo sintetico Nico Claassens dell'Università di Wageningen nei Paesi Bassi -. Puoi farlo su un computer, ma non funzionerà in una cellula». Il problema è che un genoma funziona solo se ogni elemento è al posto giusto. Basta che un gene essenziale manchi o sia organizzato in modo errato perché l'intero sistema biologico collassi. «Valutare se un genoma sembra corretto e verificare se funziona davvero sono due cose diverse», sottolinea Maciej Wiatrak dell'Università di Cambridge.







