Le nuove frontiere

Intelligenza artificiale: il codice della vita in mano agli algoritmi

Il modello Evo2 tratta il genoma come un linguaggio e genera sequenze mai esistite, ma creare organismi funzionanti resta una sfida enorme

Adobe Stock

3' di lettura

English Version

3' di lettura

English Version

L'intelligenza artificiale ora prova a scrivere il codice della vita. Non più soltanto analizzare o modificare il Dna esistente, ma generare interi genomi da zero. È il salto suggerito da Evo2, un modello di linguaggio genomico descritto su Nature che apre una prospettiva finora confinata alla fantascienza: progettare organismi artificiali partendo da sequenze create da un algoritmo.

Evo2 funziona in modo simile ai modelli linguistici usati per il linguaggio umano, ma al posto delle parole elabora nucleotidi, le lettere del Dna. È stato addestrato su circa 9mila miliardi di nucleotidi provenienti da 128mila genomi di specie diverse, vive ed estinte, e può leggere, interpretare e generare sequenze di Dna, Rna e proteine. «Il nostro sviluppo di Evo1 ed Evo2 rappresenta un momento chiave nel campo emergente della biologia generativa -, spiega Patrick Hsu, cofondatore dell'Arc Institute, un'organizzazione di ricerca no-profit con sede a Palo Alto, California, focalizzata sull'accelerazione delle scoperte biomediche -Le macchine iniziano a leggere, scrivere e pensare nel linguaggio dei nucleotidi».

Loading...

Il modello è stato sviluppato dall'Arc Institute e da Nvidia, in collaborazione con le università di Stanford e di Berkeley. A differenza della versione precedente, addestrata soprattutto su organismi unicellulari, Evo2 include anche genomi di organismi pluricellulari, compresi esseri umani e piante. Questo gli consente di elaborare sequenze lunghe fino a un milione di nucleotidi e di cogliere relazioni tra parti molto distanti dello stesso genoma.

Le potenzialità non riguardano solo la biologia sintetica. Nei test con varianti del gene Brca1, associato al tumore del seno, il sistema ha raggiunto oltre il 90% di accuratezza nel distinguere mutazioni benigne da quelle potenzialmente pericolose. Strumenti di questo tipo potrebbero accelerare la ricerca sulle malattie genetiche e ridurre il numero di esperimenti necessari su cellule o animali.

Gli scienziati hanno anche utilizzato Evo2 per progettare diverse sequenze genomiche complete, tra cui una ispirata al batterio Mycoplasma genitalium, uno degli organismi con il genoma più piccolo conosciuto. Le simulazioni indicano che circa il 70% dei geni previsti appare plausibile. Ma non basta. «Non si può progettare la vita al 70% - osserva il biologo sintetico Nico Claassens dell'Università di Wageningen nei Paesi Bassi -. Puoi farlo su un computer, ma non funzionerà in una cellula». Il problema è che un genoma funziona solo se ogni elemento è al posto giusto. Basta che un gene essenziale manchi o sia organizzato in modo errato perché l'intero sistema biologico collassi. «Valutare se un genoma sembra corretto e verificare se funziona davvero sono due cose diverse», sottolinea Maciej Wiatrak dell'Università di Cambridge.

La biologia sintetica ha già compiuto passi importanti. Nel 2008 i ricercatori sintetizzarono in laboratorio il genoma del batterio Mycoplasma genitalium e lo inserirono in cellule ospiti, creando quello che molti scienziati hanno definito il primo esempio di vita sintetica. Ma si trattava ancora della copia artificiale di qualcosa che esisteva già in natura. In studi più recenti modelli della famiglia Evo sono stati utilizzati per progettare virus che infettano batteri, i cosiddetti fagi. Quando le sequenze generate sono state inserite in cellule di Escherichia coli, alcuni dei progetti hanno prodotto virus funzionanti capaci di uccidere i batteri.

Nel campo della biologia computazionale non è l'unico caso di strumenti nati per interpretare la natura e poi trasformati in strumenti di progettazione. AlphaFold, sviluppato da DeepMind per prevedere la struttura tridimensionale delle proteine naturali, viene oggi usato anche per ideare nuove proteine con funzioni inedite. Un passaggio che segnala come l'intelligenza artificiale stia passando dalla semplice lettura dei sistemi biologici alla loro ingegneria.

Ma il vero ostacolo oggi non è solo progettare il Dna, ma verificarlo. «Le sperimentazioni stanno rapidamente diventando il collo di bottiglia», ammette lo stesso Hsu. Sintetizzare grandi quantità di Dna e assemblarle correttamente resta infatti costoso e lento. Una possibile soluzione potrebbe arrivare da laboratori automatizzati che combinano intelligenza artificiale e robotica: sistemi in grado di progettare frammenti di genoma, testarli rapidamente e migliorarli in cicli successivi. Secondo i ricercatori questo approccio modulare potrebbe portare un giorno alla costruzione di genomi molto più complessi, forse persino quelli dei mammiferi.

Per ora, tuttavia, la scrittura della vita resta un progetto in costruzione. Claassens invita alla cautela: «L'intelligenza artificiale sarà probabilmente più efficace se affiancata all'intuizione umana. L'algoritmo può suggerire combinazioni inattese, ma comprendere davvero come funziona un organismo vivente richiede ancora l'esperienza dei biologi». Eppure, la direzione sembra segnata. Se il Dna è un linguaggio, le macchine stanno imparando a parlarlo e forse, un giorno, a scriverlo.

Riproduzione riservata ©
Loading...

Brand connect

Loading...

Newsletter

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti