DNA non codificante e Intelligenza Artificiale: il futuro dell’analisi del DNA
La medicina personalizzata del futuro prevede la “scansione” dell’intero genoma e solitamente viene denominato WGS – Whole Genome Sequencing.
I test genetici attualmente disponibili (wellness, predisposizione a patologie, genealogia, farmacogenomica, nutrigenomica, metabolismo etc.) sono ottenuti utilizzando aree del DNA cosiddette codificanti.
Queste aree codificano (forniscono le informazioni per costruire) le proteine che diventano parte essenziale del nostro organismo (es: struttura ossea, muscolare, metabolismo, caratteristiche fisiche etc.).
Queste aree incredibilmente rappresentano meno del 2% del patrimonio genetico umano e comprendono circa 20.000 geni raggruppati in 23 coppie di cromosomi.
Il restante 98% del genoma umano non codificante,fino a pochi anni fa definito junk (spazzatura), indicava quelle sequenze di basi (le quasi famose ACGT) che non codificano per proteine.
Ma dato che di casuale nel corpo umano solitamente non c’è nulla, ad oggi, sulla base di importanti studi internazionali, sappiamo che le regioni di DNA non codificante rappresentano una preziosa risorsa per il genoma.
Il DNA non codificante è una sorta di magazzino da cui andare ad attingere materiale che consente la ricombinazione genetica, una delle fonti principali di mutazioni genetiche e di novità evolutive.
Vediamo quali applicazioni pratiche può avere questa scoperta e come ciò possa impattare sia sui servizi offerti, sia sul “valore” della banca dati genomica che stiamo costruendo.
Applicazioni del DNA non codificante
Oggi molti pazienti soffrono di malattie genetiche diagnosticate in modo errato o non diagnosticate a causa di insufficienti test genetici.
Le analisi basate su test di singoli geni, pannelli genetici o microarray spesso non sono in grado di identificare le cause di una malattia in quanto sono fondamentalmente limitate.
Il WGS (Whole Genome Sequencing) che abbiamo illustrato in precedenza è invece in grado di rilevare tutte le varianti e identificare quelle rilevanti con un’unica metodologia.
Ad esempio, è stato scoperto che alcune mutazioni nel DNA spazzatura potrebbero contribuire allo sviluppo di uno dei disturbi dello spettro autistico le cui cause, ad oggi, non sono ancora ben note.
A dimostrarlo è un gruppo di ricerca coordinato dalla Princeton University e guidato da Olga Troyanskaya in collaborazione con Robert Darnell.
Gli scienziati spiegano che questa è la prima dimostrazione di come le mutazioni rilevate nel DNA non codificante possano causare malattie. I risultati sono stati pubblicati su Nature Genetics.
Gli scienziati saranno in grado di applicare la stessa tecnica per studiare il ruolo delle mutazioni non codificanti legate al cancro, alle malattie cardiache e ad altre malattie, come spiega Jian Zhou, ricercatore del CCB e di Princeton.
“Questo – sottolinea il ricercatore – fornisce una nuova prospettiva sulle cause non solo dell’autismo, ma di molte altre malattie umane”.
L’intelligenza artificiale su misura
Rimane comunque il problema di come analizzare l’enorme quantità di dati presenti in un singolo genoma o in più genomi per valutazioni comparative.
Parliamo di oltre 3 miliardi di basi cioè di coppie formate dalle sole 4 lettere sopra citate.
L’analisi di strutture così ampie e indifferenziate richiede piattaforme e strumenti potenti e innovativi.
Primo elemento è l’enorme crescita dei servizi offerti in cloud sia come memorizzazione di grandi quantità di dati sia come capacità di elaborazione.
La partnership con un fornitore di tecnologia come IBM che eroga sia i servizi blockchain per la sicurezza e privacy sia i servizi di memorizzazione dei dati permette a Genesy Project di rispondere alle esigenze sopra citate.
Altro elemento correlato su cui Genesy lavora da tempo sono le tecniche di “machine learning” in ambito di Intelligenza Artificiale.
Questo termine, traducibile come apprendimento automatico, in sintesi sono algoritmi matematici attraverso i quali si permette alle macchine di apprendere quanto necessario per svolgere un compito o una attività senza che siano stati preventivamente programmati.
Serve poi identificare schemi specifici (pattern), all’interno di una grande quantità di dati genetici, che verranno poi tradotti in modelli informatici.
L’obiettivo è quello di aiutare a prevedere le possibilità del paziente di sviluppare una determinata patologia o, in alternativa, per progettare un potenziale percorso di cura.
Gli algoritmi sono progettati per aiutare a interpretare gli effetti che alcune mutazioni genetiche hanno sui processi cellulari vitali come il metabolismo, la riparazione del DNA e la crescita cellulare.
Anomalie nel funzionamento di questi meccanismi possono causare patologie e mettere il paziente a rischio di sviluppare ad esempio forme tumorali.
Test genetici: nuove informazioni per la tua salute
L’utilizzo di strumenti avanzati di machine learning permetterà inoltre di estrarre informazioni con alto valore aggiunto da integrare con le informazioni di base.
Il sequenziamento completo del DNA ci permette non solo di fornire test genetici avanzati al momento della fornitura del servizio, ma anche fornire continue analisi sulla stessa base dati.
I test genetici, frutto degli studi scientifici, saranno aggiornati periodicamente e riguarderanno sempre più le aree non codificanti che spero abbiate imparato a conoscere.