Tecnologia Moderna (Modern Technologies IT)
Potrebbe Google aver rivoluzionato la biologia?

Potrebbe Google aver rivoluzionato la biologia?

Riassunto:

  • Le proteine ​​sono parte integrante della vita, poiché svolgono la maggior parte delle funzioni delle cellule. La loro funzione è strettamente correlata alla loro struttura.
  • Determinare la struttura di una proteina dai suoi elementi costitutivi è molto difficile, a causa dell’alto grado di interazioni tra questi elementi costitutivi.
  • Classicamente, per studiare le strutture proteiche sono necessari esperimenti lunghi e complessi, come la cristallografia a raggi X e la microscopia elettronica criogenica.
  • DeepMind – una società affiliata di Google – ha sviluppato un algoritmo di apprendimento automatico in grado di prevedere le strutture proteiche dai loro elementi costitutivi con velocità e precisione senza precedenti.
  • Ciò potrebbe rivoluzionare la biologia e la farmacologia ed è considerato uno dei progressi più impattanti dell’intelligenza artificiale negli ultimi tempi.

Sembra che uno dei problemi più antichi della biologia sia stato risolto di recente: determinare la struttura tridimensionale di una proteina dalla sequenza dei suoi elementi costitutivi [1]. Agli scienziati al di fuori delle scienze biologiche, questo potrebbe non apparire immediatamente come un grande passo, ma potrebbe benissimo essere uno dei progressi più significativi della biologia negli ultimi tempi. Per capire quanto sia efficace, dobbiamo dare un’occhiata in dettaglio a come funzionano le cellule.

A livello molecolare, quasi tutte le funzioni degli organismi viventi sono eseguite dalle proteine. Quando una cellula deve svolgere un determinato compito, produce le proteine ​​richieste dal suo DNA traducendo la sequenza di DNA corrispondente in una sequenza di amminoacidi, che viene poi ripiegata nella struttura corretta, generando una proteina funzionale. Quest’ultimo passaggio di “ripiegatura” è cruciale, poiché la funzione di una proteina è determinata principalmente dalla sua struttura e una sequenza di amminoacidi può ripiegarsi in configurazioni diverse con proprietà molto differenti.

Sebbene sia piuttosto semplice per gli scienziati determinare la sequenza di amminoacidi di una proteina, è stato quasi impossibile utilizzare queste informazioni per prevedere la sua struttura, e quindi la sua funzione. Ciò è dovuto principalmente al numero astronomico di possibili configurazioni che una proteina può ottenere; in alcuni casi questo numero è nell’ordine di 10100 (un uno seguito da 100 zeri) [2]. Bisogna sottolineare che provare tutte le configurazioni possibili per trovare quella più probabile non è un’opzione realizzabile.

Tuttavia, è fondamentale in molte aree della biologia, farmacologia e medicina conoscere l’esatta struttura delle proteine ​​coinvolte in determinati processi per essere in grado, ad esempio, di sviluppare nuovi farmaci o investigare la crescita tumorale. Negli ultimi anni sono state utilizzate due strategie sperimentali a questo scopo: cristallografia a raggi X e microscopia crioelettronica [3]. Entrambi hanno avuto molto successo nel trovare le strutture di alcune proteine, ma allo stesso tempo sono tecniche che richiedono molto tempo e risorse. Pertanto, solo un piccolo numero delle proteine ​​note – meno dell’uno percento [2] – è stato analizzato con queste tecniche.

Il recente sviluppo dell’intelligenza artificiale ha alimentato nuovamente gli sforzi per prevedere le strutture proteiche a partire dalla sequenza di amminoacidi. Questo è stato principalmente guidato da piccoli gruppi accademici che hanno partecipato alla competizione biennale “Critical Assessment of Protein Structure Prediction” (CASP), in cui il compito era di prevedere strutture proteiche precedentemente sconosciute. L’iterazione della competizione di quest’anno è stata vinta con enorme margine dalla società affiliata di Google DeepMind, nota per il successo della sua intelligenza artificiale nel gioco degli scacchi e in Go. L’azienda ha addestrato la propria intelligenza artificiale, chiamata AlphaFold, su tutte le strutture proteiche conosciute e ha utilizzato un “algoritmo di attenzione” che scompone problemi complicati in parti gestibili.

Sorprendentemente, le previsioni sulla struttura di AlphaFold erano molto vicine ai risultati ottenuti sperimentalmente e quasi indistinguibili nei due terzi dei casi. Anche se l’IA ha riscontrato problemi con alcune strutture proteiche più complicate, il suo successo è considerato un “punto di svolta” da molti scienziati [1,4].

Le implicazioni di questa tecnologia sono enormi. Può consentire analisi su larga scala delle funzioni proteiche che potrebbero portare a strategie di sviluppo di farmaci più mirate e nuovi modi per studiare l’evoluzione e le funzioni delle cellule. Per il momento, sarà interessante vedere come AlphaFold si comporti al di fuori della competizione CASP e come si svilupperà negli anni a venire. Tuttavia, una cosa sembra già chiara: l’IA è in procinto di risolvere un problema che non è stato risolvibile dalle persone in oltre 50 anni [1].

References:

  1. Noble K. Artificial intelligence solution to a 50-year-old science challenge could ‘revolutionise’ medical research. CASP Press Release. 2020;
  2. Service RF. ‘The game has changed.’ AI triumphs at protein folding. Science. 2020;
  3. Callaway E. The revolution will not be crystallized: A new method sweeps through structural biology. Nature. 2015;
  4. Callaway E. ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature. 2020;