Nowe Technologie (Modern Technologies PL)
Czy Google zrewolucjonizowało biologię?

Czy Google zrewolucjonizowało biologię?

Podsumowanie:

  • Białka są integralną częścią życia, ponieważ są odpowiedzialne za większość funkcji w komórkach. Ich funkcja jest ściśle związana z ich strukturą.
  • Określenie struktury białka na podstawie jego bloków budulcowych jest bardzo trudne ze względu na wysoki stopień interakcji między nimi.
  • Typowo, do znalezienia struktur białek wykorzystuje się skomplikowane i czasochłonne eksperymenty, takie jak krystalografia rentgenowska i krioelektronowa mikroskopia.
  • Spółka zależna Google, DeepMind, opracowała algorytm uczenia maszynowego, który może przewidywać struktury białek na podstawie ich elementów budulcowych z niespotykaną szybkością i dokładnością.
  • Może to zrewolucjonizować biologię i farmakologię i jest uważane za jedno z najbardziej wpływowych osiągnięć sztucznej inteligencji w ostatnim czasie.

Wydaje się, że jeden z najstarszych problemów biologii został niedawno rozwiązany: określenie trójwymiarowego kształtu białka na podstawie jego sekwencji [1]. Dla osób nie związanych z naukami biologicznymi może to nie brzmieć szczególnie imponująco, ale jest potencjalnie jednym z najbardziej znaczących osiągnięć biologii ostatnich czasów. Aby zrozumieć ogrom tego dokonania, musimy szczegółowo przyjrzeć się funkcjonowaniu komórek.

Na poziomie molekularnym prawie wszystkie funkcje organizmów żywych są wykonywane przez białka. Kiedy komórka musi wykonać określone zadanie, generuje wymagane białka ze swojego DNA poprzez proces translacji odpowiedniej sekwencji DNA na sekwencję aminokwasów, która jest następnie zwijana w prawidłowy kształt, tworząc funkcjonalne białko. Ten ostatni etap „zwijania” jest kluczowy, ponieważ funkcja białka jest określana głównie przez jego kształt, a jedna sekwencja aminokwasów może składać się w wiele różnych konfiguracji o bardzo różnych właściwościach.

Mimo iż naukowcy są w stanie stosunkowo łatwo określić sekwencję aminokwasową białek, prawie niemożliwe było wykorzystanie tych informacji do przewidzenia ich struktury, a tym samym funkcji. Wynika to głównie z astronomicznej liczby możliwych konfiguracji, jakie może uzyskać białko; dla niektórych jest to liczba 10100 (jedynka, po której następuje 100 zer) [2]. Można śmiało powiedzieć, że wypróbowanie wszystkich możliwych konfiguracji w celu znalezienia najbardziej prawdopodobnej nie wchodzi w grę.

W wielu dziedzinach biologii, farmakologii i medycyny istotna jest jednak znajomość dokładnej struktury białek zaangażowanych w określone procesy, aby móc na przykład opracować nowe leki lub zbadać wzrost nowotworu. Współcześnie stosuje się w tym celu dwie techniki eksperymentalne: krystalografię rentgenowską i mikroskopię krioelektronową [3]. Obie są bardzo skuteczne w określaniu struktur poszczególnych białek, ale jednocześnie wymagają dużo czasu i zasobów. Dlatego tylko niewielka liczba znanych białek – mniej niż jeden procent [2] – została przeanalizowana za pomocą tych technik.

Niedawny rozwój sztucznej inteligencji ponownie wzmógł wysiłki mające na celu przewidywanie struktur białek na podstawie ich sekwencji aminokwasowych. Było to spowodowane głównie przez małe grupy akademickie, które brały udział w odbywającym się co dwa lata konkursie „Critical Assessment of Protein Structure Prediction” (CASP), w którym zadaniem było przewidywanie nieznanych wcześniej struktur białek. Tegoroczną iterację zawodów wygrała z ogromną przewagą spółka-córka Google, DeepMind – znana z sukcesów AI w szachach i Go. Firma przeszkoliła swoją sztuczną inteligencję – zwaną AlphaFold – na wszystkich znanych strukturach białek i zastosowała „attention algorithm” (algorytm uwagi – tłumaczenie autora), który dzieli skomplikowane problemy na łatwiejsze do rozwiązania części.

Co ciekawe, przewidywania struktur przeprowadzone przy użyciu AlphaFold, były ogólnie bardzo zbliżone do wyników eksperymentalnych i prawie nie do odróżnienia w dwóch trzecich przypadków. Mimo, że sztuczna inteligencja miała trudności z bardziej skomplikowanymi strukturami białek, wielu naukowców uważa, że jej sukces jest przełomowy [1,4].

Wpływ tej technologii na naukę jest ogromny. Może umożliwić przeprowadzanie analiz funkcji białek na dużą skalę. To może umożliwić opracowywania bardziej ukierunkowanych leków i nowych sposobów badania ewolucji i funkcji komórek. W międzyczasie warto śledzić, jak AlphaFold radzi sobie poza konkursem CASP i jak będzie się rozwijać w nadchodzących latach. Jedno wydaje się już jednak jasne – sztuczna inteligencja jest na najlepszej drodze do rozwiązania problemu, którego ludzie nie byli w stanie rozwiązać od ponad 50 lat [1].

Bibliografia:

  1. Noble K. Artificial intelligence solution to a 50-year-old science challenge could ‘revolutionise’ medical research. CASP Press Release. 2020;
  2. Service RF. ‘The game has changed.’ AI triumphs at protein folding. Science. 2020;
  3. Callaway E. The revolution will not be crystallized: A new method sweeps through structural biology. Nature. 2015;
  4. Callaway E. ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature. 2020;