Será que o Google revolucionou a biologia?
Resumo:
- As proteínas são uma parte integrante da vida, uma vez que desempenham a maioria das funções das células. A sua função está intimamente relacionada com a sua estrutura.
- Determinar a estrutura de uma proteína a partir dos seus blocos de construção é muito difícil, devido ao elevado grau de interacção entre esses mesmos blocos.
- Classicamente, experiências complicadas e demoradas, tais como a cristalografia de raios X e a crio-microscopia electrónica, são utilizadas para encontrar estruturas proteicas.
- A empresa filha do Google DeepMind desenvolveu um algoritmo de aprendizagem de máquinas que pode prever as estruturas proteicas dos seus blocos de construção com uma velocidade e precisão sem precedentes.
- Isto pode revolucionar a biologia e farmacologia e é considerado um dos avanços mais impactantes da inteligência artificial nos últimos tempos.
Parece que um dos problemas mais antigos da biologia foi recentemente resolvido: determinar a forma tridimensional de uma proteína a partir da sequência dos seus blocos de construção [1]. Para os leigos isto pode não parecer imediatamente uma “grande coisa”, mas pode muito bem ser um dos avanços mais significativos da biologia nos últimos tempos. A fim de compreender o impacto que isto tem, temos de olhar ao pormenor para a forma como as células funcionam.
A um nível molecular, quase todas as funções dos organismos vivos são executadas por proteínas. Quando uma célula precisa de executar uma determinada tarefa, gera as proteínas necessárias a partir do seu ADN, traduzindo a sequência de ADN correspondente numa sequência de aminoácidos, que é depois dobrada na forma correcta, gerando uma proteína funcional. Esta última etapa de ‘dobragem’ é crucial, uma vez que a função de uma proteína é principalmente determinada pela sua forma e uma sequência de aminoácidos pode dobrar-se em muitas configurações diferentes com propriedades muito diferentes.
Embora seja bastante simples para os cientistas determinar a sequência de aminoácidos de uma proteína, tem sido quase impossível utilizar esta informação para prever a sua forma e, consequentemente, a sua função. Isto deve-se principalmente ao número astronómico de configurações possíveis que uma proteína pode obter; para alguns este número chega à ordem dos 10100 (um seguido de 100 zeros) [2]. É justo dizer que experimentar todas as configurações possíveis para encontrar a mais provável não é uma opção.
No entanto, é crucial em muitas áreas da biologia, farmacologia e medicina conhecer a estrutura exacta das proteínas envolvidas em certos processos para poder, por exemplo, desenvolver novos medicamentos ou investigar o crescimento de tumores. Nos últimos anos têm sido utilizadas duas estratégias experimentais para o efeito: Cristalografia por raios X e crio-microscopia electrónica [3]. Ambas foram muito bem sucedidas na descoberta das estruturas de proteínas individuais, mas ao mesmo tempo, requerem muito tempo e recursos para o fazer. Portanto, apenas um pequeno número das proteínas conhecidas – menos de um por cento [2] – foi analisado com estas técnicas.
A recente ascensão da inteligência artificial reacendeu os esforços para prever as estruturas proteicas a partir das suas sequências de aminoácidos. Isto foi impulsionado principalmente por pequenos grupos académicos que participaram no concurso bienal “Avaliação Crítica da Previsão da Estrutura Proteica” (CASP), no qual a tarefa era prever estruturas proteicas anteriormente desconhecidas. A iteração deste ano do concurso foi ganha, por uma enorme margem, pela empresa filha do Google DeepMind – conhecida pelo sucesso da sua IA no xadrez e Go. A empresa treinou a sua IA – chamada AlphaFold – em todas as estruturas proteicas conhecidas e utilizou um ‘algoritmo de atenção’ que decompõe problemas complicados em tarefas mais fáceis de manusear.
De forma impressionante, as previsões de estrutura da AlphaFold estavam muito próximas dos resultados experimentais em geral e quase indistinguíveis em dois terços dos casos. Embora a IA tenha demonstrado dificuldades com algumas estruturas proteicas mais complicadas, o seu sucesso é considerado por muitos cientistas como uma “mudança de jogo” [1,4].
As implicações desta tecnologia são vastas. Pode permitir análises em larga escala das funções proteicas que podem levar a estratégias de desenvolvimento de medicamentos mais direccionadas e novas formas de estudar a evolução e funções das células. Por enquanto, será interessante ver como o AlphaFold funciona fora da competição CASP e como se irá desenvolver nos próximos anos. No entanto, uma coisa já parece clara: a IA está a caminho de resolver um problema que não pôde ser resolvido pelas pessoas durante mais de 50 anos [1].
Referências:
- Noble K. Artificial intelligence solution to a 50-year-old science challenge could ‘revolutionise’ medical research. CASP Press Release. 2020;
- Service RF. ‘The game has changed.’ AI triumphs at protein folding. Science. 2020;
- Callaway E. The revolution will not be crystallized: A new method sweeps through structural biology. Nature. 2015;
- Callaway E. ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature. 2020;