banner_de_página

notícias

O Prêmio Lasker de Pesquisa Médica Básica deste ano foi concedido a Demis Hassabis e John Jumper por suas contribuições à criação do sistema de inteligência artificial AlphaFold, que prevê a estrutura tridimensional de proteínas com base na sequência de primeira ordem de aminoácidos.

 

Seus resultados resolvem um problema que há muito tempo incomoda a comunidade científica e abrem caminho para a aceleração da pesquisa na área biomédica. As proteínas desempenham um papel fundamental no desenvolvimento de doenças: na doença de Alzheimer, elas se dobram e se aglomeram; no câncer, sua função reguladora é perdida; em distúrbios metabólicos congênitos, elas são disfuncionais; na fibrose cística, elas se instalam no espaço errado da célula. Esses são apenas alguns dos muitos mecanismos que causam doenças. Modelos detalhados da estrutura de proteínas podem fornecer configurações atômicas, orientar o design ou a seleção de moléculas de alta afinidade e acelerar a descoberta de medicamentos.

 

As estruturas proteicas são geralmente determinadas por cristalografia de raios X, ressonância magnética nuclear e microscopia crioeletrônica. Esses métodos são caros e demorados. Isso resulta em bancos de dados de estruturas proteicas 3D existentes com apenas cerca de 200.000 dados estruturais, enquanto a tecnologia de sequenciamento de DNA produziu mais de 8 milhões de sequências proteicas. Na década de 1960, Anfinsen et al. descobriram que a sequência 1D de aminoácidos pode se dobrar espontânea e repetidamente em uma conformação tridimensional funcional (Figura 1A), e que "chaperonas" moleculares podem acelerar e facilitar esse processo. Essas observações levam a um desafio de 60 anos na biologia molecular: prever a estrutura 3D de proteínas a partir da sequência 1D de aminoácidos. Com o sucesso do Projeto Genoma Humano, nossa capacidade de obter sequências de aminoácidos 1D melhorou muito, e esse desafio se tornou ainda mais urgente.

Estrutura da proteína ST6GAL1

Prever estruturas de proteínas é difícil por vários motivos. Primeiro, todas as posições tridimensionais possíveis de cada átomo em cada aminoácido exigem muita exploração. Segundo, as proteínas fazem uso máximo da complementaridade em sua estrutura química para configurar átomos de forma eficiente. Como as proteínas normalmente têm centenas de "doadores" de ligações de hidrogênio (geralmente oxigênio) que devem estar próximos do "aceptor" de ligações de hidrogênio (geralmente nitrogênio ligado ao hidrogênio), pode ser muito difícil encontrar conformações em que quase todos os doadores estejam próximos do aceptor. Terceiro, há exemplos limitados para o treinamento de métodos experimentais, portanto, é necessário entender as potenciais interações tridimensionais entre aminoácidos com base em sequências unidimensionais usando informações sobre a evolução das proteínas relevantes.

 

A física foi usada pela primeira vez para modelar a interação de átomos na busca pela melhor conformação, e um método foi desenvolvido para prever a estrutura de proteínas. Karplus, Levitt e Warshel receberam o Prêmio Nobel de Química de 2013 por seu trabalho em simulação computacional de proteínas. No entanto, métodos baseados em física são computacionalmente caros e exigem processamento aproximado, portanto, estruturas tridimensionais precisas não podem ser previstas. Outra abordagem "baseada em conhecimento" é usar bancos de dados de estruturas e sequências conhecidas para treinar modelos por meio de inteligência artificial e aprendizado de máquina (IA-ML). Hassabis e Jumper aplicam elementos da física e da IA-ML, mas a inovação e o salto no desempenho da abordagem decorrem principalmente da IA-ML. Os dois pesquisadores combinaram criativamente grandes bancos de dados públicos com recursos de computação de nível industrial para criar o AlphaFold.

 

Como sabemos que eles "resolveram" o quebra-cabeça da predição estrutural? Em 1994, foi criada a competição Avaliação Crítica da Predição de Estruturas (CASP), que se reúne a cada dois anos para acompanhar o progresso da predição estrutural. Os pesquisadores compartilharão a sequência 1D da proteína cuja estrutura eles resolveram recentemente, mas cujos resultados ainda não foram publicados. O preditor prevê a estrutura tridimensional usando essa sequência 1D, e o avaliador julga de forma independente a qualidade dos resultados previstos, comparando-os com a estrutura tridimensional fornecida pelo experimentalista (fornecida apenas ao avaliador). O CASP conduz revisões cegas verdadeiras e registra saltos periódicos de desempenho associados à inovação metodológica. Na 14ª Conferência CASP em 2020, os resultados da predição do AlphaFold mostraram um salto de desempenho tão grande que os organizadores anunciaram que o problema da predição da estrutura 3D havia sido resolvido: a precisão da maioria das predições era próxima à das medições experimentais.

 

O significado mais amplo é que o trabalho de Hassabis e Jumper demonstra de forma convincente como a IA-ML pode transformar a ciência. Sua pesquisa mostra que a IA-ML pode construir hipóteses científicas complexas a partir de múltiplas fontes de dados, que mecanismos de atenção (semelhantes aos do ChatGPT) podem descobrir dependências e correlações importantes em fontes de dados e que a IA-ML pode autoavaliar a qualidade de seus resultados. A IA-ML é essencialmente fazer ciência.


Horário da postagem: 23/09/2023