À medida que os recursos dos modelos generativos de IA cresceram, você provavelmente já viu como eles podem transformar prompts de texto simples em imagens hiperrealistas e até mesmo em clipes de vídeo estendidos.
Mais recentemente, a IA generativa demonstrou potencial para ajudar químicos e biólogos a explorar moléculas estáticas, como proteínas e ADN. Modelos como AlphaFold podem prever estruturas moleculares para acelerar a descoberta de medicamentos, e o “RFdifusão”, por exemplo, pode ajudar a projetar novas proteínas. Um desafio, porém, é que as moléculas estão em constante movimento e oscilação, o que é importante modelar na construção de novas proteínas e medicamentos. Simular esses movimentos em um computador usando a física – uma técnica conhecida como dinâmica molecular – pode ser muito caro, exigindo bilhões de passos de tempo em supercomputadores.
Como um passo para simular esses comportamentos de forma mais eficiente, o Laboratório de Ciência da Computação e Inteligência Synthetic do MIT (CSAIL) e os pesquisadores do Departamento de Matemática desenvolveram um modelo generativo que aprende com dados anteriores. O sistema da equipe, chamado MDGen, pode pegar um quadro de uma molécula 3D e simular o que acontecerá a seguir como um vídeo, conectar imagens estáticas separadas e até mesmo preencher quadros faltantes. Ao apertar o “botão play” nas moléculas, a ferramenta poderia potencialmente ajudar os químicos a projetar novas moléculas e estudar de perto até que ponto seus protótipos de medicamentos para o câncer e outras doenças interagiriam com a estrutura molecular que pretende impactar.
O co-autor principal Bowen Jing SM ’22 diz que o MDGen é uma prova inicial de conceito, mas sugere o início de uma nova e excitante direção de pesquisa. “No início, os modelos generativos de IA produziam vídeos um tanto simples, como uma pessoa piscando ou um cachorro abanando o rabo”, diz Jing, estudante de doutorado no CSAIL. “Alguns anos depois, agora temos modelos incríveis como Sora ou Veo que podem ser úteis de todas as maneiras interessantes. Esperamos incutir uma visão semelhante para o mundo molecular, onde as trajetórias dinâmicas são os vídeos. Por exemplo, você pode dar ao modelo o primeiro e o décimo quadro, e ele animará o que está entre eles, ou pode remover o ruído de um vídeo molecular e adivinhar o que estava oculto.”
Os pesquisadores dizem que o MDGen representa uma mudança de paradigma em relação a trabalhos anteriores comparáveis com IA generativa, de uma forma que permite casos de uso muito mais amplos. As abordagens anteriores eram “autoregressivas”, o que significa que dependiam do quadro estático anterior para construir o próximo, começando pelo primeiro quadro para criar uma sequência de vídeo. Em contraste, o MDGen gera os quadros em paralelo com a difusão. Isso significa que o MDGen pode ser usado, por exemplo, para conectar quadros nos terminais ou “aumentar a resolução” de uma trajetória de baixa taxa de quadros, além de pressionar play no quadro inicial.
Este trabalho foi apresentado em um artigo apresentado na Conferência sobre Sistemas de Processamento de Informações Neurais (NeurIPS) em dezembro passado. No verão passado, foi premiado por seu potencial impacto comercial no Workshop ML4LMS da Conferência Internacional sobre Aprendizado de Máquina.
Alguns pequenos passos em frente para a dinâmica molecular
Em experimentos, Jing e seus colegas descobriram que as simulações do MDGen eram semelhantes à execução direta das simulações físicas, enquanto produziam trajetórias 10 a 100 vezes mais rápidas.
A equipe primeiro testou a capacidade de seu modelo de capturar um quadro 3D de uma molécula e gerar os próximos 100 nanossegundos. Seu sistema reuniu blocos sucessivos de 10 nanossegundos para que essas gerações atingissem essa duração. A equipe descobriu que o MDGen foi capaz de competir com a precisão de um modelo de linha de base, ao mesmo tempo que concluiu o processo de geração de vídeo em aproximadamente um minuto – uma mera fração das três horas que o modelo de linha de base levou para simular a mesma dinâmica.
Ao receber o primeiro e o último quadro de uma sequência de um nanossegundo, o MDGen também modelou as etapas intermediárias. O sistema dos investigadores demonstrou um grau de realismo em mais de 100.000 previsões diferentes: simulou trajetórias moleculares mais prováveis do que as suas linhas de base em clipes com menos de 100 nanossegundos. Nestes testes, o MDGen também indicou uma capacidade de generalizar em péptidos que não tinha visto antes.
As capacidades do MDGen também incluem a simulação de quadros dentro de quadros, “aumentando a resolução” das etapas entre cada nanossegundo para capturar fenômenos moleculares mais rápidos de forma mais adequada. Ele pode até “pintar” estruturas de moléculas, restaurando informações sobre elas que foram removidas. Esses recursos poderiam eventualmente ser usados por pesquisadores para projetar proteínas com base em uma especificação de como as diferentes partes da molécula deveriam se mover.
Brincando com a dinâmica das proteínas
Jing e o co-autor Hannes Stärk dizem que o MDGen é um sinal precoce de progresso na geração de dinâmica molecular de forma mais eficiente. Ainda assim, faltam-lhes os dados para tornar estes modelos imediatamente impactantes na concepção de medicamentos ou moléculas que induzam os movimentos que os químicos desejam ver numa estrutura-alvo.
Os pesquisadores pretendem dimensionar o MDGen desde a modelagem de moléculas até a previsão de como as proteínas mudarão ao longo do tempo. “Atualmente, usamos sistemas de brinquedo”, diz Stärk, também estudante de doutorado na CSAIL. “Para aprimorar as capacidades preditivas do MDGen para modelar proteínas, precisaremos aproveitar a arquitetura atual e os dados disponíveis. Ainda não temos um repositório na escala do YouTube para esses tipos de simulações, então esperamos desenvolver um método separado de aprendizado de máquina que possa acelerar o processo de coleta de dados para nosso modelo.”
Por enquanto, o MDGen apresenta um caminho encorajador na modelagem de mudanças moleculares invisíveis a olho nu. Os químicos também poderiam usar essas simulações para aprofundar o comportamento de protótipos de medicamentos para doenças como câncer ou tuberculose.
“Os métodos de aprendizado de máquina que aprendem com a simulação física representam uma nova fronteira crescente na IA para a ciência”, diz Bonnie Berger, professora de matemática do MIT Simons, investigadora principal do CSAIL e autora sênior do artigo. “O MDGen é uma estrutura de modelagem versátil e multifuncional que conecta esses dois domínios, e estamos muito entusiasmados em compartilhar nossos primeiros modelos nessa direção.”
“Amostragem de caminhos de transição realistas entre estados moleculares é um grande desafio”, diz o colega autor sênior Tommi Jaakkola, que é professor de engenharia elétrica e ciência da computação do MIT Thomas Siebel e do Instituto de Dados, Sistemas e Sociedade, e investigador principal do CSAIL . “Este trabalho inicial mostra como podemos começar a enfrentar esses desafios, mudando a modelagem generativa para execuções completas de simulação.”
Pesquisadores da área de bioinformática elogiaram este sistema por sua capacidade de simular transformações moleculares. “O MDGen modela simulações de dinâmica molecular como uma distribuição conjunta de incorporações estruturais, capturando movimentos moleculares entre etapas de tempo discretas”, diz Simon Olsson, professor associado da Chalmers College of Know-how, que não esteve envolvido na pesquisa. “Aproveitando um objetivo de aprendizagem mascarado, o MDGen permite casos de uso inovadores, como amostragem de caminhos de transição, traçando analogias para trajetórias de pintura conectando fases metaestáveis.”
O trabalho dos pesquisadores no MDGen foi apoiado, em parte, pelo Instituto Nacional de Ciências Médicas Gerais, pelo Departamento de Energia dos EUA, pela Nationwide Science Basis, pelo Consórcio de Aprendizado de Máquina para Descoberta e Síntese Farmacêutica, pela Clínica Abdul Latif Jameel para Aprendizado de Máquina. em Saúde, a Agência de Redução de Ameaças de Defesa e a Agência de Projetos de Pesquisa Avançada de Defesa.