
Mais de 300 pessoas da academia e da indústria lotaram um auditório para assistir a um Seminário BoltzGen na quinta-feira, 30 de outubro, organizado pelo Clínica Abdul Latif Jameel para aprendizado de máquina em saúde (Clínica Jameel do MIT). A atração principal do evento foi o estudante de doutorado do MIT e primeiro autor do BoltzGen, Hannes Stärk, que havia anunciado o BoltzGen apenas alguns dias antes.
Construindo sobre Boltz-2um modelo de previsão de estrutura biomolecular de código aberto que prevê a afinidade de ligação às proteínas que fez sucesso durante o verão, BoltzGen (lançado oficialmente no domingo, 26 de outubro) é o primeiro modelo desse tipo a dar um passo adiante, gerando novos ligantes de proteínas que estão prontos para entrar no processo de descoberta de medicamentos.
Três inovações principais tornam isso possível: primeiro, a capacidade do BoltzGen de realizar uma variedade de tarefas, unificando o design de proteínas e a previsão de estrutura, mantendo ao mesmo tempo um desempenho de última geração. Em seguida, as restrições integradas do BoltzGen são projetadas com suggestions dos colaboradores do wetlab para garantir que o modelo crie proteínas funcionais que não desafiem as leis da física ou da química. Por último, um rigoroso processo de avaliação testa o modelo em alvos de doenças “indruggáveis”, ampliando os limites das capacidades de geração de ligantes do BoltzGen.
A maioria dos modelos usados na indústria ou na academia são capazes de prever estruturas ou projetar proteínas. Além disso, eles estão limitados a gerar certos tipos de proteínas que se ligam com sucesso a “alvos” fáceis. Assim como os alunos respondem a uma pergunta de teste que se parece com seu dever de casa, desde que os dados de treinamento sejam semelhantes ao alvo durante o design do fichário, os modelos geralmente funcionam. Mas os métodos existentes são quase sempre avaliados em alvos para os quais já existem estruturas com ligantes, e acabam falhando no desempenho quando usados em alvos mais desafiadores.
“Há modelos que tentam abordar o design do fichário, mas o problema é que estes modelos são específicos da modalidade”, salienta Stärk. “Um modelo geral não significa apenas que podemos resolver mais tarefas. Além disso, obtemos um modelo melhor para a tarefa particular person, uma vez que a emulação da física é aprendida por exemplo, e com um esquema de treinamento mais geral, fornecemos mais exemplos contendo padrões físicos generalizáveis.”
Os pesquisadores do BoltzGen se esforçaram para testar o BoltzGen em 26 alvos, variando de casos terapeuticamente relevantes até aqueles explicitamente escolhidos por sua dissimilaridade com os dados de treinamento.
Este processo de validação abrangente, que ocorreu em oito wetlabs na academia e na indústria, demonstra a amplitude e o potencial do modelo para o desenvolvimento inovador de medicamentos.
A Parabilis Medicines, um dos colaboradores da indústria que testou o BoltzGen em um ambiente de laboratório úmido, elogiou o potencial do BoltzGen: “sentimos que a adoção do BoltzGen em nossas capacidades existentes da plataforma computacional de peptídeos Helicon promete acelerar nosso progresso no fornecimento de medicamentos transformacionais contra as principais doenças humanas”.
Embora os lançamentos de código aberto do Boltz-1, Boltz-2 e agora BoltzGen (que foi visualizado no 7ª Conferência de Aprendizado de Máquina Molecular em 22 de outubro) trazem novas oportunidades e transparência no desenvolvimento de medicamentos, mas também sinalizam que as indústrias biotecnológica e farmacêutica podem precisar reavaliar suas ofertas.
Em meio à agitação do BoltzGen na plataforma de mídia social X, Justin Grace, principal cientista de aprendizado de máquina do LabGenius, levantou uma questão. “O intervalo de tempo de desempenho privado para aberto para sistemas de IA de bate-papo é de (sete) meses e está caindo”, escreveu Grace em uma postagem. “Parece ser ainda mais curto no espaço de proteínas. Como as empresas de aglutinantes como serviço serão capazes de (recuperar) o investimento quando podemos apenas esperar alguns meses pela versão gratuita?”
Para os acadêmicos, o BoltzGen representa uma expansão e aceleração das possibilidades científicas. “Uma pergunta que meus alunos costumam me fazer é: ‘onde a IA pode mudar o jogo terapêutico?’”, Diz a coautora sênior e professora do MIT Regina Barzilay, chefe do corpo docente de IA da Clínica Jameel e afiliada do Laboratório de Ciência da Computação e Inteligência Synthetic (CSAIL). “A menos que identifiquemos alvos incontroláveis e proponhamos uma solução, não mudaremos o jogo”, acrescenta ela. “A ênfase aqui está nos problemas não resolvidos, o que distingue o trabalho de Hannes de outros na área.”
O coautor sênior Tommi Jaakkola, professor Thomas Siebel de Engenharia Elétrica e Ciência da Computação afiliado à Jameel Clinic e CSAIL, observa que “modelos como o BoltzGen, lançados totalmente de código aberto, permitem esforços mais amplos em toda a comunidade para acelerar as capacidades de design de medicamentos”.
Olhando para o futuro, Stärk acredita que o futuro do design biomolecular será subvertido pelos modelos de IA. “Quero construir ferramentas que nos ajudem a manipular a biologia para resolver doenças ou realizar tarefas com máquinas moleculares que ainda nem imaginamos”, afirma. “Quero fornecer essas ferramentas e permitir que os biólogos imaginem coisas nas quais nem sequer pensaram antes.”