Elaborar uma hipótese de pesquisa única e promissora é uma habilidade basic para qualquer cientista. Também pode ser demorado: novos candidatos a doutoramento podem passar o primeiro ano do seu programa a tentar decidir exatamente o que explorar nas suas experiências. E se a inteligência synthetic pudesse ajudar?
Os pesquisadores do MIT criaram uma maneira de gerar e avaliar de forma autônoma hipóteses de pesquisa promissoras em todos os campos, por meio da colaboração entre humanos e IA. Num novo artigo, eles descrevem como usaram esta estrutura para criar hipóteses baseadas em evidências que se alinham com necessidades de investigação não satisfeitas no campo dos materiais de inspiração biológica.
Publicado quarta-feira em Materiais Avançadoso estudo foi coautor de Alireza Ghafarollahi, pós-doutorado no Laboratório de Mecânica Atomística e Molecular (LAMM), e Markus Buehler, professor Jerry McAfee em Engenharia nos departamentos de Engenharia Civil e Ambiental e de Engenharia Mecânica do MIT e diretor de LAMM.
A estrutura, que os pesquisadores chamam de SciAgents, consiste em vários agentes de IA, cada um com capacidades específicas e acesso a dados, que aproveitam métodos de “raciocínio gráfico”, onde os modelos de IA utilizam um gráfico de conhecimento que organiza e outline relações entre diversos conceitos científicos. A abordagem multiagente imita a forma como os sistemas biológicos se organizam como grupos de blocos de construção elementares. Buehler observa que este princípio de “dividir para conquistar” é um paradigma proeminente na biologia em muitos níveis, desde materiais a enxames de insectos e civilizações – todos exemplos em que a inteligência complete é muito maior do que a soma das capacidades dos indivíduos.
“Ao utilizar vários agentes de IA, tentamos simular o processo pelo qual comunidades de cientistas fazem descobertas”, diz Buehler. “No MIT, fazemos isso com um grupo de pessoas com experiências diferentes trabalhando juntas e se encontrando em cafeterias ou no Corredor Infinito do MIT. Mas isso é muito coincidente e lento. Nossa missão é simular o processo de descoberta, explorando se os sistemas de IA podem ser criativos e fazer descobertas.”
Automatizando boas ideias
Como demonstraram desenvolvimentos recentes, os grandes modelos de linguagem (LLMs) demonstraram uma capacidade impressionante de responder perguntas, resumir informações e executar tarefas simples. Mas eles são bastante limitados quando se trata de gerar novas ideias a partir do zero. Os investigadores do MIT queriam conceber um sistema que permitisse aos modelos de IA executar um processo mais sofisticado e de várias etapas que fosse além de recordar informações aprendidas durante a formação, para extrapolar e criar novos conhecimentos.
A base de sua abordagem é um gráfico de conhecimento ontológico, que organiza e faz conexões entre diversos conceitos científicos. Para fazer os gráficos, os pesquisadores alimentam um conjunto de artigos científicos em um modelo generativo de IA. Em trabalho anteriorBuehler usou um campo da matemática conhecido como teoria das categorias para ajudar o modelo de IA a desenvolver abstrações de conceitos científicos como gráficos, enraizados na definição de relações entre componentes, de uma forma que pudesse ser analisada por outros modelos por meio de um processo chamado raciocínio gráfico. Isso concentra os modelos de IA no desenvolvimento de uma forma mais baseada em princípios de compreensão de conceitos; também permite generalizar melhor entre os domínios.
“Isso é realmente importante para criarmos modelos de IA focados na ciência, já que as teorias científicas são normalmente enraizadas em princípios generalizáveis, e não apenas na recordação de conhecimento”, diz Buehler. “Ao focar os modelos de IA no ‘pensamento’ dessa maneira, podemos ir além dos métodos convencionais e explorar usos mais criativos da IA.”
Para o artigo mais recente, os investigadores usaram cerca de 1.000 estudos científicos sobre materiais biológicos, mas Buehler diz que os gráficos de conhecimento poderiam ser gerados usando muito mais ou menos artigos de investigação de qualquer área.
Com o gráfico estabelecido, os pesquisadores desenvolveram um sistema de IA para descoberta científica, com múltiplos modelos especializados para desempenhar funções específicas no sistema. A maioria dos componentes foi construída a partir dos modelos da série ChatGPT-4 da OpenAI e fez uso de uma técnica conhecida como aprendizagem no contexto, na qual os prompts fornecem informações contextuais sobre a função do modelo no sistema, permitindo-lhe aprender com os dados fornecidos.
Os agentes individuais na estrutura interagem entre si para resolver coletivamente um problema complexo que nenhum deles seria capaz de resolver sozinho. A primeira tarefa que lhes é dada é gerar a hipótese de pesquisa. As interações do LLM começam após a definição de um subgráfico a partir do gráfico de conhecimento, o que pode acontecer aleatoriamente ou inserindo manualmente um par de palavras-chave discutidas nos artigos.
Nessa estrutura, um modelo de linguagem que os pesquisadores chamaram de “Ontologista” tem a tarefa de definir os termos científicos nos artigos e examinar as conexões entre eles, dando corpo ao gráfico do conhecimento. Um modelo denominado “Cientista 1” elabora então uma proposta de pesquisa com base em fatores como sua capacidade de descobrir propriedades inesperadas e novidades. A proposta inclui uma discussão sobre possíveis descobertas, o impacto da pesquisa e uma estimativa dos mecanismos de ação subjacentes. Um modelo “Cientista 2” expande a ideia, sugerindo abordagens experimentais e de simulação específicas e fazendo outras melhorias. Finalmente, um modelo “Crítico” destaca os seus pontos fortes e fracos e sugere novas melhorias.
“Trata-se de construir uma equipe de especialistas que não pensem todos da mesma maneira”, diz Buehler. “Eles têm que pensar de forma diferente e ter capacidades diferentes. O agente Crítico é deliberadamente programado para criticar os outros, então você não tem todos concordando e dizendo que é uma ótima ideia. Você tem um agente dizendo: ‘Há um ponto fraco aqui, você pode explicar melhor?’ Isso torna o resultado muito diferente dos modelos individuais.”
Outros agentes do sistema são capazes de pesquisar a literatura existente, o que fornece ao sistema uma forma não só de avaliar a viabilidade, mas também de criar e avaliar a novidade de cada ideia.
Tornando o sistema mais forte
Para validar a sua abordagem, Buehler e Ghafarollahi construíram um gráfico de conhecimento baseado nas palavras “seda” e “intensivo de energia”. Usando a estrutura, o modelo “Cientista 1” propôs a integração da seda com pigmentos à base de dente-de-leão para criar biomateriais com propriedades ópticas e mecânicas aprimoradas. O modelo previu que o materials seria significativamente mais resistente do que os materiais tradicionais de seda e exigiria menos energia para ser processado.
O Cientista 2 fez então sugestões, como a utilização de ferramentas específicas de simulação de dinâmica molecular para explorar como os materiais propostos interagiriam, acrescentando que uma boa aplicação para o materials seria um adesivo bioinspirado. O modelo Critic destacou então vários pontos fortes do materials proposto e áreas para melhoria, tais como a sua escalabilidade, estabilidade a longo prazo e os impactos ambientais do uso de solventes. Para abordar essas preocupações, o Crítico sugeriu a realização de estudos piloto para validação de processos e a realização de análises rigorosas de durabilidade do materials.
Os pesquisadores também conduziram outros experimentos com palavras-chave escolhidas aleatoriamente, que produziram várias hipóteses originais sobre chips microfluídicos biomiméticos mais eficientes, melhorando as propriedades mecânicas de estruturas à base de colágeno e a interação entre grafeno e fibrilas amilóides para criar dispositivos bioeletrônicos.
“O sistema foi capaz de apresentar essas ideias novas e rigorosas com base no caminho do gráfico de conhecimento”, diz Ghafarollahi. “Em termos de novidade e aplicabilidade, os materiais pareciam robustos e inovadores. Em trabalhos futuros, vamos gerar milhares, ou dezenas de milhares, de novas ideias de pesquisa, e então poderemos categorizá-las, tentar entender melhor como esses materiais são gerados e como poderiam ser melhorados ainda mais.”
No futuro, os pesquisadores esperam incorporar novas ferramentas para recuperar informações e executar simulações em suas estruturas. Eles também podem trocar facilmente os modelos básicos de suas estruturas por modelos mais avançados, permitindo que o sistema se adapte às mais recentes inovações em IA.
“Devido à forma como esses agentes interagem, uma melhoria em um modelo, mesmo que pequena, tem um enorme impacto no comportamento geral e nos resultados do sistema”, diz Buehler.
Desde o lançamento de um preprint com detalhes de código aberto de sua abordagem, os pesquisadores foram contatados por centenas de pessoas interessadas em usar as estruturas em diversos campos científicos e até mesmo em áreas como finanças e segurança cibernética.
“Há muitas coisas que você pode fazer sem precisar ir ao laboratório”, diz Buehler. “Você quer basicamente ir para o laboratório bem no remaining do processo. O laboratório é caro e leva muito tempo, então você quer um sistema que possa se aprofundar nas melhores ideias, formulando as melhores hipóteses e prevendo com precisão comportamentos emergentes. Nossa visão é tornar isso fácil de usar, para que você possa usar um aplicativo para trazer outras ideias ou arrastar conjuntos de dados para realmente desafiar o modelo a fazer novas descobertas.”