
Hoje, de um número estimado de 1 bilião de espécies na Terra, 99,999 por cento são consideradas microbianas – bactérias, arquéias, vírus e eucariotas unicelulares. Durante grande parte da história do nosso planeta, os micróbios governaram a Terra, capazes de viver e prosperar nos ambientes mais extremos. Nas últimas décadas, os investigadores apenas começaram a lidar com a diversidade dos micróbios – estima-se que menos de 1% dos genes conhecidos tenham funções validadas em laboratório. As abordagens computacionais oferecem aos pesquisadores a oportunidade de analisar estrategicamente essa quantidade verdadeiramente surpreendente de informações.
Microbiologista ambiental e cientista da computação por formação, novo membro do corpo docente do MIT Yunha Hwang está interessado na nova biologia revelada pela forma de vida mais diversa e prolífica da Terra. Em uma posição compartilhada no corpo docente como Professor de Desenvolvimento de Carreira Samuel A. Goldblith no Departamento de Biologia, além de professor assistente na Departamento de Engenharia Elétrica e Ciência da Computação e o Faculdade de Computação Schwarzman do MITHwang está explorando a interseção entre computação e biologia.
P: O que o levou a pesquisar micróbios em ambientes extremos e quais são os desafios em estudá-los?
UM: Ambientes extremos são ótimos lugares para procurar biologia interessante. Eu queria ser astronauta enquanto crescia, e a coisa mais próxima da astrobiologia é examinar ambientes extremos na Terra. E a única coisa que vive nesses ambientes extremos são os micróbios. Durante uma expedição de amostragem da qual participei ao largo da costa do México, descobrimos um tapete microbiano colorido a cerca de 2 quilómetros debaixo de água que floresceu porque as bactérias respiravam enxofre em vez de oxigénio – mas nenhum dos micróbios que eu esperava estudar cresceria no laboratório.
O maior desafio no estudo dos micróbios é que a maioria deles não pode ser cultivada, o que significa que a única forma de estudar a sua biologia é através de um método chamado metagenómica. Meu trabalho mais recente é modelagem de linguagem genômica. Esperamos desenvolver um sistema computacional para podermos sondar o organismo o máximo possível “in silico”, apenas usando dados de sequência. Um modelo de linguagem genômica é tecnicamente um grande modelo de linguagem, exceto que a linguagem é o DNA, em oposição à linguagem humana. É treinado de maneira semelhante, apenas em linguagem biológica, em vez de inglês ou francês. Se o nosso objectivo é aprender a linguagem da biologia, devemos aproveitar a diversidade dos genomas microbianos. Embora tenhamos muitos dados e à medida que mais amostras se tornam disponíveis, acabamos de arranhar a superfície da diversidade microbiana.
P: Dada a diversidade dos micróbios e o pouco que sabemos sobre eles, como pode o estudo dos micróbios in silico, utilizando a modelação da linguagem genómica, avançar a nossa compreensão do genoma microbiano?
UM: Um genoma consiste em muitos milhões de letras. Um humano não pode olhar para isso e entender isso. Podemos programar uma máquina, porém, para segmentar dados em partes que sejam úteis. É assim que a bioinformática funciona com um único genoma. Mas se você estiver olhando para um grama de solo, que pode conter milhares de genomas únicos, são dados demais para trabalhar – um ser humano e um computador juntos são necessários para lidar com esses dados.
Durante o meu doutoramento e mestrado, estávamos apenas a descobrir novos genomas e novas linhagens que eram tão diferentes de tudo o que tinha sido caracterizado ou cultivado em laboratório. Essas eram coisas que chamamos de “matéria escura microbiana”. Quando há muitas coisas não caracterizadas, é aí que o aprendizado de máquina pode ser realmente útil, porque estamos apenas procurando padrões — mas esse não é o objetivo ultimate. O que esperamos fazer é mapear estes padrões nas relações evolutivas entre cada genoma, cada micróbio e cada instância de vida.
Anteriormente, pensávamos nas proteínas como uma entidade autônoma – o que nos leva a um grau decente de informação porque as proteínas estão relacionadas por homologia e, portanto, coisas que estão evolutivamente relacionadas podem ter uma função semelhante.
O que se sabe sobre a microbiologia é que as proteínas são codificadas em genomas, e o contexto em que essa proteína está delimitada – quais regiões vêm antes e depois – é conservado evolutivamente, especialmente se houver um acoplamento funcional. Isso faz todo o sentido porque quando você tem três proteínas que precisam ser expressas juntas porque formam uma unidade, então você pode querer que elas sejam localizadas uma ao lado da outra.
O que quero fazer é incorporar mais desse contexto genómico na forma como procuramos e anotamos proteínas e compreendemos a função das proteínas, para que possamos ir além da sequência ou da semelhança estrutural para adicionar informações contextuais à forma como entendemos as proteínas e levantamos hipóteses sobre as suas funções.
P: Como sua pesquisa pode ser aplicada para aproveitar o potencial funcional dos micróbios?
UM: Os micróbios são possivelmente os melhores químicos do mundo. Aproveitar o metabolismo microbiano e a bioquímica levará a métodos mais sustentáveis e mais eficientes para a produção de novos materiais, novas terapêuticas e novos tipos de polímeros.
Mas não se trata apenas de eficiência – os micróbios estão realizando uma química na qual nem sabemos como pensar. Compreender como funcionam os micróbios e ser capaz de compreender a sua composição genómica e a sua capacidade funcional também será muito importante à medida que pensamos sobre como o nosso mundo e o clima estão a mudar. A maior parte do sequestro de carbono e da ciclagem de nutrientes é realizada por micróbios; se não compreendermos como um determinado micróbio é capaz de fixar nitrogênio ou carbono, enfrentaremos dificuldades na modelagem dos fluxos de nutrientes da Terra.
Do lado mais terapêutico, as doenças infecciosas são uma ameaça actual e crescente. Compreender como os micróbios se comportam em diversos ambientes em relação ao resto do nosso microbioma é realmente importante quando pensamos no futuro e no combate aos patógenos microbianos.