
Você já teve uma ideia de algo que parecia authorized, mas que não funcionaria bem na prática? Quando se trata de projetar itens como decoração e acessórios pessoais, os modelos de inteligência synthetic generativa (genAI) podem se relacionar. Eles podem produzir designs 3D criativos e elaborados, mas quando você tenta transformar esses projetos em objetos do mundo actual, eles geralmente não suportam o uso diário.
O problema subjacente é que os modelos genAI muitas vezes carecem de compreensão da física. Embora ferramentas como a da Microsoft TRÉLIS sistema pode criar um modelo 3D a partir de um immediate de texto ou imagem, seu design para uma cadeira, por exemplo, pode ser instável ou ter peças desconectadas. O modelo não entende completamente a função do objeto pretendido; portanto, mesmo que seu assento possa ser impresso em 3D, ele provavelmente desmoronará sob a força de alguém se sentar.
Na tentativa de fazer com que esses projetos funcionem no mundo actual, pesquisadores do Laboratório de Ciência da Computação e Inteligência Synthetic (CSAIL) do MIT estão testando a realidade dos modelos generativos de IA. Seu sistema “PhysiOpt” amplia essas ferramentas com simulações físicas, fazendo com que projetos de itens pessoais, como copos, porta-chaves e suportes para livros, funcionem conforme planejado quando são impressos em 3D. Ele testa rapidamente se a estrutura do seu modelo 3D é viável, modificando suavemente formas menores e garantindo que a aparência geral e a função do design sejam preservadas.
Você pode simplesmente digitar o que deseja criar e para que será usado no PhysiOpt ou fazer add de uma imagem para a interface do usuário do sistema e, em cerca de meio minuto, você obterá um objeto 3D realista para fabricar. Por exemplo, os pesquisadores do CSAIL levaram-no a gerar um “copo em forma de flamingo para beber”, que imprimiram em 3D em um copo com alça e base que lembram a perna de um pássaro tropical. À medida que o projeto foi gerado, a PhysiOpt fez pequenos refinamentos para garantir que o projeto fosse estruturalmente sólido.
“PhysiOpt combina GenAI e otimização de forma com base física, ajudando praticamente qualquer pessoa a gerar os designs que deseja para acessórios e decorações exclusivos”, diz o estudante de doutorado em engenharia elétrica e ciência da computação (EECS) do MIT e pesquisador do CSAIL Xiao Sean Zhan SM ’25, que é co-autor principal de um papel apresentando o trabalho. “É um sistema automático que permite tornar a forma fisicamente fabricável, dadas algumas restrições. PhysiOpt pode iterar suas criações quantas vezes desejar, sem qualquer treinamento additional.”
Essa abordagem permite criar um “design inteligente”, onde o gerador de IA cria seu merchandise com base nas especificações do usuário, considerando a funcionalidade. Você pode conectar seu modelo de IA generativo 3D favorito e, depois de digitar o que deseja gerar, especificar quanta força ou peso o objeto deve suportar. É uma maneira interessante de simular o uso no mundo actual, como prever se um gancho será forte o suficiente para segurar seu casaco. Os usuários também especificam com quais materiais fabricarão o merchandise (como plástico ou madeira) e como ele será apoiado – por exemplo, uma xícara fica no chão, enquanto um suporte para livros se apoia em uma coleção de livros.
Dadas as especificidades, PhysiOpt começa a otimizar iterativamente o objeto. Nos bastidores, ele executa uma simulação física chamada “análise de elementos finitos” para testar a resistência do projeto. Essa varredura abrangente fornece um mapa de calor sobre seu modelo 3D, que indica onde seu projeto não é bem suportado. Se você estivesse gerando, digamos, uma casa de passarinho, você poderia descobrir que as vigas de suporte sob a casa eram de cor vermelha brilhante, o que significa que a casa irá desmoronar se não for reforçada.
PhysiOpt pode criar peças ainda mais ousadas. Os pesquisadores viram essa versatilidade em primeira mão quando fabricaram um porta-chaves steampunk (um estilo que combina estética vitoriana e futurista) com ganchos intrincados de aparência robótica e uma “mesa girafa” com parte traseira plana onde você pode colocar itens. Mas como ele sabia o que é “steampunk” ou mesmo como deveria ser uma peça de mobiliário tão única?
Surpreendentemente, a resposta não é um treinamento extensivo – pelo menos não por parte dos pesquisadores. Em vez disso, PhysiOpt usa um modelo pré-treinado que já viu milhares de formas e objetos. “Os sistemas existentes muitas vezes precisam de muito treinamento adicional para ter uma compreensão semântica do que você deseja ver”, acrescenta o co-autor Clément Jambon, que também é aluno de doutorado do MIT EECS e pesquisador do CSAIL. “Mas usamos um modelo com aquela sensação do que você deseja criar já incorporado, então o PhysiOpt não precisa de treinamento.”
Ao trabalhar com um modelo pré-treinado, o PhysiOpt pode usar “formas anteriores”, ou conhecimento de como as formas devem ser com base no treinamento anterior, para gerar o que os usuários desejam ver. É como se um artista recriasse o estilo de um pintor famoso. Sua experiência está enraizada no estudo minucioso de uma variedade de abordagens artísticas, então eles provavelmente serão capazes de espelhar essa estética específica. Da mesma forma, a familiaridade de um modelo pré-treinado com as formas ajuda a gerar modelos 3D.
Os pesquisadores do CSAIL observaram que o know-how visible da PhysiOpt ajudou a criar modelos 3D de forma mais eficiente do que “DifIPC”, um método comparável que simula e otimiza formas. Quando ambas as abordagens tiveram a tarefa de gerar designs 3D para itens como cadeiras, o sistema CSAIL foi quase 10 vezes mais rápido por iteração, ao mesmo tempo que criava objetos mais realistas.
PhysiOpt apresenta uma ponte potencial entre ideias e itens pessoais do mundo actual. O que você pode considerar uma ótima ideia para uma caneca de café, por exemplo, poderá em breve saltar da tela do computador para a mesa. E embora o PhysiOpt já faça testes de estresse para projetistas, em breve poderá ser capaz de prever restrições como cargas e limites, em vez de os usuários precisarem fornecer esses detalhes. Esta abordagem mais autónoma e de bom senso poderia ser possível através da incorporação de modelos de linguagem de visão, que combinam uma compreensão da linguagem humana com visão computacional.
Além do mais, Zhan e Jambon pretendem remover os artefatos, ou fragmentos aleatórios que ocasionalmente aparecem nos modelos 3D do PhysiOpt, tornando o sistema ainda mais consciente da física. Os cientistas do MIT também estão considerando como podem modelar restrições mais complexas para várias técnicas de fabricação, como minimizar componentes salientes para impressão 3D.
Zhan e Jambon escreveram seu artigo com o cientista pesquisador principal do MIT-IBM Watson AI Lab Kenney Ng ’89, SM ’90, PhD ’00 e dois colegas do CSAIL: o pesquisador de graduação Evan Thompson e a professora assistente Mina Konaković Luković, que é a investigadora principal do laboratório.
O trabalho dos pesquisadores foi apoiado, em parte, pelo MIT-IBM Watson AI Laboratory e pela Wistron Corp. Eles o apresentaram em dezembro na Conferência e Exposição SIGGRAPH da Affiliation for Computing Equipment sobre Computação Gráfica e Técnicas Interativas na Ásia.