Modelos de difusão como o Dall-E do Openai estão se tornando cada vez mais úteis para ajudar a debater novos designs. Os seres humanos podem levar esses sistemas a gerar uma imagem, criar um vídeo ou refinar um plano e voltar com idéias que eles não haviam considerado antes.
Mas você sabia que os modelos generativos de inteligência synthetic (Genai) também estão avançando na criação de robôs que trabalham? Recente Abordagens baseadas em difusão geraram estruturas e os sistemas que as controlam do zero. Com ou sem a entrada de um usuário, esses modelos podem criar novos designs e avaliá -los em simulação antes de serem fabricados.
Uma nova abordagem do Laboratório de Ciência da Computação e Inteligência Synthetic do MIT (CSAIL) aplica esse know-how generativo para melhorar os projetos robóticos dos seres humanos. Os usuários podem redigir um modelo 3D de um robô e especificar quais peças eles gostariam de ver um modelo de difusão modificar, fornecendo suas dimensões com antecedência. Genai então debate a forma excellent para essas áreas e testa suas idéias na simulação. Quando o sistema encontrar o design certo, você pode salvar e fabricar um robô de trabalho actual com uma impressora 3D, sem exigir ajustes adicionais.
Os pesquisadores usaram essa abordagem para criar um robô que salta em uma média de aproximadamente 2 pés, ou 41 % maior que uma máquina semelhante que eles criaram por conta própria. As máquinas têm uma aparência quase idêntica: ambos são feitos de um tipo de plástico chamado ácido polilático e, embora inicialmente pareçam planos, elas surgem em forma de diamante quando um motor puxa o cordão preso a eles. Então, o que exatamente a IA fez de maneira diferente?
Um visible mais atento revela que as ligações geradas pela IA são curvas e se assemelham a baquetas espessas (os bateristas de instrumentos musicais usam), enquanto as peças de conexão do robô padrão são retas e retangulares.
Blobs melhores e melhores
Os pesquisadores começaram a refinar seu robô saltador, amostrando 500 projetos em potencial usando um vetor de incorporação inicial-uma representação numérica que captura recursos de alto nível para orientar os projetos gerados pelo modelo de IA. Destes, eles selecionaram as 12 principais opções com base no desempenho da simulação e as usaram para otimizar o vetor de incorporação.
Esse processo foi repetido cinco vezes, orientando progressivamente o modelo de IA para gerar melhores designs. O design resultante parecia um blob, então os pesquisadores levaram seu sistema a escalar o rascunho para se ajustar ao seu modelo 3D. Eles então fabricaram a forma, descobrindo que realmente melhorou as habilidades de salto do robô.
A vantagem de usar modelos de difusão para esta tarefa, de acordo com o co-líder do autor e o CSAIL PostDoc Byungchul Kim, é que eles podem encontrar soluções não convencionais para refinar os robôs.
“Queríamos fazer nossa máquina pular mais alto, então achamos que poderíamos simplesmente fazer com que os hyperlinks conectem suas peças o mais finas possível para torná -las leves”, diz Kim. “No entanto, uma estrutura tão fina pode quebrar facilmente se usarmos o materials impresso em 3D. Nosso modelo de difusão teve uma idéia melhor, sugerindo uma forma única que permitiu ao robô armazenar mais energia antes de saltar, sem tornar os hyperlinks muito finos. Essa criatividade nos ajudou a aprender sobre a física subjacente da máquina”.
A equipe então encarregou o sistema de redação de um pé otimizado para garantir que ele aterrisse em segurança. Eles repetiram o processo de otimização, eventualmente escolhendo o design com melhor desempenho para anexar ao fundo de sua máquina. Kim e seus colegas descobriram que sua máquina projetada por IA caía muito menos frequentemente do que sua linha de base, no valor de uma melhoria de 84 %.
A capacidade do modelo de difusão de atualizar as habilidades de salto e aterrissagem de um robô sugere que pode ser útil para melhorar a forma como outras máquinas são projetadas. Por exemplo, uma empresa que trabalha na fabricação ou robôs domésticos pode usar uma abordagem semelhante para melhorar seus protótipos, economizando tempo dos engenheiros normalmente reservados para iterar nessas mudanças.
O equilíbrio por trás do salto
Para criar um robô que pudesse pular e pousar de forma estável, os pesquisadores reconheceram que precisavam encontrar um equilíbrio entre os dois objetivos. Eles representaram a altura de salto e a taxa de sucesso de aterrissagem como dados numéricos e, em seguida, treinaram seu sistema para encontrar um ponto excellent entre os dois vetores de incorporação que poderiam ajudar a construir uma estrutura 3D excellent.
Os pesquisadores observam que, embora esse robô assistido pela AA tenha superado sua contraparte projetada pelo ser humano, em breve poderia atingir novos alturas ainda maiores. Essa iteração envolveu o uso de materiais compatíveis com uma impressora 3D, mas as versões futuras saltariam ainda mais com materiais mais leves.
O co-líder e o aluno de doutorado do MIT CSAIL Tsun-Hsuan “Johnson” Wang diz que o projeto é um ponto de partida para novos designs de robótica com os quais a IA generativa poderia ajudar.
“Queremos ramificar -se para objetivos mais flexíveis”, diz Wang. “Think about usar a linguagem pure para orientar um modelo de difusão para redigir um robô que pode pegar uma caneca ou operar uma broca elétrica”.
Kim diz que um modelo de difusão também pode ajudar a gerar articulação e identificar como as peças se conectam, potencialmente melhorando o quão alto o robô saltaria. A equipe também está explorando a possibilidade de adicionar mais motores para controlar qual direção a máquina salta e talvez melhorar sua estabilidade de pouso.
O trabalho dos pesquisadores foi apoiado, em parte, pelas fronteiras emergentes da Nationwide Science Basis em Programa de Pesquisa e Inovação, do programa, Manus e Machina da Aliança para Pesquisa e Tecnologia de Cingapura e Machina e a colaboração do Instituto de Ciência e Tecnologia Gwangju (GIST). Eles apresentaram seu trabalho na Conferência Internacional de 2025 sobre robótica e automação.