À medida que mais dispositivos conectados exigem uma quantidade crescente de largura de banda para tarefas como teletrabalho e computação em nuvem, será extremamente desafiador gerenciar a quantidade finita de espectro sem fio disponível para todos os usuários compartilharem.
Os engenheiros estão empregando inteligência synthetic para gerenciar dinamicamente o espectro sem fio disponível, com o objetivo de reduzir a latência e aumentar o desempenho. Mas a maioria dos métodos de IA para classificar e processar sinais sem fio tem fome de energia e não pode operar em tempo actual.
Agora, os pesquisadores do MIT desenvolveram um novo acelerador de {hardware} da AI, projetado especificamente para o processamento de sinal sem fio. Seu processador óptico executa cálculos de aprendizado de máquina na velocidade da luz, classificando sinais sem fio em questão de nanossegundos.
O chip fotônico é cerca de 100 vezes mais rápido que a melhor alternativa digital, enquanto converge para cerca de 95 % de precisão na classificação do sinal. O novo acelerador de {hardware} também é escalável e flexível, para que possa ser usado para uma variedade de aplicativos de computação de alto desempenho. Ao mesmo tempo, é menor, mais leve, mais barato e mais eficiente em termos de energia que os aceleradores de {hardware} da IA digital.
O dispositivo pode ser especialmente útil em futuros aplicativos sem fio 6G, como rádios cognitivos que otimizam as taxas de dados, adaptando os formatos de modulação sem fio ao ambiente sem fio.
Ao permitir que um dispositivo de borda execute cálculos de aprendizado profundo em tempo actual, esse novo acelerador de {hardware} pode fornecer acelerações dramáticas em muitos aplicativos além do processamento de sinal. Por exemplo, poderia ajudar os veículos autônomos a fazer reações em segundo lugar às mudanças ambientais ou permitir que marcapassos inteligentes monitorem continuamente a saúde do coração de um paciente.
“There are various purposes that might be enabled by edge units which can be able to analyzing wi-fi indicators. What we have introduced in our paper may open up many potentialities for real-time and dependable AI inference. This work is the start of one thing that may very well be fairly impactful,” says Dirk Englund, a professor within the MIT Division of Electrical Engineering and Pc Science, principal investigator within the Quantum Photonics and Synthetic Intelligence Group and the Analysis Laboratory of Eletrônica (RLE) e autor sênior do papel.
Ele se junta ao artigo do autor Ronald Davis III ’24; Zaijun Chen, um ex -pós -doutorado do MIT que agora é professor assistente da Universidade do Sul da Califórnia; e Ryan Hamerly, cientista visitante da RLE e cientista sênior da NTT Analysis. A pesquisa aparece hoje em Avanços científicos.
Processamento de velocidade leve
Os aceleradores digitais de IA digital de última geração para processamento de sinal sem fio convertem o sinal em uma imagem e executam-a através de um modelo de aprendizado profundo para classificá-lo. Embora essa abordagem seja altamente precisa, a natureza computacionalmente intensiva das redes neurais profundas o torna inviável para muitas aplicações sensíveis ao tempo.
Os sistemas ópticos podem acelerar redes neurais profundas codificando e processando dados usando luz, o que também é menos intensivo em energia que a computação digital. Mas os pesquisadores lutaram para maximizar o desempenho de redes neurais ópticas de uso geral quando usadas para o processamento de sinais, garantindo que o dispositivo óptico seja escalável.
Ao desenvolver uma arquitetura de rede neural óptica especificamente para processamento de sinais, que eles chamam de uma frequência analógica multiplicativa, transformando a rede neural óptica (MAFT-NON), os pesquisadores abordaram esse problema de frente.
O Maft-Non aborda o problema de escalabilidade, codificando todos os dados do sinal e executando todas as operações de aprendizado de máquina no que é conhecido como domínio de frequência-antes que os sinais sem fio sejam digitalizados.
Os pesquisadores projetaram sua rede neural óptica para executar todas as operações lineares e não lineares em linha. Ambos os tipos de operações são necessários para o aprendizado profundo.
Graças a esse design inovador, eles precisam apenas de um dispositivo MAFT-NON por camada para toda a rede neural óptica, em oposição a outros métodos que exigem um dispositivo para cada unidade computacional particular person, ou “neurônio”.
“Podemos encaixar 10.000 neurônios em um único dispositivo e calcular as multiplicações necessárias em um único tiro”, diz Davis.
Os pesquisadores realizam isso usando uma técnica chamada multiplicação fotoelétrica, que aumenta drasticamente a eficiência. Ele também permite que eles criem uma rede neural óptica que possa ser facilmente ampliada com camadas adicionais sem exigir uma sobrecarga additional.
Resulta em nanossegundos
O MAFT-NON toma um sinal sem fio como entrada, processa os dados do sinal e passa as informações para operações posteriores que o dispositivo Edge executa. Por exemplo, ao classificar a modulação de um sinal, o MAFT-NON permitiria que um dispositivo inferir automaticamente o tipo de sinal para extrair os dados que ele carrega.
Um dos maiores desafios que os pesquisadores enfrentaram ao projetar o MAFT-NON foi determinar como mapear os cálculos de aprendizado de máquina para o {hardware} óptico.
“Não podíamos simplesmente tirar uma estrutura regular de aprendizado de máquina da prateleira e usá-la. Tivemos que personalizá-la para ajustá-lo ao {hardware} e descobrir como explorar a física para que ele executasse os cálculos que queríamos”, diz Davis.
Quando testaram sua arquitetura sobre classificação de sinal em simulações, a rede neural óptica alcançou 85 % de precisão em uma única foto, que pode convergir rapidamente para mais de 99 % de precisão usando várias medidas. O Maft-Non exigia apenas cerca de 120 nanossegundos para realizar todo o processo.
“Quanto mais você medir, maior precisão que receberá. Como o MAFT-NON calcula inferências em nanossegundos, você não perde muita velocidade para obter mais precisão”, acrescenta Davis.
Embora os dispositivos de radiofrequência digital de última geração possam executar a inferência de aprendizado de máquina em microssegundos, a óptica pode fazê-lo em nanossegundos ou mesmo picossegundos.
Avançando, os pesquisadores querem empregar o que é conhecido como esquemas de multiplexação para que possam realizar mais cálculos e ampliar o MAFT-NON. Eles também desejam estender seu trabalho a arquiteturas de aprendizado profundo mais complexas que podem executar modelos de transformadores ou LLMs.
Este trabalho foi financiado, em parte, pelo Laboratório de Pesquisa do Exército dos EUA, pela Força Aérea dos EUA, pelo MIT Lincoln Laboratory, Nippon Telegraph e Phone e à Nationwide Science Basis.