‘Sem desempenho de token aqui’ – IA física em 5G privado (tão fácil quanto Raspberry Pi)


A IA física para automação de robôs em fábricas requer modelos matemáticos leves, e não modelos de linguagem que exigem muitos tokens, diz a NTT Information. Não é necessário esperar por GPUs caras, quando as CPUs funcionam bem. Mas precisa de 5G privado para a mobilidade – e, contrariamente aos relatórios, o 5G privado está finalmente a funcionar bem.

Em suma – o que saber:

Equívoco de IA – apesar de toda a conversa sobre a IA física no limite como um impulsionador das vendas de chips de IA, os modelos industriais para robôs não requerem GPUs no native, diz a NTT Information.

Erro de cálculo 5G – depois de alguns anos difíceis e de uma narrativa de mercado que diz o contrário, a indústria privada de 5G ganhou vida ultimamente, avalia a NTT Information.

Redesignação de IoT – tanto o 5G de ponta quanto a IA, assim como o 5G privado e a IA física, fazem parte da ampla disciplina de IoT, sugere a NTT Information – e estão começando a escalar juntos.

Como com o Entrevista com Ericsson na semana passadaquando igualmente pressionado pelo tempo, aqui está um trecho de outra sessão de entrevista, desta vez com Shahid Ahmed, chefe international de serviços de ponta da NTT Information – que, como o da Ericsson, esperançosamente será ampliado, com base na entrevista completa. Mas a discussão ignorou todo um catálogo de intrigas baseadas na borda sobre IoT industrial, 5G privado, IA física, e colocou-as, colectivamente, no meio de todas as outras subtramas modernas de IA que a indústria está a vender. A conclusão, conforme escrito em um artigo de opinião no topo do boletim informativo da semana passada, é que a IA física não precisa de GPUs. A IA física em 5G privado é essencialmente uma disciplina de IoT que funciona bem o suficiente com uma unidade central de processamento (CPU), diz ele.

‘Sem desempenho de token aqui’ – IA física em 5G privado (tão fácil quanto Raspberry Pi)
Ahmed – IA + 5G na borda empresarial

Portanto, não se confunda, diz ele: economize suas GPUs caras para suas grandes cargas de trabalho de TI, gerenciadas localmente ou não. Bem, quem sabia?

Devemos qualificar essa afirmação: a IA física voltada para TO – baseada em modelos baseados em matemática, para cargas de trabalho de automação industrial – não precisa de unidades de processamento gráfico (GPUs) no native, na borda da empresa. Isto parece claro; mas também soa como uma revelação – dada a excitação sobre colocações adjacentes de GPU baseadas em RAN e ‘grade’ para IA física, invadindo a borda da empresa, e o desespero entre a comunidade privada 5G por algum tipo de impulso, enquanto procura implantar os mesmos tipos de casos nos mesmos tipos de lugares, como tem feito há anos. Os comentários de Ahmed são reveladores porque sugerem que a narrativa da IA ​​física (GPUs para robôs empresariais, pelo menos) é exagerada e que a narrativa 5G privada (conectada por celular em espectro privado) não precisa ser salva.

O argumento de Ahmed é que a IA física – pelo menos na Indústria 4.0 – é baseada em modelos matemáticos/físicos computacionalmente leves, que são determinísticos e limitados, e que são executados localmente no native; versus modelos de inferência probabilísticos e ávidos por tokens no estilo LLM. É um jogo totalmente diferente – sobre tipos de modelos, restrições de latência, loops de controle. Ele explica: “A maneira como definimos IA física e IA de borda – que, a propósito, estão dentro do mesmo espectro – é tudo o que tem que acontecer localmente, na borda (da empresa). Onde você não pode, por definição, ter um modelo de linguagem grande. A robótica e a cinemática não usam modelos de linguagem de qualquer maneira. Eles usam modelos baseados em matemática e física para resolver expressões idiomáticas (científicas) específicas – como na eletrodinâmica quântica no nível A. O que significa que eles são pequenos.”

Ele continua: “Você não precisa de uma GPU de alta potência; alguns deles rodam em um Raspberry Pi. O robô não precisa conhecer a capital do Tadjiquistão; ele precisa saber milímetros nos eixos X, Y, Z. Você pode usar qualquer CPU que tiver, e memória native, e pronto. Mas você precisa daquele modelo baseado em matemática, executado localmente – por razões de latência e controle. Você precisa ter o tipo certo de poder de computação de ponta, mas isso é isso. Quero dizer, honestamente, é a IoT com IA. Não é muito mais complicado. Sim, a robótica está chegando – basta olhar para o que está acontecendo na China – e isso está acontecendo primeiro no lado do consumidor, o que é interessante é que vai se mover muito rapidamente para os ambientes de negócios e de fábrica.

“E você precisa de IA física e inferência native, 100 por cento. Mas não será baseada em LLMs. Não há desempenho de token aqui. Estamos falando de modelos matemáticos, comprimidos por sua natureza; menos de um bilhão de parâmetros – versus Claude ou ChatGPT, onde estamos falando de centenas de bilhões, certo? Porque esses são modelos baseados em linguagem. Quero dizer, pergunte a eles o que é igual a a ao quadrado mais b ao quadrado, e eles podem vasculhar a web e dizer que é c ao quadrado, mas não porque eles entendam inerentemente o Teorema de Pitágoras; então você acabou de desperdiçar um monte de fichas.” Talvez RCR foi muito rápido para unir os pontos de IA e 5G no espaço empresarial. Ou talvez os pontos já estivessem unidos, como RCR relatou em sua ampla cobertura de IoT.

Mas mais do que apenas as GPUs serem desnecessárias para robôs (AMRs, AGVs, UAVs, HMIs, humanóides) em locais industriais, a indústria de tecnologia está classificando erroneamente (exagerando) as cargas de trabalho para forçar o ajuste de dispositivos de IA a problemas que já foram resolvidos com a computação clássica. Os requisitos de computação para IA física são bastante modestos e CPUs baseadas em edge em arquiteturas 5G privadas já são suficientes. Mais a seguir; mas Ahmed também aborda este último ponto sobre o mercado privado de 5G, onde o hype ultrapassou a realidade, de novo. Ele está filosófico sobre o estado do mercado, mas também feliz com o fato de ele finalmente estar se recuperando. “Se você me fizesse essa pergunta há 12 ou 18 meses, eu teria dito que é uma luta. Não tínhamos os dispositivos; a disponibilidade do espectro period irregular, na melhor das hipóteses”, diz ele.

“Tínhamos CBRS nos EUA e foi uma dor em todos os outros lugares… Mas avançando rápido, estamos começando a ver isso se ratificar. Existem mais dispositivos; o acesso ao espectro foi praticamente corrigido. No Reino Unido, digamos, você só precisa perguntar ao regulador e, bum, está feito; é um processo de um dia e você obtém o espectro para implantar. Na NTT, pelo menos, estamos começando a ver essa escala. Você escreveu sobre a Cargillonde acabamos de implantar em cerca de 60 locais; bem, estamos analisando mais de 100 websites apenas este ano. E estes não são pequenos websites. São armazéns e fábricas de médio porte – para Cargill, certo? Novamente, coisas de carne e batatas – principalmente apenas para cobertura. Mas estamos falando de mais de 10 pontos de acesso (APs); não são grandes fábricas automotivas, mas qualquer coisa acima de cinco APs é significativa.”

Ele acrescenta: “E não é apenas a Cargill. Quero dizer, Brownsville e Las Vegas – todas estão se expandindo. É mais parecido com o que pensei que veríamos há dois ou três anos, quando começamos. Não havia esse tipo de impulso naquela época, e quase batemos em um muro brand de cara. Tivemos que construir o mercado de várias maneiras.” Além disso, Ahmed diz mais – sobre o trabalho árduo de consultoria e integração para fazer o 5G privado funcionar; sobre a demanda por roaming 5G interpúblico/privado baseado em eSIM; sobre o interesse no novo protocolo de sinal de referência de som (SRS) em 5G NR para unidades RAN para adaptação de hyperlink, agendamento de recursos, gerenciamento de formação de feixe e – o mais importante, para empresas com gêmeos digitais e casos físicos de IA – para posicionamento de ativos.

Como afirmado, RCR tentarei escrever mais sobre a discussão com Ahmed.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *