Os enormes investimentos em IA recentemente começam a parecer uma bolha. Sim, claro, haverá uma correção. Mas depois das bolhas tecnológicas, normalmente sobra algo útil que pode ser uma potência económica nas próximas décadas.
Nos anos 1800, foram construídas ferrovias em todo o mundo, criando uma infra-estrutura duradoura que permitiu um enorme crescimento económico. As pessoas esquecem que os trilhos da Califórnia foram construídos com trilhos de bitola estreita, apoiando a bolha da mineração de ouro. A ferrovia de bitola estreita period a maneira mais barata de construir uma trilha montanha acima para extrair minério. O CAPEX de construção dos trilhos foi mais importante do que o pobre OPEX de conduzir os trens lentamente montanha abaixo. Mas estas ferrovias foram deixadas como relíquias obsoletas quando o mundo dos transportes avançou… elas usaram o padrão errado e foram localizadas em lugares errados para uso moderno.
Da mesma forma, na década de 1990, assistimos a outra enorme construção de infra-estruturas com construção de fibra nos Estados Unidos. A bolha pontocom estourou em 2000-01, mas a fibra permaneceu no solo. Constitui hoje a espinha dorsal da nossa “superestrada da informação”. Fizemos várias atualizações nos transceptores, mas a fibra de vidro é a mesma que foi colocada no solo há 30 anos.
Em ambos os casos, a “borda” das redes ferroviárias e de fibra foram descartadas após pouco tempo e substituídas por outra coisa. Mas a espinha dorsal central permaneceu. A Ferrovia Transcontinental através do Promontory Summit continua sendo uma rota comercial importante hoje. Os feixes de fibra entre São Francisco e Chicago também são muito utilizados.
Considere o increase da IA que está acontecendo agora. Todos sabem que se trata de uma bolha… mas os jogadores continuam a avançar, cada um esperando que a sua peça seja a infra-estrutura duradoura que restará após o rebentamento da bolha.
Pense nisto: a própria GPU é como um vagão de trem ou um transceptor de fibra óptica. Será útil por alguns anos e depois será atualizado para algo melhor. A GPU não será a infraestrutura duradoura… mas a infraestrutura física será reutilizada. O centro de dados, a central hidroeléctrica ou geotérmica e a fibra que o liga serão equivalentes a vias férreas ou cabos de fibra óptica… activos que criam uma plataforma económica duradoura. Novamente, é a infraestrutura centralizada que permanecerá, porque é muito difícil prever exatamente o que será necessário na periferia.
Olhando para aplicativos de IAa computação sensível à latência e à segurança mais importante está acontecendo no dispositivo:
- Estamos executando modelos de IA em nossos telefones;
- Os novos carros têm enorme potência computacional para otimizar sua potência física e
- Os óculos AI/AR estão se tornando muito mais atraentes para o consumidor.
Esses aplicativos executam inferências localmente no dispositivo, apoiados por gigantescos modelos de IA em knowledge facilities centralizados, a milhares de quilômetros de distância. Isso nos deixa com muito pouca “computação de ponta” no meio. Como expomos detalhadamente em um novo relatório divulgado esta semanaexiste um papel para as empresas de telecomunicações na “IA soberana” ou “Sovereign Edge Computing” para satisfazer o desejo de controlo nacional sobre as cargas de trabalho computacionais. Mas a natureza das aplicações atuais simplesmente não exige computação de ponta em nível de vizinhança com baixa latência. Investimento a nível nacional e no dispositivo, mas um deserto no meio.
As coisas vão mudar.
Uma coisa que provavelmente mudará: os modelos de IA precisarão de atualizações de enormes conjuntos de dados de treinamento. Os dispositivos não serão capazes de armazenar todos os dados necessários, portanto, os modelos menores executados em um dispositivo precisarão de acesso cada vez mais rápido aos dados de um datalake e modelo de IA mais central.

É aí que a visão 5G/6G para a rede móvel finalmente acontecerá. Isso ainda não está acontecendo… todos nós podemos ver que não há receita para GPU como serviço de baixa latência hoje, então as empresas de telecomunicações gastariam de US$ 15 a 20 mil em um computador ARC para cada website de celular seria um desperdício. Mas à medida que os modelos melhoram, o mecanismo de inferência no dispositivo precisará de entradas mais ricas. Não estaremos dispostos a fazer com que os modelos de IA esperem 100 ms ou mais para cada coleta de dados… então isso levará à necessidade de algo na borda da rede.
Isso levará 5 anos? 10 anos? Eu não sei ainda.
O que posso dizer é que o wi-fi segue um padrão. Primeiro, uma empresa gera receitas de centenas de milhares de milhões com fios – e depois retiramos os fios. Aconteceu com voz, depois com e-mail, depois com Web e finalmente com vídeo. Agora podemos fazer em um dispositivo sem fio qualquer coisa que fosse feita com fios.
Por que pensaríamos que a IA se desenvolveria de uma maneira diferente? Parece claro que o modelo de negócios e o ecossistema da IA se desenvolverão com enormes modelos centralizados de trilhões de dólares, vagamente acoplados a modelos menores em dispositivos portáteis. Quando esse mercado crescer o suficiente, as aplicações começarão a exigir algo entre o modelo central de IA e o aparelho… algum recurso na zona morta entre os dois extremos.
Acredito que a parceria Nvidia/Nokia poderá ser muito importante em 2035. Não creio que seja sensato para a Nokia apostar toda a sua divisão móvel na plataforma ARC no curto prazo. Mas poderá levar ao produto estratégico certo a longo prazo.