Nvidia revela o Rubin CPX de 30 petaflop para janelas de contexto em escala de um milhão de toalhas



Nvidia revela o Rubin CPX de 30 petaflop para janelas de contexto em escala de um milhão de toalhas

A NVIDIA anunciou um novo processador gráfico que, ele espera, fornece o poder computacional necessário para o “processamento maciço de contexto” em sistemas de inteligência artificial-para uma escala reivindicada de um milhão.

“A plataforma Vera Rubin marcará outro salto na fronteira da IA ​​Computing-introduzindo a GPU Rubin da próxima geração e uma nova categoria de processadores chamada CPX”, diz Jensen Huang, fundador da NVIDIA e diretor executivo da empresa. “Assim como os gráficos revolucionados e a IA física revolucionou, o Rubin CPX é o primeiro propósito de GPU da CUDA para a IA enorme de contexto, onde os modelos argumentam entre milhões de tokens de conhecimento ao mesmo tempo”.

Os grandes modelos de idiomas (LLMS) sustentando os atuais manipuladores estatísticos de token: treinados em vastos tesouros de dados frequentemente ilegitimamente generados, eles resumem tudo em “tokens”-então, quando apresentados com uma entrada que ela se transformou em contínuos, com a maior parte do estatal. Se tudo correu bem, esses tokens representam uma resposta para sua consulta; Caso contrário, eles representam um objeto em forma de resposta que, o LLM sendo totalmente incapaz de qualquer coisa semelhante ao pensamento ou raciocínio, independentemente das reivindicações dos departamentos de advertising and marketing, terá pouca ou nenhuma semelhança com fatos ou realidade.

Quanto mais tokens você puder fornecer, maior será a probabilidade de o fluxo de token em forma de resposta fornecido-mas a complexidade computacional aumenta, deixando a maioria dos modelos limitados a “janelas de contexto” relativamente pequenas. É aí que Rubin, nomeado para astrônomo e físico Vera Rubin, entra, com a NVIDIA alegando que fornece uma maneira de escalar LLMs e outros modelos generativos de IA – incluindo modelos de geração de imagens e vídeos, que funcionam da mesma forma – com janelas de contexto de até um milhão de tokens.

O Rubin CPX, a NVIDIA, reivindica, oferece até 30 operações de ponto flutuante de PETA por segundo (PETAFLOPS) de computação de precisão NVFP4 e inclui 128 GB de memória GDDR7-trocando o desempenho da memória de alta largura de banda pela capacidade de abordar mais na placa. Comparado aos sistemas Grace-Blackwell GB300 NVL72 da NVIDIA, a empresa diz que pode oferecer um triplo no desempenho da atenção-a capacidade de um modelo de processar sequências de contexto.

A empresa não espera que ninguém use um único Rubin CPX: Nvidia imagina as placas combinadas com GPUs rubin não CPX e CPUs vera, mostrando uma implementação de rack totalmente estoque dublada a verra rubin nvl144 cpx-uma combinação de 144 e 44 rubina CPX GPUS, 144 Plain Rubin P. NVFP4 Compute. Embora seja improvável que isso seja barato, a NVIDIA reivindica ousada reivindicação de lucratividade: US $ 100 milhões gastos em seu {hardware} baseado em Rubin poderiam entregar, a empresa afirma “até” US $ 5 bilhões em receita.

Mais informações sobre o rubin cpx estão disponíveis no weblog técnico de desenvolvedor da NVIDIA; Espera-se que o {hardware} fique disponível no remaining do próximo ano-a um preço anunciado por adolescentes.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *