Hoje, estamos anunciando a disponibilidade geral de Amazon Elastic Compute Cloud (Amazon EC2) Instâncias P6-B200 Alimentado pela NVIDIA B200 para atender às necessidades dos clientes de alto desempenho e escalabilidade em Inteligência Synthetic (AI)Assim, aprendizado de máquina (ML)e Computação de alto desempenho (HPC) Aplicações.
Instâncias Amazon EC2 P6-B200 aceleram uma ampla gama de cargas de trabalho habilitadas para GPU, mas são especialmente adequadas para treinamento de IA distribuído em larga escala e inferência para Modelos de fundação (FMS) Com o aprendizado de reforço (RL) e destilação, treinamento e inferência multimodais e aplicativos de HPC, como modelagem climática, descoberta de medicamentos, análise sísmica e modelagem de riscos de seguro.
Quando combinado com Adaptador de tecido elástico (EFAV4) Rede de rede, agrupamento de hiperescala por Ultraclusters EC2e recursos avançados de virtualização e segurança por Sistema Nitro da AWSvocê pode treinar e servir FMS com maior velocidade, escala e segurança. Essas instâncias também oferecem até duas vezes o desempenho para o treinamento de IA (tempo de treinar) e inferência (tokens/s) em comparação com Instâncias EC2 P5en.
Você pode acelerar o tempo até o mercado para o treinamento da FMS e fornecer taxa de transferência de inferência mais rápida, o que reduz o custo de inferência e ajuda a aumentar a adoção de aplicativos generativos de IA, além de aumentar o desempenho do processamento para aplicativos de HPC.
Especificações de instâncias EC2 P6-B200
As novas instâncias EC2 P6-B200 fornecem oito GPUs NVIDIA B200 com 1440 GB de alta memória GPU de largura de banda, processadores escaláveis da 5ª geração Intel Xeon (Emerald Rapids), 2 TIB da memória do sistema e 30 TB de armazenamento native da NVME.
Aqui estão as especificações para instâncias EC2 P6-B200:
Tamanho da instância | GPUs (NVIDIA B200) | GPU Memória (GB) | vcpus | GPU ponto para par (GB/s) | Armazenamento de instância (TB) | Largura de banda de rede (GBPS) | Largura de banda EBS (GBPS) |
P6-B200.48XLARGE | 8 | 1440 HBM3E | 192 | 1800 | 8 x 3,84 NVME SSD | 8 x 400 | 100 |
Essas instâncias apresentam melhoria de até 125 % nos TFLOPs de GPU, aumento de 27 % no tamanho da memória da GPU e aumento de 60 % na largura de banda de memória da GPU em comparação com as instâncias P5EN.
Instâncias P6-B200 em ação
Você pode usar instâncias P6-B200 no oeste dos EUA (Oregon) Região da AWS através Blocos de capacidade EC2 para ML. Para reservar seus blocos de capacidade EC2, escolha Reservas de capacidade no Console do Amazon EC2.
Selecione Blocos de capacidade de compra para ML e depois escolha sua capacidade complete e especifique quanto tempo você precisa do bloco de capacidade EC2 para P6-B200.48XLARGE instâncias. O número complete de dias em que você pode reservar blocos de capacidade EC2 é de 1 a 14 dias, 21 dias, 28 dias ou múltiplos de 7 até 182 dias. Você pode escolher sua knowledge de início mais antiga com até 8 semanas de antecedência.
Agora, seu bloco de capacidade EC2 será agendado com sucesso. O preço complete de um bloco de capacidade EC2 é cobrado antecipadamente e o preço não muda após a compra. O pagamento será cobrado em sua conta dentro de 12 horas após a compra dos blocos de capacidade EC2. Para saber mais, visite Blocos de capacidade para ML No guia do usuário do Amazon EC2.
Ao lançar instâncias P6-B200, você pode usar AWS Deep Studying Amis (Dlami) para apoiar as instâncias EC2 P6-B200. A Dlami fornece aos profissionais e pesquisadores da ML a infraestrutura e as ferramentas para criar rapidamente aplicativos ML escaláveis, seguros e distribuídos em ambientes pré -configurados.
Para executar instâncias, você pode usar Console de gerenciamento da AWSAssim, Interface da linha de comando da AWS (AWS CLI) ou AWS SDKS.
Você pode integrar instâncias EC2 P6-B200 perfeitamente com vários serviços gerenciados da AWS, como Amazon Elastic Kubernetes Providers (Amazon EKS)Assim, Amazon Easy Storage Service (Amazon S3)e Amazon FSX para brilho. Suporte para Amazon Sagemaker Hyperpod também está chegando em breve.
Agora disponível
As instâncias do Amazon EC2 P6-B200 estão disponíveis hoje na região oeste dos EUA (Oregon) e podem ser adquiridas como Blocos de capacidade EC2 para ML.
Experimente as instâncias do Amazon EC2 P6-B200 no Console do Amazon EC2. Para saber mais, consulte o Página da instância do Amazon EC2 P6 e enviar suggestions para AWS RE: POST para EC2 ou através de seus contatos habituais de suporte da AWS.
– Canal
Como está o weblog de notícias? Pegue isso 1 minuto de pesquisa!
(Esse enquete é hospedado por uma empresa externa. AWS lida com suas informações conforme descrito no Aviso de privacidade da AWS. A AWS possuirá os dados coletados por meio desta pesquisa e não compartilharão as informações coletadas com os entrevistados.)