Comecemos com uma estatística surpreendente: de acordo com a McKinsey, a IA generativa, ou GenAI, acrescentará algo entre 2,6 biliões de dólares e 4,4 biliões de dólares por ano à produção económica international, com as empresas na vanguarda. Quer você seja um fabricante que busca otimizar sua cadeia de suprimentos international, um hospital que analisa dados de pacientes para sugerir planos de tratamento personalizados ou uma empresa de serviços financeiros que deseja melhorar a detecção de fraudes, a IA pode ser a chave para que sua organização desbloqueie novos níveis de eficiência, percepção e criação de valor.
Muitos dos CIOs e líderes de tecnologia com quem conversamos hoje reconhecem isso. Na verdade, a maioria afirma que as suas organizações estão a planear a adoção complete da GenAI nos próximos dois anos. Ainda de acordo com o Índice de preparação para IA da Ciscoapenas 14% das organizações relatam que as suas infraestruturas estão hoje prontas para a IA. Além do mais, impressionantes 85% dos projetos de IA param ou são interrompidos depois de iniciados.
A razão? Há uma grande barreira à entrada. Pode exigir que uma organização reformule completamente a infraestrutura para atender às demandas de casos de uso específicos de IA, desenvolva os conjuntos de habilidades necessários para desenvolver e dar suporte à IA e enfrente o custo adicional e a complexidade de proteger e gerenciar essas novas cargas de trabalho.
Acreditamos que há um caminho mais fácil a seguir. É por isso que estamos entusiasmados em apresentar uma forte linha de produtos e soluções para casos de uso intensivo de dados e desempenho, como treinamento de grandes modelos de linguagem, ajuste fino e inferência para GenAI. Muitas dessas novas adições ao portfólio de infraestrutura de IA da Cisco estão sendo anunciadas em Cúpula de Parceiros Cisco e pode ser encomendado hoje.
Esses anúncios atendem aos requisitos abrangentes de infraestrutura que as empresas têm em todo o ciclo de vida da IA, desde a construção e treinamento de modelos sofisticados até o uso generalizado para inferência. Vejamos como isso funcionaria com os novos produtos que estamos apresentando.
Computação acelerada
Uma jornada típica de IA começa com o treinamento de modelos GenAI com grandes quantidades de dados para construir a inteligência do modelo. Para esta importante etapa, o novo Servidor Cisco UCS C885A M8 é uma potência projetada para enfrentar as tarefas de treinamento de IA mais exigentes. Com sua configuração de alta densidade de GPUs NVIDIA H100 e H200 Tensor Core, juntamente com a eficiência da arquitetura NVIDIA HGX e dos processadores AMD EPYC, o UCS C885A M8 fornece o poder computacional bruto necessário para lidar com conjuntos de dados massivos e algoritmos complexos. Além disso, a sua implementação simplificada e a sua gestão simplificada tornam mais fácil do que nunca para os clientes empresariais adotarem a IA.

Community Material escalável para conectividade de IA
Para treinar modelos GenAI, clusters desses servidores poderosos geralmente trabalham em uníssono, gerando um imenso fluxo de dados que exige uma estrutura de rede capaz de lidar com alta largura de banda com latência mínima. É aqui que o recém-lançado Comutador Cisco Nexus 9364E-SG2 brilha. Sua agregação de 800G de alta densidade garante um fluxo de dados suave entre servidores, enquanto o gerenciamento avançado de congestionamento e os grandes tamanhos de buffer minimizam as quedas de pacotes, mantendo a latência baixa e o desempenho do treinamento alto. O Nexus 9364E-SG2 serve como base para uma infraestrutura de rede altamente escalável, permitindo que os clusters de IA se expandam perfeitamente à medida que as necessidades organizacionais aumentam.

Simplicidade de Compra
Depois que esses modelos poderosos forem treinados, você precisará de infraestrutura implantada para inferência para fornecer valor actual, geralmente em um cenário distribuído de information facilities e pontos de presença. Simplificamos bastante esse processo com os novos Cisco AI PODs que aceleram a implantação de toda a pilha de infraestrutura de IA. Não importa onde você se enquadre no espectro de casos de uso mencionados no início deste weblog, os AI PODs são projetados para oferecer uma experiência plug-and-play com computação acelerada NVIDIA. Os pacotes de infraestrutura pré-dimensionados e pré-validados eliminam as suposições da implantação de inferência de borda, clusters em grande escala e outras soluções de inferência de IA, com mais casos de uso planejados para lançamento nos próximos meses.
Nosso objetivo é permitir que os clientes implantem AI PODs com segurança e previsibilidade em relação ao desempenho, escalabilidade, custo e resultados, ao mesmo tempo que reduzimos o tempo para inferência pronta para produção com uma pilha completa de infraestrutura, software program e conjuntos de ferramentas de IA. AI PODs incluem NVIDIA IA Empresarialuma plataforma de software program nativa da nuvem de ponta a ponta que acelera pipelines de ciência de dados e agiliza o desenvolvimento e a implantação de IA. Gerenciados pelo Cisco Intersight, os AI PODs fornecem controle e automação centralizados, simplificando tudo, desde a configuração até as operações diárias, com mais casos de uso por vir.
Implantado e gerenciado na nuvem
Para ajudar as organizações a modernizarem suas operações de information heart e permitirem casos de uso de IA, simplificamos ainda mais a implantação e o gerenciamento de infraestrutura com o Cisco Nexus Hyperfabric, uma solução de malha como serviço anunciada no início deste ano no Cisco Dwell. O Cisco Nexus Hyperfabric apresenta um controlador gerenciado em nuvem que simplifica o design, a implantação e o gerenciamento da estrutura da rede para desempenho consistente e facilidade operacional. O desempenho acelerado por {hardware} do Cisco Nexus Hyperfabric, com sua alta largura de banda inerente e baixa latência, otimiza a inferência de IA, permitindo tempos de resposta rápidos e utilização eficiente de recursos para aplicações de IA exigentes e em tempo actual. Além disso, os recursos abrangentes de monitoramento e análise do Cisco Nexus Hyperfabric fornecem visibilidade em tempo actual do desempenho da rede, permitindo a identificação e resolução proativa de problemas para manter um ambiente de inferência tranquilo e confiável.

Ao fornecer um conjunto contínuo de soluções, desde servidores de treinamento poderosos e redes de alto desempenho até implantações de inferência simplificadas, estamos permitindo que as empresas acelerem suas iniciativas de IA, liberem todo o potencial de seus dados e impulsionem inovações significativas.
Informações de disponibilidade e muito mais
O servidor Cisco UCS C885A M8 já pode ser encomendado e deverá ser enviado aos clientes até o last deste ano. Os Cisco AI PODs poderão ser encomendados em novembro. O swap Cisco Nexus 9364E-SG2 poderá ser encomendado em janeiro de 2025, com disponibilidade a partir do primeiro trimestre do ano civil de 2025. O Cisco Nexus Hyperfabric estará disponível para compra em janeiro de 2025 com mais de 30 parceiros certificados. O Hyperfabric AI estará disponível em maio e incluirá uma solução de IA plug-and-play que inclui servidores Cisco UCS (com computação acelerada NVIDIA incorporada e software program de IA) e armazenamento VAST opcional.
Para mais informações sobre esses produtos, acesse:
Se você estiver participando do Cisco Accomplice Summit esta semana, visite o showcase de soluções para ver o servidor Cisco UCS C885A M8 e o swap Cisco Nexus 9364E-SG2. Você também pode participar da sessão de insights de negócios BIS08 intitulado “Revolucione o amanhã: liberte a inovação através do poder da infraestrutura preparada para IA” para mais detalhes sobre os produtos e soluções anunciados.
Compartilhar: