Por que construímos a Safe AI Manufacturing unit com NVIDIA
Há um ano, no NVIDIA GTC, a Cisco e a NVIDIA apresentaram o Fábrica segura de IA da Cisco com NVIDIA. Na altura, o desafio para as empresas period claro: a IA estava a passar de projetos científicos para prioridade estratégica, mas a infraestrutura e o software program estavam fragmentados. Os clientes estavam lutando com a complexidade de montar clusters de computação massivos para treinamento, otimização e inferência, garantindo ao mesmo tempo que seus dados permanecessem seguros e privados.
Para resolver isso, a Safe AI Manufacturing unit com NVIDIA foi construída com base em PODs de IA da Cisconossa arquitetura de referência modular baseada em projetos validados pela Cisco e compatível com Arquiteturas de referência corporativa da NVIDIA. Ao integrar a rede, a computação e o armazenamento de parceiros da Cisco com a infraestrutura e o software program de IA da NVIDIA, o AI POD full-stack permite que as empresas implantem perfeitamente aplicativos de IA com segurança de nível empresarial incorporada à estrutura. Incorporado em cada camada da arquitetura de referência e envolvido nela está o portfólio de recursos de segurança e observabilidade da Cisco. Ele fornece às empresas um caminho confiável, seguro e robusto para treinamento, otimização e inferência no knowledge middle principal.
A ascensão de multiagentes em todos os lugares
Nos últimos doze meses, o panorama da IA empresarial mudou. Fomos além dos simples chatbots generativos de IA e agora transitamos para a period dos agentes autônomos que conduzem funções críticas para os negócios. O principal motivador hoje é a necessidade de executar esses sistemas multiagentes em qualquer lugar: no núcleo, na nuvem e, cada vez mais, na borda.
No entanto, esta mudança revelou um enorme obstáculo: a segurança é atualmente a maior barreira à adoção empresarial de agentes de IA.
Ao contrário de um chatbot padrão, um agente é autônomo; ele tem o poder de invocar APIs, acessar knowledge lakes e tomar decisões, permitindo assim que as equipes reduzam o tempo de obtenção de valor. Esses agentes contam com modelos de linguagem grande (LLMs) e modelos de linguagem pequena (SLMs) para fornecer contexto de raciocínio. Se o modelo que fornece esse contexto for atacado ou falhar, o impacto será catastrófico:
- Tomada de decisão operacional comprometida: Se um agente que gerencia a logística do armazém for sequestrado por meio de injeção imediata, ele poderá ser manipulado para autorizar prioridades de envio incorretas ou estoque “fantasma”, levando a uma erosão significativa das margens e a pedidos de clientes não atendidos.
- Estagnação crítica do fluxo de trabalho: Em um ambiente de alta velocidade, se um modelo de borda falhar ou seu raciocínio for corrompido, o processo automatizado será interrompido. Para um armazém, isso significa que os caminhões não estão carregados e a cadeia de suprimentos fica paralisada, impactando diretamente os resultados trimestrais.
- Exposição regulatória e de conformidade: Os agentes que operam na borda geralmente lidam com dados confidenciais. Uma violação de segurança que leve à exfiltração de informações de identificação pessoal (PII) ou modelos preditivos proprietários pode resultar em multas regulatórias massivas e na perda permanente da confiança do cliente.
Estendendo o Safe AI Manufacturing unit do núcleo até a borda
Para enfrentar esses desafios, a Cisco está anunciando a expansão do Cisco Safe AI Manufacturing unit com NVIDIA, do knowledge middle até a borda, garantindo que a segurança acompanhe o agente em todo o espectro multiagente.
Com o Cisco AI Protection, oferecemos uma postura de segurança consistente, independentemente da localização. Esteja um agente executando um LLM de trilhões de parâmetros no knowledge middle ou um SLM especializado em um armazém remoto, a Cisco garante que o modelo seja validado e os prompts sejam higienizados em tempo actual.


Uma nova arquitetura de referência: previsão de rupturas de estoque para armazéns de varejo ou manufatura com Cisco Safe AI Manufacturing unit com NVIDIA e seu ecossistema ISV
Embora o Cisco AI POD forneça um mecanismo de alto desempenho no knowledge middle, um novo desafio para algumas organizações reside no armazém. Na GTC, mostramos como uma equipe de armazenamento pode aproveitar a arquitetura da Cisco e de parceiros para encontrar valor por meio da visibilidade: saber o momento exato em que ocorre uma ruptura de estoque ou surge um risco à segurança antes que afete o turno da manhã. Para a TI, o desafio é preencher a lacuna entre TI e TO, implantando e protegendo a IA em centenas de locais remotos sem criar um pesadelo de gerenciamento. Ampliar a visibilidade e as operações do knowledge middle central até a borda envolve mais do que apenas {hardware}; trata-se de levar a inteligência certa à pessoa certa, de forma segura e em grande escala.
Estamos demonstrando essa expansão por meio de uma solução actual que amplia o Modelo de armazém inteligente multiagente NVIDIA no GTC, San José. Esta demonstração mostra como agentes especializados podem preencher a lacuna entre as camadas de TI e TO.


Como os componentes da solução se coordenam
O fluxo de trabalho começa na borda, onde Vaidio atua como os “olhos” do armazém, monitorando feeds de vídeo para eventos como rupturas de estoque de paletes. Quando um evento de falta de estoque ou estoque baixo é detectado, o Vaidio aciona uma chamada de API REST para um agente Aible em execução localmente no Cisco Unified Edge. Este agente usa um SLM para fornecer contexto de raciocínio imediato – decidir se uma ruptura de estoque é crítica o suficiente para interromper uma remessa pendente. Se for necessária uma ação, o agente de borda envia um ping para um agente principal no Cisco AI POD hospedado no knowledge middle, que consulta o knowledge lake corporativo e o LLM para calcular o impacto na receita.
Para o gerente de armazém, isso elimina totalmente a lacuna de TI/TO. Em vez de cruzar planilhas manualmente ou descobrir prateleiras vazias tarde demais, o gerente tem um assistente digital 24 horas por dia, 7 dias por semana, que identifica problemas, calcula o custo do negócio e aciona um pedido rápido automaticamente, eliminando o “inventário fantasma” e mantendo a cadeia de suprimentos em movimento.


A arquitetura da solução
- Vaidio (os olhos): Executando em nós Cisco Unified Edge (3-4 nós por web site), Vaidio os contêineres de visão computacional utilizam GPUs NVIDIA L4 para monitorar o chão em busca de rupturas de estoque ou riscos de segurança. Esta arquitetura de ponta será atualizada com o novo Edição de servidor NVIDIA RTX PRO 4500 Blackwell GPUs apresentadas no GTC.
- Aible (o cérebro): Uma plataforma de agente que orquestra o fluxo de trabalho em toda a borda e no núcleo. Quando o Vaidio detecta um problema por meio de uma API RESTful, um Aível o agente na borda usa um SLM native (como Nemotron-3 Nano ou Llama 3.3) para fornecer contexto de raciocínio imediato.
- Cisco AI POD (o núcleo): Para modelagem preditiva pesada, os agentes de borda se comunicam com o AI POD principal (alimentado pela infraestrutura de IA da NVIDIA, como servidores Cisco UCS com NVIDIA Blackwell ou NVIDIA Blackwell Extremely). Este agente central de longa duração desenvolvido pela Aible entende como equilibrar o impacto das rupturas de estoque em relação ao custo do envio rápido, consulta o knowledge lake do armazém para tomar as decisões corretas com base no impacto na receita e invoca APIs de envio.
- O pacote de implantação: A implantação aproveita o Kubernetes 1.34 no Ubuntu 24.04 LTS com NVIDIA Driver 580.95.05, tudo gerenciado centralmente por meio do Cisco Intersight.
Cisco AI Protection e segurança abrangente para agentes e aplicações de IA
Há uma nova realidade nas empresas: sistemas multiagentes. E a Cisco é o único fornecedor que incorpora segurança na estrutura do Cisco Safe AI Manufacturing unit com NVIDIA, protegendo tudo, desde a infraestrutura até os agentes que nela vivem.
Cisco Defesa de IA fornece uma blindagem de camada dupla do knowledge middle até a borda:
- Integridade e digitalização do modelo: O AI Protection verifica os LLMs e SLMs por meio de suas APIs/endpoints expostos. Isso identifica vulnerabilidades potenciais em arquivos de modelo e identifica a “lista de materiais de IA” (AI-BOM) para garantir a integridade da cadeia de suprimentos.
- Protetores de tempo de execução: À medida que os agentes se comunicam, o AI Protection aplica políticas em tempo actual para higienizar prompts e respostas. Ele detecta injeções imediatas, evita a geração de conteúdo tóxico e garante que dados confidenciais — incluindo PII, PHI e PCI — nunca saiam do ambiente seguro.
- Segurança da plataforma: Borda Unificada Cisco adiciona uma camada de proteção física e de firmware, incluindo raízes de confiança de firmware, painéis de bloqueio com detecção de intrusão e Intel TDX/SGX para computação confidencial.
A solução de agente distribuído Aible destacada acima se beneficiou de todas as três camadas de segurança. Ele foi executado com segurança nos servidores Cisco Unified Edge e Cisco AI POD. Os modelos usados por ele no núcleo e na borda foram digitalizados pela AI Protection. Todas as interações do modelo de linguagem dos agentes no núcleo e na borda usaram as proteções de tempo de execução por padrão.
O futuro dos multiagentes em todos os lugares
A mudança para a IA multiagente representa a próxima revolução industrial da inteligência. Ao resolver os desafios da implantação de borda e da segurança do modelo, a Cisco está ajudando os clientes a passar da fase experimental e entrar na produção no mundo actual.
Ao dar vida ao modelo do NVIDIA Multi-Agent Clever Warehouse na arquitetura Cisco, estamos finalmente entregando o “chocolate” para ambos os lados do negócio. O gerente de armazém ganha um coordenador digital 24 horas por dia, 7 dias por semana, por meio do Vaidio e do Aible, que automatiza fluxos de trabalho críticos e elimina o “inventário fantasma”. Simultaneamente, o funcionário de TI ganha uma plataforma segura e “livre de desvios” gerenciada com Cisco Intersight e protegida pelo AI Protection. Esta não é apenas uma conquista técnica; é uma solução pronta para produção que transforma o potencial da IA em uma vantagem competitiva para toda a empresa.
Fique ligado em nosso próximo white paper técnico, que fornecerá um mergulho profundo na arquitetura da Safe Multi-Agent AI Manufacturing unit.
Pronto para acelerar seu tempo de obtenção de valor? Entre em contato com seu representante de conta da Cisco hoje mesmo para saber como estender sua estratégia de IA segura do núcleo até a borda ou clique em aqui para saber mais sobre o Cisco Safe AI Manufacturing unit com NVIDIA.