O desafio de executar simulações e cargas de trabalho de alto desempenho de forma eficiente é um problema constante, exigindo contribuições das partes interessadas, incluindo equipes de infraestrutura, profissionais de segurança cibernética e, claro, diretores financeiros sempre atentos.
A execução desses tipos de tarefas de alta computação geralmente envolve milhares de processos simultâneos e sua execução é cara na infraestrutura tradicional. A última atualização da IBM para seu Cloud Code Engine – o lançamento de frotas sem servidor com suporte de GPU – pode reduzir a complexidade. Eles combinam computação de alto desempenho com um modelo sem servidor gerenciado e pré-pago, onde um ponto de referência é abordado pelo usuário e a implantação necessária em escala ocorre de forma autônoma.
Computação de alto desempenho sem atrito de infraestrutura
As empresas que executam treinamento de IA em larga escala, simulações de risco ou cargas de trabalho generativas estão enfrentando dois problemas, geralmente: acesso limitado à GPU e custos crescentes de infraestrutura/nuvem. Frotas sem servidor oferecem uma alternativa. Em vez de manter clusters de GPU dedicados, as organizações podem enviar grandes lotes de trabalhos de computação por meio de um único endpoint.
O sistema da IBM provisiona máquinas virtuais apoiadas por GPU, executa a carga de trabalho e reduz gradualmente os recursos usados quando concluído. Essa abordagem melhora a utilização e a visibilidade dos custos, afirma a IBM, com os clientes cobrando apenas pelo tempo de execução ativo.
Na prática, isto poderia ajudar as instituições financeiras (por exemplo) com uma modelização de risco mais rápida, ou permitir que as empresas de comunicação social processassem as suas cargas de trabalho sem investir em farms de GPU ou celebrar contratos de arrendamento longos. Para muitos, significa inovação mais rápida e redução das despesas operacionais.
Realidades de implementação
A IBM sugere que as frotas sem servidor podem gerenciar cargas de trabalho em escala “com essencialmente zero equipe de SRE”. Embora ambicioso, o modelo certamente simplifica os detalhes da orquestração. O Code Engine pode determinar o número de instâncias de trabalho necessárias e escalá-las para corresponder ao trabalho exigido. Isso reduz o ajuste normalmente necessário para equilibrar tarefas paralelas de GPU.
A adoção da plataforma, no entanto, exigiria uma supervisão cuidadosa com um olhar atento aos custos – desafios omnipresentes em ambientes sem servidor. As empresas precisarão de uma visibilidade clara dos seus padrões de carga de trabalho comuns, além de estarem cientes de quaisquer problemas de conformidade ao considerarem a terceirização eficaz de trabalhos pesados em GPU para uma nuvem gerenciada.
Contexto de mercado e ecossistema
A IBM se junta a outros hiperscaladores na adaptação de plataformas sem servidor para computação de alto desempenho. A AWS oferece suporte a contêineres apoiados por GPU por meio do Fargate com ECS ou EKS, e o Microsoft Azure oferece contêineres habilitados para GPU em seus aplicativos de contêiner sem servidor. O Cloud Code Engine da IBM é diferente, diz a empresa, suportando aplicativos da net, funções orientadas a eventos e trabalhos em lote com uso intensivo de GPU, todos gerenciados em um único ambiente.
Conclusão executiva
Para CIOs e Diretores de Nuvem, as Frotas Serverless da IBM representam um passo em direção à elasticidade prometida da nuvem e à sua capacidade de lidar com computação de alto desempenho. O modelo poderia pelo menos reduzir as barreiras de entrada para cargas de trabalho pesadas em GPU, especialmente para equipes sem DevOps prontamente disponíveis. No entanto, antes de adotar, os líderes podem considerar alguns ou todos os seguintes itens:
- Quais são os custos comparativos de GPUs sob demanda versus modelos de capacidade reservada?
- A governação e a segurança dos dados são uma questão decisiva?
- Existem métodos de monitoramento de custos que possam controlar as cargas de trabalho gerenciadas?
- Exemplos de cargas de trabalho podem ser testados para testar a escalabilidade e a previsibilidade.
- A oferta da IBM é melhor/mais barata/pior/mais cara do que soluções similares de outros hiperscaladores?
- As cargas de trabalho são adequadas para execução interna e qual poderia ser o OPEX no longo prazo dessa escolha?
A computação GPU sem servidor ainda está evoluindo, mas a abordagem da IBM oferece outra opção para as empresas explorarem IA em grande escala e cargas de trabalho de simulação sem a sobrecarga de considerações de infraestrutura.
(Fonte da imagem: “Buda disse que queria conversar comigo”, de Trey Ratcliff, licenciado sob CC BY-NC-SA 2.0.)
Quer aprender mais sobre Cloud Computing com os líderes do setor? Confira Segurança cibernética e exposição de nuvem acontecendo em Amsterdã, Califórnia e Londres. O evento abrangente faz parte TechEx e co-localizado com outros eventos de tecnologia líderes. Clique aqui para mais informações.
CloudTech Information é desenvolvido por Mídia TechForge. Discover outros eventos e webinars de tecnologia empresarial futuros aqui.
