Alibaba revela pesquisas sobre ferramentas para cortar interrupções e custos de nuvem


A Alibaba diz que seu novo software program de baixo nível reduziu as interrupções da rede, reduziu os custos de balanceamento de carga e melhorou o desempenho inteligente, mudando cargas de trabalho para infraestrutura subutilizada. Conforme relatado por O registroa empresa descreveu seus resultados em três trabalhos de pesquisa que planeja apresentar na Conferência SigComm na próxima semana.

Um dos artigos introduz um sistema chamado Zooroute, projetado para manter as redes em nuvem em execução quando ocorrem falhas. Os pesquisadores da Alibaba o descrevem como “um serviço de recuperação de falhas rápidas que garante o desvio world em redes em nuvem em larga escala em segundos”.

As falhas de rede são um fato da vida para os operadores de nuvem; portanto, a rapidez com que os provedores podem responder faz a diferença. As abordagens atuais como redirecionamento rápido ou engenharia de tráfego são medidas em segundos e minutos, diz a empresa. Para usuários finais, isso ainda pode significar interrupções ou sessões perdidas. Por esse motivo, alguns inquilinos desenvolveram seus próprios métodos de backup, geralmente pagando por recursos redundantes ou mudando a maneira como seus aplicativos interagem com as redes. Ambas as opções adicionam custo e complexidade.

Zooroute tenta resolver isso constantemente investigando a rede para caminhos alternativos. Se um hyperlink diminuir, o sistema já sabe qual caminho está disponível e pode redirecionar o tráfego imediatamente. O artigo observa que o Alibaba Cloud usou Zoorte na produção por 18 meses e, durante esse período, reduziu o tempo geral de interrupção em mais de 92%.

Balanceamento de carga mais suave com Hermes

Outro esforço de pesquisa se concentra em Hermes, um sistema que aborda ineficiências nos balanceadores de carga da camada 7. Os dispositivos são centrais para as redes em nuvem modernas, distribuindo milhões de solicitações aos servidores e trabalhadores disponíveis. Os métodos tradicionais usam ferramentas Linux como o Epoll para passar as conexões do kernel para os trabalhadores do espaço do usuário. Embora confiáveis, isso pode criar gargalos e fazer com que alguns trabalhadores fiquem sobrecarregados enquanto outros estão ociosos.

Nas redes da Alibaba Cloud, Hermes apresenta uma nova camada de agendamento com base no EBPF, uma tecnologia Linux que permite que as tarefas sejam executadas dentro do kernel. Ao filtrar os pedidos antes de chegarem aos trabalhadores, Hermes pode priorizar qual tráfego é tratado primeiro e espalhá -lo de maneira mais uniforme. Nos testes, essa abordagem reduziu os desequilíbrios da CPU em cerca de 90percente reduziu a contagem de conexões desiguais em mais de 99%.

Para os operadores, os resultados são tangíveis. O trabalhador “Hangs” – onde os processos ficam presos e precisam de intervenção – caíram quase 100%. Ao mesmo tempo, o custo da infraestrutura de balanceamento de carga da camada 7 caiu quase 19%. As melhorias apontam para um desempenho mais estável para inquilinos e menores custos operacionais para os fornecedores.

Smartnics mais inteligentes com Nezha

O terceiro artigo apresenta Nezha, um sistema distribuído para equilibrar cargas de trabalho no Smartnics. Os cartões de rede equipados com seus próprios processadores são amplamente utilizados em grandes ambientes em nuvem. Eles assumem funções de rede e armazenamento, liberando ciclos de processador.

Nas operações da Alibaba Cloud, alguns Smartnics ficaram sobrecarregados enquanto outros estavam subutilizados. Nezha aborda o problema monitorando o uso e movendo tarefas de Smartnics ocupados para aqueles com capacidade sobressalente.

Os pesquisadores escrevem que a implantação de Nezha custa apenas uma fração da adição de novo {hardware}. Eles também relatam que Nezha melhorou o desempenho, removendo gargalos de comutadores virtuais em execução no SmartNics e empurrando -os para a pilha de kernel da máquina digital, onde são mais fáceis de gerenciar.

O que significa pesquisa em nuvem do Alibaba para os provedores

Tomados em conjunto, os três sistemas demonstram como grandes fornecedores como o Alibaba estão tentando espremer mais eficiência e confiabilidade da infraestrutura existente. As interrupções e gargalos têm um impacto direto na confiança do cliente e causam gastos desnecessários de {hardware}.

A pesquisa da empresa destaca a crescente importância das técnicas baseadas em software program para gerenciar redes de nuvem complicadas.

(Foto por Evaluate a fibra)

Veja também: Alibaba Cloud se expande na Coréia do Sul com o Second Knowledge Middle

Alibaba revela pesquisas sobre ferramentas para cortar interrupções e custos de nuvemAlibaba revela pesquisas sobre ferramentas para cortar interrupções e custos de nuvem

Deseja aprender mais sobre a computação em nuvem dos líderes da indústria? Confira Cyber ​​Safety & Cloud Expo Ocorrendo em Amsterdã, Califórnia e Londres. O evento abrangente faz parte de TechEx e é co-localizado com outros eventos de tecnologia líder, clique aqui Para mais informações.

CloudTech Information é alimentado por TechForge Media. Discover outros próximos eventos e webinars de tecnologia corporativa aqui.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *