Atualizações sem tempo de inatividade – Redefinindo sua experiência de atualização de plataforma


A Cloudera revelou recentemente a versão mais recente do Cloudera Non-public Cloud Base com o recurso Zero Downtime Improve (ZDU) para aprimorar sua experiência de usuário. O objetivo do ZDU é tornar as atualizações mais simples para você e seus stakeholders aumentando a disponibilidade dos serviços da Cloudera.

Como manter a infraestrutura de TI (e os barramentos) funcionando e evitar o tempo de inatividade?

Antes de mergulhar nas profundezas da ZDU, deixe-me fornecer uma analogia inspirada por um cliente. Os cidadãos de grandes cidades dependem muito de seus sistemas de metrô locais para planejar suas vidas cotidianas. As pessoas precisam ir ao trabalho, ir ao médico e fazer compras, e cabe ao departamento de transporte native garantir que cheguem aos seus destinos de forma confiável. Gerenciar a infraestrutura de TI começa a parecer a infraestrutura de transporte de uma cidade quando você percebe que os usuários finais também dependem da confiabilidade dos sistemas de TI para concluir o trabalho e chegar em casa no horário. As organizações de TI têm a tarefa ingrata de garantir que a infraestrutura esteja atualizada e corrigida contra as vulnerabilidades mais recentes, enquanto o tempo de inatividade é mantido no mínimo. Da mesma forma, as agências de transporte reduzem o tempo de inatividade por meio de inovações como sistemas de enchimento automático de pneus; então, está na hora de inovarmos também. Isso levanta a questão: se os clusters são como ônibus, como eu encho os pneus enquanto o ônibus está a caminho? Ou seja, como eu mantenho minha infraestrutura funcionando e evito o tempo de inatividade?

Insira atualizações com tempo de inatividade zero

O ZDU é uma resposta às crescentes demandas sobre infraestrutura de TI trazidas por stakeholders internos e clientes externos se tornando globais. Os dias em que a infraestrutura de TI podia ser derrubada à noite ou nos fins de semana para aplicar atualizações estão desaparecendo. Semelhante a como um ônibus precisa de ajustes, a infraestrutura de TI precisa de manutenção para executar grandes atualizações, aplicar melhorias de desempenho para dimensionar cargas de trabalho ou corrigir vulnerabilidades para manter seus ambientes seguros. A Cloudera ajuda você com essa manutenção, fornecendo melhorias e patches de vulnerabilidade em Service Packs e Hotfixes Cumulativos (CHFs) <Weblog de Hotfix cumulativo>. Embora aplicar Service Packs e CHFs seja um processo direto, você precisa reiniciar os serviços. Portanto, o Cloudera Non-public Cloud Base precisa adotar uma mudança elementary no processo de atualização e patch para reduzir e, eventualmente, eliminar o tempo de inatividade da carga de trabalho.

O ZDU não é a primeira experiência da Cloudera em fornecer a capacidade de atualizar serviços sem tempo de inatividade. Atualizações e reinicializações contínuas estão disponíveis em serviços como HDFS e YARN. Esse recurso, que ainda está disponível no Cloudera Non-public Cloud Base, permite que os usuários reiniciem alguns dos serviços fundamentais da Cloudera com capacidade reduzida e sem tempo de inatividade

Mergulhando em atualizações com tempo de inatividade zero

Com esse contexto, vamos mergulhar em como o ZDU no Cloudera Non-public Cloud Base mantém seus usuários finais “no ônibus” enquanto realizam manutenção crítica. O ZDU permite que os administradores da plataforma realizem grandes atualizações, apliquem service packs e hotfixes cumulativos com tempo de inatividade mínimo ou nenhum. A primeira inovação dessa experiência foi melhorar o processo de atualização do Cloudera Supervisor. A sequência de atualização do serviço é otimizada para levar em conta as dependências do serviço e limitar o tempo em que um serviço experimenta capacidade reduzida. Essas otimizações melhoram o tempo de atualização, seja executando uma atualização common de tempo de inatividade whole ou a experiência do ZDU. Em seguida, os serviços são aprimorados para adicionar a capacidade de atualização sem tempo de inatividade ou reduzir a quantidade de tempo de inatividade que alguém pode experimentar.

Vamos falar sobre o que você deve esperar durante uma atualização com tempo de inatividade zero. Ao iniciar uma atualização com o Cloudera Supervisor, você primeiro verá uma página de lista de verificação para garantir que seu cluster esteja pronto para uma atualização. Após concluir a lista de verificação, você pode executar uma atualização common ou com tempo de inatividade zero. Assim que o ZDU começar, o Cloudera Supervisor começará a atualizar os serviços em dois estágios. Primeiro, os serviços que passarão por algum tempo de inatividade serão atualizados. Isso garante que qualquer tempo de inatividade do serviço seja previsível e só seja experimentado no início da janela de atualização. Em seguida, o Cloudera Supervisor executará atualizações no restante dos serviços que passarão por capacidade reduzida, mas tempo de inatividade zero. Quando o Cloudera Supervisor conclui a sequência de comandos, a validação do cluster pelos administradores pode ocorrer de forma muito semelhante a uma atualização common antes de ser finalizada. Se ocorrerem problemas durante o processo, o Cloudera Non-public Cloud Base agora oferece suporte a downgrades para permitir que um cluster adote a versão anterior sem perder nenhum metadado.

A equipe da Cloudera é apaixonada por ajudar você a enfrentar com confiança seus desafios mais difíceis de dados e IA. Este primeiro passo para atualizações de tempo de inatividade zero é uma grande conquista no fornecimento de uma experiência revolucionária para equipes de administração de cluster. Em última análise, nosso objetivo é fornecer a você as ferramentas para manter os ônibus circulando e os passageiros se movendo para que todos possamos chegar em casa no horário.

Para saber mais, visite nosso página do produto.

Atualizações sem tempo de inatividade – Redefinindo sua experiência de atualização de plataforma

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *