Como advogado de desenvolvedor na AWS, trabalhei com muitas organizações corporativas que operam aplicativos críticos em vários Regiões da AWS. Uma preocupação importante que eles frequentemente compartilham é a falta de confiança em sua estratégia de failover de região – seja ela funcionar quando necessário, se todas as dependências foram identificadas e se suas equipes praticaram os procedimentos suficientes. As abordagens tradicionais geralmente os deixam incertas sobre sua prontidão para a mudança regional.
Hoje estou animado para anunciar Amazon Utility Restoration Controller (ARC) O Area Change, um recurso totalmente gerenciado e altamente disponível que permite que as organizações planejem, pratiquem e orquestrem mudanças de região com confiança, eliminando a incerteza em torno das operações de recuperação de regiões cruzadas. A Change de região ajuda a orquestrar a recuperação para seus aplicativos de várias regiões na AWS. Ele fornece uma solução centralizada para coordenar e automatizar tarefas de recuperação nos serviços e contas da AWS quando você precisar alternar as operações do seu aplicativo de uma região da AWS para outra.
Muitos clientes implantam aplicativos críticos de negócios em várias regiões da AWS para atender aos seus requisitos de disponibilidade. Quando um evento operacional afeta um aplicativo em uma região, a troca de operações para outra região envolve a coordenação de várias etapas em diferentes serviços da AWS, como computação, bancos de dados e DNS. Essa coordenação normalmente requer a construção e manutenção de scripts complexos que precisam de testes e atualizações regulares à medida que os aplicativos evoluem. Além disso, orquestrar e rastrear o progresso das alternantes da região em vários aplicativos e fornecer evidências de recuperação bem -sucedida para fins de conformidade geralmente envolve a coleta de dados handbook.
O interruptor da região é construído em uma arquitetura regional de plano de dados, onde os planos de troca de região são executados da região sendo ativada. Esse projeto elimina as dependências da região impactada durante o comutador, fornecendo um processo de recuperação mais resiliente, uma vez que a execução é independente da região da qual você está mudando.
Construindo um plano de recuperação com o interruptor da região do arco
Com o Change da região do ARC, você pode criar planos de recuperação que definem as etapas específicas necessárias para alternar seu aplicativo entre as regiões. Cada plano contém blocos de execução que representam ações nos recursos da AWS. No lançamento, o interruptor da região suporta nove tipos de blocos de execução:
- Plano de interruptor da região ARC Bloco de execução – deixe você orquestrar a ordem em que vários aplicativos alternam para a região que você deseja ativar, referenciando outros planos de troca de região.
- Amazon EC2 Auto Scaling O bloco de execução -escalas da Amazon EC2 compra os recursos em sua região de destino, combinando uma porcentagem especificada da capacidade da sua região de origem.
- ARCO controles de roteamento O bloqueio de execução – troca os estados de controle de roteamento para redirecionar o tráfego usando verificações de saúde do DNS.
- Amazon Aurora Failover international de execução de banco de dados de bancos de dados com o failover de banco de dados com perda de dados potencial ou alternância com zero perda de dados para Banco de Dados World da Aurora.
- Pontos de controle de aprovação de aprovação de aprovação handbook Pontos de controle de aprovação em seu fluxo de trabalho de recuperação, onde os membros da equipe podem revisar e aprovar antes de prosseguir.
- Ação personalizada AWS Lambda Etapas de recuperação personalizadas do bloco de execução, executando as funções Lambda na região de ativação ou desativação.
- Amazon Route 53 Bloco de execução da verificação de saúde – deixe você especificar a quais regiões o tráfego do seu aplicativo será redirecionado durante o failover. Ao executar seu plano de troca de região, o estado da verificação de saúde da Amazon Route 53 é atualizado e o tráfego é redirecionado com base na configuração do DNS.
- Amazon Elastic Kubernetes Service (Amazon EKS) Recursos Bloco de Execução de Recursos – Escalas Kubernetes PODs em sua região de destino durante a recuperação, correspondendo a uma porcentagem especificada da capacidade da sua região de origem.
- Serviço de contêineres elásticos da Amazon (Amazon ECS) O bloco de execução de escala de recursos – escalado as tarefas ECS em sua região de destino, correspondendo a uma porcentagem especificada da capacidade da sua região de origem.
A Change de região valida continuamente seus planos, verificando as configurações de recursos e AWS Id and Entry Administration (IAM) Permissões a cada 30 minutos. Durante a execução, o interruptor da região monitora o progresso de cada etapa e fornece logs detalhados. Você pode visualizar o standing de execução através do painel do interruptor da região e na parte inferior da página Detalhes da execução.
Para ajudá -lo a equilibrar o custo e a confiabilidade, o Area Change oferece flexibilidade na maneira como você prepara seus recursos em espera. Você pode configurar a porcentagem desejada de capacidade de computação para segmentar na região de destino durante a recuperação usando blocos de execução de escala de comutador de região. Para aplicativos críticos que esperam tráfego de surto durante a recuperação, você pode optar por escalar além da capacidade de 100 % e a definição de uma porcentagem menor pode ajudar a alcançar um tempo geral de execução mais rápido. No entanto, é importante observar que o uso de um dos blocos de execução de escala não garante capacidade, e a disponibilidade actual de recursos depende da capacidade na região de destino no momento da recuperação. Para facilitar os melhores resultados possíveis, recomendamos regularmente testar seus planos de recuperação e manter Cotas de serviço em suas regiões de espera.
O Change da região do ARC inclui um painel international que você pode usar para monitorar o standing dos planos de troca de região em sua empresa e regiões. Além disso, há um painel de execuções regionais que exibe apenas execuções na região atual do console. Este painel foi projetado para estar altamente disponível em cada região, para que possa ser usado durante os eventos operacionais.
A Change de região permite que os recursos sejam hospedados em uma conta separada da conta que contém o plano de troca de região. Se o plano usa recursos de uma conta diferente da conta que hospeda o plano, a troca de região usa o executionRole
para assumir o crossAccountRole
para acessar esses recursos. Além disso, os planos de troca de região podem ser centralizados e compartilhados em várias contas usando AWS Useful resource Entry Supervisor (AWS RAM)permitindo o gerenciamento eficiente dos planos de recuperação em toda a sua organização.
Vamos ver como funciona
Deixe -me mostrar como criar e executar um plano de troca de região. Existem três partes nesta demonstração. Primeiro, eu crio um plano de troca de região. Então, eu defino um fluxo de trabalho. Finalmente, eu configuro os gatilhos.
Etapa 1: Crie um plano
Eu navego para a seção do controlador de recuperação de aplicativos do Console de gerenciamento da AWS. Eu escolho Interruptor da região no menu de navegação esquerda. Então, eu escolho Criar plano de troca de região.
Depois de dar um nome ao meu plano, especifiquei um Abordagem de recuperação de várias regiões (ativo/passivo ou ativo/ativo). No modo ativo/passivo, duas réplicas de aplicativos são implantadas em duas regiões, com o tráfego roteado apenas para a região ativa. A réplica na região passiva pode ser ativada executando o plano de comutação de região.
Então, eu seleciono o Região primária e Região de espera. Opcionalmente, posso entrar em um Objetivo do tempo de recuperação desejado (RTO). O serviço usará esse valor para fornecer informações sobre quanto tempo as execuções de plano de troca de região em relação à minha RTO desejada.
Eu entro no Plano de execução Iam papel. Essa é a função que permite que a troca de região chame os serviços da AWS durante a execução. Certifico -me de que a função que eu escolho tenha permissões a ser invocada pelo Serviço e contenha o conjunto mínimo de permissões que permitam a operação do ARC. Consulte o Seção de permissões Iam da documentação Para os detalhes.
Etapa 2: Crie um fluxo de trabalho
Quando os dois Standing de avaliação do plano As notificações são verdes, eu crio um fluxo de trabalho. Eu escolho Construir fluxos de trabalho para começar.
Os planos permitem criar fluxos de trabalho específicos que recuperarão seus aplicativos usando blocos de execução da troca de região. Você pode criar fluxos de trabalho com blocos de execução que executam sequencialmente ou em paralelo para orquestrar a ordem em que vários aplicativos ou recursos se recuperam na região ativadora. Um plano é composto por esses fluxos de trabalho que permitem ativar ou desativar uma região específica.
Para esta demonstração, uso o editor gráfico para criar o fluxo de trabalho. Mas você também pode definir o fluxo de trabalho em JSON. Este formato é mais adequado para automação ou quando você deseja armazenar sua definição de fluxo de trabalho em um sistema de gerenciamento de código -fonte (SCMS) e sua infraestrutura como ferramentas de código (IAC), como como AWS CloudFormation.
Eu posso alternar entre o Projeto e o Código visualizações selecionando a guia correspondente ao lado do Construtor de fluxo de trabalho título. A visualização JSON é somente leitura. Eu projetei o fluxo de trabalho com o editor gráfico e copiei o JSON equivalente para armazená -lo ao lado dos meus arquivos de projeto IAC.
O Change de região lança uma avaliação para validar sua estratégia de recuperação a cada 30 minutos. Ele verifica regularmente se todas as ações definidas em seus fluxos de trabalho terão sucesso quando executadas. Essa validação proativa avalia vários elementos, incluindo permissões de IAM e estados de recursos em contas e regiões. Ao monitorar continuamente essas dependências, a Change de região ajuda a garantir que seus planos de recuperação permaneçam viáveis e identifiquem possíveis problemas antes que eles afetem suas operações reais de troca.
No entanto, assim como um backup não testado não é um backup confiável, um plano de recuperação não testado não pode ser considerado verdadeiramente validado. Embora a avaliação contínua forneça uma base forte, recomendamos fortemente executar regularmente seus planos em cenários de teste para verificar sua eficácia, entender os tempos de recuperação reais e garantir que suas equipes estejam familiarizadas com os procedimentos de recuperação. Esse teste prático é essencial para manter a confiança em sua estratégia de recuperação de desastres.
Etapa 3: Crie um gatilho
Um gatilho outline as condições para ativar os fluxos de trabalho que acabaram de ser criados. É expresso como um conjunto de alarmes em nuvem. Os gatilhos baseados em alarme são opcionais. Você também pode usar o comutador de região com gatilhos manuais.
Na página de interruptor da região no console, eu escolho o Gatilhos guia e escolha Adicione gatilhos.
Para cada região definida em meu plano, eu escolho Adicione o gatilho Para definir os gatilhos que ativarão a região.Finalmente, escolho os alarmes e seu estado (OK ou alarme) que o comutador de região usará para acionar a ativação da região.
Agora estou pronto para testar a execução do plano para alternar as regiões usando o interruptor da região. É importante executar o plano da região que estou ativando (a região alvo do fluxo de trabalho) e usar o plano de dados nessa região específica.
Aqui está como executar um plano usando o Interface da linha de comando da AWS (AWS CLI):
aws arc-region-switch start-plan-execution
--plan-arn arn:aws:arc-region-switch::111122223333:plan/resource-id
--target-region us-west-2
--action activate
Preços e disponibilidade
O interruptor da região está disponível em todas as regiões comerciais da AWS a US $ 70 por mês por plano. Cada plano pode incluir até 100 blocos de execução ou você pode criar planos para orquestrar até 25 planos de crianças.
Tendo visto em primeira mão o esforço de engenharia que é necessário para construir e manter soluções de recuperação de várias regiões, estou emocionado ao ver como a troca da região ajudará a automatizar esse processo para nossos clientes. Para começar com o interruptor da região do arco, Visite o console do ARC e crie seu primeiro plano de troca de região. Para mais informações sobre a troca de região, visite o Documentação do controlador de recuperação de aplicativos da Amazon (ARC). Você também pode entrar em contato com a equipe da sua conta do AWS com perguntas sobre o uso do Change de região para seus aplicativos de várias regiões.
Estou ansioso para ouvir sobre como você usa a mudança de região para fortalecer a resiliência de seus aplicativos de várias regiões.