No ultimate da semana passada, o mundo da tecnologia testemunhou uma interrupção significativa causada por uma atualização defeituosa do CrowdStrike, uma empresa de software program de segurança cibernética que se concentra na proteção de endpoints, cargas de trabalho em nuvem, identidade e dados. Esta atualização levou a interrupções globais de TI, afetando severamente vários setores, como bancos, companhias aéreas e assistência médica. Muitas organizações descobriram que seus sistemas ficaram inoperantes, destacando a importância crítica da resiliência e confiabilidade do sistema.
No entanto, em meio a essa interrupção, um cliente da Cloudera relatou que, embora muitos de seus sistemas tenham sido impactados, a pilha de dados em movimento da Cloudera demonstrou especificamente resiliência notável, não apresentando tempo de inatividade. Aqui, discutiremos brevemente o incidente e como a Cloudera protegeu as cargas de trabalho analíticas mais críticas de seus clientes de um possível tempo de inatividade.
O incidente: uma breve visão geral
O incidente CrowdStrike, que resultou de uma atualização problemática em sua plataforma Falcon, causou problemas generalizados de compatibilidade com os sistemas Microsoft. Isso resultou em vários sistemas experimentando a infame “tela azul da morte” do Home windows, entre outras falhas operacionais. Embora esse incidente não tenha envolvido um ataque cibernético, a falha técnica levou a interrupções significativas nas operações globais.
Resiliência da Cloudera – Dados em movimento e toda a plataforma de dados da Cloudera
O cliente da Cloudera relatou que, apesar de muitos de seus sistemas terem caído, os serviços da Cloudera em execução em instâncias Linux na Amazon Net Companies (AWS) permaneceram ativos e funcionais. Esses serviços incluíam sua pilha de dados em movimento, mas é importante observar que toda a plataforma da Cloudera e todos os serviços de dados de nuvem híbrida são igualmente resilientes, em grande parte devido ao foco da Cloudera em alta disponibilidade, tolerância a desastres e longo histórico de atendimento a cargas de trabalho de missão crítica para nossos grandes clientes corporativos.
A Cloudera oferece a única plataforma híbrida verdadeira e aberta para dados, análises e IA, e com isso vêm oportunidades únicas para dar suporte a alta disponibilidade e tolerância a desastres. Com serviços de dados portáteis que podem ser executados em qualquer nuvem e no native, você pode configurar uma variedade de websites disponíveis que se misturam entre diferentes nuvens e incluem recursos no native, reduzindo a dependência de uma única plataforma, fornecedor ou serviço para operar. Para obter mais informações sobre como a Cloudera é projetada para resiliência, leia o Weblog da Cloudera sobre recuperação de desastrese siga o Arquitetura de referência Cloudera para recuperação de desastres para obter orientação e melhores práticas para promover seus próprios objetivos de resiliência e disponibilidade com a Cloudera.
Dados em movimento são um conjunto de tecnologias, incluindo Apache NiFi, Apache Flink e Apache Kafka, que permitem que os clientes capturem, processem e distribuam quaisquer dados em qualquer lugar, permitindo análises em tempo actual, IA e aprendizado de máquina. Essas tecnologias são componentes-chave para muitas cargas de trabalho e aplicativos de missão crítica – desde monitoramento de rede e garantia de serviço em telecomunicações até detecção e prevenção de fraudes em serviços financeiros. Cargas de trabalho em tempo actual, quando são de missão crítica, carregam o peso adicional da pontualidade e, como tal, uma possível interrupção pode ter um impacto comercial significativamente maior em comparação com cargas de trabalho menos críticas em termos de tempo.
Felizmente para este e muitos outros clientes da Cloudera, os dados em movimento foram projetados com os padrões mais exigentes da Cloudera para alta disponibilidade e tolerância a desastres, incluindo suporte para nuvem híbrida, garantindo que mesmo que alguns componentes tivessem dependência de um sistema ou serviço afetado pelo CrowdStrike, ele não se apresentaria como um único ponto de falha para a plataforma. A continuidade do serviço que eles experimentaram ressalta a confiabilidade e a resiliência da Cloudera, mesmo diante de interrupções externas significativas, bem como o potencial da Cloudera para reduzir o impacto comercial das interrupções do provedor de nuvem.
Arquiteto para resiliência, especialmente para aplicações em tempo actual
O incidente CrowdStrike não é a primeira grande interrupção de serviço que as empresas vivenciaram, e muito provavelmente não será a última. A nuvem fornece muitos benefícios de uma perspectiva de custo, flexibilidade e escalabilidade, especialmente para cargas de trabalho analíticas. No entanto, também vem com algum risco operacional. Muitas cargas de trabalho e aplicativos que dependem da captura, processamento e análise de dados em tempo actual têm tolerância zero para tempo de inatividade.
A plataforma da Cloudera e a pilha de dados em movimento são construídas com resiliência em mente. A abordagem exclusiva da Cloudera para nuvem híbrida e o investimento em arquiteturas comprovadas para alta disponibilidade e tolerância a desastres podem mitigar os desafios que muitas empresas têm enfrentado nos últimos dias, protegendo suas cargas de trabalho de missão crítica e garantindo a continuidade dos negócios.
Saiba mais sobre Cloudera e dados em movimento aqui.