Todos os insights

A interrupção do CrowdStrike: Um alerta para a confiabilidade, a disponibilidade e a resiliência dos dados

Octavian Tanase Octavian Tanase
Chief Product Officer

26 de julho de 2024


Uma interrupção global de TI, desencadeada por uma atualização de software defeituosa da empresa de segurança cibernética CrowdStrike, paralisou a infraestrutura crítica na sexta-feira.

Hoje estou escrevendo para você por dois motivos: Em primeiro lugar, quero garantir aos nossos clientes que a Hitachi Vantara não foi afetada pela interrupção da Tela Azul da Morte (BSOD) do Microsoft Windows, e que nossas operações comerciais (incluindo nossas ofertas de ITaaS e nuvem híbrida) continuam a funcionar sem problemas; e continuaremos a monitorá-las para garantir que permaneçam ininterruptas. Em segundo lugar, por mais problemático que esse evento possa ser, ele tem o potencial de servir como um alerta para a confiabilidade, a disponibilidade e a resiliência dos dados. Leia mais:

A interrupção, que pode ultrapassar o valor de 1 bilhão de dólares em custos, afetando empresas em todo o mundo, ressaltou a fragilidade de nosso mundo digital interconectado e os riscos associados à dependência excessiva de serviços de nuvem centralizados. Embora a causa principal da interrupção tenha sido uma falha técnica e não um ataque cibernético, ela expôs as possíveis consequências das interrupções de serviço nas operações comerciais.

O alto custo do tempo de inatividade

O impacto da interrupção do CrowdStrike foi de longo alcance, fazendo com que várias organizações enfrentassem desafios operacionais significativos e destacando as implicações financeiras do tempo de inatividade, incluindo perda de receita, rotatividade de clientes e danos à reputação da marca. De acordo com a Pingdom, o custo médio do tempo de inatividade de TI é de 100.000 dólares por hora. Além disso, a interrupção ressalta os possíveis riscos legais e regulamentares associados à inacessibilidade dos dados, especialmente para setores sujeitos a padrões de conformidade rigorosos, como serviços bancários e financeiros, saúde, transporte e energia, companhias aéreas e seguros. Além do impacto imediato, essas interrupções podem ter um efeito duradouro na reputação da marca, pois um estudo do Ponemon Institute constatou que o custo médio de uma violação de dados para a reputação de uma empresa é de 7,2 milhões de dólares.

Assista ao nosso webinar: Além do inquebrável? Oferecendo alta disponibilidade de data center, para saber mais sobre como mitigar falhas imprevisíveis de data center e fornecer alta disponibilidade real.

A necessidade de estratégias robustas de proteção de dados

Para reduzir os riscos associados às interrupções de serviço, as organizações devem priorizar a disponibilidade e a resiliência dos dados. Aqui estão as principais estratégias a serem consideradas:

  • Estratégias de nuvem híbrida e multinuvem: A adoção de uma abordagem de nuvem híbrida ou multinuvem pode aumentar significativamente a resiliência e a disponibilidade. Ao distribuir as cargas de trabalho em várias plataformas de nuvem e na infraestrutura local, as organizações podem reduzir a dependência de um único ambiente. Essa diversificação ajuda a reduzir o impacto das interrupções e garante a continuidade dos negócios.
  • Planejamento de recuperação de desastres: Um plano abrangente de recuperação de desastres descreve as medidas a serem tomadas no caso de uma interrupção de serviço. A recuperação rápida é fundamental para minimizar o impacto nos negócios. Procedimentos detalhados de recuperação, inclusive restauração de dados e reinicialização do sistema, devem ser meticulosamente delineados e testados regularmente.
  • Replicação e backup de dados: A implementação de procedimentos robustos de replicação e backup de dados é essencial para garantir a acessibilidade dos dados em caso de interrupção. Várias cópias de dados devem ser armazenadas em locais geograficamente dispersos para minimizar o risco de perda de dados.
  • Avaliação do provedor de serviços de nuvem: As organizações devem avaliar cuidadosamente a confiabilidade e o desempenho de seus provedores de serviços em nuvem. É essencial escolher provedores com um forte histórico de recursos de tempo de atividade e recuperação de desastres.
  • Prevenção de perda de dados (DLP): A implementação de soluções DLP pode ajudar a proteger dados confidenciais contra acesso não autorizado, perda ou corrupção. Essas soluções também podem ajudar nos esforços de recuperação de dados.

Construindo uma infraestrutura de dados resiliente

Embora a interrupção do CrowdStrike tenha sido um evento significativo, ela também representa uma oportunidade para as organizações fortalecerem seus recursos de proteção e recuperação de dados. Ao investir em estratégias robustas de gerenciamento de dados e criar uma infraestrutura resiliente, as empresas podem resistir melhor a futuras interrupções e minimizar o impacto nas operações.

A IA pode aumentar significativamente a resiliência da infraestrutura. Ao analisar vastos conjuntos de dados, a IA pode prever falhas, otimizar a alocação de recursos e detectar anomalias. No caso do CrowdStrike, a IA poderia ter identificado padrões que indicavam um problema de software antes que ele causasse uma interrupção generalizada.

É importante observar que a disponibilidade e a resiliência dos dados são processos contínuos. Testes e atualizações regulares dos planos de recuperação de desastres são essenciais para garantir sua eficácia. Além disso, as organizações devem se manter informadas sobre as ameaças e vulnerabilidades emergentes para lidar proativamente com os possíveis riscos.

A interrupção do CrowdStrike serve como um poderoso lembrete da função crítica que os dados desempenham nas operações comerciais modernas. Ao priorizar a disponibilidade e a resiliência dos dados, as organizações podem construir uma base mais sólida para o sucesso futuro.

DZ BANK: Economia semelhante à nuvem e alta disponibilidade

DZ BANK, uma instituição financeira líder na Alemanha, enfrentou o desafio de gerenciar e dimensionar o armazenamento de dados de missão crítica e, ao mesmo tempo, otimizar os custos. O banco precisava de uma solução que pudesse lidar com as demandas de seus aplicativos de negociação de alto desempenho, ao mesmo tempo em que fornecia flexibilidade e eficiência de custos semelhantes às da nuvem.

Para enfrentar esses desafios, o DZ BANK está fazendo a transição para uma estratégia de nuvem híbrida, movendo as cargas de trabalho dinamicamente, conforme necessário, entre a infraestrutura local e a nuvem. Como parte de sua estratégia de otimização, eles consolidaram sistemas de armazenamento e padronizaram a infraestrutura de dados, simplificaram a arquitetura e fizeram uma parceria com a Hitachi Vantara para garantir a mais alta disponibilidade e desempenho para seus aplicativos comerciais de missão crítica. O resultado: economia semelhante à da nuvem com alta disponibilidade.

Uma jornada contínua, não um destino

A criação de uma infraestrutura de dados resiliente é um processo contínuo, não uma conquista única. Ela exige uma abordagem holística que combine tecnologia, estratégia e conhecimento humano. Ao aproveitar a IA e a infraestrutura de nuvem híbrida, as organizações podem se defender proativamente contra ameaças em evolução e proteger seus valiosos ativos de dados. A verdadeira resiliência está na busca constante de aprimoramento, adaptação e vigilância, reconhecendo que o cenário de ameaças está sempre mudando.

Com um foco contínuo na necessidade de continuidade dos negócios em todos os setores, é essencial que os líderes de negócios considerem uma abordagem em várias camadas para confiabilidade, disponibilidade e resiliência de dados, incluindo soluções locais, na nuvem e híbridas, juntamente com um planejamento robusto de recuperação de desastres.

Explore como você pode obter um ecossistema de nuvem híbrida flexível com alta disponibilidade que atenda às suas necessidades agora e no futuro.

RECURSOS ADICIONAIS