
(Ilya Lukichev/Shutterstoc)
O crescimento de dados não estruturados apresenta desafios reais. Muitas organizações lutam para gerenciar dados não estruturados como texto, imagens, vídeos e PDFs devido ao tamanho dos dados e sua taxa de crescimento. Para o pessoal do escritório de advocacia Katten Muchin Rosenman LLP, mais conhecido como Katten Regulation, regulamentações e segurança introduziram outra camada de preocupação.
É difícil entender a magnitude dos dados não estruturados. Como parte do estudo International Datasphere, há alguns anos, a empresa de análise IDC previu que, até 2025, o planeta gerará mais de 175 zettabytes de dados em um período de 12 meses (desde então, reduziu a estimativa para 163 ZB).
Apenas armazenar 163 ZB de dados brutos exigiria mais de 700 bilhões de drives de 1 TB, o que obviamente não vai acontecer, já que o mundo tem apenas cerca de 13 ZB de capacidade de armazenamento instalada em todos os meios (HDDs, flash, fita, até mesmo telefones), disse a IDC. Para registro, apenas cerca de 7,5 ZB de dados são realmente gravados em um meio de armazenamento, de acordo com a IDC, o que significa que a maioria dos dados nunca é gravada, e o armazenamento é realmente superprovisionado.
A Katten Regulation está familiarizada com grandes taxas de crescimento. O escritório de advocacia, que emprega 700 advogados ao redor do mundo, precisa armazenar centenas de milhões de documentos de milhares de casos de seus clientes que remontam a décadas. Ao todo, o escritório armazena cerca de 240 TB de dados, e o número está crescendo de 20% a 25% a cada ano, de acordo com Alexander Diaz, diretor de infraestrutura e operações de datacenter do escritório.
Até recentemente, o escritório de advocacia operava seu próprio sistema de arquivamento de dados não estruturados, que pegava dados dos principais sistemas de arquivos do Home windows e os movia para servidores de armazenamento de arquivo instalados nos information facilities do escritório.
No entanto, a Katten Regulation enfrentou vários problemas operacionais nos arquivos que a levaram a buscar uma alternativa, disse Diaz. Datanami em uma entrevista recente. A empresa trouxe Empresauma gerente de soluções de gerenciamento de dados não estruturados, para fazer uma prova de conceito.
“Durante o POC, identificamos que cerca de 70% dos arquivos que estávamos armazenando em nossos servidores de arquivos estavam obsoletos e não tinham sido acessados há mais de três anos, ou o caso tinha sido encerrado”, disse Diaz. “O outro motivo pelo qual propus fazer um projeto de arquivamento em larga escala period limitar nossa exposição se encontrássemos um evento de ransomware, porque agora esses arquivos não poderiam ser impactados.”
Conforme a Katten Regulation explorava o software program, eles encontraram outros benefícios. Por exemplo, muitas soluções de arquivamento implementam um stub no sistema de arquivos de produção para representar os dados que foram arquivados. Se os dados precisarem ser recuperados, o usuário apresenta esse stub para a solução de arquivamento, que busca os dados. No entanto, se algo acontecer com o stub, pode ser muito difícil recuperar o acesso aos dados arquivados, disse Diaz.
“A Komprise tem uma abordagem diferente”, ele disse. “Eles usam um hyperlink simbólico… basicamente como um atalho. Então, na sua área de trabalho do Home windows, você tem um atalho que faz referência ao caminho para o arquivo actual ou para o programa no sistema operacional. E mesmo que esse atalho ou hyperlink simbólico quebre ou desapareça, você ainda pode ir e encontrar o arquivo authentic e/ou programa.”
O arquivamento baseado em tempo de dados não estruturados é outro benefício do uso do software program Komprise, disse Diaz. Com muitos pacotes de arquivamento tradicionais, os arquivos são arquivados com base em um período de tempo definido. Então, se os documentos associados a um caso não forem acessados em três anos, por exemplo, ele será arquivado automaticamente.
Isso não funciona muito bem no ramo jurídico, disse Diaz.
“Muitas vezes, em casos legais, especialmente litígios, eles podem ficar inativos por um tempo e podem ser escolhidos”, disse ele. “Digamos que estivéssemos representando alguém. Há um veredito, e então há um tempo entre o caso authentic e talvez uma apelação. Então, basear-se apenas no tempo nem sempre funciona.”
A Komprise deu à Katten Regulation a capacidade de arquivar os arquivos associados a um caso com base em quando o caso é realmente fechado, não em algum número arbitrário de anos em que não foi tocado. Depois que os documentos são arquivados, se o usuário precisar obter uma cópia somente leitura dos dados, os usuários podem fazer isso simplesmente clicando em um atalho na área de trabalho, o que inicia os dados sendo extraídos do arquivo da Komprise para um dispositivo de armazenamento native, onde o usuário pode recuperá-los, disse Diaz.
A empresa está no meio da transição de suas plataformas de armazenamento primário de discos giratórios tradicionais para armazenamento flash. Mover mais dados para um arquivo baseado em Komprise em execução no armazenamento BLOB do Microsoft Azure ajuda a manter os custos baixos, ao mesmo tempo em que oferece aos usuários os benefícios de um armazenamento primário mais rápido, disse Diaz.
“O Komprise tem sido muito, muito consistente para nós”, ele disse. “Começamos com casos fechados ou dados não sendo acessados por mais de três anos. Cerca de seis meses atrás, reduzimos o limite para dois anos sem acesso ou os casos fechados, e acabamos movendo outros 40 TB para o Azure.”
Reduzir o armazenamento de arquivos para os compartilhamentos de arquivos do Home windows também ajudará a economizar dinheiro para o escritório de advocacia, principalmente na transição para uma nova plataforma no last deste ano. “Não terei que comprar tanto armazenamento, então isso nos economizará nessa compra futura”, disse Diaz.
O benefício de melhorar a segurança dos dados da Katten Regulation é mais difícil de mensurar. Mas com o ransomware aumentando novamente este ano, está claro que ele traz valor actual para o escritório de advocacia.
“Não posso enfatizar o suficiente que isso também reduziu nossa exposição porque nenhum dos arquivos arquivados seria impactado por nenhum tipo de evento de hacker ou ransomware”, disse Diaz. “Eles não teriam acesso a esses arquivos. Eles não seriam impactados por nenhum tipo de evento de segurança.”
Itens relacionados:
Ainda é cedo para o gerenciamento de dados não estruturados, diz Komprise
Obtendo a vantagem sobre o problema de dados não estruturados
Crescimento de dados não estruturados está causando buracos nos orçamentos de TI