Apagão de energia: um problema corriqueiro que pode causar queda no Servidor e até perda irreversível de dados importantes da sua empresa

As oscilações de energia e os apagões provocam desligamentos inadequados que causam erros no Servidor e danos nos sistemas de arquivos

Os erros em Servidores podem acontecer por vários fatores, alguns deles mais complexos de prever por surgirem por meios externos ou por falhas humanas, sejam acidentais ou maliciosas. Exemplo disso, são as paradas inesperadas no servidor por falta de energia, um problema corriqueiro que também atinge ativos de TI como roteadores, firewalls, switches e pode causar até a perda irreversível de dados importantes da sua empresa, sobretudo se a intervenção para o reparo não for feita corretamente.

Ouvir falar que uma parada crítica no Servidor causa perda de arquivos não se trata exatamente de um exagero. Na realidade, tais falhas no servidor podem comprometer fisicamente os dispositivos de armazenamento, sejam eles os antigos HD’s ou os mais modernos SSD’s.

Você pode estar se perguntando “se arquivos desapareceram do Servidor após desligamento inesperado nunca mais são recuperados”? A resposta para esta pergunta depende de qual foi o trabalho e o cuidado que o gestor de TI teve previamente a ocorrência do sinistro. Como o caso trazido pela CTECH que exemplifica isso, acompanhe.

Um cliente da CTECH teve uma parada crítica em seu Servidor local, devido a um problema elétrico. Após a avaliação criteriosa do técnico, ainda no local, foi constatado o dano no sistema de arquivos do Servidor e que a solução seria complexa. Inicialmente nesse caso já são identificados dois agravantes:

Inatividade – Em 2020 a empresa norte-americana Forrester publicou um estudo feito com 157 profissionais de TI, onde estima que o custo de uma hora de downtime em uma infraestrutura de TI pode variar entre 10 e 1 milhão de dólares. Outros dados que também chamam atenção no estudo são que 34% dos entrevistados enfrentam problemas de indisponibilidade diariamente; 42% deles demoram entre uma hora e uma semana para descobrir a raiz de um problema nos serviços de TI e 60% dos entrevistados geralmente envolvem entre quatro e dez colaboradores na solução da falha. (Fonte: Portal Terra). A inatividade é um problema grave para empresas de qualquer porte.

Perda de dados em decorrência da falha elétrica – estudo da IBM Security sugere que os incidentes de segurança se tornaram mais caros e mais difíceis de conter, com custos aumentando 10% em comparação com o ano anterior. As violações de dados agora custam às empresas pesquisadas US$ 4,24 milhões por incidente em média.

Para além do faturamento, a exposição a problemas desse tipo coloca em xeque a reputação das empresas, sobretudo aquelas que não contam com equipe interna de TI ou com os serviços de uma empresa de tecnologia especializada para ser adequadamente responsiva nesses casos.

No caso apresentado, o chamado relatando a parada crítica no Servidor, foi realizado as 16:40 de uma quarta-feira normal de trabalho, dia chuvoso em São Paulo, onde é comum ocorrer panes elétricas. Estando impossibilitado de resolver o problema na sede do cliente, o técnico em atendimento optou por recolher o equipamento ao laboratório da CTECH, onde, com as ferramentas adequadas, foi capaz de às 10:15 do dia seguinte, devolver o Servidor ao cliente em plena operação e com zero perda de dados.

Ao todo, desde abertura de chamado, passando pela fase diagnóstica até a resolução final do problema, o retorno ao trabalho se deu após uma parada total inferior a 3 horas uteis, segundo o expediente normal do cliente. Mas isso só foi possível devido a todos os cuidados tomados previamente à falha, desde a existência de um No-break para minimizar dados até as rotinas de backup externo em nuvem e, principalmente, rotinas para restauração automatizada do Servidor em casos de pane.

Quando ocorre um erro inesperado no Servidor, componentes, sistemas e ativos de TI a empresa precisa ter um protocolo interno para acionar o socorro prontamente, evitando assim que leigos se desdobrem sem saber o que fazer após uma parada crítica, como mostrado no exemplo trazido pela CTECH.

Outro fator que fez diferença no caso em questão foi o uso da solução correta: o i-SERVER, um sistema de implantação e gestão de Servidores de rede foi o que salvou a empresa vítima do sinistro.

Apesar do final feliz, obviamente que episódios desse tipo trazem transtornos e devem ser revertidos em aprimoramentos para evitar novas ocorrências, portanto. A empresa em questão, após avaliar adequadamente os riscos aos quais ficou exposta durante o sinistro, optou por reforçar sua rotina de backup com a solução i-BACKUP da CTECH, além de aprimorar sua estrutura de no-breaks.

O que se nota aqui é que, mesmo contando com uma consultoria especializada para demandas pontuais de TI – como um Help Desk, por exemplo, – pequenas e médias empresas precisam definitivamente atingir um nível de maturidade para lançar mão de outros investimentos em tecnologia, sobretudo para garantir disponibilidade máxima e segurança aos dados que opera, gerando um ambiente estável e propício para um crescimento sólido e seguro. É o que acredita a CTECH.

Veja mais dicas para proteger o seu Servidor:

Treine a equipe para evitar exclusões de arquivos e outros erros causados por falha humana;

Tenha um backup profissional. Um dos pontos essenciais para uma gestão de dados segura é escolher o melhor backup para empresa. Alguns fatores que ajudam nessa escolha são a frequência e volume de dados que trafegam pelos departamentos da empresa, além de garantir ao backup um armazenamento fisicamente separado dos dados originais. Assim a cópia de segurança poderá efetivamente atender a necessidade da empresa diminuindo o risco de perdas de dados;

Instale um Nobreak gerenciável e faça manutenções periódicas nele. Como mostramos, a interrupção repentina do Servidor pode causar problemas de alta complexidade ou até irreversíveis. O nobreak é um equipamento essencial para manter o funcionamento do Servidor em caso de quedas de energia. Para escolher o equipamento mais adequado é aconselhável contar com ajuda profissional que levará em conta a potência necessária e o tempo em que é preciso manter a estrutura funcionando em caso de interrupção prolongada de energia;

Crie regras de auditoria nas máquinas para identificar os acessos a arquivos compartilhados do Servidor com os colaboradores. As ferramentas de monitoramento dão condições para ter acesso 24h por dia, 7 dias por semana a eventos e anormalidades que possam prejudicar o desempenho do Servidor;

Tenha um bom ERP. O sistema ERP interliga as informações de todos os setores e processos da empresa para serem gerenciados de forma unificada e completa, facilitando assim o acesso as informações de todos os departamentos com poucos passos.

Tenha um ambiente e infraestrutura adequada. Assim como a maioria das máquinas, o Servidor local precisa estar instalado em um local adequado que ofereça a temperatura correta, ventilação suficiente e espaço que permita a limpeza e proteção contra poeiras e sujidades que possam atingir os equipamentos.