Análise da causa-raiz (RCA)

Toda rede é suscetível a problemas que afetam seu desempenho e produção.

Corrigir problemas e restaurar a rede rapidamente é crucial para garantir a continuidade dos negócios, mas falar é muito mais fácil do que fazer. Redes são estruturas complicadas com várias causas prováveis para um problema de desempenho.

Por exemplo, um problema como velocidade lenta da rede pode resultar da alta banda nas interfaces, um problema de aplicação ou latência do protocolo.

Sem o conhecimento adequado sobre a causa-raiz, a ação não resolverá o problema e poderá prolongá-lo, assim como aumentar a métrica de tempo médio de reparo (MTTR) da sua rede.

Acelere a identificação da causa da falha com a análise da causa-raiz

A capacidade de monitoramento da rede do OpManager da ManageEngine é ainda mais aprimorada com o lançamento do novo recurso de Análise da causa-raiz (RCA). O RCA é fornecido com opções que permitem agregar dados de TI de vários componentes da rede e simplificar o processo de análise de seu desempenho.

Uma plataforma centralizada para análise

O OpManager permite criar um Perfil de RCA para um problema que você deseja solucionar. Um Perfil de RCA é uma plataforma centralizada que ajuda a agregar dados de desempenho de vários monitores, comparar e analisar, e tirar conclusões.

Ao criar um Perfil de RCA, a primeira etapa é especificar o módulo e selecionar as entidades. Ele é compatível com três módulos diferentes: Dispositivos, Interfaces e URLs.

Entidades refere-se à lista de dispositivos, interfaces ou URLs que serão exibidos para seleção.

Painel demonstrando como criar um Perfil de RCA no OpManager

Monitores disponíveis

O OpManager obtém automaticamente a lista de monitores associados às entidades selecionadas e a exibe. Por padrão, somente os monitores habilitados para limiar e de disponibilidade são mostrados. No entanto, você pode usar o botão de filtro para exibir todos os monitores associados às entidades selecionadas.

Painel de análise de causa-raiz com alarmes e definição de métricas do OpManager

Visualização gráfica dos dados de monitoramento

Comparar o desempenho de vários monitores e identificar as correlações entre eles ajudará a reduzir as possíveis causas de um problema.

As anormalidades da rede podem ser correlacionadas a um monitor rastreado. Por exemplo, o desempenho lento em um dispositivo de armazenamento pode estar correlacionado a um alto IOPS e à alta latência. A chave é estabelecer a conexão entre a falha e uma métrica mensurável.

No Perfil de RCA do OpManager, basta arrastar e soltar os monitores relevantes cujo desempenho você deseja analisar. Uma curva de desempenho para cada monitor será criada no gráfico. Você pode comparar até 20 monitores em uma única janela.

Todos os monitores selecionados são preenchidos como gráficos de desempenho em uma linha do tempo comum, o que ajuda a correlacionar e analisar vários desempenhos de monitores a qualquer momento.

Painel com o perfil de RCA com gráficos e tabelas de métricas

À medida que você move o cursor sobre o gráfico, os detalhes do desempenho do monitor são exibidos instantaneamente no painel direito.

Dados de alarme associados

No OpManager, você pode configurar limiares ou ativar o recurso de limiar adaptável para configurar de forma inteligente os valores de limiares para os monitores, de modo que sempre que um limiar especificado for violado, um alarme é acionado.

Você também pode obter os dados de alarmes no Perfil de RCA. Depois de gerar os gráficos de desempenho dos monitores, o Perfil de RCA exibirá automaticamente os dados do número de alarmes para cada monitor. Você pode especificar o período, os dados do alarme e os gráficos de desempenho para a duração especificada que será exibida.

Anotações de gráfico

Uma curva de desempenho representa o comportamento ao longo do tempo do dispositivo em termos do monitor selecionado.

Por exemplo, você pode preencher visualmente o comportamento de utilização da CPU do servidor crítico na forma de um gráfico de desempenho.

Ao analisar o gráfico, você pode fazer inferências e pode querer registrá-las. Por exemplo, se você ver um pico repentino no gráfico, poderá registrar, com apenas um simples clique, suas inferências nesse instante usando o recurso de anotação.

Painel de como adicionar uma anotação de gráfico

Você pode registrar várias anotações em pontos diferentes do gráfico. Ao lê-las, você terá uma perspectiva completa do problema real.

Opções avançadas

Crie um perfil de RCA com dados de alarme

Você também pode criar um Perfil de RCA com dados de alarme para solucionar problemas de violação de limiar. O OpManager permite criar facilmente um novo perfil a partir da página de instantâneo de um alarme.

Entenda como criar um perfil de RAC com dados de alarme

Execute RCA para grupos

No OpManager, é possível combinar um conjunto de dispositivos ou interfaces e formar grupos para que você possa enviar facilmente alterações de configuração em massa. Os grupos podem ser formados com base em qualquer critério. Por exemplo, você pode organizar dispositivos com base em um local ou categoria e colocá-los em um grupo.

Veja como executar RCA para grupos no OpManager

O OpManager permite executar RCA para grupos. Por exemplo, quando uma interrupção da rede ocorre em uma filial específica, você pode executar facilmente uma RCA para sua filial (Grupo) e solucionar problemas da causa da interrupção.

Perfil de notificação

Configurar o perfil de notificação no OpManager permite receber notificações instantâneas através de vários canais, como e-mail, SMS, etc.

Se você tiver criado um Perfil de RCA com dados de alarme, poderá enviar os detalhes desse Perfil de RCA para o usuário simplesmente adicionando uma variável com a mensagem de alarme.

Painel com perfil de notificação, com exemplo de email

Qual é a importância da RCA para o monitoramento da rede?

A utilização da CPU dispara em uma máquina crítica em sua rede que hospeda serviços importantes. Isso reduz o desempenho do sistema e afeta o usuário final. Como você solucionará o problema? Por onde você vai começar?

Para resolver os problemas dos usuários finais, você precisa localizar o serviço que está drenando os recursos da CPU. Pode ser simples analisar o desempenho e identificar o serviço anômalo se ele estiver restrito a uma única máquina. Mas esta será uma tarefa tediosa e demorada se a rede inteira de um local cair e você precisar encontrar a causa.

A RCA ajuda você a superar esse desafio. Ela oferece uma janela centralizada na qual você pode visualizar informações de monitoramento de TI de vários componentes da rede em um painel de controle único para acelerar o processo de identificação de falhas, garantindo o máximo tempo de atividade da rede.

Obtenha uma demonstração online grátis e personalizada com nossos especialistas que podem responder a todas as suas dúvidas relacionadas aos produtos.

VÍDEOS
OpManager Customer Videos
Altaleb Alshenqiti - Ministry of National Guard - Health Affairs
  
  •  IT Admin from "Royal flying doctor service", Australia
     Jonathan ManageEngine Customer
  •  Michael - Network & Tech, ManageEngine Customer
     Altaleb Alshenqiti - Ministry of National Guard - Health Affairs
  •  David Tremont, Associate Directory of Infrastructure,USA
     Todd Haverstock Administrative Director
  •  Donald Stewart, IT Manager from Crest Industries
     John Rosser, MIS Manager - Yale Chase Equipment & Services