O monitoramento do tempo de atividade é um recurso crucial de monitoramento de rede que é fundamental para a integridade e o desempenho de toda a rede. O tempo de atividade denota a duração ou a porcentagem de tempo em que um determinado dispositivo ou sistema de TI permanece operacional. O tempo de atividade dos dispositivos de rede em qualquer período de tempo pode ser calculado com a seguinte fórmula: tempo de atividade = (duração da indisponibilidade do dispositivo)/(período de tempo total).

O tempo de atividade ideal de uma rede é de 100%, o que é muito difícil de conseguir devido a vários fatores limitantes. O tempo de atividade de 99,999% é a alternativa mais prática a ser buscada, o que se traduz em apenas 5,25 minutos de indisponibilidade da rede por ano. Isso não deixa muito espaço para erros, especialmente considerando que as redes podem ficar indisponíveis por vários motivos. As interrupções de rede se enquadram em duas categorias principais: eventos planejados e eventos não planejados.

Eventos planejados: É quando a equipe de TI interrompe intencionalmente a rede para concluir tarefas importantes que precisam ser realizadas para manter a rede em funcionamento. Isso inclui solução de problemas de rede, instalação de hardware e software, atualização da configuração do dispositivo, execução de verificações de conformidade, dimensionamento da rede e muito mais. Isso quase não causa impacto na produtividade geral dos negócios.

Eventos não planejados: Refere-se a interrupções repentinas que ocorrem devido a circunstâncias imprevistas, como falhas no sistema, ataques distribuídos de negação de serviço, erros humanos, alocação inadequada de recursos e muito mais. Isso resulta em interrupções não planejadas dos negócios, o que resulta em perdas de milhões de dólares para organizações em todo o mundo todos os anos.

Para evitar essas perdas e garantir a disponibilidade contínua da rede em diferentes localizações geográficas, é essencial monitorar constantemente o tempo de atividade.

Por que o tempo de atividade é um parâmetro importante a ser monitorado?

Uptime Monitoring - ManageEngine OpManager

As perdas sofridas por uma empresa devido à falta de um software eficaz de monitoramento de tempo de atividade têm aumentado constantemente. Estima-se que, em média, cada minuto de tempo de inatividade não planejado resulte em perdas de US$ 5.600 por minuto ou mais de US$ 300.000 por hora.

Embora esses números sejam chocantes, o dinheiro não é o único parâmetro de preocupação. O valor da marca, a produtividade e o custo dos reparos são outros fatores que estão em jogo e que enfatizam a importância do monitoramento do desempenho do tempo de atividade no gerenciamento da rede.

O monitoramento do tempo de atividade é importante pelos seguintes motivos:

  • O tempo de atividade ideal de uma rede é 100%. O monitoramento do tempo de atividade ajuda a descobrir se a rede atingiu o tempo de atividade máximo alcançável de 99,999%.
  • O monitoramento do tempo de atividade garante o funcionamento ininterrupto dos dispositivos de rede, evitando, assim, o tempo de inatividade inesperado da rede e garantindo operações comerciais tranquilas.
  • Sem o monitoramento do tempo de atividade, os administradores de TI chegarão tarde demais para detectar que um componente da rede está sofrendo tempo de inatividade. Esse atraso na resposta pode prejudicar a boa vontade e a receita da organização.

Desafios no monitoramento do tempo de atividade

  • Monitoramento de diversos componentes da infraestrutura de TI: O número de fornecedores e os dispositivos que eles fabricam continuam aumentando. Quando uma infraestrutura de TI em crescimento usa esses diversos dispositivos, a complexidade de gerenciá-los aumenta.
  • Gerenciar a enxurrada de alertas:  Quando os dispositivos principais falham, seus dispositivos secundários param de responder consecutivamente, causando uma enxurrada de alertas.
  • Eliminação de erros humanos:  A configuração inadequada do dispositivo, a instalação de atualizações instáveis, a programação de tempo de inatividade não autorizado do dispositivo e práticas prejudiciais semelhantes afetam o tempo de atividade dos dispositivos de rede.
  • Identificação e solução de problemas de forma proativa Adotar uma abordagem reativa para corrigir problemas é uma prática antiga. Ser capaz de identificar proativamente os problemas relacionados ao tempo de atividade e eliminá-los pela raiz economizará muito tempo e recursos.
  • Visibilidade dos componentes da infraestrutura de TI: Monitorar o tempo de atividade de um grande número de dispositivos pode ser uma tarefa desafiadora, especialmente quando eles pertencem a várias categorias e estão espalhados por vários locais.

Serviços de monitoramento de tempo de atividade oferecidos pelo ManageEngine OpManager

O monitor de tempo de atividade em tempo real do OpManager verifica periodicamente a integridade e a disponibilidade dos componentes de sua infraestrutura de TI e ajuda a corrigir problemas para garantir que sua rede esteja funcionando 24 horas por dia, 7 dias por semana. O OpManager executa verificações de disponibilidade de dispositivos usando ping e Telnet do Protocolo de Mensagens de Controle da Internet (ICMP), que é usado para identificar roteadores de borda e dispositivos de zona desmilitarizada (DMZ).

As várias soluções confiáveis para monitorar o tempo de atividade oferecidas pelo OpManager são:

Monitoramento do tempo de atividade dos componentes da infraestrutura de TI

Monitoramento do tempo de atividade do dispositivo

O monitor de tempo de atividade do OpManager faz o ping de seus dispositivos de rede uma vez a cada dois minutos por padrão e, se o dispositivo não responder após duas tentativas, o OpManager o categorizará como um dispositivo indisponível. O ping é uma maneira confiável para os administradores de TI em todo o mundo identificarem a disponibilidade do dispositivo. Para sondar os dispositivos, a ferramenta de monitoramento de tempo de atividade do OpManager usa o ping ICMP.

Se você estiver em um ambiente que proíba o ICMP (como uma DMZ) ou quiser monitorar seus dispositivos de borda, poderá escolher o recurso Telnet do OpManager. O Telnet contém um intervalo de sondagem padrão de cinco minutos e quatro indicadores de status para fornecer status precisos do dispositivo.

Monitoramento do tempo de atividade da interface

O sistema de monitoramento do tempo de atividade da rede do OpManager utiliza o SNMP (Protocolo de gerenciamento de rede simples - Simple Network Management Protocol) para determinar a disponibilidade das interfaces em sua rede. Esses status de interface estão disponíveis como status de dispositivos individuais, mapas de rede da camada 2, visualizações comerciais ou grupos de dispositivos personalizados.

Monitoramento do tempo de atividade do servidor

A disponibilidade do servidor é o parâmetro crítico no monitoramento do servidor. A ferramenta de monitoramento do tempo de atividade do servidor do OpManager usa ICMP, TCP e SNMP para monitorar a disponibilidade. Você pode configurar o intervalo de monitoramento e automatizar o processo de monitoramento para evitar o tempo de inatividade do servidor. Depois que o monitoramento do tempo de atividade do servidor é agendado, o OpManager executa automaticamente o serviço de monitoramento para rastrear e atualizar o tempo de atividade, em tempo real.

Com o OpManager como um monitor de tempo de atividade do servidor Linux e Windows, você pode acompanhar proativamente a saúde e a disponibilidade do servidor, pois ele se comunica constantemente com os servidores usando diferentes protocolos, como WMI e SNMP. A ferramenta também tem um mecanismo responsivo para resolver falhas no servidor quando elas ocorrem e restaurar o tempo de atividade do servidor. Os relatórios, por outro lado, ajudam a entender o desempenho dos servidores e a natureza das falhas.

Monitoramento do tempo de atividade do site

No mercado competitivo de TI atual, você não pode correr o risco de deixar seus clientes com a mensagem de erro "Este site não pode ser acessado", mesmo que por um minuto. Para evitar isso, é necessário monitorar 24 horas por dia, 7 dias por semana a disponibilidade e o desempenho do seu site. Com o monitoramento constante do tempo de atividade do site, você pode identificar problemas no site antes que eles se transformem em tempo de inatividade substancial e perda de receita.

Monitore a disponibilidade de sites cruciais 24 horas por dia usando o monitoramento de URL do OpManager. Com ele, você pode o configurar para monitorar URLs, hosts virtuais e a intranet. O monitoramento do tempo de atividade do site do OpManager restaura sites comprometidos imediatamente; monitora farms de servidores da Web; determina se partes do seu aplicativo da Web estão fora do ar; monitora aplicativos da Web com um login; e muito mais.

Monitoramento do tempo de atividade do aplicações

O rastreamento da disponibilidade e do tempo de atividade das aplicações é fundamental para garantir o bom funcionamento das operações comerciais. O monitoramento de tempo de atividade das aplicações do OpManager usa métricas de desempenho padrão para monitorar a integridade e a disponibilidade dos servidores Active Directory/Exchange/ MSSQL. Você também pode configurar valores de limite e ajustar as frequências de sondagem para ficar de olho no tempo de atividade dos aplicativos críticos.

O OpManager é compatível com os servidores Exchange 2000/2003, Exchange 2007, Exchange 2010, Exchange 2013, Exchange 2016 e Exchange 2019.

Monitoramento do tempo de atividade do serviço

A disponibilidade do serviço é a disponibilidade do servidor. O monitoramento dos serviços em nível de sistema quanto à disponibilidade e ao tempo de resposta é essencial para garantir que o seu plano de gerenciamento de aplicativos e servidores esteja completo. Um monitor de tempo de atividade de serviço como o OpManager monitora proativamente a disponibilidade e o tempo de resposta de vários serviços, incluindo DNS, SMTP, LDAP, Telnet, HTTPS, MSSQL, MySQL e muitos outros. Esse nível de monitoramento é essencial para identificar ou restaurar aplicações defeituosas rapidamente quando um serviço fica inativo.

Os recursos de monitoramento de serviços do OpManager também fornecem relatórios e gráficos detalhados sobre a disponibilidade e o tempo de atividade dos serviços que você está monitorando. Isso ajuda a analisar os dados históricos e a tomar uma decisão sobre as atividades de gerenciamento de falhas.

Monitoramento do tempo de atividade dos serviços do Windows

O monitoramento do desempenho do tempo de atividade do OpManager utiliza o protocolo Windows Management Instrumentation (WMI) para monitorar o tempo de atividade dos serviços do Windows e não requer a instalação de um agente adicional. Com o monitoramento de serviços do Windows do OpManager, você pode automatizar determinadas ações, como reiniciar o serviço ou o servidor quando o serviço do Windows estiver inativo, interromper um serviço que esteja em execução no momento e muito mais. Isso ajuda a reduzir a carga de trabalho redundante da placa de administradores de rede e a se concentrar em tarefas críticas.

Monitoramento do tempo de atividade do processo

O monitoramento do tempo de atividade do processo é importante para entender a disponibilidade e o desempenho de cada processo crítico associado aos aplicativos ou serviços em execução no servidor. Com o OpManager, você pode monitorar remotamente os processos em execução nos servidores quanto ao seu tempo de atividade e desempenho. O OpManager usa vários protocolos (SNMP/WMI/CLI) e monitora os processos em execução no Windows, Linux, Solaris, UNIX, servidores VMware, máquinas virtuais e muito mais.

Com o monitor de processos do OpManager, você também pode obter uma visibilidade detalhada da fonte de carga dos recursos do sistema. Se a utilização de recursos de um processo específico exceder o limite definido, o OpManager enviará alertas instantaneamente e você será notificado em pouco tempo.

FAQ sobre monitoramento de tempo de atividade

O que é monitoramento de tempo de atividade?

+

Como funciona o monitoramento do tempo de atividade?

+

Mantenha o tempo de atividade de sua rede sob controle com o OpManager

Faça o download da avaliação gratuita por 30 dias
VÍDEOS
OpManager Customer Videos
Altaleb Alshenqiti - Ministry of National Guard - Health Affairs
  
  •  IT Admin from "Royal flying doctor service", Australia
     Jonathan ManageEngine Customer
  •  Michael - Network & Tech, ManageEngine Customer
     Altaleb Alshenqiti - Ministry of National Guard - Health Affairs
  •  David Tremont, Associate Directory of Infrastructure,USA
     Todd Haverstock Administrative Director
  •  Donald Stewart, IT Manager from Crest Industries
     John Rosser, MIS Manager - Yale Chase Equipment & Services