Detectar los problemas de rendimiento que aparecen durante un período de tiempo es bastante difícil con la configuración actual de gestión de fallos que funciona muy bien para los problemas cotidianos, como un pico repentino en la utilización de la CPU, las interrupciones del servidor, etc. Por eso, es imperativo que los problemas graduales de rendimiento se identifiquen y solucionen rápidamente antes de que puedan afectar a su cliente.
Por ejemplo, si la carga del servidor aumenta durante un periodo de tiempo, el tiempo de respuesta se verá afectado gradualmente y el cliente se sentirá frustrado. La detección de anomalías en Applications Manager puede ser la clave para detectar problemas de rendimiento como los mencionados anteriormente.
La detección de anomalías le ayuda a saber si hay una degradación gradual del rendimiento mediante la definición de perfiles de anomalía en las métricas de rendimiento. Mediante la creación de perfiles de anomalía, se pueden definir reglas en las que se comparan los datos actuales con los mejores datos informados anteriormente (por ejemplo, unos seis meses atrás, cuando el sistema funcionaba a un nivel óptimo).
Los perfiles de anomalías pueden crearse en función de:
La anomalía se produce cuando el conjunto actual de valores no se ajusta a los valores del rango de referencia. Los valores actuales de los atributos se comparan con los datos informados en una semana determinada [valor fijo] o simplemente con los datos de la semana anterior [valor móvil]. Después de elegir la semana de comparación de referencia, el valor de cada día se comparará con el día correspondiente de la semana de referencia. Por ejemplo, si elige la primera semana de agosto como semana de referencia, los datos de cada lunes se compararán con el valor del lunes de la primera semana de agosto.
La anomalía se detecta cuando los datos actuales no se ajustan a las reglas definidas por el usuario [basadas en las variables del sistema]. Por ejemplo, el usuario puede crear una regla como Anomalía, la cual debe ser detectada cuando el Valor Medio de la Última Hora actual es mayor que el doble del Valor Medio Móvil de Seis Horas. Las alarmas críticas y de advertencia pueden ajustarse en consecuencia.
Los perfiles de anomalía que se creen deben asociarse a los atributos de rendimiento correspondientes. También se asocian acciones de alarma adecuadas como el correo electrónico. Por ejemplo, si se detecta una anomalía en el tiempo de respuesta del servidor, se enviará una notificación por correo electrónico al administrador para que solucione el problema.
Dashboard de Anomalías : El rendimiento de los monitores se puede ver desde los Dashboards de Anomalías. También ayuda en la resolución de problemas.
También puede automatizar la detección de anomalías aprovechando las técnicas de machine learning. Esto ayuda a evitar los errores humanos, ya que es posible que el umbral que fijamos no identifique todos los tipos de anomalías de forma precisa.
Applications Manager utiliza el algoritmo RCPA para utilizar los datos históricos del atributo para entrenar un modelo mediante machine learning. Una vez generado el modelo, los datos recopilados se consultan con el modelo para identificar si hay valores anormales.
Si se determina un valor anormal, se generan alertas que se muestran como mensajes RCA. Si el valor recopilado se ha desviado del valor entrenado en un porcentaje mayor, se genera una alerta crítica. Si el valor recopilado no presenta ninguna anomalía, entonces se activa la alarma anulada.
Reciba notificaciones a través de correo electrónico, SMS o mensajes de Slack o emita automáticamente los tickets en herramientas ITSM como ServiceNow y ServiceDesk Plus. Automatice las acciones correctivas cuando se detecta una anomalía y reduzca el tiempo medio de reparación.