Os termos incidente e problema soam semelhantes, mas desempenham papéis distintos no ITSM. Um incidente no gerenciamento de incidentes refere-se a uma interrupção não planejada de um serviço ou componente da infraestrutura de TI. Por exemplo, um problema de login em uma aplicação devido a uma atualização de código defeituosa é um incidente, e o processo de restaurar a aplicação à sua operação normal é o gerenciamento de incidentes.
O gerenciamento de problemas refere-se à determinação da causa de um incidente e à remoção do gargalo potencial. Por exemplo, se uma equipe de TI observar uma tendência de incidentes recorrentes de lentidão em aplicações, isso se qualifica como um problema. A equipe de TI realiza uma análise aprofundada dos logs da aplicação para encontrar deadlocks frequentes no banco de dados e erros de tempo limite de consulta durante os horários de pico de uso.
Após a análise inicial, a equipe descarta a latência da rede como um possível problema primário. Após realizar uma análise de causa raiz usando métodos como os cinco porquês e diagramas de espinha de peixe, a equipe de TI constata que as consultas SQL em um módulo de relatórios recém-criado foram escritas de forma ineficiente. A equipe de TI então implementa uma correção permanente, otimizando o código e usando visualizações materializadas para dados acessados com frequência, reduzindo assim a carga no módulo de relatórios durante os horários de pico de uso.