Дата последнего обновления: September 19, 2019
Управление ИТ-инцидентами – это один из основных процессов в работе службы поддержки. В этом руководстве представлены основные сведения об управлении инцидентами, его компонентах, ролях и областях ответственности, а также о том, как управление согласуется с другими компонентами работы службы поддержки.
Ниже перечислены темы, рассматриваемые в рамках данного руководства.
ИТ-инцидент – это нарушение в работе ИТ-служб организации, которое оказывает влияние как на отдельного пользователя, так и на организацию в целом. Если говорить кратко, инцидент – это любая ситуация, которая прерывает бесперебойную работу бизнеса.
Управление инцидентами представляет собой процесс управления нарушениями в работе ИТ-служб и восстановления их работоспособности в течение срока, который указан в соглашении об уровне обслуживания (SLA).
Область управления инцидентами начинается с момента сообщения конечным пользователем о проблеме и заканчивается устранением проблемы специалистом службы поддержки.
Организовав управление инцидентами надлежащим образом, можно оптимизировать сбор информации об инцидентах и упорядочить ее, избавившись от путаницы в переписке по электронной почте. Специалисты службы поддержки могут опубликовать соответствующие формы на портале самообслуживания для пользователей, чтобы обеспечить своевременный сбор всей необходимой информации при создании заявки.
Следующий этап управления инцидентами подразумевает классификацию инцидента и присвоение ему приоритета. Это не только помогает сортировать поступающие заявки, но и гарантирует переадресацию заявки тем специалистам, которые обладают всеми необходимыми знаниями и навыками для устранения проблемы. Благодаря классификации инцидентов к инцидентам применяются наиболее подходящие SLA, а конечные пользователи могут узнать о приоритете своих обращений. После того как инциденту присвоены класс и приоритет, технические специалисты могут выполнить диагностику и предоставить конечному пользователю соответствующее решение.
При наличии соответствующих процессов автоматизации управление инцидентами позволяет специалистам службы поддержки отслеживать соблюдение SLA. Также можно настроить уведомление технических специалистов о нарушении SLA; технические специалисты также могут эскалировать нарушения SLA, настроив автоматическую эскалацию, когда это применимо к инциденту. После диагностики проблемы технический специалист предлагает конечному пользователю решение, которое последний может проверить. Данный многоэтапный процесс обеспечивает оперативное устранение ИТ-проблем, которые оказывают влияние на бесперебойную работу бизнеса.
Существуют различные способы классификации инцидентов в ИТ-среде. К факторам, влияющим на классификацию, относятся срочность и степень влияния инцидента на каждого пользователя в отдельности и бизнес в целом. Классификация ИТ-инцидентов помогает в определении инцидентов и их переадресации соответствующим техническим специалистам, что позволяет сэкономить время и усилия. Например, по степени влияния инцидентов на бизнес и срочности их можно классифицировать как серьезные или незначительные. Обычно к серьезным инцидентам относят проблемы, которые оказывают влияние на работу критически важных служб, что влияет на функционирование всей организации в целом. Такие инциденты подлежат немедленному устранению. Незначительные инциденты обычно затрагивают одного пользователя или определенный отдел. Также в отношении таких инцидентов могут иметься задокументированные решения.
Управление инцидентами затрагивает каждый аспект инцидента на протяжении всего его жизненного цикла. Управление инцидентами ускоряет процесс предоставления решения и обеспечивает прозрачность управления заявками. Без управления инцидентами обработка заявок может оказаться достаточно сложной задачей. Вот некоторые из основным проблем, с которыми можно столкнуться:
Хотите оптимизировать управление инцидентами в своей организации?
Запланируйте демонстрацию возможностей ServiceDesk PlusУправление инцидентами широко применяется службами ИТ-поддержки по всему миру. Обычно служба поддержки является единой точкой обращения конечных пользователей для сообщения о проблемах в отдел управления ИТ-инфраструктурой.
Процесс управления инцидентами включает следующие этапы:
В зависимости от типа инцидента эти процессы могут быть простыми или сложными; помимо основного процесса, указанного выше, они также могут включать несколько рабочих процессов и задач.
Для регистрации инцидента можно использовать телефон, электронную почту, SMS, веб-формы, опубликованные на портале самообслуживания, а также живые чаты.
В зависимости от того, какую область ИТ или бизнеса затрагивает инцидент, например, сеть, оборудование и т. д., инциденту можно присвоить категорию и соответствующую подкатегорию.
Приоритет инцидента можно определить с помощью матрицы приоритетов (степень влияния и срочность). Степень влияния на работу бизнеса означает степень ущерба, который проблема нанесет пользователю или организации. Срочность инцидента обозначает временные рамки, в которые инцидент должен быть устранен. Инциденту можно присвоить следующий приоритет:
После присвоения инциденту категории и приоритета он автоматически переадресуется соответствующему техническому специалисту, обладающему необходимыми знаниями и навыками.
В зависимости от сложности инцидента процесс его устранения можно разделить на несколько действий или задач. Задачи обычно создаются в случае, когда для выработки решения по инциденту требуется привлечь нескольких специалистов из различных отделов.
При обработке инцидента техническому специалисту необходимо обеспечивать соблюдение требований SLA. SLA — это приемлемое время, в течение которого требуется предоставить ответ по инциденту (SLA в отношении ответа) или решение (SLA в отношении предоставления решения). SLA можно назначать инцидентам на основе таких параметров, как категория инцидента, автор заявки, влияние, срочность и т. д. В случае, когда требования SLA могут быть нарушены или уже нарушены, инцидент можно эскалировать для передачи другому специалисту или на другой уровень, чтобы обеспечить его оперативное устранение.
Инцидент считается устраненным, когда технический специалист предоставил временное обходное решение или окончательное решение проблемы.
После устранения инцидента и получения от пользователя подтверждения того, что решение сработало и он удовлетворен результатом, инцидент можно закрыть.
После закрытия инцидента рекомендуется задокументировать все выводы, сделанные после инцидента. Это помогает подготовить специалистов к подобным инцидентам в будущем и организовать более эффективный процесс управления инцидентами. Процесс обзора последствий инцидента можно разделить на несколько этапов, как описано ниже. В особенности это очень полезно при устранении серьезных инцидентов.
Помимо указанных выше факторов, также следует оценить ряд факторов, с которыми сталкиваются конечные пользователи. Для этого после закрытия инцидента проводится опрос для сбора отзывов от конечных пользователей, которых затронул инцидент. Результаты такого опроса позволят получить ответы на следующие вопросы:
Создайте собственные рабочие процессы управления инцидентами
Попробуйте ServiceDesk Plus уже сегодняНесмотря на то что в каждой организации могут иметься собственные настраиваемые роли и области ответственности, существует ряд ролей, которые наиболее часто используются в управлении ИТ-инцидентами.
Это та заинтересованная сторона, которая обычно испытывает перебои в работе службы и создает заявку об инциденте для запуска процесса управления инцидентами.
Первая точка обращения авторов заявок, которые хотят сообщить об инциденте. К службе поддержки уровня 1 обычно относятся технические специалисты, обладающие практическими знаниями в области наиболее распространенных проблем, которые могут возникать в ИТ-среде, включая запросы на сброс паролей и проблемы в работе Wi-Fi.
Технические специалисты этого уровня обладают глубокими знаниями в области управления инцидентами. Они обычно занимаются более сложными обращениями от конечных пользователей; от также получают заявки при эскалации проблем от специалистов уровня 1.
Этот уровень обычно представлен специалистами с экспертными знаниями в определенной области информационных технологий. Например, технические специалисты в области обслуживания оборудования и поддержки серверов специализируются в очень узких областях.
Данное заинтересованное лицо играет ключевую роль в процессе управления инцидентами. Помимо других своих обязанностей, инцидент-менеджер организует мониторинг эффективности процесса, предоставляет рекомендации по улучшению, а также обеспечивает соблюдение процесса.
Назначается лицом, ответственным за соблюдение процесса управления инцидентами. Также анализирует, изменяет и улучшает процесс, чтобы он оптимально подходил для организации.
У каждой роли имеется своя уникальная область ответственности, как указано ниже.
Показатели, которые являются основой для принятия важных решений, называются ключевыми показателями эффективности (КПЭ). Ниже перечислены некоторые из КПЭ для эффективного управления ИТ-инцидентами.
Среднее время, которое требуется для устранения инцидента.
Среднее время, которое требуется для реагирования на каждый инцидент.
Количество инцидентов, устраненных в соответствии с требованиями SLA, в процентах.
Количество инцидентов, которые были устранены оперативно, в процентах.
Количество идентичных инцидентов, зарегистрированных в течение указанного периода времени.
Количество устраненных инцидентов, которые были открыты повторно, в процентах.
Количество инцидентов, ожидающих в очереди, по которым не предоставлено решение.
Количество серьезных инцидентов от общего количества инцидентов.
Средние расходы на каждую заявку.
Количество конечных пользователей или клиентов, которые удовлетворены предоставляемыми им ИТ-услугами.
Организовав надлежащий процесс управления инцидентами ITIL, вы получаете следующие возможности:
При выборе системы обработки заявок или программного обеспечения для службы ИТ-поддержки важно обращать внимание на наличие в них определенных функций, от которых зависит эффективное управление ИТ-инцидентами. Ниже перечислены некоторые функции, на наличие которых следует обращать внимание при выборе программного обеспечения для управления инцидентами:
Получите собственное программное обеспечение для управления инцидентами, которое соответствует требованиям ITIL
Приступить к работе с бесплатной пробной версиейУправление инцидентами — это набор политик, процессов, рабочих процессов и документации, которые помогают ИТ-отделам в управлении инцидентами на протяжении всего их жизненного цикла. Процесс управления инцидентами включает определение инцидента, его регистрацию вместе со всей необходимой информацией, диагностику проблемы и своевременное восстановление обслуживания. Управление инцидентами можно сравнить с тушением пожара, где основной целью является минимизация ущерба для бизнеса.
С другой стороны, управление ИТ-проблемами представляет собой процесс определения основной причины одного или нескольких инцидентов и последующего выполнения мероприятий по устранению проблемы. Управление проблемами призвано минимизировать влияние проблемы на бизнес путем применения более организованного подхода в виде анализа основных причин, который используется для выявления основной причины. После этого проблема устраняется для исключения подобных инцидентов в будущем. Наконец, определение основных проблем помогает в управлении инцидентами и способствует бесперебойной работе бизнеса.
Процесс управления изменениями ITIL — это процесс систематического изменения ИТ-инфраструктуры организации в соответствии со стандартами. Это четко спланированный процесс, состоящий из нескольких этапов и включающий различные состояния, в которых могут находится ИТ-изменения.
Обычно ИТ-изменения инициализируются по завершении процессов управления ИТ-проблемами для устранения обнаруженных ИТ-проблем с целью заменить неисправный актив, который приводит к возникновению повторяющихся инцидентов, или в рамках предоставления решения при устранении серьезного инцидента. Цель управления ИТ-инцидентами — свести к минимуму перебои в работе ИТ-инфраструктуры и оперативно восстановить обслуживание. В некоторых случаях реализация изменений может привести к возникновению инцидентов, подавляющее большинство из которых являются незначительными, вызванными временными перебоями в обслуживании или недоступностью службы. Влияние таких инцидентов можно минимизировать за счет упреждающего уведомления пользователей об изменениях, а также определения предполагаемых инцидентов или недоступности службы. Если изменение вызвало серьезный инцидент, группы управления изменениями могут сразу же откатить такое изменение для восстановления нормальной работы.
Интегрировав процессы управления ИТ-активами и управления ИТ-инцидентами, можно значительно упростить для технических специалистов уровней 2 и 3 диагностику инцидентов и предоставления решений по ним. Например, когда пользователь сообщает о проблеме, связанной с ограниченным подключением к Интернету, проблема может быть связана либо с компьютером, либо с маршрутизатором, к которому он подключен. Обладая всей информацией о компьютере пользователя – включая сведения о маршрутизаторе, к которому он подключен, и данные о нем, – технический специалист может оперативно определить причину инцидента и предоставить соответствующее решение. С точки зрения управления активами связывание ИТ-инцидентов с активами помогает ИТ-отделам определять и исключать неисправные активы, которые приводят к возникновению повторяющихся инцидентов в организации.
Незапланированное прерывание ИТ-обслуживания или снижение его качества. Сбой в работе элемента конфигурации, даже если он еще не коснулся работы службы, также считается инцидентом (например, сбой в работе одного из дисков в массиве).
Процесс обнаружения инцидента.
Создание и сохранение записи об инциденте в виде заявки.
Надлежащее протоколирование инцидента для присвоения ему соответствующей категории.
Закрытие открытой заявки об инциденте после его устранения.
Набор правил, определяющих иерархию для эскалации инцидентов, включая триггеры, которые вызывают эскалацию. Триггеры обычно основаны на степени серьезности инцидента и времени предоставления решения.
Управление жизненным циклом всех инцидентов для восстановления нормальной работы службы и сведения к минимуму влияния на бизнес.
Ряд отчетов, создаваемых инцидент-менеджером для различных целевых групп (например, для групп, занимающихся ИТ-управлением, управлением уровнем обслуживания, другими процессами управления обслуживанием или управлением самим инцидентом).
Лицо, ответственное за эффективное внедрение процесса управления инцидентами и отчетность. Также выступает в роли первого этапа для эскалации, если инцидент не удается устранить на согласованном уровне обслуживания.
Содержит предварительно заданные этапы, которые должен пройти инцидент определенного типа.
Отслеживание статуса инцидентов для оперативного принятия мер по их устранению, если существует риск нарушения требований соглашения об уровне обслуживания.
Назначение приоритетов инцидентам и определение тех, которые представляют собой серьезные инциденты.
Набор данных об инциденте со всеми подробными сведениями о нем, в котором задокументирована вся история инцидента, от его регистрации до закрытия.
Отчет, в котором содержится информация об инцидентах, сведения о том, как они были обработаны, а также другие данные, которые помогают измерить эффективность процесса управления инцидентами.
Обходное решение или исправление, которое позволяет устранить инцидент и возобновить обслуживание без потери качества.
Этап, на котором находится инцидент в процессе управления инцидентами. К наиболее распространенным статусам относятся следующие:
Эксклюзивный набор списков функций и презентаций по управлению инцидентами.
Полный список необходимых функций, который можно использовать для оценки работы своей службы ИТ-поддержки.
Подробные презентации с примерами использования управления инцидентами ITIL, которые помогут приступить к работе.
ServiceDesk Plus, флагманский продукт компании ManageEngine, представляет собой программное обеспечение для службы технической поддержки, которое используется профессионалами в области ITSM по всему миру и обеспечивает поддержку ITIL. Благодаря функции ITSM, сертифицированной по отраслевым стандартам, удобству использования и собственным мобильным приложениям ServiceDesk Plus использует передовые технологии, чтобы помочь ИТ-отделам организовать высококлассное обслуживание конечных пользователей при одновременном сокращении затрат и снижении сложности. Программное обеспечение, которое доступно как в облаке, так и локально, предлагается в трех версиях и на 29 языках. Свыше 100 000 организаций в 185 странах применяют ServiceDesk Plus для оптимизации своих служб ИТ-поддержки и использования передовых практик в области управления ИТ-обслуживанием. Подробные сведения о ServiceDesk Plus представлены на странице по адресу manageengine.com/ru/service-desk.
Zoho Corporation Pvt. Ltd. Все права защищены.