Библиотека ITIL — подробный набор методов управления ИТ-услугами, который применяют с восьмидесятых годов. Но путаница в используемых терминах и их значении до сих пор преследует тех, кто только начинает внедряет у себя соответствующие методологии.

В этой статье мы попытаемся разграничить три пары похожих терминов:

  • Инцидент и проблема
  • Управление инцидентами и управление проблемами
  • Service desk и Help Desk

На основе примеров покажем, для чего нужен каждый из них.


/ Flickr / Dennis / CC

Инцидент и проблема


IT-специалист и автор тренингов по ITIL Майкл Скарборо (Michael Scarborough) подчёркивает, что между терминами установлена следующая зависимость: проблема — причина, инцидент — следствие.

Второе отличие, по мнению Майкла, заключается в том, что инцидент можно разрешить только на определённое время. Когда мы говорим «разрешили инцидент», это значит, что временно восстановили какую-то услугу (на 10 лет или всего на 1 минуту). То есть очень вероятно, что подобная ситуация повторится в будущем.

Проблема же, это причина возникновения инцидентов. Эксперт в области ITSM профессор Росс Вайз (P. Ross S. Wise) считает, что первый признак проблемы — вопрос «почему», который вы задаёте себе.

Посмотрим на примеры, которые приводит директор по маркетингу компании Hornbill Питер Саммерс (Peter Summers).

Инцидент: пользователь звонит в службу поддержки и сообщает, что не может распечатать документ. Специалист, который принимает вызов, обнаруживает, что указанный файл вызвал ошибку в очереди печати. Чтобы можно было продолжить работу, специалист предлагает пользователю временно воспользоваться принтером в соседнем офисе.

Проблема: инцидент с принтером — признак глобальной проблемы. Этот пользователь — первый из многих, кто позвонит сегодня в службу поддержки. Допустим, удалось установить, что причиной инцидентов является обновление офисного ПО прошлой ночью. Если исправить баги апдейта, проблема будет решена и отказов в печати по этой причине больше не будет.

Для наглядности возьмём более приземлённый пример. Вы едете на машине, и у неё лопнуло колесо. Это инцидент, потому что прокол нарушил ваши планы: вам приходится останавливаться, чтобы заменить колесо. В этом случае инцидент считается исчерпанным. Но теперь у вас есть проблема — вы едете на запасном колесе. Чтобы устранить проблему, вам нужно залатать покрышку.

Другой пример: вы едете на лысой резине — это проблема. Если вы продолжите её игнорировать, вероятность возникновения инцидента будет расти, покрышка, вероятно, лопнет.

Чтобы упростить вопрос с разграничением значений этих двух терминов, Филип Юсон (Philip Yuson), генеральный директор Concept Solutions Corporation, рекомендует задавать следующие вопросы:

  • Сервис недоступен?
  • Ухудшилось ли качество услуг?
  • Пострадали ли бизнес-процессы?
  • Пострадало ли качество предоставления услуги?

Если вы ответили «да» на один из этих вопросов, скорее всего, вы столкнулись с инцидентом.

Incident Management и Problem Management


Мы уже выяснили, чем отличаются инцидент и проблема, поэтому разграничить эти два процесса будет проще. ITIL определяет эти два термина следующим образом:

Управление инцидентами — управляет жизненным циклом всех инцидентов. Цель: скорейшее восстановление ИТ-услуги для пользователей.

Управление проблемами — управляет жизненным циклом всех проблем. Цель: предотвращение инцидентов в будущем.

Посмотрим на примеры от специалистов Microsoft. Представим сценарий: к специалисту техподдержки обратился пользователь, который не может просмотреть электронное письмо из-за ограничений. Саппорт создаёт новый инцидент с помощью шаблона e-mail incident, чтобы быстро разрешить ситуацию и обрабатывать похожие случаи в будущем.

В сценарии управления проблемами специалист техподдержки создаёт запрос на внесение изменений в код. Когда команда найдёт и устранит причину проблемы, это разрешит проблему и автоматически устранит инциденты с ней связанные.

Для большей ясности приведём пару примеров из жизни. Управление инцидентами похоже на работу пожарных. Они приходят на место происшествия и стараются максимально эффективно погасить огонь. То же самое происходит при управлении инцидентами. Возобновить работу инфраструктуры нужно быстро.

Далее начинается управление проблемами и детальное расследование происшествия. Этот процесс похож на работу эксперта или следователя. Он не был на месте, когда тушили пожар, но может определить причину возгорания и дать рекомендации, которые позволят избежать таких ситуаций в будущем.

Service desk и Helpdesk


Для начала вновь заглянем в официальную терминологию ITIL.

Service Desk — единая точка контакта (SPOC) между поставщиком услуг и клиентами. Функции: управляет инцидентами, запросами на обслуживание.

Help desk — точка контакта для пользователей. Функции: регистрирует инциденты.

Термин «служба поддержки» часто употребляется как синоним службы Service Desk, что является главной причиной путаницы в терминах. Крис Коффи (Cris Coffey), менеджер по маркетингу компании BMC Software, который работает на рыке Help Desk уже 20 лет, выделяет следующие различия между двумя этими службами.

Service Desk: полностью интегрируется с другими ITSM-процессами, помогает организации соответствовать соглашениям об управлении уровнем услуг, интегрируется с базой данных управления конфигурациями и процессом управления активами.

Help Desk: отслеживает все входящие инциденты, автоматически отслеживает уведомления по электронной почте, предлагает ограниченную интеграцию с другими ITSM-процессами, предоставляет услуги самообслуживания для конечных пользователей.

Посмотрим, как это выглядит на практике. Пример работы Help Desk: драйвер для принтера Джо сломался, а ему нужно распечатать копии документов до 10 часов. Help Desk поможет Джо восстановить работу принтера или найдёт другой способ получить распечатки вовремя. Задача службы — сделать так, чтобы распечатки были в руках у Джо до 10 часов.

В той же ситуации Service Desk заметит, что за прошедшую неделю несколько человек с этого этажа обратились в службу с той же проблемой. Это значит, что проблема — глубже, чем кажется. Service Desk отправляет специалиста, чтобы установить корень проблемы с принтером. Задача службы — устранить первопричину.

Напоследок кратко обобщим все разобранные моменты:

Инцидент и проблема

  1. Проблема — причина, инцидент — следствие.
  2. Инцидент устраняем сразу же. После него ищем источник проблемы разрешаем её.

Управление инцидентами и управление проблемами

  1. Управление инцидентами работает быстро, а управление проблемами — тщательно.
  2. Устраняем проблему — предотвращаем инциденты, связанные с ней.
  3. Устраняем инцидент — помогаем пользователю продолжить работу.

Help Desk и Service Desk

  1. Service Desk — стратегия, Help Desk — тактика.
  2. Service Desk работает для сотрудников и для клиентов, а Helpdesk только для клиентов.
  3. Service Desk концентрируется на процессах и делает всё, чтобы они соответствовали ITIL.
  4. Help Desk концентрируется на помощи. Его главная задача — решить задачи клиента.



P.S. Еще пара материалов из нашего блога:

Комментарии (4)


  1. kay
    27.11.2017 00:28

    Можно ли пользоваться услугой?
    Ухудшилось ли качество услуг?
    Пострадали ли бизнес-процессы?
    Пострадало ли качество предоставления услуги?
    Если вы ответили «да» на один из этих вопросов, скорее всего, вы столкнулись с инцидентом.

    Можно ли пользоваться услугой? Да.


    Инцидент?


    В оригинале так:


    Is the service unusable?
    Is there a degradation of the service?
    Is the business process affected greatly?
    Are service levels affected?

    Я бы первый вопрос перевел: Услуга недоступна?


  1. kolu4iy
    27.11.2017 09:41

    Вопрос: если решение инцедента приведёт к заметанию следов причин возникновения проблемы — насколько правильно решать его сразу? Вопрос не праздный. Сервис на сервере завис — сервер перезагрузили — инцидент решён. А проблема осталась: никто не знает почему завис сервис — логи при перезагрузке потерялись, объемы занимаемой памяти и активность дисковой подсистемы никто не снял и т.д… В идеале за технической стороной вопроса, конечно, должен смотреть мониторинг. В реальной жизни — неучтённые обстоятельства бывают всегда, как мне кажется.


    1. Mikhael1979
      27.11.2017 12:09

      >… насколько правильно решать его сразу?

      Зависит от вашего SLA. Если уровень сервиса позволяет дождаться специалиста, который займётся поиском причины на месте — правильно его дождаться. А если у вас по SLA допустимое время простоя — 3 минуты, то перезагружаем сразу, потом делаем снэпшот и на препродуктовой среде пробуем воспроизвести баг для поиска проблемы.

      Как-то так.


  1. ikormachev
    27.11.2017 13:58

    Настолько сложно все описали, что даже сами запутались и ввели людей в заблуждение. Если коротко: инцидент — отклонение от нормального функционирование, проблема — причина повторяющихся инцидентов. Замена пробитого колеса на докатку — это обходное решение инцидента, проблема — это гвозди на дороге из-за которых колеса постоянно пробиваются.

    Управление инцидентами — процесс, направленный на оперативное восстановление работы отказавших систем. Управление проектами — процесс, направленный на анализ причин повторяющихся сбоев и устранение этих причин (если это экономически обосновано).

    Как по мне, разница между Helpdesk и ServiceDesk небольшая. В реальности и то и другое в компаниях используется практически одинаково. Ну и да, ни один ServiceDesk не умеет обнаруживать повторяющиеся инциденты в автоматическом режиме и создавать проблему — все же это делает руками человек. Остальные выводы относительно различия Helpdesk и ServiceDesk попахивают булшит.