Вот уже 12 лет я занимаюсь обслуживанием ИТ-систем на промышленных предприятиях. Очень часто работодатели ставят передо мной весьма интересную задачу: сделать так, чтобы ИТ-системы работали без сбоев и с минимально возможным операционным бюджетом.

Для реализации этой цели я использую «деформированную» ITIL. Началось все со смены терминологии. Дело в том, что заводами руководят люди старой закалки. Они плохо понимают значение «Problem Management». Но очень хорошо знают, что такое «устранение аварий». Поэтому рассказывать о «проактивном управлении проблемами» все равно, что о стенку головой биться. Оплачивать эту заморскую диковинку они не хотят.

А вот когда говоришь о «безаварийной эксплуатации оборудования» начинают слушать очень внимательно. Ведь аварии — это простои оборудования, сорванные сроки поставок. Это нервы, это деньги. Руководство заводов не хочет аварий. Поэтому готово вкладывать ресурсы в эксплуатацию без аварий.

Но изменением терминологии ITIL дело не ограничивалось, изменения затрагивают и процессную модель. Плохо это или хорошо – прочитайте статью до конца и решите сами.

В упрощенном виде безаварийную модель эксплуатации ИТ-оборудования можно разделить на два процесса.

image

Зеленая ветка – усеченная версия процесса «Управление инциндентами». Его цель – обеспечить ежедневное функционирование ИТ-систем. Это «обслуживание по факту», т.к. мы приступаем к работе только после получения информации о произошедшем инциденте.

  1. Если у пользователя возникает потребность в помощи ИТ-специалистов, он отправляет заявку на обслуживание в ServiceDesk.
  2. ИТ-специалисты принимают обращение в работу, классифицируют, анализируют его и приступают к решению.
  3. После выполнения заявки вносят в ServiceDesk информацию о проделанной работе и использованных ТМЦ (необходимо для планирования закупок на следующий период).

Красная ветка — плановое техническое обслуживание (ТО). Задача этого блока мероприятий – поддерживать исправное состояние оборудования и коммуникаций в течение всего срока службы. Чтобы не допустить возникновения инцидентов мы по заранее составленному плану ликвидируем причины их появления.

  1. В конце года руководитель ИТ-службы составляют графики ТО на следующий год. При этом используются документы: перечень работ технического обслуживания, руководство по эксплуатации, планы послеаварийного восстановления.
  2. В течение года (в соответствии с составленным расписанием) через ServiceDesk выдаются задания на конкретную работу по обслуживанию оборудования.
  3. Сотрудник ИТ-службы выполняет предписанный регламентом перечень работ. Если обнаруживает отклонение от нормального функционирования системы – создает заявку в ServiceDesk.
  4. После завершения работ заносит информацию в ServiceDesk информацию о проделанной работе и использованных ТМЦ.

По моим оценкам, грамотно спланированное и правильно реализованное ТО позволяет на 50-70% снизить количество обращений пользователей за поддержкой. И поскольку планирование технического обслуживания сделано совсем не по ITIL, стоит рассмотреть эту процедуру более подробно.

Во-первых, хочу отметить, что ТО в моем понимании складывается из нескольких видов работ:

  • Планово-предупредительные работы. Проводятся строго по графику, без привязки к фактическому состоянию оборудования. Позволяют точно планировать запасы комплектующих частей и свести к минимуму отказы оборудования. Могут осуществляться персоналом средней квалификации, но требуют значительных финансовых расходов (т.к. меняем еще рабочее детали, держим внушительный запас комплектухи на складе).
  • Планово-профилактические работы. Инициируются с учетом текущего состояния оборудования, поэтому требуют высокой квалификации обслуживающего персонала и вложений в инструменты диагностики. Но позволяют минимизировать затраты на комплектующие материалы.
  • Нормативное обслуживание. Выполняются в соответствии с требованием надзорных органов и нормативных документов (ПТЭЭП и т.д.). ИТ-служба редко сталкивается с такими работами, поэтому заострять внимание на них не будем.
  • Текущий ремонт. Проводится раз в несколько лет с целью продлить нормативный срок службы оборудования и коммуникаций.

Небольшое отступление. Помните, с описания какой цели я начал эту статью? Cделать так, чтобы ИТ-оборудование работало без сбоев и с минимальным операционным бюджетом.

Скорее всего, что системы и оборудование, задействованные в основных бизнес-процессах, будут наиболее важны для работодателя. И при обслуживании таких систем он сделает акцент на «работа без сбоев». В этом случае нужно большее внимание уделить предупредительным работам. Для вспомогательных систем во главу угла, скорее всего, встанет «с минимальным бюджетом». В этом случае нужно внедрять профилактические работы и текущие ремонты. У нас эти моменты решаются через SLA, но это тема другой статьи.


Во-вторых, хочу отметить, чтобы персонал ИТ-службы смог качественно провести техническое обслуживание, он должен быть обеспечен документацией на проведение ТО.

Фундаментом для организации ТО является перечень работ по каждой группе оборудования. В качестве примера привожу фрагмент нашего перечня работ по обслуживанию ПК.

  • Опрос пользователя о недостатках в работе оборудования.
  • Проверка целостности наклеек с инвентарным номером и номером лицензии.
  • Осмотр электрических кабелей подключенного оборудования.
  • Проверка S.M.A.R.T. HDD, при необходимости тестирование HDD.
  • Осмотр компонентов системного блока (материнская плата, блок питания, соединительные кабели и т.д.).
  • Удаление пыли и грязи с поверхностей оборудования и внутри системного блока.
  • Замена HDD, RAM, клавиатуры, мыши и других узлов (в случае выработки ресурса).
  • Контроль температуры в помещении.
  • Фиксация выполненных работ в ServiceDesk.

Т.е. это простой «чеклист» для обслуживающего персонала. Составив такой перечень можно переходить к формированию графика ТО оборудования. Но что бы проводимые работы были обоснованными и максимально эффективными, стоит подготовить еще несколько документов:

image

Руководства по эксплуатации основных ИТ-систем (ЛВС, учетная система и т.д.). В таких документах должно содержаться общее описание ИТ-систем, описание действий персонала в штатном режиме работы, определение зон ответственности и обязанностей команд эксплуатации.

Планы послеаварийного восстановления (DRP). В этих документах должны быть описаны наиболее вероятные отказы в работе ИТ-систем и пошаговые процедуры восстановления работоспособности. Кроме этого должны быть описаны программы тестирования планов.

Из этих документов в график работ «перекочуют» действия обслуживающего персонала в штатном режиме (в основном это проверка log-файлов) и процедуры по тестированию DRP (замена жесткого диска в сервере с целью проверки работы RAID и т.д.).

Третий момент, на котором хочу заострить ваше внимание. Чтобы графики ТО наиболее точно соответствовали потребностям бизнеса в отказоустойчивости оборудования, нужно учитывать несколько факторов: плановый срок службы комплектующих, рекомендации производителя оборудования по проведению ТО, фактические условия эксплуатации. Что это значит на практике? В частности то, что для групп оборудования, находящегося в разных условиях эксплуатации, стоит сделать разные графики обслуживания.

К примеру мы разрабатываем отдельные графики обслуживания ПК в офисных и в производственных помещениях. Компьютеры в офисе размещены на столах или напольных подставках, влажная уборка помещений осуществляется ежедневно. В производственных помещениях хоть и делают влажную уборку каждый день, все равно очень пыльно. Поэтому ТО в офисе проводим 2 раза в год. Первый раз в мае, второй раз в ноябре. А вот в производственных помещениях ТО проводится ежемесячно. Перечень работ я указывал выше.

На этом я бы хотел пока остановиться и узнать мнение уважаемого сообщества.
Стоит ли описывать модель «безаварийного обслуживания» дальше?

Проголосовало 120 человек. Воздержалось 23 человека.

Какие моменты нужно раскрыть более подробно?

Проголосовало 108 человек. Воздержалось 23 человека.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Комментарии ()