image alt text


Чем новее сервер, тем дольше он грузится. Особенно это раздражает при диагностике или в ходе обновления прошивок, поэтому однажды я покопался в закромах Dell и нашел несколько полезных утилит для экономии нервов.


Автоматическая миграция и самостоятельная прошивка


У Dell есть бесплатный набор инструментов OpenManage Essentials для мониторинга оборудования и обновления прошивок. Для инфраструктуры с физическими серверами это неплохой вариант решения некоторых административных задач:


  • Мониторинг любого оборудования через SNMP, IPMI и WMI. Для OpenManage Essentials 2.2 и новее доступен импорт файлов описаний MIB прямо из консоли. Для более старых версий потребуется Dell OpenManage Essentials MIB Import Utility;


  • Загрузка и установка новых версий драйверов и прошивок.

Если же у вас виртуальная среда, то пригодится Dell Management Plug-in for VMware vCenter.


image alt text


Плагин позволяет vCenter своевременно узнавать об аппаратных сбоях, а заодно обновлять прошивки, драйверы и BIOS на хостах с ESXi. Но что оказалось наиболее полезным, с ним vCenter может мигрировать виртуальные машины перед запуском прошивки.


Миграция при обновлении сервера доступна как для актуальных систем Dell PowerEdge 12 и 13 поколений, так и для восстановленных серверов 11 поколения с контроллером iDRAC.


Что такое iDRAC

Это проприетарный вариант IPMI (Intelligent Platform Management Interface). Фактически, тот же "удаленный доступ к физической консоли и BIOS", но с дополнительными инструментами от Dell. Аналог от HP – iLO (Integrated Lights-Out), от IBM – RSA (Remote Supervisor Adapter).


Сценарий обновления железа на виртуальных хостах теперь выглядит так:


  1. Прямо в консоли vCenter я вижу пометки о необходимости обновления – там же можно запустить FirmWare Wizard. Мастер может подтягивать обновки как из онлайн-репозитория Dell, так и из местных источников;

image alt text


  1. Затем выбираю обновления и указываю удобное время. Обязательно отмечаю BIOS, iDRAC и LifecycleControler, чтобы не получить проблем при установке;


  2. Обновление кластера занимает от 30 до 60 минут. Если все пройдет успешно, то машины вернутся обратно на свой хост, а за процессом можно наблюдать через почтовые уведомления или на странице Job Queue.

image alt text


Для автоматического перемещения виртуальных машин на другой хост vSphere должна работать в конфигурации DRS (Distributed Resource Scheduler) с полностью автоматическим режимом.


Без плагина все эти операции выполнялись вручную, включая предварительную миграцию машин, создание загрузочной флешки для обновления, прошивку каждого компонента отдельно и т.п. Разумеется, сидя рядом с сервером, что уже не так красиво и удобно.


Конечно, нечто подобное можно попробовать реализовать на базе Zabbix и набора скриптов. Но почему бы не использовать некоторые удобства, которые обходятся компании в скромные $495 за лицензию на плагин для 5 хостов.


Были некоторые опасения вида "а что, если все пойдет не так, и на следующий день серверы вообще не будут работать". От большинства сложностей есть такой алгоритм:


  1. Я получаю оповещение о том, что виртуальные машины успешно или не очень мигрировали. Если миграция не удалась – обновление не начнется, и на следующий день я спокойно разберусь в ситуации;


  2. После миграции машин на другой хост наш "пациент" может хоть сгореть, пользователи не заметят. При неудачном обновлении хост не будет пытаться снова и снова загрузиться, а будет спокойно ожидать отката прошивки. Конечно, если не забыть поставить галку Enable Alarms for Dell Hosts при настройке OpenManage Integration;


  3. Если обновление микро-ПО прошло не слишком удачно, то уже будут готовы журналы перезагрузок и скриншоты консоли в процессе.

Конечно, порой и кластер не панацея, но от всего и не застрахуешься.


К слову о скриншотах – это следующая полезная опция.


Скриншоты синих и пурпурных экранов


Знаете, как это бывает: добавляешь драйвер на хост, перезагружаешь ESXi и спокойно отключаешься от удаленного управления в ожидании загрузки системы. А она все недоступна и недоступна. Подключаешься снова и видишь пурпурный экран. Понятно, что первым действием будет откат добавленного модуля. А если проблема не в нем?


В таких случаях я сначала перезагружаю хост и наблюдаю за процессом загрузки, его этапами и возникающими сообщениями. Для серверов с модулем iDRAC 7 Enterprise ведется лог сообщений и экранов консоли при загрузке сервера, зависании или возникновении ошибок. То есть, вся диагностическая информация уже под рукой и не требует многократных перезагрузок, каждая из которых у современных систем может длиться более 5 минут.

image alt text


Можно просмотреть записи последних трех загрузок. Для работы опции нужна лицензия iDRAC Enterprise за $75.


Еще немного магии iDRAC


Аппаратный модуль управления Dell может отменить неудачную установку прошивки и вернуть любую прошлую версию. Это полезно, например, при обнаружении бага в новой версии – о подобных вещах как раз была дискуссия в комментариях к статье про сервисные контракты. Можно просто вернуть "как было" и больше не трогать. Откат прошивок доступен сразу для нескольких компонентов за одну перезагрузку, что здорово экономит время (помним про неспешную загрузку современного железа с десятками ГБ памяти).


Пару лет назад неудачно прошили BIOS в сервере и после перезагрузки любовались такой вот надписью:


image alt text


Все, что я сделал после первичной паники – это зашел в Lifecycle Controller со своей станции и выбрал Launch Firmware Rollback для BIOS, который успешно отыграл свою партию.


image alt text


Мастер восстановления прошивок поддерживает следующие устройства:



Из дополнительных полезных удобств iDRAC:


  • Встроенный сервер VNC. Позволяет подключаться к iDRAC через привычный клиент VNC, без использования браузера или установки стороннего ПО. Требует лицензии iDRAC Enterprise;


  • Прозрачная аутентификация в Active Directory. До сих пор многие коллеги используют локальный учетные записи в модулях аппаратного управления, что довольно неудобно при смене ответственного за конкретный сервер.

Мобильная перезагрузка и мониторинг


В наш век модных мобильных технологий даже автомобиль уже можно открыть или запустить с телефона. Нечто подобное есть и от Dell – называется OpenManage Mobile, приложение доступно под Android и iOS.


image alt text


Фактически, это урезанный клиент консолей OpenManage Essentials и iDRAC, который можно установить на смартфон или планшет и получить следующие возможности:


  • Включение и перезагрузка сервера;
  • Просмотр уведомлений iDRAC;
  • Чтение журналов событий OpenManage Essentials;
  • Запуск подключения через VNC. В приложении есть ссылки на удаленное управление, которые откроются в установленном по умолчанию VNC-клиенте планшета;
  • Загрузка документации к оборудованию.

Есть у меня старая дурная привычка: уже после манипуляций с железом или софтом на одной из наших площадок еду в офис и по дороге просматриваю последние состояния «пациентов» через оповещения в почте. OpenManage Mobile вывел привычку на новый уровень и позволил смотреть статус в реальном времени. Конечно, я бы не рискнул вот так просто перезагружать сервер удаленно вне офиса, но просмотр статусов и логов частенько пригождается.


image alt text


Использовать приложение логичнее с планшета – тогда можно организовать удобный VNC-доступ и получить своеобразный пульт управления сервером. Разумеется, доступ к сети с интерфейсами iDRAC осуществляется через VPN.


О земном


Если посчитать стоимость всех этих бонусов для одного сервера, то выходит $174:


  • Dell iDRAC Enterprise обойдется примерно в $75 на каждый сервер;
  • Dell Management Plug-in for VMware vCenter – около $99 на хост.

Даже без покупки дополнительных лицензий вы получаете детальный мониторинг всех компонентов PowerEdge "из коробки", вместе с бесплатной системой мониторинга сети и стороннего оборудования OpenManage Essentials.


А какие инструменты управления скрашивают ваши административные будни?


Напоследок, несколько полезных ссылок:


Поделиться с друзьями
-->

Комментарии (14)


  1. KorP
    29.09.2016 20:49

    А для HPE есть что то аналогичное под vmware?


    1. buggg
      30.09.2016 11:00

      Если про обновление прошивок — то, HPE может предложить HP SIM (не путать с SUM).
      Там и автодискаверинг, и мониторинг, и менеджмент прошивок и много всего другого.
      И даже плагин был для vSphere, но как я не пытался, у меня не удалось подружить.

      Но это было пару лет назад. Слышал что теперь все это переплыло в HP OneView, но там это за хорошую денежку.


      1. KorP
        30.09.2016 11:01
        +1

        Да у меня этот Dell Management Plug-in for VMware vCenter вчера что то то же не поднялся, видать староват у меня Dell. Вроде всё видит, всё находит, а авторизоваться не может… плюнул я в итоге на это дело и пошёл спать :)


        1. alligator_one
          30.09.2016 16:17

          А что за сервер dell?


          1. KorP
            30.09.2016 16:18

            r710


            1. alligator_one
              30.09.2016 19:38
              +1

              R710 есть в списке совместимых серверов:
              http://www.dell.com/support/home/ru/ru/rubsdc/Drivers/DriversDetails?driverId=P68G5


              1. KorP
                30.09.2016 19:44

                Ну тем не менее — залогиниться он не смог… ни на сам esxi на сервере, ни в iDrac (при том что там нет отдельного указания ip для него и он видимо по тому же ip пытался войти...)


                1. alligator_one
                  01.10.2016 03:19

                  R710 — сервер 11 поколения. Он не умеет с плагином интерграции через iDRAC общаться — только через OMSA.

                  For installations on PowerEdge 11th generation servers OMSA agent is now automatically installed during the deployment process. For more information about OMSA, please see the section “Understanding OMSA For 11G Hosts” in the Dell Management Plug-in User's Guide.

                  http://downloads.dell.com/Manuals/all-products/esuprt_electronics/esuprt_software/esuprt_virt_solutions/dell-mgmt-plugin-for-vmware-center-1.6_User%27s%20Guide_en-us.pdf


    1. dimskiy
      30.09.2016 12:51

      Про HPE тоже готовится статья, скоро расскажем про их полезные утилиты тоже.


  1. ivakin
    29.09.2016 21:43

    Спасибо большое за информативную статью!
    Я как раз тестирую OpenManage Essentials (OME), есть пару моментов которые неясны. Может вам удалось их решить.

    — нет возможности обновлять OpenManage Server Administrator (OMSA) через OME. Версию установленного софта оно показывает, а вот в обновлениях его нет. Для меня это довольно критично, так как я мониторю серваки через SCOM, а там Dell Management Pack работает с последним OMSA. Понятно что можно раскатывать обновления обычными средствами GPO, но хотелось бы что-то Dell native.

    — что то у меня не встречались обновления для Lifecycle Controller. Возможно это были не совсем свежие серваки, проверю на более новых моделях.

    У меня нет Vmware, все только от Microsoft (Hyper-V).


  1. Year
    29.09.2016 23:41

    1 Возможность обновлять OMSA через OME есть. Manage->Remote Tasks->Create deployment task. Пошаговый конспект есть на сайте Dell.
    2 Обновления для LC есть, но они выходят нечасто, примерно по версии в год. Manage->System updates->Non-Compliant Systems.


    1. ivakin
      30.09.2016 09:39

      Спасибо большое!


    1. alligator_one
      30.09.2016 10:00
      +1

      1. на http://en.community.dell.com/techcenter/extras/m/white_papers/20069180


      1. ivakin
        30.09.2016 10:02

        отлично, спасибо!