В шведском дата-центре Digiplex, который используется Nasdaq для осуществления операций в Северной Европе, в середине апреля произошел серьезный сбой. Вышли из строя жесткие диски многих серверов. Причиной стала неверно настроенная система пожаротушения — она издавала при работе крайне громкий звук, который привел к повреждениям дисков.

Что случилось


Традиционно я дата-центрах и технических помещениях используются системы тушения, работающие при помощи инертного газа — это позволяет потушить пожар, не повредив оборудование водой или пеной. Однако при неверной настройке подобной системы, ее работа может сопровождаться крайне громким звуком, возникающим при выходе газа из баллонов. А такие звуки могут вывести из строя жесткие диски, что и произошло в дата-центре Digiplex.

Как удалось выяснить изданию Bleeping Computer, система тушения сработала случайно, пожара в действительности не было. В результате инцидента вышли из строя серверы Nasdaq, а также скандинавских банков FIM Bank и OP Bank Group.

Простой в результате сбоя составил около пяти часов — после этого инженеры Nasdaq Nordic запустили резервную систему. При этом представитель компании заявил, что для замены всего вышедшего из строя оборудования «не хватит серверов во всей Швеции», и его придется импортировать из других стран.

Не первые проблемы из-за громкого звука в ЦОД


Инциденты, подобные сбою в дата-центре Nasdaq, случались и ранее. К примеру, в сентябре 2016 года громкий звук системы пожаротушения на десять часов вывел из строя дата-центр румынского ING Bank.

Негативное влияние громких звуков на работу жестких дисков подтверждается различными исследованиями. К примеру, эксперименты экспертов компании IBM подтвердили тот факт, что в некоторых случаях работа систем пожаротушения на инертном газе может приводить к подобным проблемам.

Другие материалы по теме финансов и фондового рынка от ITI Capital:


Комментарии (16)


  1. saag
    05.05.2018 19:17

    Как я их понимаю, у меня в свое время вышел из строя рейд-контроллер, а на нем был RAID5, печалька была.


    1. CherryPah
      05.05.2018 20:00

      1) Зачем использовать raid5?
      2) Замена вышедшего из строя контроллера разве не является штатной процедурой?


      1. saag
        05.05.2018 20:25

        1)Ну зачем то его собрали, это было до меня, причем поскупились купить нормальный рейд-контроллер.
        2) Пришлось собирать RAID1 на встроенном контроллере с сопутствующими операциями.


      1. Frankenstine
        06.05.2018 09:48

        Замена вышедшего из строя контроллера разве не является штатной процедурой?

        Когда как. Порой бывает, что RAID собран специфическим для контроллера способом, несовместимым с другими производителями, и данный производитель уже ничего не выпускает такого, соответственно замену днём с огнём не сыщешь.


      1. VolCh
        06.05.2018 14:08

        2) Зависит от модели угроз и требуемого уровня обслуживания.



  1. a0fs
    05.05.2018 21:08

    Читал как-то, что по весне в советских ЦОД-ах, работающих с ЕС и иже с ними происходила активизация грызунов, которые начисто сжирали магнитные ленты. Без остатка так. Зато работникам было чем помидорки подвязывать. Так вот, всё таки вопрос — не тот ли случай?


  1. LeshaRB
    05.05.2018 22:42

    Где-то я читал уже похожее…


  1. erondondon
    05.05.2018 23:09

    Тесла звуком дом шатал.


  1. Dmitri-D
    06.05.2018 00:17

    у винтов уже дано есть датчик ускорения, который позволяет остановить запись и отправить головки на паркинг. Что мешало установить микрофон и делать то же самое, если громкий звук рядом с резонансными частотами?


  1. mspain
    06.05.2018 08:59
    +1

    Если на резерв переключили только через 5 часов, то у кого-то явно руки в том самом месте :) глядишь и россказни про злое пожаротушение не особо правда


  1. achekalin
    06.05.2018 10:26
    +1

    Удивили люди: построить систему с вообще возможным звуком такой силы (он для людей ещё опаснее, чем для дисков), умудриться много раз на грабли наступить с этим звуком, и 5 часов (!!!) поднимать систему из резерва (про банки не знаю).


    Расписались в кривизне рук сразу много раз. Были бы в Японии — наверняка бы сепукку сделали полным составом.


    Что у них в стране серверов не хватит — так их бы и в России не хватило, все равно бы везли со складов поставщиков, со всего мира собирая. Это плач админов, мол, система великовата, вот мы и не осилили.


    1. Firz
      06.05.2018 14:27
      +2

      По идее, там где срабатывает эта система, людей уже не должно быть, потому что сам газ то явно для дыхания не предназначен.
      А про резервирование да, какая разница какое у тебя резервирование, если весь твой резерв(пусть он хоть десятикратный) стоит в соседней стойке.


  1. tBlackCat
    06.05.2018 15:37

    Звук, не звук, но самой непобедимой напастью является уборщица со шваброй.
    Как мне кажется, старые модели дисков были не столь подвержены звуковому влиянию.


  1. maolo
    06.05.2018 21:47

    В результате инцидента вышли из строя серверы Nasdaq, а также скандинавских банков FIM Bank и OP Bank Group.

    Там только финансовые организации хостятся, или просто им так «повезло»?
    Или очередной Джордан Белфорт следы заметает? )