По данным отчета The Linux Foundation, с начала Git-эпохи (с 2005 года) в разработке ядра Linux поучаствовали 15 тысяч программистов из 1,5 тыс. компаний. Сегодня разработчики добавляют в систему порядка 7500 строк кода ежедневно, а мажорное обновление ядра выходит каждые 2–3 месяца.

Однако все изменения нужно как-то контролировать. Для этого существует Linux Kernel Mailing List (LKML) — список рассылки электронной почты, с помощью которого распространяют объявления и обсуждают изменения ядра Linux.

Поэтому, когда на прошлой неделе в сети появилась информация о том, что один из хостинг-ресурсов LKML — LKML.org — оказался недоступен, в сообществе началось активное обсуждение случившегося. Сегодня мы попробуем разобраться в ситуации.


/ Flickr / Sam Weng / CC

В чем причина


В свете последних событий, в сообществе появилось мнение, что выход сайта из строя связан с уязвимостями Meltdown и Spectre. Однако реальной причиной «падения» ресурса стало отключение электроэнергии дома у Джаспера Спаанса (Jasper Spaans) в Нидерландах, где стоял сервер для сайта. В результате сервер перезагрузился (когда «дали свет»), но запросил логин и пароль (по крайней мере такой была первая мысль Джаспера). Ввести идентификационные данные было некому, так как Джаспер находился в отъезде, а подключиться удаленно он не смог, о чем сообщил в своем твиттере.


Реакция сообщества


Люди сочли удивительным тот факт, что такой популярный ресурс в 2018 году размещался на одном домашнем компьютере. Событие активно обсуждалось в социальных сетях: кто-то отпускал саркастические комментарии, кто-то пытался связать отказ сервера с багом Meltdown, а кто-то предлагал помощь.

Например, Джоб Снайдерс (Job Snijders), основатель NLNOG, отметил, что может предоставить Джасперу виртуальную машину для сервиса LKML.org или выслать источник бесперебойного питания, которым пользуется у себя дома.

Хостинговая компания Liquid Web тоже вызвалась помочь и предложила Джасперу свои услуги. А кто-то даже тегнул Илона Маска и предположил, что тот мог бы помочь с поставкой литий-ионных аккумуляторов Tesla Powerwall.

Развязка


Когда Джаспер вернулся домой, он выяснил, что материнская плата не пережила скачка напряжения и сгорела.


И пока Спаанс ждал доставки платы, он вместе со своим котом начал копировать все данные на VPS, чтобы как можно быстрее запустить сайт. В общей сложности сервис был недоступен около четырех дней. После этой истории Джаспер задумался о его переносе на более надежную инфраструктуру, чем одинокий домашний сервер.

О чем ещё мы пишем в блоге 1cloud:

Комментарии (7)


  1. impwx
    23.01.2018 13:17
    +1

    «Пока жареный петух в задницу не клюнет»


  1. rt3879439
    23.01.2018 13:33

    Много кто знает как «сделать правильно», но не так много делают правильно.


  1. bulaev
    23.01.2018 13:50

    Я в далёком 2012 решил заняться хостингом игровых серверов. Начинал с обычного сервера дома. На нём проводились многие официальные Российские турниры по L4D/L4D2. Потом уже поставил полноценные железки на разных хостингах. А на домашнем, для экономии, долго ещё крутил панель управления и сайт. Так что мне подобная история знакома. Может ему просто некогда было заниматься. Может лень или страшно браться. Хотя, конечно, для подобных сервисов надо думать на сто шагов вперёд и продумывать многократное резервирование.


  1. Aquahawk
    23.01.2018 14:57
    +1

    Если быть объективным, то ещё стоит сравнить с большими площадками, не лучше ли у него показатель отказов по факту получился. А то и амазон бывает падает. Я при этом не призываю хостить дома.


  1. Taciturn
    23.01.2018 15:15

    Как вообще сочетается

    сервер перезагрузился (когда «дали свет»), но запросил логин и пароль
    и
    материнская плата не пережила скачка напряжения и сгорела
    ?


    1. mediaman
      23.01.2018 16:39
      +1

      Как я понял, Джаспер сперва решил, что проблема в необходимости ввести пароль. Но когда он вернулся домой то выяснил, что сгорела плата и проблема посерьезнее


  1. Pilat
    23.01.2018 16:22

    Сервер работает 15 лет. Это 5475 дней. Не работал 4 дня. Это показатель надёжности 0.999.


    конечно это не призыв. У меня за неделю капитального ремонта электропроводки сгорели два UPS'а...