Надежная система электроснабжения — это сердце любого ЦОД, будь то маленькая серверная или коммерческий дата-центр на несколько тысяч стоек. Даже малейшие сбои могут привести к остановке всего комплекса с сопутствующими репутационными и коммерческими потерями.
В нашей практике мы встречаемся с самыми удивительными решениями в части инженерных систем, и сегодня Кирилл Дмитриев, архитектор инженерных систем центра сетевых решений «Инфосистемы Джет», разберет пять самых распространенных проблем.
![](https://habrastorage.org/getpro/habr/upload_files/e96/d32/60a/e96d3260a212b083967876c08174b996.png)
Некорректное секционирование вводных щитов
Нам не раз приходилось сталкиваться с тем, что оба ввода электроснабжения в серверную подключались в один щит без возможности посекционного отключения и изоляции. Сброс питания только с одной секции был физически невозможен, все равно вводные кабели смежной секции оставались в общем объеме пучка. То есть для проведения каких-либо работ на щите приходилось отключать оба ввода, что автоматически сводило на нет все попытки резервирования.
Решение:
Все вводные щиты должны быть секционированы и иметь межсекционные переключатели. При этом переключатели должны обеспечивать возможность полного сброса нагрузки с любой секции без отключения всего щита в целом.
Отсутствие резервных ИБП
Многие пользователи ЦОД устанавливают единый модульный ИБП с резервным модулем и считают, что таким образом у них обеспечен резерв по компонентам N+1. Однако это не так. Технологии многих ИБП, представленных на российском рынке на данный момент, не обеспечивают исключение единой точки отказа в рамках одного шасси ИБП. То есть, сколько бы силовых модулей ни было в составе ИБП, он все равно остается потенциальной единой точкой отказа.
Решение:
Организация корректной топологии ИБП. Не имеет значения, используете вы модульные или моноблочные ИБП, гораздо важнее, как организована схема их резервирования. Не рекомендуется резервировать ИБП и при этом использовать единый батарейный массив, поскольку при несоответствующем обслуживании единый массив может подвести вас в самый неудачный момент.
Старые батарейные массивы
Свинцово-кислотные АКБ до сих пор остаются самым распространенным типом аккумуляторов. При этом они имеют ряд особенностей, которые зачастую упускают из вида. Например, многие пользователи забывают, что у батарей есть параметры автономии BOL (beginning of life) и EOL (end of life) — расчетное время автономии в начале и в конце срока службы. И эти параметры могут отличаться на 20–30%.
Значение EOL автономии достигается обычно в конце срока службы. Но многие упускают тот факт, что срок службы может быть израсходован ранее расчетных 10 лет из-за неблагоприятных условий эксплуатации.
Как итог: пользователь может получить сокращенное время автономии уже через 3–5 лет, а если поставщик решения оказался недостаточно благонадежным, то эта автономия может оказаться значительно ниже проектной. Таким образом, при аварийной ситуации запас времени на устранение сбоя будет намного меньше.
Решение:
1. Во-первых, сразу знать расчетное время в начале срока службы и в конце срока службы. Это позволит понимать, есть у вас запас или его нет.
2. Во-вторых, регулярно проводить диагностику АКБ.
3. В-третьих, эксплуатировать АКБ только при рекомендуемых температурах, чтобы обеспечить их расчетный срок службы.
Эти три простых шага позволят вам всегда располагать самой достоверной информацией о состоянии системы бесперебойного электроснабжения.
Отсутствие гарантированного электроснабжения
Бытует ошибочное мнение, что, имея два ввода электроснабжения от города, можно не усложнять себе жизнь установкой дизельной электростанции, поскольку «ну что может случиться?». Только отсутствие автономного электроснабжения делает систему зависимой от состояния городской сети. Конечно, кратковременные сбои могут быть нивелированы системой бесперебойного питания, но бывали ситуации, как, например, в 2005 году, когда случались общегородские аварии на распределительных сетях и целые районы оставались без электроснабжения на длительный срок. Многие считают дизель-генераторы бесполезным расходованием бюджета, поскольку он устанавливается ради того, чтобы запуститься от силы один раз за все время, а может быть, исключительно на тестовые запуски. Но дай бог, чтобы этого одного раза не случилось.
Решение:
Гарантированное электроснабжение обязательно необходимо, если дата-центр обрабатывает критичную для бизнеса информацию. Не зря в рекомендациях The Uptime Institute Tier Topology говорится, что электроснабжение от города не рассматривается как основной источник энергии для ЦОД, а только как более дешевый аналог круглосуточного использования дизеля.
![](https://habrastorage.org/getpro/habr/upload_files/c67/aa3/793/c67aa3793949fb6e042fa6a80a2fdc47.jpg)
Оба ввода подключены к одной трансформаторной подстанции
Еще одна достаточно распространенная ошибка — когда питание для ЦОД берут от одного ввода на общую трансформаторную подстанцию. При этом зачастую трансформаторные отсеки не отделяются друг от друга. В итоге в случае аварии под ударом оказывается весь комплекс городского ввода. При этом, если присутствует проблема в виде предыдущего пункта с отсутствием дизель-генератора, мы получаем очень уязвимую систему.
Решение:
Идеальной ситуацией является наличие двух независимых вводов на объект от разных энергоснабжающих компаний. Если на рынке энергетики в регионе присутствует только один игрок, то рекомендуется брать питание от разных подстанций или линий.
В собственной подстанции необходимо размещать каждый ввод в собственном отсеке, а еще лучше — в отдельных строениях, имеющих между собой достаточное расстояние.
Заключение
Сколько бы «лучших практик» ни публиковалось, все же универсальной и идеальной схемы не бывает, поскольку каждый объект и регион имеют свою специфику. Однако, если следовать достаточно простым мерам предосторожности на начальном этапе, можно избежать инцидентов в будущем. Главное — учиться на ошибках других, а не на своих собственных.