Электронная почта является одним из самых популярных средств коммуникации в мире. Она стала неотъемлемой частью рабочего процесса для многих организаций и предприятий, поскольку это экономичный способ общения с клиентами, поставщиками и партнерами. И поэтому очень важно, чтобы почтовые серверы были надежными и гарантированно доставляли сообщения своим получателям.

Почтовые серверы высокой доступности характеризуются способностью непрерывно работать, даже в случае аппаратных или программных сбоях на серверах. Такие почтовые серверы поддерживают избыточность, так что в случае возникновения проблемы с одним сервером другой сервер автоматически возьмет на себя его нагрузку.

С помощью почтовых серверов высокой доступности организации могут гарантировать, что их служба электронной почты всегда будет доступна для пользователей.

Что подразумевается под высокой доступностью?

Высокая доступность (HA) — это термин, используемый для описания способности системы поддерживать свою доступность в случае сбоя. Высокодоступный почтовый сервер гарантирует, что он может продолжать предоставлять услуги электронной почты даже в случае отказа одного или нескольких компонентов.

Высокая доступность гарантирует определенный уровень доступности в течение определенного периода (например, время безотказной работы не менее 99,99 % в год, что означает 4 минуты простоя в месяц).

Высокая доступность часто включает избыточность, но эти термины имеют разные значения. Высокая доступность означает, что система будет доступна, несмотря ни на что. В свою очередь, избыточность означает, что несколько компонентов могут быть заменены, чтобы сохранить работоспособность в случае отказа.

Системы высокой доступности часто состоят из группы слабо связанных серверов с возможностью аварийного переключения. Этот метод нельзя назвать идеальным. Например, из-за его высокой стоимости, о которой пойдет речь дальше.

Каковы преимущества высокодоступной инфраструктуры?

Высокая доступность имеет много преимуществ. Например, это помогает организациям избежать простоев, гарантируя, что почтовый сервер всегда онлайн, а также сокращает время, необходимое для восстановления в случае сбоя.

  • Высокая доступность почтовых серверов помогает компаниям экономить деньги и время в долгосрочной перспективе, обеспечивая стабильную инфраструктуру для работы своих сотрудников, без проблем, связанных с тем, что электронные письма не будут доставлены вовремя или вообще не будут доставлены.

  • Инфраструктура высокой доступности обеспечивает надежную систему, способную продолжать работу в случае сбоя оборудования.

  • Инфраструктура высокой доступности означает, что серверы могут автоматически переключаться на резервный набор серверов.

  • Инфраструктура высокой доступности позволяет распределять различные рабочие нагрузки между несколькими серверами.

Однако есть некоторые недостатки. К примеру, высокая доступность обходится дорого, поскольку требует больше аппаратных ресурсов и конфигураций, чем серверы с более низким уровнем доступности.

Нужна ли вам инфраструктура высокой доступности?

Независимо от того, являетесь ли вы поставщиком услуг, предлагающим клиентам решения для почтового сервера, или организацией, которой требуется частная платформа для совместной работы, в ряде случаев вам может потребоваться высокая доступность на вашем сервере.

Например, если вы являетесь поставщиком услуг и часть вашей работы заключается в обеспечении высокой производительности предлагаемых вами услуг, и, говоря простыми словами, вы не можете сделать это без надежной системы высокой доступности. Другим примером является значимость «прайм-тайма» или других чувствительных ко времени факторов, когда доступность услуги имеет решающее значение. В деловом мире ваши клиенты доступны только в определенные часы. Аварии, которые происходят в это время могут серьезные финансовые последствия. Так, если у крупной международной компании один из пиков продаж приходится на ранние утренние часы, то если в это время произойдет системный сбой, бизнес может потерять весь дневной доход.

Независимо от того, важна ли доступность ваших услуг для ведения вашего бизнеса или возможные простои каким-то образом наносят ущерб вашему доходу, высокий уровень доступности имеет большое значение.

Что препятствует достижению высокой доступности?

Как было сказано ранее, обеспечение высокой доступности обходится дорого, поскольку требует большего количества системных ресурсов для более высоких уровней доступности, если только не используются интеллектуальная оптимизация и подходы для обеспечения той же доступности без дублирования всей инфраструктуры.

Предположим, вы оцениваете различные решения высокой доступности для своей инфраструктуры. В зависимости от размера вашей инфраструктуры, репликация всего парка серверов может быть невероятно дорогой. Следовательно, для достижения одного и того же результата с меньшими затратами используются разные стратегии, что приводит к значительной экономии средств. Высокоэффективное решение высокой доступности устраняет эти недостатки за счет использования новых подходов.

Ответ на вопрос, сколько стоит обеспечение высокой доступности почтового сервера, зависит от многих факторов. Первый фактор — требования к оборудованию и программному обеспечению. Вторым фактором является размер организации и ее бюджет. Третий фактор — это ваша терпимость к простоям, и, наконец, ваш набор навыков в области ИТ также будет влиять на то, сколько вам будет стоить быстрое восстановление после сбоев.

Измерение доступности серверов

Обычно доступность сервера принято измерять в процентах. Под этими процентами подразумевается количество времени в год, которое сервер будет доступен. Как правило, изначальной величиной доступности сервера является 99%. При добавлении к нему резервного сервера, который берет на себя функции первого в случае его отказа, доступность сервера возрастает до 99,99%. Математика проста. 1% теоретической недоступности первого сервера умножается на 99% доступности второго, что дает 0,99 и при суммировании этих двух метрик мы и получаем 99,99%.

На практике же все обстоит немного иначе. Переключение между серверами в случае отказа занимает определенное время, кроме того нарушения связности, отключения электричества и пожары могут приводить к тому, что оба сервера могут оказаться недоступными. И поскольку недоступность серверов может быть связана с большим количеством разных факторов, зависимость не является линейной. Поэтому в настоящее время специалисты стремятся использовать такой показатель как количество девяток для определения доступности.

Доступность,% 

Время простоя в год

Время простоя в день

Количество девяток

99%

3 дня 15 часов 36 минут

14 минут 24 секунды

Две

99.9%

8 часов 45 минут 36 секунд

1 минута 26 секунд

Три

99.99%

52 минут 34 секунд

9 секунд

Четыре

99.999% 

5 минут 15 секунд

Менее 1 секунды

Пять

99.9999% 

32 секунд

Менее 1 секунды

Шесть

99.99999% 

3 секунды

Менее 1 секунды

Семь

Подсчитать доступность можно простым уравнением Доступность = F / (F + R). Здесь F - это ожидаемое время между двумя отказами, а R - максимальное время восстановления после отказа. 

Из этого уравнения следует, что чем больше времени проходит между отказами сервера, тем меньше влияния на доступность имеет время восстановления. Еще одним выводом является то, что уменьшение времени восстановления до нуля приводит к увеличению доступности до 100%.

Несколько подводных камней

Несмотря на то, что приведенный выше график нагляден и понятен, далеко не все так однозначно, ведь периоды простоя могут иметь различный эффект. Для примера возьмем отключение электричества в двух предприятиях. В одном из них отключение электричества может привести к потере клиентов, тогда как в другой отключение просто создает небольшие неудобства для пользователей. Другим примером может стать простой онлайн-магазина. 50 минут простоя в год означает SLA 99,99%, однако если отключение произойдет в черную пятницу или в предновогодний вечер, потери от такого простоя будут явно выше, чем такой же простой в ночь с воскресенья на понедельник. Таким образом, высокий SLA вовсе не гарантирует отсутствия или незначительности потерь.

С другой стороны SLA 99,99% не всегда означает, что ваша система будет недоступна не более чем 50 минут в год. К примеру, если ваша инфраструктура состоит из 7 узлов, то если один из них выйдет из строя, то с большой долей вероятности недоступной для конечного пользователя станет вся система. Однако на деле речь идет всего об одном недоступном компоненте и если подсчитать совокупный SLA для всех узлов, то получится 99,93%. Отличие, вроде бы, не такое большое, но на деле: 

Доступность, %

Интервал недоступности

99,99

52 минуты 34 секунды

99,93%

8 часов 45 минут 36 секунд

Как видно из таблицы, незначительное изменение в процентах SLA приводит к большому изменению в фактическом интервале недоступности. Поэтому лучше всего измерять доступность не в процентах, а в допустимом интервале недоступности. 

Почему система высокой доступности в Carbonio настолько рентабельна?

В системе высокой доступности Zextras Carbonio используется технология репликации на основе учетных записей с ячеистой структурой. Чтобы лучше понять, как это устроено, рассмотрим следующий пример.

Допустим, у вас есть три сервера и четыре учетных записи. Как видно из таблицы, рабочий сервер указан как активный. Резервный означает, что учетная запись реплицирована на этом сервере. Учитывая это, вы можете потерять как минимум половину серверов без ущерба для инфраструктуры.

Учетная запись 1

Учетная запись 2

Учетная запись 3

Учетная запись 4

Сервер 1

Активна

Активна

В ожидании

Активна

Сервер 2

В ожидании

В ожидании

Активна

Сервер 3

В ожидании

Наиболее заметным преимуществом этой технологии является то, что она устраняет необходимость в репликации всей инфраструктуры, что приводит к значительной экономии средств.

Прелесть Zextras Carbonio HA заключается в том, что, в зависимости от размера вашей инфраструктуры и возможностей ваших хранилищ, вы можете допустить потерю нескольких хранилищ, прежде чем откажет вся система.

Доступность сервиса не пострадает, даже если половина серверов будет потеряна.

Это также позволяет выбирать учетные записи для репликации в зависимости от их важности. Обратите внимание, что этот метод отличается от резервного копирования; его цель - создать много копий на других, уже существующих серверах.

Еще одним важным элементом системы высокой доступности Carbonio является система мониторинга Heartbeat. Сервер использует её, чтобы определить, есть ли у приложения проблемы. Эта технология позволяет предсказать сбой сервера до того, как он выйдет из строя, и распределяет нагрузки, интенсивно использующие ЦП или диски, без необходимости добавлять дополнительные сервера в инфраструктуру за счет оптимизации использования уже имеющихся.

Рассмотрите возможность использования технологии репликации, описанной выше; если сервер выйдет из строя, все будет продолжать нормально работать и не произойдет полная остановка. Ведь несмотря на то, что сервер все еще работает, иногда он может быть недоступен. Например, он отвечает слишком медленно или отвечает метаданными из-за повреждения данных. В результате наличие в системе компонента, который отслеживает, насколько быстро сервер отвечает в зависимости от загрузки ЦП или памяти, может помочь предотвратить такие задержки, сэкономив много времени, усилий и денег в долгосрочной перспективе!

Эксклюзивный дистрибьютор Zextras SVZcloud. По вопросам тестирования и приобретения Zextras Carbonio обращайтесь на электронную почту: sales@svzcloud.ru

Комментарии (2)


  1. Revertis
    29.07.2022 14:46

    Она стало

    Серьёзно? Прямо во втором предложении?

    А запрет личных сообщений чтобы мы тут писали об этом?


    1. Zextras Автор
      29.07.2022 14:54

      Добрый день, исправили! Запрет на личные сообщения мы не ставили.