Всем привет!

Сегодня я хотел бы поделиться опытом настройки AWS Auto Scaling Group (ASG) на основе использования оперативной памяти (RAM).

Все началось с того, что на одном из проектов нам понадобилось настроить масштабирование EC2-инстансов по использованию памяти, а стандартный ASG Target Tracking Scaling Policy позволяет создавать политики только на основе следующих метрик: среднее использование ЦПУ, средний входящий или исходящий сетевой траффик и количество запросов на цель ALB:

Немного погуглив, я выяснил, что для реализации такого решения понадобится воспользоваться ещё одним сервисом AWS – CloudWatch, причём на самих инстансах должен быть установлен агент, который будет считывать использование памяти. Также хотел бы немного обозначить входные данные: приложение работает на инстансах с Ubuntu 18.04, сначала все работы проводятся на одном инстансе, с которого впоследствии будет снят образ и подготовлена AMI, которая будет использоваться для ASG. Весь процесс можно разделить на несколько этапов:

  1. Создание IAM-роли, которая будет работать с CloudWatch-агентом и добавление этой роли к инстансу.

  2. Скачать, установить, настроить и запустить агент на инстансе.

  3. Создать оповещения в Cloudwatch.

  4. Создать Amazon EC2 Auto Scaling policy для ASG.

Создание IAM-роли

Cначала нужно создать IAM-роль с политикой для CW-агента, для этого необходимо выполнить следующие действия:

  1. Войти в консоль управления AWS и открыть консоль IAM.

  2. В области навигации выбрать Роли (Roles), а затем выбрать «Создать роль» (Create role).

  3. В разделе «Выбор типа доверенной организации» (Select type of trusted entity) выберите сервис AWS.

  4. В разделе «Общие варианты использования» (Common use cases) выберите EC2, а затем нажмите «Далее: Разрешения» (Next: Permissions):

5. В списке политик найдите пункт CloudWatchAgentServerPolicy и установите флажок рядом с ним, как на рисунке ниже:

6.      Далее выберите теги и добавьте одну или несколько пар значений тегов-ключей для организации, отслеживания или управления доступом для этой роли, а затем выберите «Далее: Обзор» (Next: Review).

7.      В поле «Имя роли» введите имя для вашей новой роли (например, CloudWatchAgentRole).

8.      Если необходимо, то для описания роли введите описание.

9.      Убедитесь, что полиси CloudWatchAgentServerPolicy отображается в соответствующем разделе:

И нажмите «Создать роль» (Create role).

10.   После этого необходимо добавить созданную роль к инстансу, с которым будем работать. Сделать это можно из консоли AWS, выбрав нужный инстанс и выполнив действия: Actions -> Security -> Modufy IAM roles.

Установка, настройка и запуск Cloudwatch-агент на EC2-инстансе с установленным образом Ubuntu 18.04

1.  Сначала скачиваем и устанавливаем агент и collectd:

wget https://s3.amazonaws.com/amazoncloudwatch-agent/ubuntu/amd64/latest/amazon-cloudwatch-agent.deb 

sudo dpkg -i -E ./amazon-cloudwatch-agent.deb

sudo apt-get install collectd

2.  Запускаем мастера настройки агента

sudo /opt/aws/amazon-cloudwatch-agent/bin/amazon-cloudwatch-agent-config-wizard 

и следуем его инструкциям. Во время работы мастера нужно указать путь к логам и место, где хранить конфигурацию, тут есть два варианта:

  • локально,

  • AWS Systems Manager Parameter Store.

Я выбрал локально, так как использование Systems Manager не планировалось.

3. Копируем config.json из папки /opt/aws/amazon-cloudwatch-agent/bin/ в  папку /opt/aws/amazon-cloudwatch-agent/etc/ и переименовываем в amazon-cloudwatch-agent.json. Конфиг-файл затем можно просто копировать на новые инстансы без запуска мастера настройки.

4. Запускаем сервис и добавляем его в автозагрузку:

sudo service amazon-cloudwatch-agent start 

sudo systemctl enable amazon-cloudwatch-agent.service

5. После этого в CloudWatch проверяем, что сбор метрик работает:

Создание оповещений в CloudWatch и Auto Scaling Actions (добавление/удаление инстансов в ASG)

Я создал два оповещения, первое — на срабатывание выше 80%, который затем использовал для добавления инстансов в ASG, второе — на срабатывание <30%, для того, чтобы убирать один инстанс из ASG. Более подробно о том, как создать оповещение и Auto Scaling Policy на добавление инстанса через консоль AWS, ниже:

1.      В консоли выбрать сервис CloudWatch.

2.      При необходимости, изменить регион AWS на регион, в котором находится ваша группа автоматического масштабирования (ASG).

3.      Выбрать Alarms и Create alarm, затем Select metric.

4.      В поиске ввести имя группы автоматического масштабирования (ASG). Затем выбрать метрику использования памяти — MemoryUtilization. Появится страница «Указать метрику и условия» (Specify metric and conditions), на которой отображается график и другая информация о метрике.

5.      В качестве периода выбрать период оценки сигнала оповещения (например, 1 минута).

6.      В качестве типа порога выбрать «Статический».

7.      Для каждого случая использования памяти указать, хотите ли вы, чтобы значение показателя было больше, больше или равно, меньше или меньше или равно пороговому значению для срабатывания аварийного сигнала. Затем ввести пороговое значение, при котором вы хотите вызвать оповещение:

В разделе «Дополнительная настройка» нужно выполнить следующие действия:

8.      Чтобы точки данных вызывали тревогу, нужно ввести количество точек данных (периодов оценки), в течение которых значение показателя должно соответствовать пороговым условиям для срабатывания тревоги. Например, два последовательных периода по 5 минут потребовали бы 10 минут, чтобы сработал сигнал тревоги, после этого нажать «Далее».

9.      Если необходимо, в разделе «Уведомление» (Notification) можно выбрать или создать Amazon SNS топик, который будет использоваться для получения уведомлений. В противном случае можно удалить уведомление сейчас и добавить его позже по мере необходимости:

10.   Чуть ниже на этой же странице можно сразу выбрать действие для ASG (если предварительно вы ее уже создали) при срабатывании оповещения (или добавить его позже):

11.   После этого остаётся только ввести название оповещения (например, MemoryUtilizationScaleOut) и необязательное описание, затем нажать «Далее» и «Создать оповещение» (Create alarm).

Для удаления одного инстанса я затем создал оповещение на срабатывание при использовании памяти менее, чем 30% и в Auto Scaling action выбрал ScaleInPolicy (Remove 1 instance). 

Создание Amazon EC2 Auto Scaling policy (опционально, если не реализовано в предыдущем пункте)

Во время настройки политик масштабирования можно создавать оповещения (Alarms). Кроме того, можно использовать оповещения, созданные в консоли CloudWatch, как описано в предыдущем пункте.

Чтобы создать пошаговую политику масштабирования (step scaling policy) для масштабирования, нужно выполнить следующее:

1.      В консоли управления Amazon EC2 выбрать Auto Scaling groups.

2.      Установить флажок рядом с вашей группой автоматического масштабирования, созданной заранее, при этом в нижней части страницы откроется разделённая панель, в которой отображается информация о выбранной группе.

3.      Убедиться, что Minimum capacity и Maximum capacity установлены надлежащим образом. Например, если ваша группа уже достигла максимального размера, вам необходимо указать новый максимум для масштабирования. Автоматическое масштабирование Amazon EC2 не масштабирует вашу группу ниже минимального или выше максимального значения. Чтобы обновить группу, на вкладке «Сведения» (Details) изменить текущие значения минимума и максимума.

4.      Во вкладке Automatic scaling выбрать Dynamic scaling policies и нажать Create dynamic scaling policy:

5.      Чтобы определить политику масштабирования (scale out/increase capacity), необходимо выполнить следующие действия:

a)      В Policy Type выбрать Step Scaling.

b)     Ввести имя для политики.

c)      Выбрать CloudWatch Alarm, созданный ранее в пункте «Создание оповещений в Cloudwatch и Auto Scaling Actions (добавление/удаление инстансов в ASG)». Если вы еще не создали оповещение, то выберите «Create a CloudWatch alarm» и воспользуйтесь пунктом «Создание оповещений в Cloudwatch и Auto Scaling Actions (добавление/удаление инстансов в ASG)».

d)     Используйте команду Take the action, чтобы указать изменение текущего размера группы, которое будет произведено при выполнении этой политики. Вы можете добавить определённое количество экземпляров или процент от существующего размера группы.

 Например, выберите «Добавить» (Add), введите 80 в следующем поле, а затем выберите процент от группы.

 e)     Чтобы добавить еще один шаг, нужно выбрать «Добавить шаг» (Add step), а затем определить величину, на которую необходимо масштабировать, а также нижнюю и верхнюю границы шага относительно порога оповещения.

f)       Чтобы задать минимальное количество экземпляров для масштабирования, необходимо указать нужное значение в поле «Add capacity units in increments of at least» с шагом не менее 1 единицы.

g)      Затем указать время «прогрева инстанса» в течение которого его сервисы будут загружаться и его показатели не будут учитываться в CloudWatch, после этого нажать «Создать» (Create):

 Теперь остаётся добавить ещё одну политику для удаления инстансов при срабатывании оповещения об использовании памяти менее 30%.

 В итоге наш CloudWatch Dashboard выглядел так:

После этого желательно проверить, что масштабирование работает, как задумано, например, установить утилиту stress. Но нам необходимо было проверить работу всех частей приложения, поэтому мы подготовили несколько скриптов, имитирующих действия пользователей и использовали для этого Fargate, но это уже другая история. А на этом пока все, спасибо за внимание!

Комментарии (2)


  1. chupakabra
    14.09.2021 16:49

    Не забываем про дополнительную стоимость за использование Amazon CloudWatch Logs.


    1. sergeyyavorskiy Автор
      14.09.2021 18:26

      Да, все верно, free tier покрывает только малую часть https://aws.amazon.com/cloudwatch/pricing/