Serverless ? это не про физическое отсутствие серверов. Это не «убийца» контейнеров и не мимолетный тренд. Это новый подход к построению систем в облаке. В сегодняшней статье коснемся архитектуры Serverless-приложений, посмотрим, какую роль играет провайдер Serverless-услуги и open-source проекты. В конце поговорим о вопросах применения Serverless.
Я хочу написать серверную часть приложения (да хоть интернет-магазина). Это может быть и чат, и сервис для публикации контента, и балансировщик нагрузки. В любом случае головной боли будет немало: придется подготовить инфраструктуру, определить зависимости приложения, задуматься насчет операционной системы хоста. Потом понадобится обновить небольшие компоненты, которые не затрагивают работу остального монолита. Ну и про масштабирование под нагрузкой не будем забывать.
А что если взять эфемерные контейнеры, в которых требуемые зависимости уже предустановлены, а сами контейнеры изолированы друг от друга и от ОС хоста? Монолит разобьем на микросервисы, каждый из которых можно обновлять и масштабировать независимо от других. Поместив код в такой контейнер, я смогу запускать его на любой инфраструктуре. Уже лучше.
А если не хочется настраивать контейнеры? Не хочется думать про масштабирование приложения. Не хочется платить за простой запущенных контейнеров, когда нагрузка на сервис минимальна. Хочется писать код. Сосредоточиться на бизнес-логике и выпускать продукты на рынок со скоростью света.
Такие мысли привели меня к бессерверным вычислениям. Serverless в данном случае означает не физическое отсутствие серверов, а отсутствие головной боли по управлению инфраструктурой.
Идея в том, что логика приложения разбивается на независимые функции. Они имеют событийную структуру. Каждая из функций выполняет одну «микрозадачу». Все, что требуется от разработчика ? загрузить функции в предоставленную облачным провайдером консоль и соотнести их с источниками событий. Код будет исполняться по запросу в автоматически подготовленном контейнере, а я заплачу только за время исполнения.
Давайте разберемся, как теперь будет выглядеть процесс разработки приложения.
Со стороны разработчика
Ранее мы начали говорить про приложение для интернет-магазина. В традиционном подходе основную логику системы выполняет монолитное приложение. И сервер с приложением запущен постоянно, даже если нагрузки нет.
Чтобы перейти к serverless, разбиваем приложение на микрозадачи. Под каждую из них пишем свою функцию. Функции независимы друг от друга и не хранят информацию о состоянии (stateless). Они даже могут быть написаны на разных языках. Если одна из них «упадет», приложение целиком не остановится. Архитектура приложения будет выглядеть вот так:
Деление на функции в Serverless похоже на работу с микросервисами. Но микросервис может выполнять несколько задач, а функция в идеале должна выполнять одну. Представим, что стоит задача собирать статистику и выводить по запросу пользователя. В микросервисном подходе задачу выполняет один сервис с двумя точками входа: на запись и на чтение. В бессерверных вычислениях это будут две разные функции, не связанные между собой. Разработчик экономит вычислительные ресурсы, если, например, статистика обновляется чаще, чем выгружается.
Serverless-функции должны выполняться за короткий промежуток времени (timeout), который определяет провайдер услуги. Например, для AWS timeout составляет 15 минут. Значит, долгоживущие функции (long-lived) придется изменить под требования ? этим Serverless отличается от других популярных сегодня технологий (контейнеров и Platform as a Service).
Каждой функции назначаем событие. Событие ? это триггер для действия:
Событие | Действие, которое выполняет функция |
В хранилище загрузили картинку товара | Сжать картинку и выгрузить в каталог |
В базе данных обновился адрес физического магазина | Подгрузить в карты новое местоположение |
Клиент оплачивает товар | Запустить обработку платежа |
Архитектуру проработали, и приложение почти стало serverless. Дальше идем к провайдеру услуги.
Со стороны провайдера
Обычно бессерверные вычисления предлагают провайдеры облачных услуг. Называют по-разному: Azure Functions, AWS Lambda, Google Cloud Functions, IBM Cloud Functions.
Пользоваться услугой будем через консоль или личный кабинет провайдера. Код функций можно загрузить одним из способов:
- написать код во встроенных редакторах через веб-консоль,
- загрузить архив с кодом,
- работать с публичными или приватными git-репозиториями.
Здесь же настраиваем события, которые вызывают функцию. У разных провайдеров наборы событий могут отличаться.
Провайдер на своей инфраструктуре построил и автоматизировал систему Function as a Service (FaaS):
- Код функций попадает в хранилище на стороне провайдера.
- Когда появляется событие, на сервере автоматически разворачиваются контейнеры с подготовленным окружением. Каждому экземпляру функции ? свой изолированный контейнер.
- Из хранилища функция отправляется в контейнер, вычисляется, отдает результат.
- Число параллельных событий растет ? растет количество контейнеров. Система автоматически масштабируется. Если пользователи не обращаются к функции, она будет неактивна.
- Провайдер задает время простоя контейнеров ? если в течение этого времени функции не появляются в контейнере, он уничтожается.
Таким образом мы получаем Serverless «из коробки». Платить за услугу будем по модели pay-as-you-go и только за те функции, которые используются, и только за то время, когда они использовались.
Чтобы познакомить разработчиков с услугой, провайдеры предлагают до 12 месяцев бесплатного тестирования, но ограничивают общее время вычислений, количество запросов в месяц, денежные средства или потребляемые мощности.
Основное преимущество работы с провайдером ? возможность не беспокоиться об инфраструктуре (серверах, виртуальных машинах, контейнерах). Со своей стороны провайдер может реализовать FaaS как на собственных разработках, так и с помощью open-source инструментов. О них и поговорим дальше.
Со стороны open source
Последние пару лет сообщество open-source активно работает над инструментами Serverless. В том числе вклад в развитие бессерверных платформ вносят крупнейшие игроки рынка:
- Google предлагает разработчикам свой open-source инструмент ? Knative. В его разработке участвовали IBM, RedHat, Pivotal и SAP;
- IBM работали над Serverless-платформой OpenWhisk, которая затем стала проектом Apache Foundation;
- Microsoft частично открыли код платформы Azure Functions.
Разработки ведутся и в направлении serverless-фреймворков. Kubeless и Fission разворачиваются внутри заранее подготовленных Kubernetes-кластеров, OpenFaaS работает как с Kubernetes, так и с Docker Swarm. Фреймворк выступает в роли своеобразного контроллера ? по запросу готовит внутри кластера среду выполнения, потом запускает там функцию.
Фреймворки оставляют простор для конфигурации инструмента под свои нужды. Так, в Kubeless разработчик может настроить timeout выполнения функции (дефолтное значение ? 180 секунд). Fission в попытке решить проблему холодного старта предлагает часть контейнеров держать все время запущенными (хоть это и влечет затраты на простой ресурсов). А OpenFaaS предлагает набор триггеров на любой вкус и цвет: HTTP, Kafka, Redis, MQTT, Cron, AWS SQS, NATs и другие.
Инструкции к началу работы можно найти в официальной документации фреймворков. Работа с ними подразумевает наличие чуть большего количества навыков, чем при работе с провайдером ? это как минимум умение запустить Kubernetes-кластер через CLI. Максимум, включить в работу другие open-source инструменты (допустим, менеджер очередей Kafka).
Вне зависимости от того, каким способом мы будем работать с Serverless ? через провайдера или с помощью open-source, мы получим ряд преимуществ и недостатков Serverless-подхода.
С позиции преимуществ и недостатков
Serverless развивает идеи контейнерной инфраструктуры и микросервисного подхода, при которых команды могут работать в мультиязычном режиме, не привязываясь к одной платформе. Построение системы упрощается, а исправлять ошибки становится легче. Микросервисная архитектура позволяет добавлять в систему новый функционал значительно быстрее, чем в случае с монолитным приложением.
Serverless сокращает время разработки еще больше, позволяя разработчику сосредоточиться исключительно на бизнес-логике приложения и написании кода. Как следствие, время выхода разработок на рынок сокращается.
Бонусом мы получаем автоматическое масштабирование под нагрузку, а платим только за используемые ресурсы и только в то время, когда они используются.
Как и любая технология, Serverless имеет недостатки.
Например, таким недостатком может быть время холодного старта (в среднем до 1 секунды для таких языков как JavaScript, Python, Go, Java, Ruby).
С одной стороны, на деле время холодного старта зависит от многих переменных: язык, на котором написана функция, количество библиотек, объем кода, общение с дополнительными ресурсами (те же базы данных или серверы аутентификации). Поскольку разработчик управляет этими переменными, он может сократить время старта. Но с другой стороны, разработчик не может управлять временем запуска контейнера ? здесь все зависит от провайдера.
Холодный старт может превратиться в теплый, когда функция переиспользует запущенный предыдущим ивентом контейнер. Такая ситуация возникнет в трех случаях:
- если клиенты часто используют сервис и растет количество обращений к функции;
- если провайдер, платформа или фреймворк позволяют держать часть контейнеров запущенными все время;
- если разработчик запускает функции по таймеру (скажем, каждые 3 минуты).
Для многих приложений холодный старт ? не проблема. Здесь нужно отталкиваться от типа и задач сервиса. Задержка старта на секунду не всегда критична для бизнес-приложения, но может стать критичной для медицинских служб. Вероятно, в этом случае бессерверный подход уже не подойдет.
Следующим недостатком Serverless называют короткое время жизни функции (timeout, за который функция должна выполниться).
Но, если предстоит работать с долгоживущими задачами, можно использовать гибридную архитектуру ? скомбинировать Serverless с другой технологией.
Не все системы смогут работать по Serverless-схеме.
Некоторые приложения по-прежнему будут хранить данные и состояние во время выполнения. Некоторые архитектуры останутся монолитными, а некоторые функции будут долгоживущими. Однако (как когда-то облачные технологии, а затем и контейнеры), Serverless ? технология с большим будущим.
В этом ключе мне бы хотелось плавно перейти к вопросу применения Serverless-подхода.
Со стороны применения
За 2018 год процент использования Serverless вырос в полтора раза. Среди компаний, которые уже внедрили технологию в свои сервисы, такие гиганты рынка как Twitter, PayPal, Netflix, T-Mobile, Coca-Cola. При этом нужно понимать, что Serverless ? не панацея, а инструмент для решения определенного круга задач:
- Сократить простой ресурсов. Не надо постоянно держать виртуальную машину под сервисы, к которым мало обращений.
- «На лету» обработать данные. Сжимать картинки, вырезать фон, менять кодировку видео, работать с датчиками IoT, выполнять математические операции.
- «Склеить» между собой другие сервисы. Git-репозиторий с внутренними программами, чат-бот в Slack с Jira и с календарем.
- Балансировать нагрузку. Здесь остановимся подробнее.
Допустим, есть сервис, на который приходит 50 человек. Под него стоит виртуальная машина со слабым железом. Периодически нагрузка на сервис возрастает в разы. Тогда слабое железо не справляется.
Можно включить в систему балансировщик, который будет распределять нагрузку, скажем, на три виртуальные машины. На данном этапе мы не можем точно спрогнозировать нагрузку, поэтому какое-то количество ресурсов держим запущенными «про запас». И переплачиваем за простой.
В такой ситуации мы можем оптимизировать систему через гибридный подход: за балансировщиком нагрузки оставляем одну виртуальную машину и ставим ссылку на Serverless Endpoint с функциями. Если нагрузка превышает порог ? балансировщик запускает экземпляры функций, которые берут на себя часть обработки запросов.
Таким образом, Serverless можно использовать там, где приходится не слишком часто, но интенсивно обрабатывать большое количество запросов. В этом случае запускать несколько функций на 15 минут выгоднее, чем все время держать виртуальную машину или сервер.
При всех преимуществах бессерверных вычислений, перед внедрением в первую очередь стоит оценить логику приложения и понять, какие задачи сможет решить Serverless в конкретном случае.
Serverless и Selectel
В Selectel мы уже упростили работу с Kubernetes в виртуальном приватном облаке через нашу панель управления. Теперь мы строим собственную FaaS-платформу. Мы хотим, чтобы разработчики могли решать свои задачи с помощью Serverless через удобный, гибкий интерфейс.
Если у вас есть идеи, какой должна быть идеальная FaaS-платформа и как вы хотите использовать Serverless в своих проектах, поделитесь ими в комментариях. Мы учтем ваши пожелания при разработке платформы.
Материалы, использованные в статье:
Комментарии (7)
arheops
17.05.2019 21:54Позвольте с вами не согласится по поводу исправления ошибок.
Для более-менее нетривиальной serverless задачи там уже десятки-сотни РАЗНЫХ функций и найти в какой функции у вас сбоит — та еще задача. К тому же часто еще и сбой не проявляется при локальном тесте.
hippoage
18.05.2019 13:01Все-таки serverless сейчас уже далеко не только функции. Мне нравится в этом случае определение и сервисы Google.
Определение:
— нет управления инфраструктурой (включая автоматическое масштабирование)
— отсутствие оплаты за простой (оплата за реальное использование)
— безопасность на стороне поставщика
И их 3 основных сервиса:
— функции
— AppsEngine (свой фреймворк приложений для нескольких языков)
— Cloud Run (любой контейнер без состояния, который реагирует на http)
Как по мне, всё приложение на функциях писать неудобно
(поэтому и появились всякие фреймворки для функций, но все равно сложно),
AppsEngine несколько ограничен и заточен на Google (первый serverless сервис, который никак массово не взлетает, в о основном из-за зависимости кода от Google),
а Cloud Run — выглядит как раз как то, что надо.morrandir666 Автор
20.05.2019 11:59Да, можно сказать, что serverless уже не только про функции. Отчасти это правда. Serverless сегодня и про микросервисы, менеджмент которых берет на себя провайдер услуги. Но функции для serverless — основа, то с чего всё началось, и то на чем легко объяснить принципы, как мне кажется.
С моей точки зрения Cloud Run не может считаться полностью попадающим под определение serverless, так как на разработчика всё равно ложится необходимость написания docker-файла. На мой взгляд это дополнительная сложность. Хотя сама идея выглядит многообещающей.
dibroff
Еще было бы весьма недурно чтобы вся эта история вертелась на децентрализованной основе.
morrandir666 Автор
А вы можете рассказать, что вы имеете ввиду под децентрализованной основой?
dibroff
например когда базы, скрипты, файлы распределены по плоской инфраструктуре нод-хранилищ с контролем целостности
на ум приходит Swarm
ConstSe
Есть вот такая штука: ether1.org
Там не FaaS, но сайт в децентрализованной структуре можно хостить.