Как я автоматизировал разворачивание приложений на Linux на коленке с помощью Bash скриптов и Java / forpes.ru

Главная
Как я автоматизировал разворачивание приложений на Linux на коленке с помощью Bash скриптов и Java

Как я автоматизировал разворачивание приложений на Linux на коленке с помощью Bash скриптов и Java -3

26.07.2020 17:06

1nt3g3r 25 2700 Источник

Когда вы написали серверное приложение, его нужно где-то развернуть. У нас в компании сейчас это реализовано с помощью VPS на Linux, bash скриптов, и небольшой Java программы. Это эволюционный процесс, и как по мне, получилось весьма неплохо.

В статье я хочу описать эволюцию такого подхода, почему так получилось, плюсы и минусы подхода. Если у вас есть похожая проблема — почитайте, возможно придут в голову полезные мысли.

КДПВ — архитектура системы, для части которой автоматизируем развертывание:

Немного предыстории

Я сейчас являюсь руководителем отдела разработки в компании, где я работаю. У нас небольшая, но сбалансированная команда — есть бекенд, фронтенд разработчики, QA, дизайнер, верстальщик.

Наша компания занимается образовательной деятельностью в IT, и софт мы пишем для себя. Это накладывает определенные ограничения — у нас нет огромных бюджетов на разработку, бывают размытые требования, потому что не до конца понятно, что же нужно людям.

В то же время, есть плюсы — пишем на чем хотим, и можем сами ставить и согласовывать сроки разработки. Также, поскольку пилим не стотысячный лендинг или интернет магазин, работать интересно. Развиваем несколько продуктов, собираем фидбек пользователей, и фиксим/добавляем фичи.

Таким образом, мы сами выбираем стек технологий, процесс развертывания приложений.

Архитектура системы

Один из наших продуктов имеет следующую архитектуру:

Есть один главный бекенд — центр. Именно к нему стучатся все фронтенды (их несколько). На главном бекенде хранятся данные юзеров, и сосредоточено большинство бизнес-логики.

Также есть несколько вспомогательных бекендов, которые физически вынесены на разные серверы. Сделано так по нескольким причинам:

эти сервера запускают внешний непроверенный код. Следовательно, никаких данных там хранить нельзя, потому что рано или поздно внешний код выберется из песочницы;
вспомогательные бекенды довольно нагруженные, именно они делают основную работу. Главный бекенд умеет распределять нагрузку, и в случае чего — мы добавляем еще вспомогательные бекенды для размазывания нагрузки.
на вспомогательных бекендах используются разные технологии. Есть java, node.js, python.

Также особенность вспомогательных бекендов — их часто нужно перезапускать, потому что находятся различные мелкие правки (по большей части markdown файлов). Перезапуск такого вспомогательного бекенда никак не отражается на работе всей системы.

Я бекенд разработчик, написал главный бекенд, несколько вспомогательных. И я прошел велосипедный процесс автоматизации разворачивания вспомогательных серверов. Я разбил его на условные уровни.

Level 1

Все начиналось просто. Захожу по SSH на VPS, выкачиваю изменения с git, делаю mvn build, ну или npm i, дальше java -jar или выполняю другую команду для поднятия сервера.

Ничего не автоматизировано, все вручную. Частота — несколько раз в день.

Level 2

По происшествию какого-то времени я понял, что времени этот процесс занимает слишком много. Я ввожу дофига паролей от гитхаба и т.д.

Окей, в gihub добавляю SSH ключ VPS. Теперь git pull, не ввожу пароли. Вроде мелочь, но стало быстрее.

Level 3

И все же получается долго. Даже не так долго, как скучно.

Окей, пишу bash скрипт. В скрипте несколько команд:

git pull, чтобы вытянуть последние изменения
mvn package — делаем fatjar (описываю Java)
pkill yourserverprocessname — убиваем текущий процесс
java -jar yourfatjar.jar

Теперь мне нужно зайти на VPS, сделать cd ~/git/repository_name, и выполнить скрипт — ./deploy.sh

Level 4

Раз у нас есть один скрипт, почему не вызывать его удаленно?

Не забывайте, что все вращается на дешевых VPS. Поднимать что-то сложное я не хочу. Ищу простой сервер на C — чтобы занимал минимум ресурсов. Нахожу, пытаюсь пофиксить под свои нужды — не получается быстро. Я писал на C десять лет назад, и понимаю, что помню только синтаксис, но работу с сетью, сокетами забыл напрочь.

Окей, делаем возврат к Java. На коленке набрасываю сервер из нескольких десятков строк кода. Использую встроенный HttpServer. Умеет принять GET и POST запрос, вытянуть параметр token, если параметр правильный — запустить указанный bash скрипт.

Запускаю все это чудо.

Теперь на каждом VPS вращается две программы. Одна основная. Другая — вспомогательная, для перезапуска основной.

Итог — когда что-то поменяли на вспомогательном бекенде, просто переходим по определенному URL, выполняется bash скрипт, и сервер перезапускается с обновленным кодом.

Level 5

Остается последний шаг.

Открываю github, нахожу настройки webhook для нужных репозиториев. Смысл в том, что когда мы делаем определенное действие (push, etc) — github умеет дернуть указанный для этого репозитория URL. Точнее — отправить POST запрос по указанному адресу с параметрами события.

Я настроил webhook на любой push. Дергается именно тот URL, который делает обновление и рестарт сервера.

Теперь, если мы делаем git push, через минуту мы имеем обновленный и перезапущенный сервер.

Level 6 (bonus)

Как я уже упоминал, иногда вспомогательные бекенды падают. На них пользователи исполняют недоверенный код. Пусть и в песочнице, но тот же node.js все же иногда валится.

Для нас падение некритично, при условии что сервер быстро поднимется.

Окей, я начинаю искать сервисы для мониторинга доступности серверов. Нахожу UptimeRobot. По описанию все выглядит весьма прилично:

раз в пять минут мониторит доступность указанного адреса
если адрес недоступен — делает то или иное действие (отправляет POST/GET запрос, шлет оповещение по электронной почте и т.д.).

Прямо то что нужно! Настраиваю мониторинг, добавляю действие — если сервер упал, то дернуть URL перезагрузки. Также добавляю Телеграм бота, чтобы он оповещал команду о падении и восстановлении серверов.

Какое-то время работает нормально. Потом оказывается, что UptimeRobot мониторит нифига не раз в пять минут. Сервер упал, прошел час или что-то вроде того, и только тогда он обнаруживает падение.

Час — это долго. На коленке на Spring Boot набрасываю решение, аналогичное UptimeRobot, но сильно урезанное. Раз в минуту мониторим указанные адреса, если адрес недоступен — шлем оповещение про падение/поднятие сервера, ну и перезапускаем сам сервер.

В Телеграм канале, где есть все разработчики, видим вот такое:

Такое наколенное решение работает уже больше месяца, пока проблем не замечал.

Плюсы решения

Главный плюс описанной выше системы — простота. Примитивные bash скрипты с минимумом логики.

Все уровни автоматизации накладываются один на другой, и верхние слои зависят от нижних, но не наоборот. В любой момент можно откатиться на уровень вниз, и ничего не поломается.

Минусы решения

Главный минус — хрупкость.

Что, если не при каждом push на github мы хотим перезапускать сервер?

Что, если мы сделали push, а код не компилируется?

В некоторой мере эти минуса нивелируются малым количеством разработчиков, работающим над бекендом. Мы привыкли к этой системе, знаем ограничения. Поскольку даже такая автоматизация сильно упрощает работу, мы живем с этим.

По нормальному это решается CI/CD системой. Где код вначале проходит тесты, и лишь если все ок — доставляется на production.

Следуюет учесть, что мы начинали, и до сих пор частично находимся в стадии MVP. То есть, на данном этапе важно быстро выкатить продукт, собрать фидбек. Но сейчас потихоньку переходим в стадию, когда продукт начинает немного зарабатывать деньги, и ощутимо — экономить. Поэтому я задумываюсь про описанные выше минусы, и прикидываю способы их устранения.

Куда двигаться дальше?

Скорей всего, указанные выше минуса решатся довольно просто. В Java, при сборке Maven проекта, сначала прогоняются юнит тесты, потом собирается jar. Если тесты не проходят, либо же ошибка компиляции и билд не собрался — мы про это узнаем.

Поэтому нужно слегка дофиксить bash скрипт, чтобы он лишь в случае успешной сборки билда (появился .jar файл после mvn package) убивал текущий процесс и пытался запустить новый. Что-то похожее можно сделать и для node.js — если тесты не прошли, ничего не перезапускаем.

Также нужно вынести вебхук из github на внешний сервер, и обновлять сервер по определенным условиям (например, запланировать обновление на ночь, когда пользователей меньше).

Я думал про взрослые CI/CD системы, типо Jenkins, Gitlab, софт вида Ansible. Но пока пришел к выводу, что текущая система более чем достаточна.

Любую систему нужно поддерживать, а чем система проще — тем проще ее поддержка. Я люблю простые и понятные решения, и не хочу слепо использовать технологии лишь из-за того, что они на слуху. Если команда разработки вырастет, и нас перестанет устраивать текущий подход — тогда задумаемся о его изменении, но не раньше.

Путь тимлидера

Как я уже упоминал, я сейчас руковожу отделом разработки. Это очень отличается от того, когда просто пишешь код. Нужно ставить задачи, определять их приоритетность, задумываться не только о технической, но и о бизнес части. Код при этом писать тоже нужно, пусть и меньше.

Нужно учитывать временные и финансовые ограничения. Учитывать особенности каждого разработчика. Я сейчас читаю много тематичной литературы, из последних прочитанных за месяц книг — "Как пасти котов", "Я, нерды и гики", "Программист-праграматик", "Роман о управлении проектами".

Это интересный и новый для меня путь. Я прохожу его, описывая свой прогресс в своем Телеграм канале — Программист и бизнес.

Пишу о бизнесе с точки зрения разработчика. Туда выкладываю короткие заметки, которые не подходят хабру по формату.

Комментарии (25)

vdshat
26.07.2020 20:27
#21890340
+6
Проходили похожий путь и поверьте использование готового специализированногл софта в разы дешевле, т.к. не нужно еще и велосипед изобретать и чинить его.
Есть разного уровня решения.
Для сборки Jenkins.
Для разворачивания его же можно использовать или Rundeck, Ansible, Puppet etc
Не поленитесь потратить немного времени и оно вернется десятикратно
1. 1nt3g3r Автор
  26.07.2020 21:57
  #21890670
  Почитал комментарии, и понимаю что да, костыльное решение получилось. Могу сказать, что поскольку никто не знал как правильно — делали как умеем.
  
  Я так понимаю, что у вас была такая же ситуация (проходили похожий путь).
  
  К чему вы все же пришли, к какому стеку?
  
  Я склоняюсь пока к варианту поднять Jenkins, и делать что-то вроде:
  
  1) Jenkins из jenkinsfile собирает на той же машине, где запущен jenkins билд — это jar файл.
  2) Дальше jar файл копируется на целевую машину
  3) Каким-то скриптом убиваем старый процесс, запускаем новый.
  
  Пока до конца не понимаю, зачем использовать ansible, например, если процесс билда — это mvn package.
  1. vdshat
    27.07.2020 00:06
    #21891026
    Jenkins для сборки пакетов или Docker контейнеров, которые кладутся в соответствующие репозитории.
    Для деплоймента использовали Rubdeck и Ansible. В результате сейчас для всего используется Jenkins + Git + Helm, но не от хорошей жизни, а отсутствия ресурсов. Все таки деплоймент должен выполняться предназначенным для этого софтом, который знает топологию и умеет работать с инфраструктурой.
  1. Nikobraz
    27.07.2020 00:35
    #21891118
    +1
    2) деплой ансиблом:
    остановить сервис
    положить файл
    запустить сервис
    3) напишите systemd юнит для вашего софта
  1. killeralex
    27.07.2020 20:48
    #21894942
    Иван, в чем отличие рис. 1 и рис. 2? Спасибо

lair
26.07.2020 20:48
#21890420
+3
Я еще могу понять — самописный деплой, но самописный билд? Ненене.

ArsenAbakarov
26.07.2020 21:27
#21890540
+5
«Я сейчас являюсь руководителем отдела разработки в компании, где я работаю» — ну и зачем испытывать себя на компетенцию со стороны коллег? Вы уволитесь, им поддерживать ваше поделие
1. 1nt3g3r Автор
  26.07.2020 21:49
  #21890656
  +1
  Понимаю, о чем вы. Стоял выбор между совсем не автоматизировать, и автоматизировать хоть как-то — никто не умел делать это правильно. Выбрали такой вариант.
  
  Ну и можно не поддерживать. То есть, в крайнем случаем откатиться нужно до ручной сборки, заходя по SSH на сервер, но больше ничего не поломается.
  1. TyVik
    26.07.2020 23:13
    #21890876
    +1
    Зачем автоматизировать так, что всё равно потом переделывать? Я уже молчу про Docker (хотя и docker-compose нормально на одной машине работал), но хотя бы Ansible. Чтение доки вечером, пара дней поиграться и потом можно в прод. Заодно и знания эти потом пригодятся.
    
    lubezniy
    28.07.2020 00:36
    #21895606
    -1
    Вот после таких «пара дней поиграться, и в прод» потом и случаются факапы. Инструмент это таки серьёзный и требует соответствующего подхода. Для простейших случаев, не перспективных с т. з. быстрого развития, всё же лучше несколько строк кода: они намного проще для понимания.

Fox_exe
26.07.2020 21:43
#21890630
+2
Не совсем понял, зачем там Java? Bash + стандартные утилиты (sed/awk/grep/echo/etc..) вполне справляются с задачами по разворачиванию и запуска софта.
Личто я писал скрипт, который с моего компа цеплялся на указанный хост, используя ключи и конфиги из соответствующего файла параметров. Всё предельно автоматизировано. Корректность запуска проверяется через Exit-коды. Веб-контент — банально через wget/curl/netcat + grep/awk.
1. 1nt3g3r Автор
  26.07.2020 21:47
  #21890650
  +1
  Я хорошо знаю Java, и очень базово — bash. Выбрал инструмент, на котором смог сделать решение. Согласен с вами, что исключительно bash + утилиты получше решение, по крайней мере с точки зрения потребляемых ресурсов.
  1. Fox_exe
    26.07.2020 21:53
    #21890662
    Тут вопрос в том, что Bash (или его урезанный аналог) есть везде, в отличии от Java.
  1. justhabrauser
    26.07.2020 22:55
    #21890822
    Человек выше правильно указал, и могу добавить — на Linux-серверах утилитарного типа JVM есть крайне редко. Оно там просто не нужно, а ресурсов потребляет как не в себя.
    Её ставят только в случае крайней необходимости ввиду очень специфического софта.
    А на десктопах — практически только из-за LibreOffice (когда им уже руки подкручивают).
    Так что ставить себе в достоинство использование этого прекрасного в своей сфере фотоаппарата как инструмент для забивания гвоздей — идея так себе.
1. Nikobraz
  27.07.2020 00:37
  #21891124
  Джава-программисты так любят. У меня на текущем месте пайплайны в дженкинсе по 2к строк и несколько java-приложений, которые тут же собираются и запускаются.
  Недавно заменил 250 строк кода на 30 с тем же функционалом и большей отказоустойчивость.

denyago
26.07.2020 21:45
#21890640
А что происходит когда Ваше приложение падает, чисто гипотетически?
Какой-то мониторинг используете?
1. 1nt3g3r Автор
  26.07.2020 21:45
  #21890642
  Да, отдельное приложение мониторит раз в минуту доступность сервисов, и если какой-то упал — перезапускается. В статье упомянул.
  1. kvazimoda24
    27.07.2020 00:40
    #21891136
    Посмотрите Заббикс
    
    Nikobraz
    27.07.2020 11:06
    #21892358
    systemd with http healthcheck
    чем мешает? заббикс не очень хорошо подходит для мониторинга сервисов, лучше уже Prometheus + Grafana, если нужен полноценный мониторинг, но перезапуск сервисов не его задача.
    
    Есть же нативный инструмент, нет надо костыли городить.

AlexGluck
26.07.2020 22:28
#21890758
Я бы поставил подман, собирал софт в контейнерах с помощью зеркала на гитлабе (бесплатный приватный репо есть у гитхаба и гитлаба), с его gitlab ci (бесплатно 1000 часов, если мало в контейнере запустить бы свой ранер), пушил в приватный репо докерхаба. Потом ансибл раскатывал на сервера. В гитлаб ci сделал пайплайн по расписанию для проверки работы стенда и его перезапуска. Ну и супервизоров получилось бы 2, первый это conman от подмана, второй это системд. Ну и не забудем что у контейнеров есть helthcheck'и. На всё про всё 10000 рублей на фрилансера девопса, и он за день сделал бы. Либо можно и самостоятельно запилить за пару дней. Благо всё примитивно делается, баш скрипты режуться на строчки и в докерфайл или yaml для ci. Никаких своих серверов писать не надо.

anonymous
26.07.2020 23:38
#21890932
+3
А про Ansible кто-то слышал?
1. AlexGluck
  27.07.2020 01:07
  #21891192
  +1
  Но как же "фатальный недостаток"
1. samodum
  27.07.2020 03:26
  #21891410
  Один мой знакомый говорил, что видел человека, у которого сестра была замужем за мужиком, у которого коллега об этом слышал

razielvamp
27.07.2020 03:55
#21891434
+2
Конечно недочеты типо "апдейт сервера по любому push без тестов" (и вообще, это что push в maste… ой, я хотел сказать main?) несколько напрягают, но в остальном не вижу ничего плохого в таком подходе.

Изучать ансибл и кучу приблуд к нему или пролистать N десятков строк кода, это ещё вопрос, что будет быстрее и проще. Это к слову о дальнейшей поддержке.
Хотя писать такие скрипты надо тоже с умом, конечно. Если бы все было на баше и с комментариями, наверное, нарм. Но вот с джавой могут быть проблемы, если обслуживанием инфраструктуры начнёт заниматься человек, который занимается этим профессионально, а не программист.
После программистов, да, периодически приходилось переделывать.
С одним даже крепко спорил насчет баша. Он уверял, что баш это прошлое и не нужен, а все скрипты надо на питоне писать, ибо там все структурированно, с exceptionaми, raiseми и т.д.

Но при этом не люблю и другую крайность, когда в стойке два средних сервера и под них накручены ансибл, дженкинс, и ещё парочка модных приложух. В каждом сервере виртуалки и в виртуалках контейнеры. В контейнерах вся дата гвоздями к локальным папкам прибита, ip чуть ли не статические и образа крутятся уже пару лет без изменений, с периодическими падениями из-за этого и перезагрузками (иногда ручными).
Зато модно и молодежно.

ЗЫ jenkins это вообще crontab с gui. Почему-то админимить сервера с gnome не втыкая в командную строку — это моветон, а использовать jenkins вместо crontab — это быть в курсе современных технологий.

ivanovdev
27.07.2020 10:08
#21892112
-2
Автор гляньте в сторону OKD.io — возможно вам оно подойдет.

Как я автоматизировал разворачивание приложений на Linux на коленке с помощью Bash скриптов и Java -3

Немного предыстории

Архитектура системы

Level 1

Level 2

Level 3

Level 4

Level 5

Level 6 (bonus)

Плюсы решения

Минусы решения

Куда двигаться дальше?

Путь тимлидера

Комментарии (25)

1nt3g3r Автор

1nt3g3r Автор

1nt3g3r Автор

1nt3g3r Автор