Не так давно на нас свалилась задачка: обновить криптошлюзы (КШ) «Континент» с версии 3.7.5 до версии 3.9.1 на всей VPN-сети довольно крупного клиента. Сеть географически распределена и охватывает все часовые пояса нашей необъятной Родины. Всего – порядка 120 центров управления сетью (ЦУС) с подчиненными КШ. В общей сложности нам предстояло обновить более 3500 «зелёных» устройств. Насколько нам известно, мы одни из первых выполнили обновление такого масштаба с версии 3.7.5 на 3.9.1 без замены железа и настройки сети «с нуля». То есть именно обновили существующую сеть со всеми ее текущими настройками и оборудованием. Но, как говорится, есть нюансы. Зная их заранее, вы наверняка сможете сэкономить свои ресурсы, если затеете нечто подобное.

Нюанс 1. Чтоб не запороли пароли

ЦУС как устройство централизованного управления криптосетью хранит все данные о ее настройках, и очень важно не потерять их перед обновлением. Это легко сделать, сохранив конфигурацию ЦУС из программы управления (ПУ ЦУС). При этом важно задать пароль на латинице, а лучше использовать цифровой пароль, чтобы при загрузке конфигурации точно быть уверенным, что она попадет на ЦУС версии 3.9.1. У нас был случай, когда мы задали пароль в русской раскладке, но при загрузке конфигурации на ЦУС ввести пароль в русской раскладке невозможно – будьте внимательны.

Нюанс 2. Не все флэшки одинаково полезны

Следующий очень важный аспект – носитель, с которого загружается конфигурация. Как выяснилось в процессе, не все флешки для этого подходят, даже если они были отформатированы в FAT32 или подготовлены с использованием ПО ServiceTool (входит в комплект установки ПУ ЦУС). Нам не удалось до конца понять причину такого поведения. В то же время флешка из комплекта ЦУС (зеленая в виде ключика с логотипом вендора) в 99,9% случаев с первого раза загружала конфигурацию корректно.

А с "неправильной" флэшкой получалось такое...
А с "неправильной" флэшкой получалось такое...

Нюанс 3. Обновление конфигураций

Дабы в дальнейшем вы не тратили уйму времени зря, поговорим о еще одной распространённой проблеме – некорректной загрузке конфигурации ЦУС в процессе обновления. Итак, если ЦУС после прошивки отказывается загружать конфигурацию (пробовали 4 разные флешки), то нужно всего лишь еще раз его перепрошить.

Следите за тем, чтобы все КШ при сохранении конфигурации ЦУС были в «спокойном состоянии», то есть чтобы на них были применены и обновлены все настройки с ЦУС. Например, на некоторых управляющих устройствах мы столкнулись с тем, что из-за большого количества объектов в группах и, как следствие, большого числа правил фильтрации в базе, криптошлюзам не удавалось загрузить с ЦУС соответствующие обновления конфигурации. КШ бесконечно пытались это сделать (в ПУ ЦУС напротив КШ постоянно висел значок обновления).

Решить эту проблему помогли отключение некоторых правил фильтрации, содержавших большое количество различных сервисов, или удаление сетевых объектов из управляющих центров (удалили 100 идентичных подсетей, заведенных по стандартной матрице на всех ЦУС). В одном случае нам пришлось проделать обе операции.

Нюанс 4. Сайзинг оборудования

Этот вопрос особенно актуален для проектировщиков и архитекторов со стороны эксплуатации. Для управления криптосетью из более чем 80 КШ лучше использовать как минимум IPC-500, а если подчиненных КШ более 150, то IPC-1000. Например, после обновления наш ЦУС IPC-100, управляющий 128 КШ, начал «засыпать», отклика в ПУ приходилось ждать по несколько часов. После подключения второго, более производительного резервного ЦУС (IPC-1000) и переключения на него управление вернулось, и работа ЦУС восстановилась.

Ещё одна рекомендация проектировщикам и архитекторам по КШ, а также инженерам, тестирующим ту или иную процедуру. КШ лучше использовать именно для шифрования и как можно реже возлагать на него дополнительные сетевые функции (SPAN, QoS и прочие).  Например, после обновления с 3.7.5 на 3.9.1 производительность КШ сильно упала (не факт, что такая проблема будет у вас, так как она весьма специфична, но разговор не об этом). После разбора проблемы выяснилось, что функционал SPAN стал потреблять больше ресурсов. В том же ключе проявился нюанс, связанный с логированием сетевого трафика: включение всех параметров мониторинга заметно «съедало» процессорные мощности. Мораль сей басни: чем больше задействовано функционала, тем больше нюансов нужно учитывать при тестировании или планировании технических работ.

Нюанс 5. Резервное копирование

И пара слов про бэкап ЦУС. Если не обновить все до одного подчиненные КШ в ПУ ЦУС до текущей версии, то конфигурация ЦУС, которую вы сохраните, в дальнейшем не будет пригодна для восстановления. ЦУС ее просто не примет.

Мы рекомендуем обновляться сразу на версию 3.9.1, минуя 3.9.0 (в 3.9.0 изменена логика применения правил фильтрации и работы КШ в «мягком режиме», затруднена работа КШ в кластере, а также имеется ряд мелких багов).

В любом деле очень важна подготовка, и чем больше разных бэкапов вы сделаете перед обновлением, тем лучше. Например, на всякий случай сделайте скрины или выпишите на листочек настройки интерфейсов и маршрутизации – вдруг придется откатываться.

Нюанс 6. Заключительный

Отдельно скажем, что при обновлении такого количества ЦУС и подчиненных им КШ в распределённой сети не обойтись без помощи вендора. Хочется отметить коллег из «Кода Безопасности», которые оказывали своевременную и всестороннюю поддержку: диагностику по месту возникновения проблем, оперативное моделирование и выявление нюансов на своих стендах. В этой связи в крупных VPN-сетях порекомендуем приобретать техническое сопровождение в обязательном порядке.


На этом всё. Всем удачи в непростом деле сопровождения отечественных VPN-сетей. И помните: глаза боятся – руки делают.

Евгений Веретенников, инженер 2-й линии администрирования, "Ростелеком-Солар"

Михаил Данилов, администратор информационной безопасности, "Ростелеком-Солар"

Комментарии (13)


  1. iddqda
    22.10.2021 10:25
    +9

    Название статьи предполагает использование какого то рода автоматизации

    А тут, как я понял, было 3500 обезьян и 3500 флешек и все грабли заключались в том что либо флешки не читались либо обезьяны косячили

    Даже зная про все грабли с ума сойти все таки возможно


    1. elobachev
      22.10.2021 14:57
      +1

      ИМХО основные грабли там в том, что в сети 120 центров управления =) Как не умел делать отечественный вендор системы управления средствами сетевой безопасности, так и не умеет..


      1. vesper-bot
        22.10.2021 21:18

        А ещё у них VPN по факту с куском в неподконтрольной заказчику сети.


        1. elobachev
          25.10.2021 14:23

          Было бы интересно услышать этот тезис более развернуто. =)


          1. vesper-bot
            25.10.2021 18:11

            Так… возможно я перепутал Континент и Випнет. У какого-то из этих вендоров есть "номер сети" вместо айпишника подключения, который меня настораживает. Проблема в том, что от Континента в виде железки и от Випнета в виде ПО у меня нет управления, и они для меня оба черные ящики. Если все-таки в Континенте система подключения типа клиент-сервер, как у диалапного VPN, то я неправ.


            1. StJimmy
              26.10.2021 08:46
              +1

              У ViPNet всю сеть также контролирует владелец сети, другое дело, что «заказчик» в Вашем сценарии может быть не владельцем сети, а только подключаться к ней. Впрочем между двумя шлюзами, а также между клиентами и шлюзами траффик будет в любом случае ходить шифрованный, но у владельца сети в таком случае может быть доступ к их ключевой информации.


            1. methos2
              27.10.2021 17:35

              У Випнета номер сети. И тем и другим можно управлять имея ЦУС.

              Но в Випнете меня очень веселит, что можно передавать трафик через промежуточную сеть.


    1. lexxand
      22.10.2021 18:31

      Не, всё-таки хоть один плюс у обновления КШ есть - оно нормально проходит в удаленном режиме, обновлять вручную нужно только цусы. Флешки и танцы нужны когда в процессе обновления был сбой.

      Но а в целом - версия 3.9.1 - как бы это сказать помягче...нечто тёплое, мягкое, и коричневого цвета. На UX программистам из КБ наплевать, управлять сетью больше 50 континетов - боль и страдания. Панель управления глючит, виснет, постоянные таймауты, чтобы включить snmp нужно плодить сетевые объекты... А в статье ещё и пишут что span грузит процессор сильнее чем на 3.7. Мрак.


  1. GypsyBand
    22.10.2021 12:24

    Принесли мне сегодня коробку с Континент 3.9, но отложу как я её до понедельника :)

    Надеюсь в понедельник у техподдержки будут свежие силы ;)


  1. korsetlr473
    22.10.2021 13:22

    как криптошлюзы связаны с вашей статьей? которые USDC от Circle чтоли или биржевые которые от Биткономи?


    1. oblom86
      22.10.2021 18:31
      +1

      Ознакомиться с матчастью можно хотя бы и на вики https://ru.wikipedia.org/wiki/Криптошлюз


  1. Dvlbug
    22.10.2021 21:03

    Раз тут такая тема, есть проблема, два админа одновременно настраивают Континент, после чего слетают сделанные настройки.

    Как один из них подозреваю, что при изменении конфигурации заливаются настройки, лежащие в кэше, и затирающие параметры, которые внёс второй админ.

    В какую сторону смотреть, приходится звонить перед каждой правкой конфигов "Серега, ты сейчас в Континенте не сидишь?".


    1. Pinkbyte
      23.10.2021 10:58

      Насколько мне известно на версии 3.9 предполагается одновременное управление только с одного RCP. При этом технически подключиться можно с нескольких и запороть конфигурацию при этом(это кстати причина почему у нас RCP живет на виртуалке с клиентской вендой куда мы с напарником ходим по RDP).

      Вроде в 4.0 есть какие-то подвижки на этот счет, но учитывая геморрой при обновлениях мы сидим на 3.9 и не жужжим. У нас конечно сеть в разы меньше(~20 КШ), но я уже по такому количеству граблей прошелся, что заглянцовывать это апдейтом который может^W точно пойдет не так - не охота от слова совсем!