В Selectel есть особенный отдел — Selectel Lab. Это виртуальная лаборатория, где мы ставим эксперименты над технологическими новинками ведущих вендоров. Изучить эти новинки могут и наши клиенты — предлагаем им бесплатно тестировать подобранные конфигурации в своих проектах.

В этом тексте собрали «анамнез» последних экспериментов, проведенных в нашей лаборатории. Под катом — разбор сервера на ARM-процессоре, тестирование отечественных «Эльбрусов» и препарация золотого «суперкомпьютера».

Тест ARM-процессора Ampere Altra



Зачем тест: Хотели сравнить заявленные производителем характеристики с реальными. Процессоры с таким числом ядер с частотой 3.0 ГГц при TDP в 210 Вт не предлагает ни один «звездный» вендор. Кроме того, на тот момент мы завозили ARM-процессоры в дата-центр, и нам нужно было понять, насколько он подойдет для наших серверных.

Уже сейчас вы можете арендовать выделенный сервер c ARM-процессором (Ampere Altra Max M128-30 3 ГГц, 128 ядер) или же протестировать сервер с ним бесплатно — в Selectel Lab (на тесте — 80-ядерный процессор).

Тестовый конфиг:

  • Материнская плата GIGABYTE MP32-AR1-00
  • Процессор Ampere Altra Q80-30
  • Память: 16 x 16 ГБ Micron DDR4 3200 МГц ECC (256 ГБ)
  • 2 SSD-накопителя Micron_5300 на 480 ГБ
  • NVMe-диск на 1 ТБ M.2 SSD (GIGABYTE GP-AG41TB)
  • Три видеокарты Nvidia TESLA T4

Список тестов: AI-Benchmark, Geekbench 5, ffmpeg NVENC, CUDA Toolkit, проверка температурного режима и энергопотребления.

Для сравнения с Amper Altra выбрали два процессора AMD EPYC 7513 — 64 ядра в сумме, базовая частота 2,6 ГГц (до 3.65 ГГц в режиме Turbo CORE).

Результат: В однопоточном режиме процессор выдает довольно скромные результаты (впрочем, опять же, показатели не так далеко ушли от AMD EPYC). Зато в мультипоточном лидерство Ampere Altra очень уверенное. Даже несмотря на то, что использовалось два процессора AMD EPYC 7513, Ampere Altra Q80-30 составляет конкуренцию процессору от AMD. На момент публикации, согласно внутренним бенчмаркам Selectel, этот процессор на втором месте по производительности после AMD EPYC 7742.

Базовые тесты ARM-процессора Ampere Altra показали, что на данный момент этот CPU эффективнее с точки зрения электропотребления. Учитывая этот факт и цену процессора, он экономически выгоден для дата-центра.

Подробное описание теста процессора →



Анализ эффективности «Эльбрус-8СВ» для дата-центра



Зачем тест: Хотела проработать план Б — сможем ли предоставлять сервера на отечественном процессоре? Взяли на изучение процессор «Эльбрус-8СВ». Он шел в комплекте с материнской платой «2Э8СВ-EATX» производства компании МЦСТ. Нам было важно понять, сможем ли мы встроить процессор в систему дата-центра, примет ли он все автоматизации, написанные для быстрого запуска выделенных серверов Selectel.

Тестовый конфиг:

  • Корпус: 2U NVMe
  • Процессор: «Эльбрус-8СВ»
  • Матплата: «2Э8СВ-EATX»
  • RAM: 8 шт. DDR4 32 ГБ 2933 МГц ECC Reg DIMM (MTA36ASF4G72PZ-2G9J3) Micron
  • SSD: 1 шт. Micron 5300 Pro 1 ТБ
  • HDD: 1 шт. ST4000NM0035 Seagate 4 ТБ
  • SSD: Samsung 480 ГБ MZ7LH480HAHQ
  • SSD: Intel 240 ГБ S4510

Список тестов: бенчмарк-тест Geekbench5 в режиме бинарной трансляции, также отдельным тестом стала установка ОС.

Результат: На данный момент препятствий для внедрения серверов в дата-центры более чем достаточно. Чтобы привести серверы на Эльбрусе к такому же удобству для конечного пользователя, нужно будет вложить очень много сил и времени. Придется поломать голову над автоматизацией процессов, перекомпилировать необходимые программы, подумать, как обойти все существующие ограничения.

На данный момент мы продолжаем вести коммуникацию с разработчиками и тестировать процессор. Возможно, еще вернемся с продолжением этой истории.

Подробнее о тесте «Эльбруса» →

Разбираем тяжеловеса с 8 GPU



Зачем тест: Этот сервер с 8 видеокартами нам предоставила компания Forsite. NVIDIA DGX A100 — стоечный сервер, высотой в 6U и массой более 130 килограмм. Мы хотели опробовать новинку сами и предложить поработать с этим «монстром» нашим клиентам.

Характеристики:

  • 2 x AMD EPYC 7742, 128 ядер
  • 2.25 ГГц
  • 1 ТБ RAM
  • Объем дискового пространства 15 ТБ
  • GPU 8 х Tesla A100
  • GPU-память 320 ГБ

Список тестов: GeekBench 5 Compute, AI-benchmark, MLPerf, также проверили «теоретическое» состояние сервера с помощью команды nvsm show health.

Мы даже сняли ролики на YouTube – посмотрите.

Результаты: Несмотря на наличие инструкции и четкий регламент, большинство тестов не запускалось из-за ошибок в зависимостях Docker-контейнеров. DGX имеет множество сложных технических нюансов и особенностей, но их нельзя прочувствовать на паре общих тестов производительности. Чтобы почувствовать настоящую мощь этого сервера, нужно «потрогать» его самостоятельно.

Посмотреть на «золотой сервер» →

Возможно, эти тексты тоже вас заинтересуют:

Чем заняться в 2023? Идеи для пет-проектов и подборка материалов по профессиональному развитию
Гиперскейлинг в 2023 год: что мы делали, чтобы поддержать бизнес клиентов
Loongson 3D5000: китайский процессор на собственной архитектуре. Что он из себя представляет?

Комментарии (12)


  1. Writer
    17.01.2023 20:07
    +2

    сможем ли предоставлять сервера на отечественном процессоре?

    Будь он быстрым, как тот же M1, то и остальные ограничения как-нибудь преодолели бы (по крайней мере, был бы стимул). А так, вопрос ставится проще: можно ли перевести ДЦ на пентиумы4. Наверное можно - спалив кучу электричества и потеряв в производительности в несколько раз. Но зачем?


    1. punzik
      18.01.2023 10:38
      +1

      Так надо не полениться, и перекомпилировать программы для нативного запуска, а не пускать в бинарной трансляции.


      1. nzamb1
        18.01.2023 13:27
        -1

        M1 быстр во всем. И без компилации под M1. Даже с эмулятором Rosetta. Компилация под архитектуру ускорит работу но не принципиально.


  1. DustCn
    17.01.2023 20:12
    +5

    Результаты где?


    1. nochkin
      17.01.2023 21:05
      +2

      Чтобы почувствовать настоящую мощь этого сервера, нужно «потрогать» его самостоятельно.


      1. wizard_s
        17.01.2023 21:35

        На SM 4029gp-trt можно в 4u 10gpu засунуть. Этот в 1.5 раза толще. Трогать не особо хочется.

        Вообще с такими системами боль - найти место с достаточной мощностью, подведенной к стойке. Под полный шкаф таких 6u надо от 14кВт, а под 4u еще больше. Еще найти надо дц, который с такой плотностью размещаться даст


    1. lodz
      17.01.2023 23:24
      +1

      По ссылкам под блоками текста:

      → ARM

      Эльбрус

      DGX


      1. DustCn
        18.01.2023 18:22
        +2

        То есть сводную табличку я должен сам сделать?
        Спасибо, вот это сервис!


        1. lodz
          20.01.2023 14:15

          Сводную табличку по чему именно вы хотите? Мы не сравниваем три системы между собой) Это три отдельных эксперимента.


  1. Kolymbarii
    18.01.2023 18:04
    +2

    Жаль, что Эльбрусы еще пока не выстрелили. А можно ли запускать на них PostgreSQL (что-то другое?) как вариант облачного сервиса? Я бы пользовался на самом деле, в качестве поддержки Эльбрусов и дальнейшего их развития. На самом деле жду на этих процессорах железки)


  1. helze
    20.01.2023 11:19

    Ссылка на ютуб мёртвая


    1. lodz
      20.01.2023 14:13

      Спасибо, что заметили! Поменяли ссылку в тексте. Вот она: https://www.youtube.com/watch?v=O16nj-dIBHU&list=PLCHX0Xp-DjKpEhVkLYGEBKQHNtaYcm1wb