В свое время, в далеком уже 2017 году, мы опубликовали статью Что такое Intel Xeon Scalable?, в которой поясняли суть масштабной трансформации серверной линейки процессоров Intel. С тех пор прошло 4 года и два поколения Xeon, и мы вновь решили вернуться к этой теме. Что представляют из себя Intel Xeon Scalable Gen3, какие новейшие технологии они в себя вобрали? Как выглядит линейка Xeon, что означают многочисленные индексы моделей? Обо всем этом мы расскажем здесь.

Все о ядре Sunny Cove


Начнем с самого главного. Семейство Ice Lake-SP, процессоры Intel Xeon Scalable третьего поколения, предназначены для использования в двухсокетных серверах (платформа Whitley) и включают в себя ядра Sunny Cove, выполненные по 10 нм техпроцессу. Вот так во всей своей красе выглядит кристалл 28-ядерного процессора Ice Lake-SP.



В ядре Sunny Cove много микроархитектурных усовершенствований и новшеств. Сравним важнейшие характеристики ядра с предшествующим поколением.
Cascade Lake Ice Lake
Буфер для хранения инструкций для внеочередного исполнения команд 224 384
Количество операций загрузки + хранения в кэш-памяти 72 + 56 128 + 72
Количество команд в планировщике 97 160
Количество регистров (целочисленных и с плавающей запятой) 180 + 168 280 +224
Очередь выборки команд 64 на поток 70 на поток;
L1Dкэш (Kбайт) 32 48
Скорость работы L1 Dкэша (загрузка + хранение) (Байт/Цикл) 128 + 64 128 + 64
Буфер ассоциативной трансляции L2 (записей) 1.5K 2K
L2-кеш (Мбайт) 1 1.25
Микроархитектура ядра Sunny Cove выглядит следующим образом.


Подытоживая, выделим основные улучшения Sunny Cove по сравнению с предшественником.
  • Улучшен блок выборки команд – больше емкость и быстрее предсказатель переходов
  • Более широкий и глубокий уровень выполнения команд – больше ресурсов на выборку и выполнение
  • Улучшения в кэше адресов L2, ускорение однопоточных вычислений, алгоритмов предвыборки
  • Серверные улучшения – больше L2-кэш, второй FMA (fused multiply-add) блок

И, наконец, еще один принципиальный вопрос — добавленный аппаратный функционал ядра. Итак, о новых инструкциях Sunny Cove. Для нужд криптографии добавлены операции арифметики больших чисел (AVX-512 Integer Fused-Multiply-Add), в частности, VPMADD52 — FMA 52-битных целых. А также инструкции векторного AES, в том числе допускающие параллельную обработку, и новые инструкции поля Галуа (алгоритмы шифрации и коррекции ошибок). Добавлена аппаратная поддержка алгоритмов криптографического хеширования SHA-NI.

В области сжатия данных и специальных SIMD-инструкций также проведена большая работа. Добавлены операции битовой алгебры, а также инструкции VBMI (Vector Bit Manipulation Instruction) для операций перестановки, сдвига, расширения и сжатия, используемых в дискретной математике, словарной декомпрессии и проч.

Что в индексе тебе моем


Нынешний «большой запуск» включает в себя сразу 53 модели процессоров. Как разобраться в таком разнообразии? В этом нам помогут индексы моделей, разделяющие все поколение на группы. Признаться, сначала эти индексы, наоборот, всех запутали — к нам регулярно приходили просьбы пояснить их значение. Что ж, сейчас есть возможность разобраться в обоих вопросах.

В таблицах ниже приведены основные характеристики каждой серии. Темно-серый цвет обозначает класс Xeon Platinum, желтый — Xeon Gold, светло-серый — Xeon Silver.

Начнем мы с серии H/HL для 4- и 8-сокетных платформ, стоящей во всей линейке несколько особняком. Эти модели принадлежат к предыдущему семейству Cooper Lake, выполнены по 14-нм техпроцессу и имеют соответствующий функционал (ревизию PCIe, поддержку памяти и т.д.). Они предназначены для специально разработанных для них серверов — просим иметь в виду. Серия Н поддерживает до 1,2 Тб памяти на сокет, HL — до 4,5 Тб.



Далее следует основная серия без индексов (ну, почти). Она олицетворяет саму сущность Xeon Scalable: масштабируемость и полезность каждого ядра — вы получаете ровно то, что вам требуется. Как видите, совсем без индексов и тут не обошлось: модели с буковкой Y поддерживают технологию Intel Speed Select — Performance Profile 2.0 (Intel SST PP). На эту тему мы еще поговорим.




Отдельно обратим внимание на серию с увеличенным размером анклава SGX — они не удостоились отдельного индекса, но имеют 512 Гб под анклавы SGX вместо типовых для Gen3 64 Гб. Дополнительные индексы в этом списке: Q — предназначен для водяного охлаждения, S — поддерживает Intel Speed Select — Performance Profile 2.0.



Серия P/V для облачных провайдеров насчитывает пока по одному экземпляру каждого процессора. P предлагается использовать в IaaS, а V — в SaaS платформах виртуализации.



Модели с индексом N — для сетевых устройств и технологий виртуализации сетевых функций.



Очень маленькая пока серия М — для обработки медиа и AI-применений.



Индекс T указывает на соответствие стандарту NEBS — такие процессоры могут работать в экстремальных условиях и рассчитаны на длительное использование.



Процессоры серии U могут использоваться только в односокетных платформах.



Теперь вы знаете об индексах Xeon Scalable Gen3 всё!

Speed Select бывает разный


Далее хотелось бы затронуть еще одну важную тему. Процессоры Xeon Scalable Gen3 — это не только большое количество мощных ядер, но и самая интеллектуальная у Intel технология управления их производительностью. Набор средств для обеспечения максимальной эффективности использования процессора Xeon носит название Intel Speed Select (Intel SST) и включает в себя:
  • Intel SST – Performance Profile (Intel SST-PP, ранее Speed Select);
  • Intel SST – Base Frequency (Intel SST-BF, ранее Prioritized Base Frequency);
  • Intel SST – Core Power (Intel SST-CP);
  • Intel SST – Turbo Frequency (Intel SST-TF, ранее FACT).

Первые две технологии доступны только для семейства Ice Lake, вторые, в том числе, и для Cooper Lake — моделей с индексом Н. Расскажем коротко о каждой из них.



Intel SST-PP позволяет сконфигурировать для процессора три конфигурационных профиля, включающих в себя количество активных ядер, TDP, базовую частоту SIMD, температуру перехода (TjMax), а начиная с Ice Lake еще и ряд других, таких как базовая частота AVX2/AVX512, частота памяти и прочее. Управление конфигурациями осуществляется с помощью утилиты Intel. Таким образом, мы получаем три фиксированных набора характеристик (показаны на схеме звездочками), оптимальных для каких-либо нагрузок — по сути, три разных процессора. Далее, эти процессоры используются различными группами пользователей для своих задач на основе разделения времени или по графику: скажем, днем сервер выполняет функцию VDI, а ночью считает результаты каких-либо экспериментов или занимается тяжелым рендерингом.



Intel SST-BF, как следует из названия, перераспределяет базовую частоту между менее и более приоритетными ядрами, тем самым улучшая общую производительность системы, ведь при ее использовании дополнительную частоту получат ядра с критически важной нагрузкой.



С помощью Intel SST-CP операционная система или менеджер виртуальных машин может назначать приоритеты процессорным ядрам. Когда появляется возможность для повышения частоты, Power Control Unit (PCU) распределяет запас согласно приоритетам. Приоритизация частоты работает с расширениями SSE, AVX2, AVX512. Таким образом, дополнительная производительность доставляется именно туда, где она требуется больше всего: для решения критических на текущий момент задач и ликвидацию узких мест.



SST-TF позволяет выбранным приоритетным ядрам превысить потолок максимальной турбо-частоты; при этом турбо-частота для остальных ядер будет уменьшена исходя из ТТХ процессора. Набор приоритетных ядер может изменяться динамически во время работы.

Почему стоит переходить на Gen3 уже сейчас?


Напоследок давайте подведем итоги, так сказать, с потребительской точки зрения. Почему Xeon Scalable Gen3 интересны прямо сейчас? Во-первых, все вышеперечисленные улучшения вылились в солидный прирост производительности — около 20% по сравнению с предшественниками. Это означает, что для тех же задач можно использовать или меньше серверов, или более дешевые процессоры.

Во-вторых, напомним основные технические преимущества — для кого-то это тоже будем важным.
  • 8-канальная (макс.) память DDR4-3200 до 6 Тб на процессор;
  • Intel Optane Persistent Memory 200 для реализации больших объемов памяти и быстрых накопителей;
  • PCI Express 4.0 — новые скорости для средств хранения и всей периферии (до 64 линий);
  • не забываем про Intel VROC — ее обновленная версия вкупе с новой конфигурацией PCIe позволяют создать NVMe хранилища со скоростными характеристиками, недостижимыми для обычного RAID.

В-третьих — думаем, это заинтересует разработчиков — новые фишки Gen3, о которых мы рассказывали вначале. уже реализованы в свежих версиях компилятора Intel oneAPI DPC++/C++. Как говорится, функциональность готова к употреблению.


Сервер HPE ProLiant DL380 Gen10 Plus на базе Intel Xeon Scalable Gen3

Ну и в-четвертых, что немаловажно, ведущие производители серверного «железа», такие как HPE, ASUS и прочие, за этот год успели представить большой ассортимент продуктов на базе Gen3 — как готовых к использованию изделий, так и различного рода «конструкторов». Так что с предложением проблем также быть не должно.

Мы рассказали самое основное о процессорах Intel Xeon Scalable Gen3. Если вам интересна эта тема, пишите нам, о чем бы вы еще хотели узнать.

Комментарии (9)


  1. amarao
    07.10.2021 16:53
    +2

    Скажите, а что делать, если нам нужен сервер с процессорами по 64 ядра каждый? И, желательно, быстрых, и по цене меньше $10000 за процессор?

    Вот я посмотрел у конкурентов ваших, у них есть такое:

    EPYC 7763 US $7890 7 nm 64

    А что вы можете противопоставить?


    1. saul Автор
      08.10.2021 09:21

      Среди процессоров AMD исторически, еще со времен Opteron, были 64-ядерные модели. Однако требуются они далеко не часто, по крайней мере представитель НР мне говорил, что заказчиков на такие сервера буквально единицы.


      1. amarao
        08.10.2021 09:34
        +2

        Ну тут ещё вопрос цены. Если можно больше, быстрее И ДЕШЕВЛЕ - why not?

        У intel'а сейчас есть только одно преимущество - наличие на рынке. У AMD сейчас дефицит, обещают разрулить к весне.


    1. edo1h
      08.10.2021 15:09

      обычно покупателя интересует производительность, а не число ядер на сокет )


      так на интел можно собрать вот такое:
      https://www.spec.org/cpu2017/results/res2020q4/cpu2017-20201026-24280.html
      будет на уровне системы с двумя 7763.


      или даже вот такое:
      https://www.spec.org/cpu2017/results/res2021q1/cpu2017-20210118-24814.html
      у AMD пока нечего противопоставить такой системе.


      но всё это, конечно, ужасно дорого.


      1. amarao
        08.10.2021 15:40
        +1

        Интересует производительность на $ (или W, зависит от обстоятельств). С учётом того, какое роскошное IO у AMD (достаточно посмотреть на схему подключения 8 NVME у делла для Intel VS AMD - AMD'шное просто заводит это на проц без всяких допконтроллеров), intel выглядит дорого и медленно.


        1. edo1h
          08.10.2021 17:18

          достаточно посмотреть на схему подключения 8 NVME у делла для Intel VS AMD — AMD'шное просто заводит это на проц без всяких допконтроллеров

          если вы про число линий, то у scalable gen3 их ЕМНИП 64 на сокет, вполне достаточно, чтобы подключить 8 nvme.


  1. eigrad
    09.10.2021 01:02

    А не было подобного обзора с расшифровкой маркировок Cascade Lake? Было сложно разобраться отличается ли какой-то 24-ядерник от аналогичной старшей модели чем-то кроме порезанного FMA который на машинке с кучей GPU вряд-ли понадобится (не помню, кажется в итоге оказалось что сравнивали модели для 2 vs 4 сокетов), и что за маркировка R.


  1. mons3x
    10.10.2021 08:25

    Процессоры только-только начали появляться. Платформы под них ждать по 6-8 недель. О какой доступности и "переходите сейчас" вообще речь?


    1. edo1h
      10.10.2021 18:33

      что-то вы странное пишете, в июле покупали сервер, 6330 и прочие были вполне доступны (правда, купили на эпике, но это отдельная история).
      да и сейчас посмотрел, есть и процессоры, и материнские платы, и платформы:
      https://www.regard.ru/catalog/?query=socket%204189


      или вам нужен сервер конкретного вендора? ну так и надо тому вендору претензии адресовывать )