Калифорнийская компания Ampere представила первый в отрасли 80-ядерный серверный ARM-процессор на 64-битной архитектуре Ampere Altra.

Уже несколько лет специалисты прогнозируют, что платформа ARM составит конкуренцию x86 в дата-центрах, но этого никак не происходит. По итогам 2019 года там доминирует Intel с долей 95,5%, у AMD — 4,5%.

Однако новый ARM-процессор в целочисленном бенчмарке SPECrate 2017 показывает более высокую производительность, чем самый быстрый 64-ядерный AMD EPYC или топовый 28-ядерный Xeon семейства Cascade Lake. Это уже серьёзная заявка (хотя результаты бенчмарка немного «подкручены», см. ниже).

Главное преимущество ARM — энергоэффективность, с которой по определению не могут сравниться процессоры x86 из-за особенностей архитектуры. У 80-ядерного Ampere Altra показатель TDP составляет 45-210 Вт, тактовая частота — 3 ГГц.

Ampere считает, что один поток на ядро вместо двух способствует более высокой безопасности, поскольку такой дизайн лучше защищает отдельные ядра от атак по сторонним каналам типа Meltdown и Spectre.





Процессор предназначен для серверных приложений, таких как аналитика данных, искусственный интеллект, базы данных, хранилища, телекоммуникационные стеки, пограничные вычисления, веб-хостинг и облачные приложения. Специально для приложений машинного обучения на аппаратном уровне реализована поддержка форматов данных FP16 (числа половинной точности) и INT8 (однобайтное представление целого числа). Есть также аппаратное ускорение хэширования AES и SHA-256.



Микросхемы производятся на заводе TSMC по техпроцессу 7 нм. Первые образцы CPU уже отправлены потенциальным клиентам, а массовое производство планируется начать в середине 2020 года.

Исполнительный директор Ampere и бывший президент Intel Рене Джеймс (Renee James) основала компанию Ampere Computing в октябре 2017 года на фундаменте обанкротившейся корпорации Applied Micro Circuits (1979—2017), которая тоже занималась проектированием серверных ARM-процессоров. В частности, в 2011 году она представила 64-битную платформу X-Gene на базе ARMv8-A.

Сейчас Джеймс совмещает должности исполнительного директора и председателя совета директоров Ampere Computing с должностью заместителя председателя Национального консультативного комитета по безопасности телекоммуникаций (National Security Telecommunications Advisory Committee), который консультирует президента Соединенных Штатов.

Интересно, насколько успешной будет новая попытка вывести ARM-процессоры на серверный рынок.

«Мы выпустили процессор с самым большим количеством ядер на рынке, — говорит Джеймс. — Теперь мы отправили его [для тестирования] некоторым из крупнейших поставщиков облачных услуг в отрасли… Думаю, люди будут удивлены. [На смену предыдущим технологиям] всегда приходит что-то новое. И если не от действующей компании, то от новой. Очень интересно работать над тем, что я считаю следующим этапом развития индустрии».

О 64-битных серверных чипах ARM много говорили в прошлые годы, когда подобные процессоры пытались выпускать AMD и вышеупомянутая Applied Micro. Но эти компании потерпели неудачу. AMD закрыла свой ARM-проект, а активы Applied Micro были проданы компании Macom. В 2017 году Carlyle Group купила у неё подразделение ARM-процессоров. Сделку закрыли в конце 2019 года, а Джеймс заняла пост генерального директора в новой компании, оставив свою должность операционного директора в Carlyle Group.


Две серверные платформы Ampere: Mt. Jade и Mt. Snow

Однопоточные ядра Ampere Altra и «плотные энергоэффективные серверы», которые можно строить на таких CPU, позволят клиентам «максимизировать количество сервисов, которые они могут развернуть в облаке», говорится в сообщении компании.

Процессор Ampere Altra основан на платформе ARM Neoverse N1. Положительные отзывы о новых серверах получены от инженеров Microsoft Azure, Oracle, Canonical, VMware, Kinvolk, Packet, Lenovo, Gigabyte, Wiwynn и Micron, все они цитируются в пресс-релизе.


Сервер Mt. Jade на два процессора (160 ядер): аналитика данных, БД, веб

Компания говорит, что программное обеспечение готово для работы с Ampere Altra: «Самое важное сейчас то, что если вы посмотрите на все уровни, уровень ОС, все — от Linux до BSD и Windows — все поддерживают ARM», — говорит Джефф Виттич (Jeff Wittich), старший вице-президент по продуктам Ampere. — По виртуализации у нас есть поддержка Kubernetes, Docker, VMware и KBM. Там всё поддерживается. На уровне приложений всё, что сегодня работает в облаке, уже работает и у нас».


Сервер Mt. Snow на один процессор: граничные вычисления, телекоммуникационные сервисы, веб, хранение данных

Спецификации




  • Подсистема процессора
    • 80 ядер ARM v8.2+ 64 бита с тактовой частотой до 3,0 ГГц с Sustained Turbo, добавлены некоторые улучшения от ARM v8.3 и v8.4
    • I-кэш L1 64 KБ, D-кэш L1 64 КБ на каждое ядро, кэш L2 1 МБ на каждое ядро, общий кэш системного уровня 32 МБ (SLC)
    • Поток коротких инструкций SIMD (Single Instruction, Multiple Data) двойной ширины (128 бит)
    • Когерентные межсоединения в mesh-сети
  • Системная память
    • 8x 72-битных каналов DDR4-3200
    • ECC, Symbol-based ECC, DDR4 RAS
    • До 16 модулей DIMM и 4 ТБ на сокет
  • Системные ресурсы
    • Полная виртуализация прерываний (GICv3)
    • Полная виртуализация I/O (SMMUv3)
    • Надёжность RAS (Reliability, Availability, Serviceability) корпоративного серверного класса
  • Сеть
    • 128 линий PCIe Gen4
      • 8 x8 PCIe + 4 x16 PCIe/CCIX с поддержкой Extended Speed Mode (ESM) для передачи данных на 20/25 ГТ/с (гигатранзакций в секунду)
      • 48 контроллеров для поддержки до 32 x2 соединений
    • 192 линий в конфигурации 2P
    • Поддержка нескольких сокетов
    • 4 линии x16 CCIX
  • Температурный диапазон – от 0°C до +90°C
  • Питание
    • CPU: 0,80 В, DDR4: 1,2 В
    • I/O: 3,3 В/1,8 В, SerDes PLL: 1,8 В
  • Управление питанием – Динамическая оценка, Turbo Gen2, защита от падения напряжения
  • Корпус – 4926-пиновый FCLGA
  • Производство – Технология FinFET 7 нм

Бенчмарки


Джефф Виттич говорит, что в тестах процессор Ampere показывает результат на 4% лучше, чем самый быстрый процессор EPYC от AMD, и потребляет на 14% меньше энергии. Речь идёт о 64-ядерном процессоре EPYC
7742 с TDP 225 Вт и стоимостью $6950. Это самый мощный в семействе процессоров EPYC 2 на микроархитектуре Zen 2. Семейство представлено в августе 2019 года.





Виттич также привёл сравнение с 28-ядерным процессором Xeon семейства Cascade Lake. Процессор Ampere Altra превзошёл его «в 2,23 раза по производительности и в 2,11 раза по энергоэффективности». Здесь показатели сравнивались с 28-ядерным Xeon Platinum 8280 (205 Вт), а энергоэффективность вычислялась из расчёта на одно ядро.

Как сообщается, в целочисленном бенчмарке SPECrate 2017 процессор Ampere Altra показывает результат больше 259. В таблице результатов это уступает пиковой производительности ASUS RS720A-E9(KNPP-D32) Server System (2.20 GHz, AMD EPYC 7601) и ASUS RS500A-E10(KRPA-U16) Server System 2.25 GHz, AMD EPYC 7742.

Однако в сравнении производительности Ampere применила к результатам AMD коэффициент 0,85 из-за использования пакета компиляторов AMD64 для компиляции кода бенчмарка по сравнению с GCC 8.2, который использовала сама, поскольку компилятор AMD C/C++ производит более оптимизированный код, чем GCC для ARM.

Несмотря на такие «подкрутки» бенчмарка, Ampere Altra выглядит очень впечатляюще по производительности и энергоэффективности. В стандартную серверную стойку 42U с подачей питания 12,5 кВт можно «упаковать» около 3500 процессорных ядер, получив экономию из расчёта ватт на ядро.





И это только начало. Джефф Виттич сказал, что через год на рынке появится ещё один продукт под кодовым названием Mystique, в котором Ampere ещё больше увеличит количество ядер.

Mystique будет поддерживать тот же разъём, так что замена материнских плат не потребуется. На 2022 год запланирован выпуск следующего поколения Siryn SoC.



В последние годы мы наблюдали несколько попыток выпустить серверные ARM-процессоры от разных компаний: Broadcom/Cavium/Marvell, Calxeda, Huawei, Fujitsu, Phytium, Annapurna/Amazon и AppliedMicro/Ampere. Большинство этих попыток были неудачными. Но есть признаки, что ситуация меняется. В декабре 2019 года Amazon выкатила в продакшн серверы с 64-ядерными ARM-процессорами Graviton2 — это система-на-кристалле на таком же ядре ядре ARM Neoverse N1. В некоторых тестах инстансы на ARM (M6g и M6gd) проявили себя лучше, а иногда намного лучше, чем x86.

В ноябре 2019 года сообщалось, что американский стартап Nuvia привлёк $53 млн венчурного финансирования. Стартап основали три ведущих инженера, которые занимались созданием процессоров в Apple и Google. Они тоже обещают разработать серверные процессоры, которые составят конкуренцию Intel и AMD. По имеющейся информации, Nuvia спроектировала с нуля процессорное ядро, которое может быть построено «поверх» архитектуры ARM, но без получения лицензии ARM.

Всё это указывает на то, что процессоры RISC могут найти применение не только в мобильных устройствах, но и в серверах, а также в настольных компьютерах и ноутбуках. Кстати, ходят слухи, что и будущие ноутбуки Apple MacBook тоже выйдут на ARM-процессорах.



По сути, последние модели iPad Pro с ARM-процессорами A12X почти не уступают по производительности 15-дюймовым MacBook Pro с процессорами Core i7 и Core i9, так что такой апгрейд станет вполне логичным.