/ фото Fritzchens Fritz PD / 14-нм AMD Zeppelin
Что изменилось
Zen 2 разрабатывалась c прицелом на 7-нм техпроцесс. В компании заявляют, что переход на 7-нм позволит повысить производительность на 25%, сохранив уровень потребления энергии.
На выполнение одной операции чипам на Zen 2 потребуется на 50% меньше мощности. Это придется кстати в современных дата-центрах, для которых важны параметры энергоэффективности оборудования (к слову чипы EPYC, о которых мы расскажем ниже, созданы специально для работы в ЦОД). При этом чипы имеют умные функции управления энергопотреблением. Они могут динамически менять уровень напряжения в зависимости от загрузки ядер. Алгоритмы самостоятельно снижают частоту ядра, если понимают, что возможные задержки не отразятся на работе нагрузки.
AMD внесли ряд изменений в архитектуру Zen 2, по сравнению с предшественниками. Часть из них коснулась векторных регистров и показателя IPC (instructions per cycle).
Векторные регистры расширили. Их размер увеличили с 128 до 256 бит. Это позволило удвоить производительность при выполнении AVX-операций с числами с плавающей запятой. Теперь 256-битные AVX-операции не нужно разбивать на две 128-битные микрооперации. Поэтому Zen 2 показала результат в 16 FLOPS за такт, как архитектура Skylake от Intel.
IPC увеличили на 20%. Процентного прироста удалось добиться за счет балансировки нагрузки между компонентами архитектуры и расширения кеша. Прирост IPC позволил повысить производительность на 13%, по сравнению с Zen+. Отметим, что Zen+ превосходит Zen по этому показателю всего на 2–5%.
Первые чипы на новой архитектуре
Этим чипом станет серверный процессор EPYC Rome. Он будет обладать структурой, которую в AMD называют Chiplet Design. Компоновка микросхемы подразумевает соединение 7-нм CPU с 14-нм чипом I/O. Процессор будет содержать восемь вычислительных блоков, расположенных вокруг 14-нм чиплета. Соединение обеспечивается по шине InfinityFabric без прямых кремниевых соединений. В каждом блоке будет представлено восемь ядер — в сумме это 64 ядра.
Процессоры EPYC Rome смогут обрабатывать 128 потоков одновременно. Интерфейс памяти будет поддерживать восьмиканальный контроллер DDR4, который обеспечит чипу доступ к четырем терабайтам DRAM на каждый сокет.
Дополнительно процессор получит поддержку PCIe Gen 4, что увеличит количество гигатранзакций за секунду в два раза — с 8 до 16 ГТ/с.
В сентябре в сеть утекли результаты тестирования нового CPU в многопоточном бенчмарке Cinebench R15 — счет составил 12587. Это больше, чем у любого из процессоров текущего поколения компании (результат для AMD Ryzen Threadripper 2990WX — 5500).
Сейчас в AMD уже начали поставку первых образцов процессоров EPYC Rome своим клиентам и производителям серверов. Массовые поставки новых устройств начнутся уже в 2019 году, тогда же можно ожидать появления этих чипов в дата-центрах.
Intel vs AMD
Генеральный менеджер AMD Форест Норрод (Forrest Norrod) еще летом говорил, что серверные CPU EPYC Rome разрабатывались с целью составить конкуренцию 10-нм решениям Intel вроде Ice Lake-SP. Однако Intel долгое время откладывали выпуск чипов нового поколения из-за проблем с выходом годных микросхем. Релиз намечен на 2019 год, но точная дата выхода процессоров Intel на новом техпроцессе остается неизвестной.
Таким образом, Intel придётся конкурировать с новыми процессорами AMD с помощью «старого» семейства Cascade Lake-SP. Поэтому в AMD ожидают, что микросхемы на базе Zen 2 отвоюют у Intel первенство по производительности. Но особых иллюзий они все же не питают — долго удерживать лидерство может не получиться.
Представители компании AMD считают, что, в конце концов, конкуренты представят архитектуру аналогичную Zen 2. «Ответного удара» Intel в AMD ожидают уже к концу 2019 года.
/ фото Fritzchens Fritz PD / 14-нм AMD Zeppelin
Аналитики прогнозируют, что пока Intel будут налаживать производство 10-нм, цена акций AMD вырастет на 15%. Но когда новые процессоры Intel увидят свет, AMD сразу потеряют 4% от стоимости акций. И дальше их цена продолжит снижаться. Эксперты считают, что ни Zen 2, ни использование 7-нм техпроцесса не поможет AMD удержать временное преимущество на рынке.
Что дальше: от Zen 2 до Zen 5
Проектирование Zen 2 уже официально завершено. Серверные процессоры появятся на рынке уже в конце этого года, а десктопные решения — в 2019 году.
AMD также подтвердили, что разработка Zen 3 по техпроцессу 7nm+ идет полным ходом и закончится в 2020 году. О Zen 4 ходят противоречивые слухи. WikiChip Fuse сообщают, что разработка архитектуры уже началась, а WCCFTECH пишут, якобы Zen 4 решили пропустить и перейти сразу к Zen 5.
Zen 5 планируют изготавливать по 3-нм техпроцессу и новостей по этой архитектуре не стоит ждать раньше 2020 года.
P.S. Материалы из нашего корпоративного блога:
- Серверы для SAP: основные платформы
- Unboxing блейд-сервера Cisco UCS B480 M5
- Unboxing all-flash СХД NetApp AFF A300: технические характеристики
P.P.S. Еще мы пишем об IaaS и смежных темах в корпоративном Telegram-канале:
Комментарии (22)
BaLaMuTt
23.11.2018 15:07Интересно насколько поднимется частотный потолок на новом техпроцессе.
amartology
23.11.2018 15:43Возможно, что ни на сколько. Новые техпроцессы уже давно про сокращение площади и потребления, а не про рост частоты.
BaLaMuTt
24.11.2018 09:15Вообще-то рост частот всё-равно есть, хоть и не такой огромный как при переходах 130-90-65-45-32. Просто сечас со сменой ТП ещё и ядер добавляют из-за чего итоговые частоты остаются такие же. А так например при переходе с 22 на 14нм у интела прирост потолка частот на пару-тройку сотен мегагерц был, правда только у скальпированных процов.
amartology
24.11.2018 11:16Если вас интересует частотный потолок техпроцесса, а не процессора, то смотреть стоит на радиочастотные схемы, сделанные по техпроцессу, а не на процессоров общего назначения.
BaLaMuTt
24.11.2018 16:40меня этот потолок как заядлого оверклокера интересует. Первый Zen вставал колом на 4-4.1ГГц, Zen+ на 4,3-4,4. Учитывая что для второго обещают ТП 7нм думаю теоретически до 5 на воздухе может пойти.
0xd34df00d
23.11.2018 20:01Отличные новости, особенно на тему AVX. А то у текущих Zen'ов с этим всё очень плохо:
vs
DaylightIsBurning
23.11.2018 22:59так-то оно так, но вообще, это довольно специфичное направление. Если я понимаю правильно, AVX — это кусочек GPUшной архитектуры в ядре процессора. До какой-то степени в этом есть смысл, но по-хорошему если нагрузки хорошо ложатся на AVX — они должны быть портированы на GPU, мне кажется. Расширять AVX до производительности GPU смысла не много, наверное. Или, может быть, наоборот, со временем GPU и CPU сольются в единой системе как это уже частично происходит. Тут архитектура Zen3 с центральным IO ядром и вычислительными нодами выглядит как раз кстати.
0xd34df00d
24.11.2018 00:03+1До какой-то степени в этом есть смысл, но по-хорошему если нагрузки хорошо ложатся на AVX — они должны быть портированы на GPU, мне кажется.
В идеальном мире. А в реальном мире есть куча вещей и библиотек, которые куда легче портировать на AVX, чем на GPU (и вообще, автовекторизаторы часто неплохо справляются).
DaylightIsBurning
24.11.2018 00:11согласен. Любопытно, как долго наращивание SIMD performance будет продолжаться. Контролирующая логика GPU уже много поколений и успешно усложняется, в CPU становится всё больше ALU, сольются ли CPU и GPU в какой-то момент в один класс устройств? Отпадёт ли необходимости в специальных GPU специфичных ЯП типа CUDA/OpenCL?
tzps
23.11.2018 23:45Сравнение не совсем корректное. На второй картинке в топе процессоры с поддержкой AVX-512, аналога этих наборов у AMD все еще нет совсем. А AVX/AVX2 судя по этому же графику — вполне сопоставимую производительность дают.
p.s. И сравниваются в целом новое 8 поколение Intel, с Zen. Хорошо бы сравнивать полностью с Zen+ включая TR20xd34df00d
24.11.2018 00:05Если я правильно помню методологию тестирования, это именно что код с чистым AVX, без AVX2/512. Думается, процессоры с AVX512 просто эффективнее и с обычным AVX. Но это уже так, теоретизирование.
А Zen+ вроде не принципиально быстрее Zen, качественным образом выводы оно не поменяет.
willyd
24.11.2018 21:38Вроде они переписали этот тест под avx512.
For this test, we run a stock particle set over the six algorithms for 20 seconds apiece, with 10 second pauses, and report the total rate of particle movement, in millions of operations (movements) per second. We have a non-AVX version and an AVX version, with the latter implementing AVX512 and AVX2 where possible.
Tyrauriel
24.11.2018 06:11Сколько CCX на одном вычислительном блоке?
Как в Zen 2 реализованы кеши различного уровня?
1 уровень кеша на ядро, 2 уровень кеша на CCX, 3 уровень кеша на процессор?
Есть ли подробная информация по кешу на чиплет?
Можно ли вычислить количество CCX по блокам кеша?
barbanel
alchemist666
Скорее всего не будет, так как есть девкиты, а они идут с точки зрения фактических наработок, хотя может они созданы на базе существующих инженерных образцов/малых партий. Все равно основная производительность строится за счёт видео ядер.