Целое десятилетие Лиза Су стоит у руля AMD, и за это время она не просто вывела компанию из кризиса, а превратила её в настоящего лидера рынка. Под её руководством AMD из аутсайдера превратилась в серьезного игрока на рынке серверных процессоров, где Intel в итоге приходится играть роль догоняющих за AMD, а с учётом их текущего состояния – бороться за выживание изо всех сил.
И вот, наконец-то случилось долгожданное всеми кто следит за рынком серверного железа – 10 октября AMD представила свои новые серверные процессоры серии EPYC 9005 Turin. Хотите 384 потока на процессор? Пожалуйста, вот вам Epyc на 192 ядра, разве что с нюансом, унаследованным с линейки EPYC 9004 "Bergamo" – энергоэффективные ядра Zen5C с меньшим числом кэша, всё во славу многопотока и запихивания как можно большего числа ядер на один кристалл. Также были представлены и 128-ядерные варианты с полноценными Zen5 ядрами и аж полугигабайтом L3 кэша.
Впрочем, есть о чём поговорить за пределами одних только ядер с кэшем и подробнее о всех нововведениях поговорим ниже в посте.
Будет жарко
Новые процессоры показывают впечатляющий рывок в производительности в сравнение с предшественниками – +17% в облачных задачах и +37% в работе с нейронками, при этом за достаточно скромную цену. От 527$ долларов за модель на 8 ядер и 14800$ за 192 ядерного монстра, пусть и с маленькими ядрами.
Однако, увеличение числа ядер и плотности транзисторов неизбежно ведет к росту TDP. Несмотря на уменьшение техпроцесса до 3 и 4 нанометров, площадь процессора осталась прежней. В результате выходит нетривиальная задача – как эффективно отвести 0.5kW тепла при относительно небольшой площади контакта?
Такой уровень тепловыделения может ознаменовать переход серверного сегмента в эпоху водяного охлаждения. Возможно, скоро мы увидим топовые модели EPYC, поставляемые с интегрированными системами жидкостного охлаждения. А что касается классических воздушных систем охлаждения в серверах формата 1U - кажется, инженерам придется изрядно поломать голову, чтобы вместить туда достаточно мощный радиатор.
Но давайте посмотрим на это с другой стороны. Серия EPYC 9005 предлагает серверные решения с исключительной производительностью. Например, двухсокетные серверы с процессорами AMD EPYC 9965 обеспечивают в 1.7 раза большую производительность на ватт системы, чем процессоры Intel Xeon 8592+ при запуске теста SPECpower.
Более того, замена 100 старых серверов на базе двухсокетных Intel Xeon 8280 всего 14 новыми серверами с AMD EPYC 9655 может обеспечить сравнимую производительность, используя при этом до 86% меньше серверов и потребляя на 69% меньше энергии. Для достижения того же уровня производительности потребовалось бы 35 серверов на базе Intel Xeon 8592+. А вот на счёт 6 поколения Intel Xeon, данных AMD в своих брошюрах не привели, что странно.
Так что да, процессоры горячие, но они позволяют значительно сократить количество серверов и общее энергопотребление дата-центра при той же или даже большей вычислительной мощности. А как конкретно OEM-производители серверов будут решать вопрос охлаждения всей этой мощи, мы узнаем уже скоро.
Zen5 - мощь в чистом виде
Новая архитектура Zen5 – это не просто очередной шаг, а настоящий прыжок вперёд. AMD умудрились не только запихнуть больше транзисторов на кристалл, но и серьезно оптимизировать их работу. Результат? Частоты до 5 ГГц, что для серверного процессора звучит скорее сомнительно, так как производимые этими 5ГГц тепло нужно будет куда-то рассеять и все ядра вряд ли смогут одновременно работать на такой частоте. А одноядерная производительность, не столь важна в серверном сегменте, как многопоточность, хотя, для тех же баз данных это пожалуй имеет смысл.
Zen5C - плотность и эффективность
Но AMD решили, что этого мало. Поэтому появилась Zen5C – младший брат большого Zen5, но с серьезными амбициями. Меньше кэша, зато влезает больше ядер. И вот уже у нас 192 ядра в одном процессоре. Конечно, они не такие мощные как полноценные Zen5, но когда дело доходит до многопоточных задач – тут уже не до жиру, быть бы живу, и количество берёт верх над качеством.
Zen5C CPU кристалл содержит 16 ядер, каждое с 1МБ L2 кэша и общим 32МБ L3 кэшем. Для создания процессоров с более чем 128 ядрами, до 12 таких кристаллов могут быть подключены к I/O кристаллу, что в итоге дает до 192 ядер на процессор для сверхплотных высокопроизводительных систем.
Память и шины – всего побольше
А что на счёт оперативной памяти? Здесь у новых Epyc всё тоже хорошо, но без фантастики. Поддерживается DDR5 с частотами 6400 МГц с 12 каналами. Так к примеру конкретно EPYC 9005 поддерживает до 6 ТБ DDR5-6000 памяти, что обеспечивает максимальную теоретическую пропускную способность 576 ГБ/с на сокет. Что наиболее заметно скажется на приложениях чувствительных к пропускной способности оперативной памяти, к примеру in-memory базы данных.
И раз уж заговорили про пропускную способность, отметим ещё 160 линий PCI-E 5.0, чтобы шина обмена данными точно не была бутылочным горлышком при подключение новых серверных GPU.
EPYC vs Xeon
Прямыми конкурентами новых EPYC выступают вышедшие чуть раньше процессоры от Intel – Xeon 6700E и 6900P. Но AMD в который раз не даёт синему коллеге и шансов на победе. Больше ядер, выше частоты, современнее память – EPYC 9005 превосходят Xeon 6 поколения во всём. Особенно это заметно в задачах, связанных с AI, где EPYC показывает себя настоящим монстром производительности.
По оценкам AMD, двухсокетные серверы с 192-ядерными EPYC 9965 демонстрируют на 2.68x более высокую пропускную способность по сравнению с 64-ядерными Intel Xeon 8592+ при запуске SPECrate2017_int_base.
Превосходство в бизнес-нагрузках
Когда дело доходит до реальных бизнес-приложений, EPYC 9005 также демонстрирует впечатляющие результаты. При использовании двухсокетных серверов на базе 192-ядерных AMD EPYC 9965 достигается в 2.2 раза больше критических jOPs в Multi-JVM по сравнению с 64-ядерными Intel Xeon 8592+ при запуске бенчмарка SPECjbb2015-MultiJVM.
Для MySQL нагрузок, основанных на бенчмарке TPC-C, двухсокетные серверы на базе 192-ядерных AMD EPYC 9965 обеспечивают до 2.9 раз больше транзакций в секунду по сравнению с 64-ядерными Intel Xeon 8592+.
AI – попытка запрыгнуть в уходящий поезд?
Отдельно стоит отметить, как AMD позиционирует свои новые процессоры для задач искусственного интеллекта. EPYC 9005 не просто поддерживает AI-вычисления, он становится настоящим фундаментом для создания мощных AI-систем. Возможность подключить кучу специализированных ускорителей через PCI-E 5.0, combined с огромным количеством ядер и быстрой памятью, делает эти процессоры идеальным выбором для создания инфраструктуры под самые требовательные AI-приложения.
EPYC 9005 обеспечивает до ~2.7x более высокую пропускную способность при выполнении задач ИИ-инференса, таких как XGBoost на наборе данных бозона Хиггса, по сравнению с Intel Xeon 8592+. Это делает их отличным выбором для широкого спектра ИИ-задач, от классификации изображений до обработки естественного языка.
Зачем и кому это нужно, когда возможности инференса на GPU, либо NPU/TPU на порядки превосходят таковые даже у самых многоядерных процессоров – традиционно оставили загадкой.
Оптимизация для GPU-систем
Впрочем, новые процессоры по настоящему хороши как дополнения для мощных видеокарт в задачах связанных с AI. AMD оптимизировала некоторые модели EPYC 9005 для использования в качестве хост-процессоров в системах с GPU. Например, при использовании двух высокочастотных AMD EPYC 9575F в качестве хоста для 8 GPU-ускорителей достигается на ~15% более быстрое время обучения по сравнению с двумя Intel Xeon 8592+ при запуске Llama 3.1-8B.
Красный путь к инновациям
Процессоры AMD EPYC разделили блоки с ядрами CPU и функций ввода-вывода на разные кристаллы, которые могут разрабатываться по своим собственным графикам и производиться с использованием технологических процессов, соответствующих задачам, которые они должны выполнять. От поколения к поколению размер кристаллов CPU уменьшался по мере развития технологии фотолитографии. Сегодня ядра 'Zen 5' производятся по 4-нм технологии, ядро 'Zen 5c' производится по 3-нм технологии, а кристалл ввода-вывода остается на 6-нм технологии с предыдущего поколения.
Этот подход более гибкий и динамичный, чем попытка построить все функции процессора с использованием одной технологии изготовления. При модульном подходе мы можем смешивать и сочетать кристаллы CPU и ввода-вывода для создания специализированных процессоров, которые точно соответствуют требованиям рабочей нагрузки. Они варьируются от высокопроизводительных процессоров с 192 ядрами до процессоров для масштабируемых систем, требующих всего восемь ядер.
Итого, что имеем в сухом остатке?
AMD в очередной раз доказала, что может не просто конкурировать с Intel, а задавать тон на рынке серверных процессоров. Тенденция осталось прежней как и в прошлые поколения, но масштабы стали больше – больше транзисторов, больше ядер, больше кэша, но и больше тепловыделения.
Что ж, ждём теперь, когда новые EPYC начнут появляться в дата-центрах по всему миру. А там, глядишь, и до наших серверов в ServerFlow доберутся. Главное – не забыть обновить систему кондиционирования в серверной комнате. А то как бы с 0.5 киловатта на процессор не получить сауну вместо серверной.
Загадкой разве что остаётся то, чем на это ответят Intel? И как скоро, опять прямо перед выходом новых, превосходящих их Xeon по всем фронтам EPYC? Да и доживёт ли Intel вообще к моменту выхода новых EPYC? Приглашаем всех в комментарии, чтобы обсудить это!
Комментарии (36)
volkovdaily
11.10.2024 14:42Думаю версия на 192 ядра хорошо покажет себя в виртуализации, не смотря на то что ядра там Zen5c. Отличная наверное сборка выйдет с 384 ядрами на 2 сокета.
kenskiy Автор
11.10.2024 14:42Мне более интересно как Windows Server 2022 отреагирует на такое число ядер.
Поскольку когда к нам в руки попала 256 ядерная система на EPYC 9754, Winserver 2019 отказался запускаться. И только Server 2022 смог понять, что у нас за система такая.
SF_author
11.10.2024 14:42Поскольку когда к нам в руки попала 256 ядерная система
Ого, новости из будущего?) 128 ядерная, а потоков 256.
OrkBiotechnologist
Я думал дальше будут кратно наращивать и что эти эпиики будут на 256 ядер. Но видимо уже в следующем поколение.
Так понимаю переводится с маркетингового на обычный язык тем, что в рамках текущих размеров сокета, такое же количество нормальных ядер они бы не смогли впихнуть из-за теплопакета, либо чисто физически из-за размера.
kenskiy Автор
Почти уверен, что в следующем году нас ждёт условный 256 ядерник с неизменным TDP.
По крайней мере индекс EPYC 9965 намекает на возможность выпуска условного 9985
ahdenchik
Может их там 256, но выход годных таков, что гарантировать можно только 192
kenskiy Автор
Вполне вероятно, это еще раз подталкивает нас на мысль, что стоит ждать 256 ядерную модель