В мире железа сентябрь оказался насыщенным на новые обновления: лидеры рынка представили новые процессоры и видеокарты, а стартапы активизировались и выпустили свои ускорители. Мы решили поддержать тренд и анонсировали собственную материнскую плату на базе AMD EPYC™ 9005 Turin. Но и это не все новинки.

Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В новом дайджесте серверного железа разбираю новинки сентября, оцениваю перспективы решений от начинающих вендоров и делюсь своими мыслями насчет оборудования в AI. Подробности под катом! 

Платформы

Материнская плата на базе AMD от Selectel

8 октября мы объявили о расширении линейки собственных серверных решений и представляем плату на базе AMD EPYC™ 9005 Turin. Ключевое преимущество данных процессоров — количество используемых ядер: до 192 на сокет. Такие CPU обеспечивает быструю масштабируемость в задачах, которые требуют высокой плотности виртуальных машин и контейнеров.

Разработанная плата поддерживает современные стандарты, включая PCIe 5.0, DDR5 до 6 400 МГц и CXL 2.0, позволяющие дополнительно расширить установленную память на 4 ТБ. Это критически важно для высокопроизводительных вычислений и работы с кластерами GPU. Кроме того, решение предусматривает установку до 24 накопителей NVMe. По предварительным оценкам, наша плата превосходит альтернативные платформы в производительности инференса AI-моделей до 3,8 раз.

Наряду с собственными платформами на базе AMD EPYC™ 9005 Turin, для клиентов остаются доступны решения на Intel® Xeon® 6, которые были представлены в прошлом году. Это существенно расширяет возможности по построению гибкой и высокопроизводительной IT-инфраструктуры.

Платформа актуальна для представителей различных рынков. Для корпоративных заказчиков, включая компании финансового сектора и телеком-компании, наличие двух архитектур в портфеле одного вендора снижает риски и обеспечивает предсказуемость IT-инфраструктуры.

Начать предоставлять клиентам готовые серверы на базе AMD планируется уже в 2025 году.

MSI c GPU RTX Pro 6000 Blackwell Server Edition

Компания MSI представила два сервера на модульной архитектуре NVIDIA MGX: CG480-S5063 (4U) и CG290-S3063 (2U). Оба используют ускорители NVIDIA RTX Pro 6000 Blackwell Server Edition с 96 ГБ памяти и ориентированы на AI-нагрузки.

Характеристики и особенности CG480-S5063 (4U)

  • Два процессора Intel Xeon серии 6500P / 6700P / 6700E, TDP до 350 Вт. 

  • До 32 слотов DDR5 (RDIMM / MRDIMM) с каналами на каждый CPU. 

  • До 20 отсеков E1.S NVMe (PCIe 5.0 x4) спереди. 

  • Два внутренних слота M.2 (2280 / 22110) через PCIe 5.0 x2. 

  • Есть возможность расширения: восемь слотов PCIe 5.0 x16 двойной ширины и дополнительные слоты одинарной ширины, что позволяет установить до восьми ускорителей. 

  • Воздушное охлаждение с hot-swap вентиляторами.

  • Четырe блока питания по 3 200 Вт (сертификат 80 PLUS Titanium).

Соответственно, у сервера CG290-S3063 (2U) один процессор Intel того же поколения, в два раза меньше слотов для оперативной памяти и поддержка только до четырех GPU. Но важно отметить, что в обоих случаях суммарный объем видеопамяти и конечная стоимость таких систем обеспечивают оптимальные показатели price/perfomance.

Серверы отлично подходят под AI и поддерживают как задачи обучения, так и инференса. Это все — благодаря богатому I/O, NVMe-хранилищам и современной памяти. Они попадают в тренд на интеграцию мощных ускорителей в модульные и высокоплотные серверные платформы.

Блейд-серверы Giga Computing с процессорами AMD и Intel

Подразделение Giga Computing компании Gigabyte анонсировало серию блейд-серверов B343, ориентированных на корпоративные, облачные и периферийные нагрузки. Две версии: B343-C40 (на AMD) и B343-X40 (на Intel) — выполнены в формате 3U. В каждой — десять узлов с гибкой конфигурацией памяти и сети.

Характеристики и особенности

  • Форм-фактор: 3U-шасси, десять узлов внутри, воздушное охлаждение.

  • Каждый узел — самостоятельный сервер с CPU, памятью, I/O и сетевыми интерфейсами.

  • Питание: четыре блока по 2 000 Вт или 2 блока по 3 200 Вт (80 PLUS Titanium).

Сервер B343-C40 работает с процессорами EPYC Embedded 4005 (Grado) или Ryzen 9000. Модель B343-X40 предназначена для Intel Xeon 6300/E-2400.

Во всех системах — до четырех слотов DDR5 ECC на узел, слот M.2 2280/22110 (PCIe 3.0 x1), два SFF-слота NVMe / SATA, слот расширения FHHL (PCIe 5.0 x16) и три слота OCP NIC 3.0 (PCIe 4.0 x4). Также поддерживаются различные конфигурации сетевых портов в зависимости от модели (максимально — два порта 25 GbE).

Десять серверов в 3U-корпусе – это высокая плотность для облаков, периферии или масштабируемых решений. А возможность выбора AMD или Intel дает гибкость по оптимизации под нагрузку и экосистему.

Процессоры

AMD EPYC 4005 — процессоры для периферии

AMD представила встраиваемые процессоры EPYC Embedded 4005 для промышленных и периферийных систем: индустриальных серверов и межсетевых экранов нового поколения. Новинки продолжают развитие линейки EPYC 4005 Grado и базируются на архитектуре Ryzen 9000. 


Характеристики и особенности

  • Архитектура Zen 5, производство по 4-нм техпроцессу, чиплетная компоновка.

  • Совместимость с сокетом AM5.

  • Поддержка DDR5-5600 ECC, 28 линий PCIe 5.0, инструкций AVX-512.

  • До 128 МБ кеша L3 (в топовой модели с 3D V-Cache).

  • Встроенные функции безопасности AMD Infinity Guard.

  • Поддержка многопоточности и TDP от 65 до 170 Вт для гибкого баланса производительности и энергопотребления.

  • 7-летний цикл поставок — важное преимущество для промышленных решений.

AMD EPYC Embedded 4005 — это семейство «промышленных» Zen 5 CPU, которое упаковывает серверные возможности (AVX-512, PCIe 5.0, DDR5 ECC, 3D V-Cache в старшей модели) в форм-фактор и тепловые профили, пригодные для периферии, встраиваемых систем и NGFW. Для системных интеграторов и операторов периферийной инфраструктуры это удобное и жизнеспособное решение благодаря гибкому TDP и многолетней поддержке.

AMD Ryzen Pro 9000 – для рабочих станций

AMD тихо обновила линейку бизнес-процессоров, добавив в базу сайта серию Ryzen Pro 9000 на архитектуре Zen 5. Это профессиональные версии обычных Ryzen 9000, дополненные технологиями безопасности и корпоративного управления, а также ориентированные на рабочие станции и бизнес-ПК.

Характеристики и особенности

  • Архитектура Zen 5.

  • Разъем AM5.

  • TDP — 65 Вт во всех моделях.

  • Отличия от обычных Ryzen 9000: поддержка фирменных средств защиты и администрирования (аналог AMD PRO Security, Memory Guard, Manageability).

Появление чипов на сайте говорит о «мягком запуске» — вероятно, ориентированном на OEM-партнеров. AMD Ryzen Pro 9000 — это обновленные бизнес-процессоры Zen 5 с упором на безопасность и управляемость, без роста TDP, но с повышением частот и IPC. Линейка нацелена на корпоративный сегмент и готовые OEM-решения, а не на розницу. Это хоть и тихий, но важный апдейт для рынка рабочих станций и корпоративных ПК.

GPU и ускорители

Innosilicon Fenghua 3 – первый полнофункциональный китайский GPU на RISC-V

Компания Innosilicon представила Fenghua 3 — первая в Китае полнофункциональная GPU собственной разработки, основанная на открытой архитектуре RISC-V и совместимая с CUDA. Новый ускоритель ориентирован на AI-вычисления, инференс моделей, научные задачи, визуализацию и облачный гейминг, укрепляя позиции Китая на рынке высокопроизводительных GPU.


Характеристики и особенности

  • До 112 ГБ HBM-памяти — рекорд для китайских GPU.

  • OpenCore RISC-V Nanhu V3 архитектура — отказ от PowerVR, которая использовалась в Fenghua 1–2.

  • Графические API с поддержкой DirectX 12, Vulkan 1.2, OpenGL 4.6 и аппаратной трассировки лучей.

  • Один ускоритель способен обрабатывать модели до 72 млрд параметров, а кластер из восьми — DeepSeek 671B и 685B.

  • Поддержка AI-экосистем Qwen 2.5/3, DeepSeek V3/V3.1/R1.

  • Заявлена совместимость с CUDA, что упрощает адаптацию существующих AI-фреймворков.

Это первая китайская видеокарта с поддержкой формата YUV444, обеспечивающего максимальную точность цветопередачи. Это важное преимущество для видеомонтажа и САПР.

Кроме того, Fenghua 3 — это первая в мире видеокарта с аппаратной поддержкой DICOM, позволяющей корректно отображать рентген, МРТ и КТ-снимки на обычных дисплеях без специализированного медоборудования.

Fenghua 3 знаменует переход Китая от брендовых GPU к полностью собственным архитектурам. Использование RISC-V и совместимость с CUDA делают этот проект не только национальным, но и стратегически значимым шагом в сторону автономной графической экосистемы.

Metis M.2 Max – ускоритель для AI-инференса

Нидерландский стартап Axelera AI анонсировал Metis M.2 Max — улучшенную версию модуля Metis M.2, ориентированную на AI-инференс на edge-устройствах. Разработчики заявляют, что девайс способен повысить производительность для LLM и VLM задач за счет увеличенной пропускной способности памяти, улучшенного теплоотвода и усиленных средств безопасности.

Характеристики и особенности

  • Форм-фактор: M.2 2280 (M-Key), интерфейс PCIe 3.0 x4.

  • Архитектура основана на Metis AIPU, есть четыре ядра RISC-V.

  • Удвоенная пропускная способность памяти по сравнению с оригинальным Metis M.2 (точные цифры не раскрываются).

  • Объем памяти — до 16 ГБ.

  • Есть встроенная защита целостности прошивки через Root of Trust и secure boot, а также — защита от неавторизованного ПО.

  • Энергопотребление среднее и составляет 6,5 Вт.

Заявлено +33% к производительности в сверточных сетях (CNN), ×2 по скорости токенов у LLM- и VLM-моделей. Устройство совместимо с SDK Voyager, что облегчает интеграцию в приложения и оптимизацию моделей.

Кроме того, ускоритель сохраняет компактность форм-фактора и энергоэффективность при существенном улучшении пропускной способности памяти, повышенной безопасности и возможностях в LLM/VLM. Он особенно интересен для внедрения в системы, где важно сочетание производительности, компактности и устойчивости к условиям эксплуатации.

NVIDIA Blackwell Ultra – ключевые детали и преимущества

Компания NVIDIA раскрыла архитектурные особенности Blackwell Ultra — эволюции ускорителя Blackwell. Стало известно о росте числа транзисторов, более мощной тензорной вычислительной базе и расширенной памяти. Это решение нацелено на задачи AI-инференса, рассуждения (reasoning models) и плотное масштабирование в ЦОД.

Характеристики и особенности: архитектура и спецификации

  • Blackwell Ultra остается двухкристальным (dual-die), а связка организована через интерфейс NV-HBI с пропускной способностью до 10 ТБ/с между кристаллами.

  • Общий транзисторный счет — 208 млрд. 

  • Архитектура включает 160 SM (streaming multiprocessors) и около 640 тензорных ядер пятого поколения, ориентированных на операции с низкой точностью (NVFP4, FP8 и др). 

  • Состав SM: 128 «обычных» CUDA-ядер на SM (для FP32 / INT32 / FP16 / BF16 и др); четыре тензорных ядра на SM с поддержкой Transformer Engine второго поколения, оптимизированного для FP8, FP6, NVFP4; 256 КБ Tensor Memory (TMEM) для хранения локальных промежуточных данных, что снижает нагрузку на внешнюю память; специальные функциональные блоки (SFU) для трансцендентных функций. 

  • NVFP4 — новый 4-битный формат с плавающей запятой, использующий блочное масштабирование (E4M3) и FP32 на уровне тензорных блоков. NVIDIA заявляет, что точность NVFP4 близка к FP8, при этом память расходуется до ~3,5 раз меньше по сравнению с FP16. 

В сравнении с оригинальным Blackwell, производительность в NVFP4 выросла с 10 до 15 Пфлопс. Для операций внимания (attention layer) пропускная способность SFU удвоена, что ускоряет вычисления на длинных контекстах и уменьшает время до первого токена. 

Характеристики и особенности: подсистема памяти и interconnect

  • Память: 288 ГБ HBM3e, интерфейс 8 × 512 бит (общая шина — 8 192 бит). 

  • Пропускная способность памяти — 8 Тбайт/с, то же значение, что было у Blackwell (GB200).

  • NVLink 5 (GPU–GPU) с возможностью объединения до 576 GPU в одну «вычислительную фабрику». 

  • PCIe 6.0 x16 как хост-интерфейс. 

  • В системах Blackwell Ultra интегрируются ConnectX-8 SuperNIC и Quantum-X800 InfiniBand / Spectrum-X Ethernet с пропускной способностью до 800 Гбит/с на GPU.

Наблюдается смещение на инференс и reasoning: архитектурные изменения (ускорение внимания, NVFP4) делают Ultra более пригодным для задач с интерактивным откликом и длинным контекстом. А увеличение объема памяти дает возможность размещать крупные модели целиком в памяти GPU, снижая обращения к системной памяти или флэш-накопителям. Обратной же стороной остается необходимость эффективного охлаждения и инфраструктуры высокой плотности.

Blackwell Ultra — это очередной архитектурный шаг вперед по сравнению с Blackwell. Больше транзисторов, улучшенные тензорные ядра и расширенная память — все это позиционирует новинку как основу модульных и масштабируемых AI-фабрик.

D-Matrix JetStream – карта для распределенного инференса

Стартап d-Matrix представил специальную I/O-карту JetStream, которая призвана распределять AI-инференсные нагрузки между серверами. Карта работает в связке с ускорителями Corsair (DIMC-архитектура) и позволяет снизить задержки, не требуя замены существующей сетевой инфраструктуры.

Характеристики и особенности

  • Форм-фактор: плата расширения PCIe 5.0 x16.

  • Сеть: два порта 200 GbE или один порт 400 GbE с поддержкой стандартного Ethernet (QSFP-DD).

  • Энергопотребление около 150 Вт — с охлаждением за счет радиатора и тепловых трубок. 

Один JetStream обслуживает до четырех ускорителей Corsair. Между двумя Corsair устанавливается DMX-мост (bridge), позволяющий передавать данные без использования PCIe-шины. Затем узлы объединяются через PCIe / коммутатор. 

Заявленная сетевая задержка в такой конфигурации — 2 мкс. Таким образом, устройство устраняет узкое место I/O при масштабировании ускорителей Corsair, особенно когда модель распределена между серверами.

При этом низкая задержка в сочетании с высоким пропускным потоком (400 Гбит/с) отличает разработку от обычных NIC в задачах AI-инференса. По заявлениям d-Matrix, карты справляются с моделями свыше 100 млрд параметров. Также отмечают прирост по сравнению с GPU-решениями: до 10 раз быстрее, в три лучше энергоэффективность и соотношение стоимости и производительности. 

Стоит отметить, что заявленные параметры исходят от производителя и требуют подтверждения в независимых тестах. Образцы уже доступны, массовое производство запланировано к концу года.

Память

SK hynix HBM4 для GPU

Организация SK hynix объявила о завершении разработки памяти HBM4, уже отправила 12-слойные образцы клиентам и готовится к массовому выпуску во второй половине 2025 года.

HBM4 станет ключевым компонентом будущих AI-ускорителей (NVIDIA Rubin, AMD, др), предлагая удвоенную пропускную способность и значительный рост энергоэффективности по сравнению с HBM3/3E. 

Характеристики и особенности

  • 2048-битный интерфейс — удвоение разрядности по сравнению с HBM3/E (впервые с 2015 года).

  • Скорость передачи данных — свыше 10 Гбит/с на пин, что на 25% выше официального стандарта JEDEC для HBM3E (8 Гбит/с).

  • Пропускная способность — в два раза выше, чем у HBM3E.

  • Энергоэффективность улучшена на 40%.

  • Ожидаемый прирост производительности AI-ускорителей — до 69%, за счет устранения узких мест в подсистеме памяти.

При производстве используется 10-нм техпроцесс пятого поколения (1β nm). Также применяется инновационная сборка Advanced MR-MUF (Molded Underfill), обеспечивающая механическую стабильность, лучший теплоотвод и контроль высоты стека.

Решение будет использоваться в будущих продуктах NVIDIA (предположительно — в ускорителях Rubin), AMD, Broadcom и других лидеров AI-индустрии. По данным журналистов, первые чипы могут быть 12-Hi стеками с емкостью 36 ГБ, хотя SK hynix официально не раскрывает эти параметры.

Диски

Solidigm D7-PS1010 — E1.S SSD с жидкостным охлаждением

Solidigm (бренд SK hynix) представила одну из первых в мире жидкостно охлаждаемых корпоративных SSD — D7-PS1010 E1.S. Решение предназначено для использования в серверах с высокой плотностью компоновки и без воздушного охлаждения. Ключевой особенностью является охлаждающая пластина (cold plate), которая контактирует с обеими сторонами накопителя. При этом допускается горячая замена накопителя.

Характеристики и особенности

  • SSD использует форм-фактор E1.S с толщинами 9,5 мм и 15 мм. 

  • Накопитель базируется на 176-слойной 3D TLC NAND и интерфейсе PCIe 5.0 x4 (NVMe). 

  • Доступны емкости 3,84 ТБ и 7,68 ТБ для жидкостно охлаждаемой версии. 

  • Последовательные скорости: чтение — до ≈ 14 500 МБ/с, запись — до ≈ 10 500 МБ/с (8 400 МБ/с — для версии на 3,84 ТБ). 

Solidigm работает с производителями серверов для встраивания решения в AI-инфраструктуры — в том числе в системы на базе NVIDIA HGX B300. В отличие от традиционных систем DLC, которые охлаждают лишь одну сторону SSD, новое решение позволяет охлаждать обе стороны, что улучшает тепловой баланс и снижает вероятность троттлинга. Кроме того, с устранением вентиляции для накопителей появляется возможность для наиболее плотной компоновки серверов. 

Solidigm определенно делает технологический шаг, предлагая жидкостно охлаждаемый SSD-формата E1.S с высокой пропускной способностью и возможностью обслуживания в горячем режиме. Это не просто эксперимент: решение нацелено на AI и высокоплотные серверы, где тепловые ограничения часто становятся узким местом. Если оно успешно будет внедрено, это может ускорить переход дата-центров к полностью жидкостному охлаждению.

Как думаете, удастся ли дата-центрам со временем перейти на полностью жидкостное охлаждение? И нужно ли это? Оставайтесь на связи и следите за дайджестом железных новинок в Академии Selectel.

Комментарии (1)


  1. Kerman
    17.10.2025 09:05

    А нафенгхуа в GPU RISC-V? Там же совсем другая архитектура, которая SIMD с рождения.

    Это первая китайская видеокарта с поддержкой формата YUV444

    С этим тоже не ясно. 24 бита на пиксель - этим кого-то можно удивить? Или тут про то, что видеовыход умеет выдавать такой формат сигнала?