На связи Сергей Ковалёв из Selectel с традиционным ежемесячным дайджестом железа. Сегодня я пробую новый формат: по ходу месяца мы с коллегами публикуем новости железных новинок, и я собрал их с краткими аннотациями в первой части статьи. Если вы уже читали наши новости, смело переходите ко второй части — в ней собрал то, до чего не дошли наши писательские руки. Подробности под катом.

О чем писал Selectel в мае

AMD Instinct MI430X

AMD анонсировала MI430X — HPC-ускоритель с 432 ГБ HBM4, пропускной способностью 19,6 ТБ/с и нативным FP64 свыше 200 TFLOPs. Это не развитие серии MI350X, а другой класс железа для научных расчетов, где FP32 просто не подходит. Задачи для GPU: CFD (гидродинамика), молекулярная динамика, ядерные расчеты. NVIDIA предлагает эмуляцию FP64 через тензорные ядра, но для ряда реальных задач высокопроизводительных вычислений это дает лишь 33 TFLOPs против честных 200 у AMD. Подробности в статье.

AMD Instinct MI350P

AMD выпустила первую с 2022 года PCIe-карту серии Instinct™ MI350P с 144 ГБ HBM3E. Архитектура CDNA™ 4 в стандартном двухслотовом форм-факторе с TDP 600 Вт. По сути, это половина MI350X: четыре XCD-кристалла вместо восьми, пропускная способность памяти — 4 ТБ/с. Прямой соперник H200 NVL, только без NVLink®, то есть объединить карты в пул не получится. Полная заметка здесь.

NVIDIA HGX B300: тест на инференсе

Не про новое железо, но нельзя пройти мимо в майском дайджесте. Взяли HGXTM B300 с 2,3 ТБ VRAM и прогнали на нем DeepSeek R1/V3.2, Qwen 3.5 397B и Minimax M2.5 через vLLM. NVFP4 дает двух-трехкратный прирост на prefill по сравнению с FP8 — это реально ощутимо. На decode разница скромнее и пока до конца не объяснена, но Qwen 3.5 в NVFP4 вытягивает 330 тысяч ответов в сутки при decode-окне в 1000 токенов. Читайте, это интересно!

Alibaba Zhenwu M890

Alibaba представила GPU Zhenwu™ M890 с 144 ГБ HBM, межчиповым интерконнектом 800 ГБ/с и поддержкой FP4 для инференса. На его базе собрали суперсервер Panjiu® AL128 — это стойка из 128 ускорителей с задержкой между GPU менее 150 наносекунд. По памяти паритет с H200, по масштабированию кластеров — тоже, но главное здесь не характеристики, а стек и предпочтения рынков. Раскрыли тему устройства в статье.

Majestic Labs Prometheus

Стартап Majestic Labs анонсировал серверную платформу Prometheus — собственные AIU-чипы Ignite на архитектуре Arm + RISC-V с единым адресным пространством памяти до 128 ТБ на весь сервер. Это примерно в 60 раз больше, чем у восьми B300 SXM в стандартной HGX-конфигурации. Пока все это существует на уровне лендинга без публичных бенчмарков и цен. Главный вопрос: какова реальная пропускная способность этих 128 ТБ? Его компания пока обходит стороной, о других подробностях в заметке.

Dell PowerEdge R7725xd + Kioxia LC9

Dell™ и Kioxia™ объявили первый сервер с флеш-памятью объемом 9,8 ПБ в форм-факторе 2U. Это Dell™ PowerEdge™ R7725xd с 40 дисками Kioxia™ LC9 до 245,76 ТБ в формате E3.L. Диски построены на BiCS8 3D QLC NAND™, скорость последовательного чтения до 12 ГБ/с, случайное чтение 1,3 млн IOPS. Для аналогичной емкости на стандартных 30-терабайтниках понадобилось бы еще семь серверов и 280 дополнительных дисков. Статья по ссылке.

Huawei HSSD 122 ТБ

Huawei представила SSD до 122,88 ТБ, обойдя санкционные ограничения на 3D NAND с помощью собственной технологии DoB. Кристаллы размещаются прямо на плате без корпусной упаковки, что дает прирост плотности на 33%. В основе NAND от китайского YMTC (Xtacking 4, до 232 слоев), которая уступает топовой Samsung, но DoB компенсирует разрыв за счет компоновки. В СХД OceanStor Pacific 9926 с 36 дисками на 122 ТБ получается 4,42 ПБ в корпусе 2U. Читайте здесь.

Micron 6600 ION 245 ТБ

Micron объявила о поставках SSD 6600 ION емкостью 245,76 ТБ на 276-слойной G9 QLC NAND с интерфейсом PCIe Gen5. По заявлению компании, это самый объемный SSD, доступный к покупке. Скорость последовательного чтения до 13,7 ГБ/с. Цена пока не афишируется, но по найденным в продаже дискам на 122 ТБ можно прикинуть, что один терабайт на SSD 6600 ION обходится примерно в пять раз дороже HDD. Подробнее в статье.

Celestica DS6000

Celestica выпустила коммутаторы DS6000 на базе Broadcom Tomahawk 6. В них 64 порта по 1,6 Тбит/с и коммутационная способность 102,4 Тбит/с. Есть два варианта: классический 3U с воздушным охлаждением и OCP ORv3 с гибридным воздушно-жидкостным, где шесть кВт потребления говорят сами за себя. Для массовых дата-центров пока избыточно, но кластерам на тысячи GPU такой запас уже нужен, об этом можно прочитать подробно.

Что интересного еще выпустили вендоры

Dell PowerEdge XE9785 — AMD EPYC 9005 Turin + MI355X в одном корпусе

Сервер Dell PowerEdge XE9785. Источник.
Сервер Dell PowerEdge XE9785. Источник.

Dell™ выпустила PowerEdge™ XE9785 — двухсокетный сервер в форм-факторе 10U с воздушным охлаждением на платформе AMD®.

Характеристики:

  • CPU: два AMD EPYC™ 9005 Turin, до 384 ядер суммарно;

  • RAM: 24 слота DDR5-6400 RDIMM, до 6 ТБ суммарно;

  • Хранение: до 16 NVMe E3.S PCIe 5.0 (до 245,76 ТБ) или до десяти NVMe U.2 (до 153,6 ТБ) + два M.2 внутренних;

  • ускорители: восемь AMD Instinct™ MI355X по 288 ГБ HBM3E каждый, пропускная способность памяти 8 ТБ/с;

  • интерконнект GPU: AMD Infinity Fabric™;

  • альтернативная конфигурация: восемь NVIDIA HGX™ B300 + NVLink

  • питание: 12 блоков по 3200 Вт (80 Plus® Titanium, горячая замена);

  • охлаждение: воздушное — 15 вентиляторов в зоне GPU (все с горячей заменой), пять — в зоне CPU (все с холодной заменой);

  • сеть: слот OCP 3.0 (PCIe 5.0 x8), 2 × RJ45, Mini-DisplayPort, USB Type-A и Type-C.

10U воздушного охлаждения при таком теплопакете — смелое решение. Охладить сервер сложно, но возможно. Зато не нужна инфраструктура СЖО. Dell также объявила о поддержке AMD Instinct MI350P в серверах PowerEdge XE7745 и R7725, о таком GPU мы уже писали ранее.

AMD пытается составить конкуренцию NVIDIA в задачах обучения моделей и инференса, а ключевые вендоры реализовывают такие решения. Но не забывают и о запасном варианте, адаптируя такие серверы и под возможность использования B300.

Giga Computing TO46-SD3-LA07 — HGX B300 с жидкостным охлаждением

Сервер TO46-SD3-LA07. Источник.
Сервер TO46-SD3-LA07. Источник.

Giga Computing (дочка Gigabyte) не отстает от Dell, и тоже показала новинку, OCP-сервер TO46-SD3-LA07 на платформе NVIDIA HGX B300. 

Характеристики:

  • CPU: два Intel® Xeon® 6 6500/6700 (Granite Rapids-SP);

  • RAM: 32 слота DDR5 RDIMM/MRDIMM;

  • хранение: восемь SFF NVMe (горячая замена) + два M.2 PCIe 5.0 x4 и PCIe 5.0 x2;

  • расширение: 4 PCIe 5.0 x16 FHHL;

  • GPU: восемь NVIDIA B300;

  • DPU: совместим с NVIDIA BlueField®-3;

  • сеть: 8 OSFP InfiniBand® XDR (до 800 Гбит/с) или 2 × 400GbE (NVIDIA ConnectX®-8 SuperNIC);

  • охлаждение: прямое жидкостное, покрывает GPU и CPU, есть датчик утечки.

Сервер традиционно предназначен под обучение моделей и инференс. Стандарт OCP позволяет эусплуатантам не привязываться к конкретному вендору шасси. Жидкостное охлаждение для HGX B300 — отличный бонус: охлаждать воздухом такие системы достаточно сложно.

На рынке уже вышло следующее поколение Rubin, но вендоры уровня Giga часто выпускают предыдущие системы с задержкой, тем более, что спрос на B300 на рынке остается актуальным.

Собственный сервер Selectel

В основе — самые современные процессоры Intel® Xeon® 6, до 8 ТБ DDR5 и специально разработанная материнская плата. Арендуйте сервер у нас или закажите в свой дата-центр.

Узнать подробности →

HPE Compute Scale-up Server 3250 — до 64 ТБ RAM в одной системе

HPE Compute Scale-up Server 3250. Источник.
HPE Compute Scale-up Server 3250. Источник.

HPE анонсировала Scale-up Server 3250 — модульный сервер под задачи, где оперативная память важнее всего остального. Например, резидентные БД, OLAP, SAP.

Характеристики одного шасси (5U):

  • CPU: четыре Intel® Xeon® 6700P, до 86 ядер каждый;

  • RAM: 64 слота DDR5, до 256 ГБ на модуль, до 16 ТБ на шасси;

  • масштабирование: до четырех шасси в одну систему, 16 CPU и 64 ТБ RAM; интерконнект через внешний контроллер узлов;

  • хранение: до 24 E3.S NVMe;

  • расширение PCIe 5.0;

  • сеть: 1 GbE + 10/25 GbE SFP28;

  • питание: блоки 2400 Вт (80 Plus Titanium), горячая замена.

HPE называет 3250 первым масштабируемым сервером на Xeon 6 с модульной архитектурой в своем классе и первой системой, прошедшей валидацию в SAP BW при 48+ ТБ RAM. Конкурент от Eviden™ Bullsequana™ SH предлагает схожий класс, но с другим конструктивом.

Firefly CSC2-N48SPK3 — 48 узлов RISC-V в 2U

Сервер Firefly CSC2-N48SPK3. Источник.
Сервер Firefly CSC2-N48SPK3. Источник.

Firefly показала многоузловой сервер CSC2-N48SPK3 на архитектуре RISC-V. Суммарная производительность заявлена на уровне 2880 TOPS (INT4). Для RISC-V это событие.

Характеристики:

  • форм-фактор: 2U, 48 вычислительных узлов;

  • процессор узла: SpacemiT™ Key Stone K3, 8 x 64-бит ядер RISC-V X100M, до 2,4 ГГц;

  • RAM на узел: 8 / 16 / 32 ГБ LPDDR5;

  • хранение на узел: 128 ГБ UFS 2.2;

  • поддержка профиля RVA23 полностью;

  • узел управления: Rockchip® RK3588  4 Cortex®-A76 (2,4 ГГц) + 4 Cortex-A55 (1,8 ГГц), Mali™-G610, NPU 6 TOPS, 8 ГБ RAM;

  • суммарная производительность: 2880 TOPS (INT4);

  • сеть: 4 × 10 GbE SFP+;

  • хранение опционально: до 48 × M.2 2280 NVMe PCIe; при дисках 16 ТБ — до 768 ТБ суммарно.

Платформа интересна прежде всего как демонстрация жизнеспособности RISC-V в серверном сегменте — не Arm и не x86, но уже работающая железка с ценником. Для продакшн-нагрузок пока скорее эксперимент, но направление понятно: тестирование совместимости ПО на RISC-V, облачная отладка и разработка под RISC-V. В качестве эксперимента возможен инференс и виртуализация.

Медные водоблоки от UIUC — используется 3D-печать 

Медный радиатор охлаждения. Источник.
Медный радиатор охлаждения. Источник.

Исследователи из Иллинойского университета (UIUC) совместно с компанией Fabric8Labs представили новую технологию охлаждающих пластин для СЖО в дата-центрах. Повод заняться этим простой: большинство производителей водоблоков экономят на меди и берут алюминиевые сплавы — они дешевле в обработке, но хуже отводят тепло.

Что сделали:

  • Метод проектирования: топологическая оптимизация — алгоритм итерационно меняет геометрию ребер, на каждом шаге оценивая теплоотвод и гидравлическое сопротивление.

  • Результирующая форма ребер: заостренные вершины и зазубренные края (вместо классических параллелепипедов, конусов или цилиндров).

  • Материал: чистая медь.

  • Технология изготовления: ECAM™ (электрохимическое аддитивное производство, 3D-печать металлом) — точность 30–50 мкм, меньше толщины волоса.

  • Прирост эффективности охлаждения: +32% по сравнению с традиционными ребрами-параллелепипедами.

Потребление энергии СЖО с такими пластинами оценивается в 1,1% от общего потребления ЦОД. Для сравнения: воздушное охлаждение тратит до 30%, обычные СЖО — 5–15%. 

О сроках коммерциализации пока ничего конкретного. Fabric8Labs ранее уже предлагала похожие водоблоки с гироидными структурами. Microsoft и Corintis идут еще дальше, они хотят формировать каналы для охлаждающей жидкости прямо на поверхности чипов, без отдельного водоблока вообще.

PCIe 8.0 v0.5 — 256 ГТ/с на горизонте 2028 года

Сравнительная таблица скоростей PCI Express (PCIe) разных поколений. Источник.
Сравнительная таблица скоростей PCI Express (PCIe) разных поколений. Источник.

Новость не про физическое устройство, но важная для индустрии.

PCI-SIG опубликовала версию 0.5 спецификации PCIe 8.0, первый официальный вариант с учетом правок по итогам прошлогоднего релиза 0.3. Финальная версия ожидается к 2028 году.

Цели стандарта PCIe 8.0:

  • Скорость передачи: 256 ГТ/с (вдвое быстрее PCIe 7.0, вчетверо быстрее актуального PCIe 6.0).

  • Максимальная пропускная способность x16: до 1 ТБ/с при двустороннем обмене.

  • Оценка новых конструкций коннекторов.

  • Снижение энергопотребления через обновленные техники управления питанием.

  • Улучшение протоколов для увеличения эффективной пропускной способности.

  • Обратная совместимость со всеми предыдущими поколениями PCIe.

Для контекста: серверные CPU AMD и Intel только добираются до поддержки PCIe 6.0, PCIe 7.0 у обоих в дорожных картах на ближайшие годы. PCI-SIG торопится выпустить 8.0 заранее, чтобы у рынка было время планировать инфраструктуру. С учетом того, как быстро растут аппетиты AI-систем к межчиповым интерфейсам, запас в 1 ТБ/с на x16 выглядит разумной страховкой. До реального железа еще минимум три года.

Комментарии (3)


  1. evil_raider
    17.06.2026 11:56

    Медные водоблоки от UIUC — используется 3D-печать

    Картинка выбрана непонятная и неинформативная. Эта интереснее.


    1. RED75
      17.06.2026 11:56

      Вот только это не 3D печать, а гальваническое осаждение, судя по картинке.


      1. evil_raider
        17.06.2026 11:56

        участники проекта обратились к компании Fabric8Labs для электрохимического аддитивного производства (ECAM) — метода 3D-печати металлом

        https://servernews.ru/1141854