Только недавно NVIDIA сообщила, что выпуск суперкомпьютера GB200 NVL72 на архитектуре Blackwell задерживается, а суперсервер GB300 выпустят в середине 2025 года. Получается, эти устройства выйдут практически в одно и то же время с архитектурой Rubin, хотя последняя позиционируется как некстген. В статье рассмотрим эти технологии и попробуем разобраться, куда компания так спешит с релизом новой платформы.
Почему NVIDIA торопится с разработкой Rubin
Архитектуру Rubin презентовали в 2024 году на конференции Computex вместе с версией Blackwell — о ней мы в декабре писали в блоге. Технологию назвали в честь астронома Веры Рубин, которая обнаружила одно из подтверждений существования темной материи. Решение должны были внедрить в графические процессоры серии R-100 (Rubin-100) и центральные процессоры Vera в 2026 году, но теперь это произойдет раньше — ориентировочно в середине 2025-го.
Причина спешки заключается в бурном развитии нейросетей: ИИ-модели становятся всё сложнее и масштабнее. Стандартное «железо» не дает нужной скорости вычислений и передачи данных и одновременно не отличается энергоэффективностью, что важно для больших дата-центров с тысячами вычислительных машин.
NVIDIA не скрывает, что хочет стать лидером в сфере технологий для искусственного интеллекта, поэтому делает упор в своих решениях на производительность, скорость передачи информации и снижение энергопотребления их устройствами. Благодаря этому архитектура Rubin должна в разы ускорить обучение и генерацию ответов нейросетями и стать прорывом на AI-рынке.
Особенности архитектуры Rubin
Подробной спецификации будущих устройств, пока нет, но частично информацию о них раскрыл глава NVIDIA Дженсен Хуанг на конференции Computex 2024. Чипы на архитектуре Rubin будет производить компания Taiwan Semiconductor Manufacturing. Изготовитель будет использовать техпроцесс 3 нм, а не предыдущую версию 5 нм, то есть чип станет меньше, чем предыдущее поколение.
При этом архитектура Rubin будет использовать конструкцию сетки 4х. Эта технология позволит NVIDIA добиться большей производительности устройств на базе Rubin при меньшем энергопотреблении.
NVIDIA не планирует останавливаться на этом: Taiwan Semiconductor Manufacturing сообщает, что следующие платы, которые должны выйти к 2026 году, будут иметь конструкцию сетки 5,5х и использовать 12 стеков памяти HBM на подложке 100 × 100 мм. Планируется, что решение позволит выжать еще в 3,5 раза больше вычислительной мощности, чем дают предыдущие поколения. А к 2027 году разработчик планирует представить плату CoWoS с сеткой 8х на подложке 120 × 120 мм.
В обширных вычислительных средах для кластеров ИИ или суперкомпьютеров важна не только высокая производительность CPU и видеочипов. Подобные системы работают распределенно, то есть выполнением операций одновременно занимаются сотни и даже тысячи машин. Поэтому в дата-центрах для работы с AI особенно важной становится не только производительность CPU и GPU, но и высокая пропускная способность коммутаторов и адаптеров, через которые проходит информация из разных частей кластера.
Чтобы повысить скорость, NVIDIA планирует обновить память в некстген чипах до стандарта HBM4. Это позволит увеличить пропускную способность устройств до 3,6 Тбит/с — в два раза быстрее, чем у предыдущего поколения.
Какие решения на базе Rubin анонсировала NVIDIA
Всего NVIDIA анонсировала шесть устройств, среди них — центральные и графические процессоры, а также периферия. Уже известно, что в линейку войдут:
Rubin R100. Графический процессор, который будет работать на стандарте памяти HBM4 с 8 стеками. Разработчики подчеркивают, что GPU будет оптимизирован для параллельных вычислений при обработке нейросетевых запросов.
Rubin Ultra. Флагманский GPU с 12 стеками памяти HBM4. GPU будет совместим с новой CPU Vera, что позволит минимизировать задержки при обмене информацией и снизить потребление электроэнергии. Устройство также будет оптимизировано для выполнения параллельных вычислений.
Vera CPU. CPU нового поколения, разработанное специально для вычислений глубоких нейронных сетей. Решение интегрировано с новыми коммуникационными технологиями — NVLink 6 и ConnectX 9 SuperNIC. На базе этого устройства выйдет суперчип Vera Rubin, который объединяет в себе функции графического и центрального процессоров.
NVLink Switch шестого поколения. Шина для создания IT-сетей. Пропускная способность — 3600 ГБ/с. Позволяет объединять до 16 графических процессоров в рамках одного кластера.
CX9 SuperNIC 1600 ГБ/с. Сетевой адаптер со скоростью передачи данных 1600 ГБ/с, он обеспечит бесперебойную связь между продвинутыми CPU и GPU. Сейчас в самых современных дата-центрах используют устройства ConnectX-8 SuperNIC с пропускной способностью 800 ГБ/с.
X1600 IB Ethernet Switch. Сетевой коммутатор, который поддерживает стандарт InfiniBand (IB). Совместим с портами QSFP-DD1600, позволяет подключить до 128 устройств. Пропускная способность — 1600 ГБ/с на один порт.
Сейчас мы можем говорить о работе будущей архитектуры только по заявлениям разработчика и слухам от инсайдеров — на данный момент работающие по этой технологии чипы и другие устройства не показывали. К сожалению, на недавно прошедшей пресс-конференции CES генеральный директор NVIDIA Дженсен Хуанг не поделился подробностями о Rubin. В целом нам показалось, что компания сместила фокус внимания с оборудования для дата-центров на платформы для работы с роботами и автономными ИИ-системами, в том числе беспилотным транспортом.
Ждет ли нас прорыв в AI-сфере от NVIDIA
NVIDIA заявляет, что Rubin по всем параметрам обойдет Blackwell:
Архитектура |
Rubin |
Blackwell |
Конструкция сетки |
4х |
3,3х |
Стандарт памяти |
HBM4 |
HBM3E |
Пропускная способность |
3600 ГБ/с |
1800 ГБ/с |
Поддержка коммутационных стандартов |
NVLink 6 |
NVLink 5 |
Всё это позволит нейросетям, которые будут работать на кластерах новой сборки, быстрее обучаться и генерировать ответы.
Конкуренты NVIDIA — AMD и Intel — тоже не отстают. Они готовятся ответить на GB300 и Rubin новыми архитектурами и устройствами. Их будущие решения MI350 и Falcon Shores выйдут во втором и третьем квартале 2025-го. Они также основаны на технологии N3, но память в них пока на уровень ниже NVIDIA.
Хотя NVIDIA обходит конкурентов по количеству решений, пока рано говорить об их качестве. Всё встанет на свои места только после релиза и внедрения новых технологий в реальных дата-центрах. Мы в mClouds продолжим следить за новостями и будем рассказывать о самом интересном в блоге — подписывайтесь, чтобы быть в курсе.