
Совсем недавно NVIDIA представила DGX Spark — компактный AI-компьютер формата 150×150×50 мм. Внутри установлен Grace Blackwell Superchip GB10, объединяющий 20-ядерный ARM-процессор и GPU Blackwell, 128 ГБ единой LPDDR5X-памяти и накопитель до 64 ТБ. По уровню вычислительной мощности устройство сопоставимо с RTX 6000 Ada, но не требует серверной стойки, отдельного охлаждения и сложного подключения.
DGX Spark рассчитан на специалистов, которым нужно запускать крупные языковые модели и дообучать нейросети локально — без облачных квот, задержек и рисков для данных. В статье разберем архитектуру системы, интерфейсы и охлаждение, а также реальные сценарии, где мини-суперкомпьютер действительно заменяет сервер — от генерации изображений до вычислений в материаловедении.
«Железо», подключения и структура
В основе лежит Grace Blackwell Superchip GB10 — единый кристалл, где 20-ядерный ARM-процессор Grace и графический модуль Blackwell объединены шиной NVLink-C2C. Скорость обмена данными по ней в несколько раз выше, чем у PCI Express 5.0 ×16, поэтому CPU и GPU работают как одно целое, без задержек при передаче больших массивов данных — что критично при обучении нейросетей или обработке длинных контекстов.
Процессорная часть построена на ядрах Cortex-X925 и Cortex-A725: первые отвечают за ресурсоемкие вычисления вроде матричных операций и компиляции кода, вторые — за фоновую работу, подготовку данных и мониторинг. Ну а графический блок содержит 6144 CUDA-ядра, тензорные ядра пятого поколения для ускорения операций машинного обучения и RT-ядра четвертого поколения для рендеринга и трассировки лучей.

В DGX Spark установлено 128 ГБ LPDDR5X-памяти, доступной одновременно и процессору, и графическому ядру. Благодаря этому данные не нужно копировать между ними — все работает в едином пространстве. Пропускная способность 273 ГБ/с позволяет без задержек обрабатывать длинные тексты или большие пакеты изображений. В режиме низкой точности FP4 (четырехбитные числа) система справляется с моделями до сотен миллиардов параметров и подходит даже для тонкой настройки небольших нейросетей без потери качества.
В DGX Spark установлен NVMe SSD объемом 1 ТБ. А при необходимости можно добавить до 64 ТБ через внутренние разъемы или внешние хранилища. Все диски поддерживают аппаратное шифрование, поэтому данные — будь то медицинские снимки, последовательности ДНК или корпоративные файлы — можно безопасно держать локально, без передачи в облако.
Корпус DGX Spark выполнен из алюминия, окрашен в золотистый цвет и весит всего 1,2 кг. По форме это аккуратный куб, который органично смотрится на рабочем столе — и в офисе, и дома. За охлаждение отвечают два тихих вентилятора и массивная теплопластина, плотно прижатая к чипу, чтобы тепло распределялось равномерно. Даже при полной нагрузке температура держится в пределах 75–80 градусов, а шум не превышает 35 децибел — тише, чем у большинства ноутбуков во время сборки проекта или рендеринга видео. Питание подается от внешнего адаптера мощностью 240 Вт, подключаемого к обычной розетке. Благодаря этому систему можно без усилий переносить между комнатами, брать на презентации или ставить в коворкинге — без спецлиний и источников бесперебойного питания.
Подключения в DGX Spark продуманы так, чтобы все работало без переходников и лишних проводов. На корпусе — четыре порта USB Type-C со скоростью до 40 Гбит/с: один подает питание ноутбука или периферии, остальные подходят для внешних накопителей, мониторов с последовательным подключением или док-станций. Видеовыход HDMI 2.1a поддерживает 4K при 120 кадрах в секунду и 8K при 60, что удобно для демонстраций, монтажа и стриминга контента. Для сетевых задач предусмотрен порт RJ-45 (10 Гбит/с) и два QSFP-разъема на контроллере ConnectX-7 (по 200 Гбит/с). Через них можно объединять несколько устройств в кластер: два Spark почти удваивают производительность, а четыре превращаются в компактную вычислительную ферму с минимальными задержками. Беспроводная часть — протоколы Wi-Fi 7 и Bluetooth 5.4.
Характеристики DGX Spark:
Процессор: 20-ядерный ARM Grace (10 × Cortex-X925 + 10 × Cortex-A725)
Графика: GPU Blackwell с 6144 CUDA-ядрами, тензорными ядрами 5-го поколения и RT-ядрами 4-го поколения
Память: 128 ГБ LPDDR5X, единое адресное пространство CPU + GPU, пропускная способность 273 ГБ/с
Накопитель: NVMe SSD от 1 ТБ (расширяется до 64 ТБ через внутренние или внешние массивы)
Производительность: до 1 петафлопса в FP4 с учетом разреженности матриц
Интерфейсы: 4 × USB Type-C (40 Гбит/с), HDMI 2.1a, RJ-45 10 Гбит, 2 × QSFP (по 200 Гбит/с)
Беспроводные подключения: Wi-Fi 7 и Bluetooth 5.4
Операционная система: DGX OS на базе Ubuntu для ARM, предустановлены CUDA, cuDNN, TensorRT, контейнеры NVIDIA NIM
Охлаждение: два вентилятора и тепловая пластина с низким уровнем шума (до 35 дБ)
Питание: внешний адаптер 240 Вт
Габариты: 150 × 150 × 50 мм
Вес: 1,2 кг
С завода установлена DGX OS на основе Ubuntu для архитектуры ARM с полным набором инструментов от NVIDIA. CUDA для вычислений, cuDNN — глубокого обучения, TensorRT — оптимизации вывода и контейнерами с использованием платформы NVIDIA NIM для быстрого развертывания. Модель запускается буквально парой команд в терминале — скачал готовый образ, запустил контейнер, и через минуту уже получаешь вывод или стартуешь обучение без ручной настройки зависимостей, драйверов или борьбы с совместимостью. Производительность в низкой точности FP4 с учетом разреженности матриц достигает одного петафлопса, что ставит систему на уровень профессиональных ускорителей, но в корпусе, который занимает в двадцать раз меньше места, потребляет втрое меньше энергии и не требует серверного охлаждения или отдельного питания.
Применение в реальных задачах
DGX Spark рассчитан не только на разработчиков, но и на всех, кто работает с ИИ-инструментами в повседневной работе — от дизайнеров до исследователей. Компактный формат позволяет запускать те же модели, что раньше требовали серверных мощностей, но теперь — на столе. Ниже - несколько примеров.
В творческих проектах система дает свободу экспериментов без «облаков». Дизайнер может взять собственную подборку из нескольких тысяч изображений, адаптировать Flux.1 или Stable Diffusion XL и получить генератор, создающий контент в нужном стиле или под конкретный бренд. Все данные остаются на локальном накопителе, поэтому приватность и конфиденциальность не нарушаются. Отсутствие сетевых задержек позволяет мгновенно видеть результат генерации и менять параметры без ожидания отклика. Для работы с текстами DGX Spark справляется с моделями вроде Qwen3 или Llama, поддерживая контексты до 32 000 токенов. Это удобно при создании чат-ботов, систем retrieval-augmented generation и локальных ассистентов, которые можно встроить в любое приложение и получать ответы мгновенно, без привычных облачных задержек.

В инженерной сфере DGX Spark заменяет традиционные рабочие места с несколькими видеокартами или даже небольшими кластерами. Так, например, при расчетах в вычислительной гидродинамике загружают сетку из ста миллионов элементов, запускают симуляцию на тензорных ядрах и получают предварительные результаты за несколько часов вместо суток на процессорных системах. В материаловедении или химии единое адресное пространство памяти позволяет держать в оперативке миллионы молекулярных структур, ускоряя поиск оптимальных конфигураций или предсказание свойств новых соединений. Биоинформатики дообучают сети на геномных последовательностях, хранят сырые файлы FASTQ на внутренних дисках и полностью избегают передачи зашифрованных данных в облако, что соответствует строгим требованиям регуляторов вроде HIPAA или GDPR.
Несколько DGX Spark можно объединить в кластер для распределенного обучения больших моделей. Два сетевых порта QSFP (по 200 Гбит/с каждый) на контроллере ConnectX-7 обеспечивают быструю связь между устройствами, поэтому два или три таких модуля работают как единая когерентная система. Это удобно для небольших лабораторий и стартапов, которым нужно тестировать архитектуры или дообучать модели без доступа к дата-центру. Малые команды могут запускать на такой связке собственные чат-боты и внутренние LLM, используя корпоративные данные — без внешних API, подписок и лимитов по токенам. В университетах исследователи проводят десятки экспериментов параллельно, меняют гиперпараметры и отслеживают метрики в реальном времени, не дожидаясь своей очереди на общий GPU-кластер или облачные ресурсы.
А сколько это стоит?
Базовая версия DGX Spark оценивается в 3999 долларов. Для домашнего пользователя это серьезная сумма. Но если сравнить с серверными решениями с аналогичной производительностью, то стоимость становится привлекательной. Ведь одна только RTX 6000 Ada стоит около шести–семи тысяч долларов, а вместе с материнской платой, оперативной памятью, накопителем и блоком питания итог легко переваливает за десять. Здесь же все собрано в компактном корпусе, не требующем ни стойки, ни промышленного охлаждения, ни отдельной электролинии.
Продажи стартовали в октябре 2025 года, Spark уже вызвал интерес у исследователей, инженеров и разработчиков. По сути, DGX Spark делает то, что раньше было доступно только в дата-центрах: обучение, тестирование и настройку моделей можно проводить прямо на столе. Все работает локально — без задержек, ограничений и зависимости от облака. Это особенно важно там, где требуется быстрая обратная связь и гарантированная защита данных — от исследовательских лабораторий до небольших студий, которые хотят держать ИИ-проекты под полным контролем.
Как считаете, стоит ли овчинка выделки? Пишите в комментариях.
Комментарии (12)

unwrecker
30.10.2025 07:16Штука интересная. Жду тестов производительности, ну и снижения цены, конечно :)

NeriaLab
30.10.2025 07:16На данный момент цена - 3 999 вечно зелёных и не думаю что цена сильно снизится даже на НГ

unreal_undead2
30.10.2025 07:16Про проблемы с перегревом стоило сказать (по многим сайтам пролетело, навскидку здесь).

Rezzet
30.10.2025 07:16Почему все пишут что это дата-центр? Давайте по факту, 6144 CUDA-ядер, это уровень RTX 5070, бюджетной видеокарты за $500. Процессорная часть 10 × Cortex-X925 + 10 × Cortex-A725, это не быстрее Ryzen 9950х, а скорее всего даже ближе к 9700X. Быстродействие память крайне низкое по сравнению даже с RTX 5070( 273 ГБ/с против 672 ГБ/с у видеокарты), что опять же делает не самый быстрый чип еще медленнее, особенно в вопросах нейросетей, да во всех вопросах оно замедляет видеочип. Если просто речь о вычислительной мощности - то любой комп с 5070, можно называть дата-центром на столе. Что же тогда сказать про владельцев 4090 и 5090.
Теперь о цене, $4k, что можно собрать за эти деньги. С таким количеством памяти для инференса нейронок - ничего, разве что можно макбук попробовать взять на каких-то скидках если они есть. Но если вам хватит 64Гб, то лучше взять обычное железо на интел или амд, и две Radeon AI Pro 9700 с 32Гб памяти на борту($1300 за штуку). Или четыре RTX 5070 по $500 за штуку(материнские платы на АМ5 есть с четырьмя PCIe 16x, но придется конечно использовать райзеры и мудрить корпус из профиля типа как для ферм делали). В общем за $4k можно собрать более быстрые, более масштабируемые альтернативы, при условии что вы готовы пожертвовать общим размером видеопамяти для инференса, есть задачи где это критично, ту же GPT-OSS 120B вы просто не запустите на чем-то меньше 96Гб видеопамяти(работать будет крайне медленно), есть задачи где 64Гб пока хватит, а именно работа с генерацией изображений(stable diffusion) и там лучше иметь чип быстрее.
В целом пока на рынке железа нет серебряной пули для простого энтузиаста, ну есть RTX6000, но ценник $8000+ немного отталкивает. А так что бы и быстро и много памяти и хорошо по поддержке софта и дешево, пока нет. Самое лучшее наверно это покупать бу(или новые) RTX 4090 и переделывать их в 48Гб. Или достаточно дешево стоящие на вторичке RTX 3090. Ходят слухи что в январе покажут RTX 5080 Super 24Гб. MacStudio и макбуки, а так же мини пк на Ryzen 395+ то же выглядят неплохо, но ценник все равно будет 3-4 тыщи вечнозеленых(а может больше за макстудио).

unwrecker
30.10.2025 07:16Ну я, например, хочу топовое железо в компактном корпусе. Да, датацентром это точно называть не стоит, но штука прикольная. Надеюсь, Nvidia будет продвать чипы, и китайцы выпустят то же самое в разы дешевле.
010011011000101110101
Хо-чюююююю!
Наверняка появится и аналогичное для размещения у роботов на борту. Это сильно добавит им ума и умений.
по деньгам - это выгоднее, чем собирать аналогичную по производительности систему на видеокартах. Да и не получится собрать аналогичную. По крайней мере, своими руками
MountainGoat
На Реддите народ не впечатлился, говорят, что если нет ограничений по габаритам и мощности питания, то можно получить за те же деньги лучше.
010011011000101110101
128Gb сплошной VRAM и шина быстрее, чем PCIE*16? не знаю как это получить за те же деньги
igrblkv
Только память сильно медленная, а не как на видеокартах.
В десктопном варианте за те же деньги будет сильно выше производительность.
Посмотрел обзоры - не впечатляет.