FPGA Intel Stratix 10 SX/GX, появившиеся в продаже 2 года назад, стали новым словом в области вентильных матриц. Выполненные по минимальному на тот момент 14-нм техпроцессу, они были в два раза производительнее и на 70% энергоэффективнее предшественников. Однако чтобы реализовать все заложенные в FPGA Intel возможности, нужна такая же продвинутая «обертка». Аппаратно-программный конструктив, выпускаемый Intel для использования Stratix в хост-системах, называется Programmable Acceleration Card (PAC) — его очередная версия анонсирована в сентябре этого года.
Новый РАС имеет в своей основе FPGA Intel Stratix 10 SX — самую мощную модель из семейства Stratix 10. Напомню вкратце ее основные характеристики:
- архитектура HyperFlex;
- технология производства — 14-нм Tri-Gate (FinFET);
- монолитная фабрика с 5.5 млн логических элементов;
- до 96 дуплексных трансиверных каналов;
- пропускная способность трансиверов до 28.3 Гб/с;
- аппаратная коррекция ошибок в каждом канале трансивера;
- аппаратные контроллеры памяти, поддерживающие DDR4-2666 память;
- блоки цифровой обработки сигналов (DSP) суммарной производительностью до 10 TFLOPS, энергоэффективность до 80 GFLOPS/Вт;
- встроенный 4-ядерный 64-битный процессор ARM Cortex-A53 с частотой до 1.5 ГГц;
- аппаратное ускорение шифрации/дешифрации AES-256, SHA-256/384 и ECDSA-256/384;
- аппаратная поддержка многофакторной аутентификации.
Что же касается самой Programmable Acceleration Card, то ее функциональное устройство выглядит следующим образом.
То же самое более подробно в виде таблицы.
Форм-фактор | PCIe Gen3 x16 Full height, 3/4 length, dual slot |
Память | 32 Гб DDR4 (4x8 Гб) ЕСС |
Сетевые интерфейсы | 2X QSFP+ до 100 Гбит/с |
Служебный интерфейс | USB 2.0 для отладки и программирования |
Контроллер управления | Intel MAX 10 FPGA Baseboard Management Controller (BMC) • Чтение данных температуры и напряжения • Platform Level Data Model (PLDM) • IPMI 2.0 |
Управление питанием | Intel Enpirion Power Solutions (телеметрия реального времени и контроль состояния) |
Программное обеспечение | • Acceleration Stack для Intel Xeon CPU с FPGA • FPGA Interface Manager • Intel Quartus Prime Pro Edition • Intel FPGA SDK для OpenCL |
Комментарии (31)
achekalin
08.10.2018 10:54+2А можно попросить хотя бы один абзац в начало текста добавить: для таких, как я, в «ускорителях для больших задач» не разбирающихся, дать хотя бы общее представление, о чем идет речь в тексте, и почему оно круто?
Спасибо!NordicEnergy
08.10.2018 11:31Любые вычисления, нейросети, работа в реал-тайме с большим потоком данных, например, аппаратный файрвол, криптография — шифровать в реал-тайме Ethernet 10G какой нибудь. Ну и многое другое. Задач на деле миллион, просто в СНГ нет компаний, которые занимаются задачами где реально может потребоваться чудовище в виде стратикса, отсюда и вопросы «а нафига оно нужно?»
JC_IIB
08.10.2018 14:26А вот интересно, вы пишете «работа в реал-тайме с большим потоком данных»… можно на базе этой штуки быстрый аппаратный L7 DPI соорудить?
Очень-очень любопытно мне сие.ToSHiC
08.10.2018 16:51В такой постановке вопроса — скорее нет, либо ваш DPI будет медленно развиваться. С точки зрения скорости разработки я бы для этой задачи брал всё же что-то типа DPDK. Вот там, где в latency операций упираться начинаете — есть смысл думать про FPGA, но сил надо затратить очень много. Прямо сейчас Intel предоставляет некоторый acceleration pack для нейросеток, но там не любые архитектуры сетей поддерживаются, да и в целом геморройной будет.
hashtet
08.10.2018 16:44Мне тоже — интереса ради… Эта железка может применяться для майнинга криптовалюты?
Если да, то нецелесообразно из-за высокой стоимости железки, или из-за алгоритмов(мол из пушки по воробью)?ToSHiC
08.10.2018 16:52+2Нет смысла — асики более энергоэффективны. Майнинг на FPGA меньше полугода был прибыльным, вроде.
SiliconValleyHobo
08.10.2018 17:19-1>просто в СНГ нет компаний, которые занимаются задачами где реально может потребоваться чудовище в виде стратикса
Глупости. ПЛИС это вообще нишевый продукт. Для маркетного использования они не годятся, они используются только для прототипирования, либо для задач, в которых реально может потребовать постоянно изменять прошивку.
А вы говорите о третьем применении, куда более редком — когда производство очень мелкосерийно (выпекать ASIC экономически невыгодно), а весь интерконнект при этом между блоками обработки/интерфейсами должен быть на чипе. Такого не то, что в СНГ, такого по миру почти не делают. Ибо это какая-то очень странная бизнес-модель получается.
edit: Да, HFT. И кроме него, честно говоря, мне сложно представить себе задачу, которая бы обоснованно лучше имплементировалась именно на ПЛИСxFFFF
08.10.2018 21:34+1Задач для ПЛИС море! Для любой мелкосерийки ASIC делать не выгодно. Скорость разработки на ПЛИС в разы выше. Готовый софт и инфраструктура для разработки. Ну и множество других ништяков. Средне — крупносерийное выгоднее уже на ASIC.
SiliconValleyHobo
08.10.2018 22:10-1Для большинства мелкосериек не нужно взаимодействие между IP-блоками на кристалле. Дешевле и проще купить готовые чипы/контроллеры, распаять их на плате вместе с управляющей логикой на МК/процессоре. Стоимость и время разработки на ПЛИС будут намного, намного больше. Как и стоимость самой железки как продукта.
Готовый софт для разработки? Насколько я помню, весь нормально работающий софт сурово проприетарен, а пользоваться им удобно… не очень. Плюс, в нем достаточно часто встречаются баги, которые раздражают и сильно тормозят разработку — и их ведь не найти в силу закрытости софта. В ту же копилку и проприетарные вендорные IP-блоки. А сколько стоят IP-шки от внешних вендоров? Там с ума сойти какие ценники (даже для бизнеса) на не самые сложные контроллеры не самых актуальных интерфейсов.
Я мог отстать от жизни, уже давненько ушел из отрасли. Если так, то назовите, пожалуйста, еще три обоснованных с точки зрения бизнеса применения ПЛИС, помимо инфраструктуры для бирж/трейдинга.Antervis
09.10.2018 00:58Радиолокация и связь, на военку.
JerleShannara
09.10.2018 11:02+1Именно по этой причине стратиксы и попали под группу «двойное назначение».
Fandir
09.10.2018 11:39Авиация, военные, космос… В любом самолете ПЛИС очень большое количество… Если хотите что-то более приземленное, то даже на хабре писали о использовании подобных плат в анализе сетевого трафика, если не ошибаюсь статья была о диагностике работоспособности тысяч видео потоков на одном сервере…
defecator
08.10.2018 12:39Интересно, а подобную мощь вообще можно ввозить в Россию?
Fandir
08.10.2018 14:21это думается мне можно без проблем ввести в Россию, т.к. оно не Military и не Space…
JerleShannara
08.10.2018 22:48Но с PACом на базе Arria 10 у них это не получилось, оно оказалось под Экспортным контролем.
kovserg
08.10.2018 13:09Интересно куда 125Вт рассеивается в такой конструкции (где радиатор на fpga?)
И сколько сия железяка стоит?
nerudo
08.10.2018 13:25Как с ввозом в Россию дела обстоят в свете «аппаратное ускорение шифрации/дешифрации AES-256, SHA-256/384 и ECDSA-256/384» и заботы о нас родного ФСБ?
Fandir
08.10.2018 14:22Пишите письмо-гарантию на таможню, что это не устройство шифрования… и вроде проблем быть не должно
nerudo
08.10.2018 15:41Я к чему спросил — у дистрибьютеров Xilinx есть явные проблемы с поставкой аналогичной продукции. Вплоть до выпуска специальных версий чипов с деактивированным шифровальным блоком
NordicEnergy
08.10.2018 16:16AES-256 есть даже в DSP и микроконтроллерах и никаких проблем. Все эти ограничения распространяются если устройство предназначается для шифрования, а отладочный комплект законченным устройством в принципе не является и функционалом не обладает. Сопроводительное письмо на таможню или брокеру DHL-я и вопрос закрыт.
malishich
08.10.2018 14:54Предполагаю, что стоимость этого устройства будет от 10k $ в низшей конфигурации.
springimport
08.10.2018 16:36По моему, нужны новые реализации подключения периферии. Уже сейчас есть видеокарты весом почти в полтора кг которые вынуждают «армировать» слоты pci.
Fandir
08.10.2018 16:43Когда Intel наконец родит полноценный SoC в виде Xeon и Stratix необходимость в этих монстрах исчезнет.
bagamut
08.10.2018 20:49Вроде же родила и продает
en.wikichip.org/wiki/intel/xeon_gold/6138p
ark.intel.com/products/139940/Intel-Xeon-Gold-6138P-Processor-27-5M-Cache-2-00-GHz-kovserg
09.10.2018 11:27Если использовать AVX512 на 20ядрах то процессор не справляется с отводом тепла и понижает частоты ядер с 3.7ГГц до 1.9ГГц. Интересно а если использовать fpga то он будет понижать еще ниже?
bagamut
09.10.2018 11:41TDP с FPGA увеличен до 195Вт против 125Вт, FPGA отдельный кристалл рядом с процессором, если система охлаждения справится с 195Вт то не должно влиять
proton17
«монолитная фабрика с 5.5 млн логических элементов» — дальше не читал)