В августе прошлого года министерство энергетики США и производитель суперкомпьютеров Cray объявили о создании суперкомпьютера El Capitan. Планируется, что он будет установлен в Ливерморской национальной лаборатории им. Лоуренса в Калифорнии и начнёт работу в 2023 году. 4 марта министерство и лаборатория рассказали об устройстве будущего лидера Top500.
Ведомство и научный центр сообщили, что центральные и графические процессоры суперкомпьютера будет предоставлено компанией AMD — AMD EPYC и AMD Radeon Instinct соответственно. Кроме того, в сравнении с изначальными планами изменилась ожидаемая производительность El Capitan — она составит два экзафлопса, хотя изначально предполагалось, что она будет 1,5. Благодаря этому суперкомпьютер обгонит предыдущего заочного лидера Top500 Frontier, который также разрабатывается министерством энергетики США и появится в 2021 году. Отмечается, что El Capitan будет потреблять около 40 МВт.
Новый суперкомпьютер очень похож на Frontier с аппаратной точки зрения, пишет AnandTech. Это неудивительно, поскольку подрядчиком для них обоих выступает Cray. Конструкция суперкомпьютера Aurora базируется на базе унифицированных кластерных систем Cray Shasta; их количество не называется, однако их, вероятно, будет больше, чем во Frontier со 100 системами.
El Capitan будет оснащён процессорами AMD, использующими архитектуру Zen 4, которая ещё находится в разработке. Кроме того, компания пообещала, что будет использовать интерконнект Infinity Fabric 3.0 для связи между кристаллами в дизайне чиплетов. А вот о графических процессорах, которые будут использоваться в El Capitan, пока практически ничего не известно — Cray лишь сообщила, что они будут следующего поколения, а также смогут поддерживать вычисления смешанной точности для ускорения решения задач глубокого обучения. Работать El Capitan будет в конфигурации 4:1 — четыре GPU на каждый CPU. При этом узлы Infinity Fabric 3.0 будут иметь унифицированную память для центральных и графических процессоров. Связаны между собой они будут с использованием технологии Slingshot от Cray — пропускная способность соединения составит 200 Гбит/с.
В первую очередь суперкомпьютер предназначен для использования Национальной администрацией по ядерной безопасности (NNSA), которая моделирует состав ядерного вооружения с помощью суперкомпьютеров. Отмечается, что повышение производительности по сравнению с изначальными планами произошло как раз по инициативе ведомства — в Cray заявили, что сначала определили архитектуру суперкомпьютера на основе систем Shasta, а только затем начали выбор моделей GPU и CPU для El Capitan. Благодаря этому и удалось достичь производительности в два экзафлопса. Кроме того, его планируется использовать для поиска лекарства от рака и причин мутаций белков RAS человека, вызывающих онкологические заболевания. El Capitan займёт место суперкомпьютера Sierra в Ливерморской лаборатории, и станет в 16 раз мощнее него. Стоимость нового суперкомпьютера составит $400 млн.
deadmoroz14
Интересный выбор железа.
Получится хорошая производительность «на бумаге», а вот про реальность я что-то не уверен.
Довольно большое количество продуктов завязано на/скомпилировано Intel'овскими компиляторами, которые не очень жалуют AMD'шное железо. Работать то будет, но не самым оптимальным образом, по крайней мере «из коробки».
Ну и я молчу про отсутствие CUDA для GPU от AMD.
Может, конечно, к 2023 ситуация исправится, но пока что верится в это слабо
darthmaul
Для суперкомпьютера и пересобрать можно.
Опять же, не играть же на нём будут. А «кастомный» код для паралельных задач архитектура АМД тянет хорошо, вспомните хотя бы бум майнинга на видеокартах — в основном на АМД делали фермы.
Kobalt_x
Тулкиты для ML/газовой динамики/биоинформатики сейчас на cuda, а не на opencl.Потому что а) это проще и больше батареек из коробки б)потому что модель у cuda немного лучше чем opencl. Переписывать тонны кода никто не будет. То что сейчас предлагает AMD с их HIP(конвертация cuda кода) это в песочнице поиграться максимум