NVIDIA показала GPU на Ampere для облачных вычислений и обучения систем на ИИ / forpes.ru

Главная
NVIDIA показала GPU на Ampere для облачных вычислений и обучения систем на ИИ

NVIDIA показала GPU на Ampere для облачных вычислений и обучения систем на ИИ +12

16.05.2020 13:22

maybe_elf 11 6900 Источник

NVIDIA на днях продемонстрировала графические процессоры с архитектурой Ampere. Они предназначены для дата-центров, способны выполнять научные расчеты и обрабатывать большие данные.

Презентация прошла необычным образом. Директор компании Дженсен Хуанг вынул cистему DGX A100 из духовки у себя на кухне.

«Это наш самый лучший графический процессор для дата-центров, и он вобрал почти десять лет нашего опыта», — отметил Хуанг позднее уже на пресс-конференции.

У GА100 свыше 54 млрд транзисторов. GPU GA100 содержит 8192 ядра CUDA и 512 тензорных ядер третьего поколения, а также шесть модулей памяти HBM2 с шиной памяти разрядностью в 6144 бита. Выпускается по 7-нм технологии компанией TSMC.

A100 GPU при этом — не графический процессор, а графический ускоритель. Он включает пять модулей HBM2 (40 ГБ) с шиной памяти разрядностью в 5120 бит. 3456 ядер CUDA предназначены для вычислений с плавающей запятой двойной точности (FP64), 6912 ядер — для одинарной (FP32). Тензорных ядер третьего поколения с поддержкой вычислений TF32 — 432.

В новой станции DGX A100 AI восемь таких процессоров объединят в один. Общая производительность системы составит 5 петафлопс. Она будет иметь 320 ГБ видеопамяти с пропускной способностью 12,4 Тбит/с.

В GPU включили TensorFloat-32 — новый режим для обработки математических матриц, также называемый тензорными операциями, который используется в основе AI и некоторых приложений HPC. Комбинация TF32 со структурированной разреженностью позволяет повысить производительность процессоров по сравнению с GPU Volta в 20 раз.

Пиковая производительность ускорителя составляет 19,5 TFLOPS (FP32) или 9,7 TFLOPS (FP64).

GA100 поддерживает интерфейс NVLink третьего поколения. Это дает возможность обмениваться данными с аналогичными GPU со скоростью 600 Гбайт/с. Каждый графический процессор поддерживает 12 каналов NVLink 3.0. С помощью технологии виртуализации MIG можно разделять ресурсы одного графического процессора на семь независимых сегментов.

Разработка будет выполнять задачи обучения искусственного интеллекта. Как отметили в NVIDIA, сейчас клиенты использует решение стоимостью $11 млн, которое занимает 25 серверных стоек в дата-центре и потребляет 630 киловатт электроэнергии. Однако на базе Ampere для тех же мощностей понадобится в 11 раз меньше оборудования, стоимость которого составит около $1 млн, всего одна серверная стойка и 28 киловатт электроэнергии. В компании подчеркнули, что использование новой системы ускорит процесс обучения ИИ в 20 раз.

Серийное производство DGX A100 уже стартовало. В числе заказчиков оказалась Аргоннская национальная лаборатория США, которая планирует задействовать систему в исследованиях коронавируса.

Начальная цена вычислительной станции составляет $199 000.

Nvidia показала также кластер из 140 DGX A100 под названием DGX SuperPod. Он имеет производительность 700 петафлопс. Благодаря соединению с серверными адаптерами Mellanox HDR 200Gbps InfiniBand interconnects компании удалось получить собственный суперкомпьютер. Его можно задействовать в исследованиях генома и разработке говорящих ИИ.

При этом никаких официальных данных о сроках доступности игровых видеокарт с архитектурой Ampere нет.

См. также:

«История потоковых мультипроцессоров Nvidia»

«Вычисления на GPU – зачем, когда и как. Плюс немного тестов»

«AMD твёрдо намерена заполучить весомую долю рынка дата-центров»

«Ваша первая нейронная сеть на графическом процессоре (GPU). Руководство для начинающих»

Комментарии (11)

Arxitektor
16.05.2020 17:34
#21624316
+1
Как я понимаю производительность системы составит 5 петафлопс у DGX A100 AI только в определёны задачах?
И можно ли эту систему сравнить с суперкомпютерами хотя бы из 2000 годов?
1. Kriger91
  16.05.2020 18:23
  #21624402
  +1
  Tianhe-1A (2010 год) — 4,7 петафлопс. Так что да.
  Ну и отмечу, что сейчас основной упор не столько на рост просто числа операций, скоролько на рост операций на единицу потребляемой энергии
  1. Quiensabe
    17.05.2020 00:59
    #21625516
    Немного дополню. Из Википедии:
    Тяньхэ-1А (??-1A, Tianhe-1A) — суперкомпьютер, спроектированный Национальным университетом оборонных технологий Китайской Народной Республики[3]. Скорость вычислений, производимых суперкомпьютером, составляет 2,57 петафлопс
    …
    Тяньхэ-1А использует 7168 графических процессоров Nvidia Tesla M2050 и 14336 серверных процессоров Intel Xeon[2]. Согласно заявлениям компании Nvidia, суперкомпьютер использует электрическую энергию в три раза эффективнее, чем иные электронные вычислительные машины подобного класса. Потребляемая Тяньхэ-1А электрическая мощность составляет 4,04 МВт[1].
    …
    Строительство суперкомпьютера обошлось в 88 млн $
    (При старте производительность Тяньхэ-1А была в два раз ниже DGX A100)
    
    Т.е. 10 лет назад: 14336 графических процессоров, 176 млн $, и 8,08 МВт
    Сегодня: 8 графических процессоров, 0,2 млн $, и 0,0056 МВт…
    
    Падение стоимости в 880 раз, потребления энергии в 1442 раз.
    
    Каждый год стоимость падала в 1.97 раза, потребление энергии в 2,07 раза.
    
    MooNDeaR
    17.05.2020 02:28
    #21625638
    Надо ещё сегодняшние 0,2 млн пересчитать в деньги десятилетней давности и цифры ещё более впечатляющие будут)
    
    Quiensabe
    17.05.2020 02:50
    #21625668
    Вы правы.
    Если пересчитать, получается падение стоимости в 1047 раз. Или 2.004 раза в год.
    
    DenisTrunin
    17.05.2020 11:26
    #21626126
    Вот интерестно, а какие-нибудь задачи то оно позволяет быстрее решать. Что с того что процессор будет быстрее на бумаге, при этом будет использовать более кривой код

DrunkBear
17.05.2020 00:49
#21625496
-1
Интересно, как отреагируют на анонс представители Сбера, которые в прошлом году построили кластер на базе NV Tesla V100?
1. nidalee
  17.05.2020 10:20
  #21625986
  Ну надо же когда-то начинать, иначе так всю жизнь можно новых анонсов ждать.
1. Zibx
  17.05.2020 14:19
  #21626698
  А есть какие-то варианты? Закупят новую партию и введут в эксплуатацию.

Arxitektor
17.05.2020 21:15
#21627826
Вы правы.
Если пересчитать, получается падение стоимости в 1047 раз. Или 2.004 раза в год.

Интересная закономерность. Почти закон мура. Надеюсь в следующие 20 лет темп не особо сильно упадет. И в 2040 можно будет такую мощность засунуть в обычный ПК.
1. Quiensabe
  18.05.2020 02:49
  #21628530
  Сейчас оно стоит 200 000$ и потребляет 6 киловат. Если закономерность не изменится, то уже через 10 лет оно будет стоить 200$ и потреблять 6 ватт… А через 20 лет — 0,2$ и 6 милливатт… Где-то в датчиках дыма, если только будут такую ерунду использовать, что не жалко выбросить когда встроенная батарейка сядет :)