image

Торговый конфликт Китая и США продолжается. Вот-вот Соединенные Штаты могут ввести новые ограничения на поставку Китаю современных чипов, включая ИИ-ускорители. После введения в силу новых экспортных запретов, не имея возможности пополнить запасы, у Китая могут начаться серьезные проблемы. Поэтому Поднебесная не ждет появления новых санкций, а пытается решить эти, пока что вероятные, проблемы массовыми закупками ускорителей. Подробности — под катом.

Что снова происходит?


Китайские компании выделают миллиарды долларов США на закупки разного оборудования в США и других странах, которые зависят от технологий Штатов. Делается это для того, чтобы накопить солидные запасы электронных систем и компонентов, которые нужны китайским компаниям. По данным Financial Times, они уже потратили свыше $5 млрд на закупки, в том числе, ИИ-ускорителей.

Сейчас Китай не может покупать (во всяком случае, официально) ускорители А100 и Н100. Но Nvidia ранее выпустила искусственно урезанные версии этих систем, А800 и Н800. Сделано это для обхода экспортных ограничений.

Среди тех компаний, которые закупают ускорители — AliExpress, ByteDance (компания, создавшая TikTok) и u Baidu вместе с Tencent. По данным аналитиков, указанные компании оформили предзаказ примерно на 100 тыс. ускорителей. И это лишь 20% об планируемого объема закупок.

Зачем все это? Дело в том, что такого рода ускорители используются в системах для высокопроизводительных вычислений. В том числе, суперкомпьютеров, отрасли, в которой Китай традиционно силен, а также ИИ-отрасли.

Nvidia обязалась предоставить ИИ-ускорители до конца 2023 года — во всяком случае, большей части заказчиков из Китая. Поднебесная надеется приобрести до 1 млн ускорителей к концу 2024 года — именно тогда США могут ввести новые санкции.

Почему Nvidia не может поставлять более продвинутые ускорители?


image

Это на все 100% американская компания. Соответственно, она обязана соблюдать правила экспорта, установленные регуляторами США. В целом, она так и делает, но есть и небольшие хитрости, позволяющие продолжать поставки современного оборудования покупателям из Китая.

Сначала появилась урезанная версию ускорителя А100 под названием А800. Его отличием от оригинала стала пониженная примерно на треть скорость двунаправленной передачи данных (bidirectional transfer rate; BTR), что и позволило обойти новые ограничения.



Ну а чуть позже появилась и урезанная версия Н100, которую Nvidia модифицирует для китайских потребителей. Кастомизированная версия системы продается под другим названием — не H100, а Н800.

Насколько известно, вариант системы, которая поставляется в Китай, искусственно «замедлен». Т.е. у ускорителя сниженные характеристики пропускной способности. Так, если у H100 это 300 Гбит/с, то у китайской версии — всего 150 Гбит/с.

Что касается характеристик «оригинала», т.е. модели Н100, то она включает 80 млрд транзисторов. Кроме того, это первый в мире укоритель с поддержкой шины PCIe Gen5 и высокоскоростной оперативной памяти HBM3. Впечатляет и пропускная способность памяти — около 3 ТБ/с.

Благодаря новой высокопроизводительной шине NVLink, между собой можно соединить сразу 256 ускорителей Н100. Конечно, система с такими характеристиками не могла пройти мимо внимания китайских корпораций. Ну а Nvidia не хочет терять клиентов, ведь китайский рынок поистине огромен, кому захочется упустить доход в сотни миллионов долларов США?

Американская компания разработала урезанные версии ускорителей в конце 2022 года, практически сразу после того, как американские власти ужесточили правила поставок в Китай различных hi-tech технологий.

Понятно, что такие мощные ускорители покупают не частные лица или небольшие компании, а мощнейшие корпорации из КНР. Все те, у кого есть дата-центры и развернутая облачная инфраструктура.

Intel тоже не хочет терять китайский рынок


image

Не только Nvidia, но и Intel тоже не желает терять покупателей из Поднебесной. Ранее стало известно о том, что корпорация Intel начнет продажу Китаю ускорителей Habana Gaudi 2. Как и в случае систем от Nvidia, они предназначены для работы с задачами глубинного обучения и инференса (обеспечение работы предварительно обученной нейросети на конечном устройстве). При этом сам по себе ускоритель — система, которую нельзя в текущем виде поставлять в Китай, в силу ограничений, наложенных США на эту страну.

Для того, чтобы обойти ограничения и получить прибыль, Intel изготовит экспортный вариант Gaudi. Если раньше прилагательное «экспортный» подразумевало улучшенную версию экспортируемого товара, будь это автомобиль, пиво или что-то еще. То в случае Intel все наоборот — Gaudi несколько урежут в функциональности. В таком виде GPU и будут продавать в КНР, не опасаясь проблем с регуляторными органами США.

К сожалению, что именно будет урезано/сокращено, компания не раскрывает. Вероятно, это станет известно уже после старта продаж GPU в Китай. Что касается самой системы, то это конкурент Nvidia A100 — это тоже ускоритель, который используется во многих отраслях, связанных с ИИ, включая обучение больших языковых моделей, включая GPT. Производительность GPU от Intel примерно равна производительности системы конкурента, во всяком случае, при использовании бенчмарков ResNet-50 и BERT.

Вероятно, подобных примеров сотрудничества между китайскими и американскими компаниями можно ожидать и в будущем. Дело в том, что многие представители бизнеса не согласны с санкциями США в отношении Китая. Например, финансовый директор Nvidia Коллет Кресс (Colette Kress) заявил о том, что что ограничения поставок в Китай оборудования для искусственного интеллекта «приведут к постоянной потере возможностей для промышленности США».

Возможно, эти тексты тоже вас заинтересуют:

Рутина продакта: путешествие из ХЗ в ТЗ
«20% оборудования не приедет в срок, а 10% — не приедет никогда». Параллельный импорт глазами провайдера инфраструктуры
Учимся разрабатывать REST API на Go на примере сокращателя ссылок

Комментарии (17)


  1. Nick_Shl
    14.08.2023 00:39
    +4

    Не понимаю я этих маркетологов...

    А100 под названием А800. Его отличием от оригинала стала пониженная примерно на треть 

    Почему не A67?

    не H100, а Н800.

    ... Так, если у H100 это 300 Гбит/с, то у китайской версии — всего 150 Гбит/с.

    Почему не H50?


    1. wazzard
      14.08.2023 00:39
      +16

      Китайцы любят восьмерки


    1. dragonnur
      14.08.2023 00:39

      Потому что маркетинг!


  1. mishkin79
    14.08.2023 00:39

    А можно натренировать ИИ чтобы он выдал варианты реализации физической базы для собственного экзистенциализма? Варианты "хочу быть кисой" не рассматривать.


  1. ivankudryavtsev
    14.08.2023 00:39

    Вообще, пропускная способность этой самой шины не всегда является ограничением, так что ускорители вполне себе можно считать полноценными для многих задач. Особенно, если не тренировать модели, а делать инференс правильным способом. А hpc может быть Китаю не так и нужен, как цифровой концлагерь.


    1. CKA304HUK
      14.08.2023 00:39

      Почти во всех этих AI'х, когда ты оптимизировал все (инференс и тренинг) - ты уткнулся в IO. Если повезло - в ио на борту карты, если не повезло - в ио на материнке.


      1. ivankudryavtsev
        14.08.2023 00:39

        Объясните насчет лимита пропускной способности на pci-e gen4 для инференса, скажем видео?


        1. ivankudryavtsev
          14.08.2023 00:39

          64 потока hevc 4k залетают в gpu, требуя меньше 1 гбит/сек пропускной способности.


  1. Arhammon
    14.08.2023 00:39
    +2

    Интересно по цене их продают дороже не урезанных? А-то бизнес 100500 левла - продать на хайпе кучу неконкурентоспособных, по сравнению с неурезанными, ускорителей. И бабки есть и рынок не перегреется...

    По-моему это не Китай пользуется лазейкой, а Китаем пользуются...


    1. nidalee
      14.08.2023 00:39
      +4

      А какие у них еще варианты? Либо урезанные, либо никаких. Тут можно даже и больше ценники заряжать, никуда с подводной лодки не денутся...


    1. Hardcoin
      14.08.2023 00:39
      +8

      В России берут автомобили по двойной цене. Вариантов мало.


    1. VitalySh
      14.08.2023 00:39
      -1

      Аппаратная начинка, количество транзисторов - всё такое же. Плюс партии очевидно меньше. То есть стоимость производства для NVIDIA как минимум не меньше, чем у оригиналов.
      По всем правилам такие урезанные адаптеры должны быть дороже, но никак не дешевле.


  1. DGN
    14.08.2023 00:39

    Почему не сделали оригинальный чип с защитой, ну как от майнинга? После продажи китайские хакеры взломали, и ни к кому нет вопросов.


    1. Nick_Shl
      14.08.2023 00:39

      А зачем?


    1. u007
      14.08.2023 00:39

      Вот тоже любопытно, андерклокинг у А800, часом, не джампером на плате выполняется?


  1. bit8
    14.08.2023 00:39

    Я так и не понял из статьи, где именно урезание. На программном уровне или чипы просто слабее.

    Просто если программный уровень, то его могут обойти, а вот если чипы сразу произведены слабее, то, к сожалению, не обойти.


    1. sa1ntik
      14.08.2023 00:39

      Я так и не понял из статьи, где именно урезание. На программном уровне или чипы просто слабее.

      Просто если программный уровень, то его могут обойти, а вот если чипы сразу произведены слабее, то, к сожалению, не обойти.

      А вы как себе это представляете? Допустим что одна компания фиктивно продаёт другой компании искусственно заторможенный товар. Делает это исключительно для того, чтобы обойти ограничения регулятора.

      И представители этих обеих компаний такие "да так то вообще фигня, одной перемыкой разгоняется", да?

      Думаю, тут немного не тот масштаб денег и власти, чтобы факт лёгкого оверклокинга(вернее приведения в норму) был публичен и широко известен.