В конце лета 2023 года мы писали о том, что Китай пользуется лазейкой с урезанными версиями ИИ-ускорителей. Дело в том, что Китай не имел возможности покупать (во всяком случае, официально) ускорители А100 и Н100. Но Nvidia ранее выпустила искусственно урезанные версии этих систем, А800 и Н800. Сделано это для обхода экспортных ограничений.

Но чуть позже США запретили ввоз в страну любых ИИ-чипов производства Nvidia, AMD и Intel. Китаю пришлось искать новые способы заполучить производительные графические чипы. Насколько можно понять, Поднебесная нашла и пока что активно пользуется таким способом. Подробности — под катом.

Санкции? Какие санкции?


Компании, указанные выше, не могут ввозить в Китай графические чипы, предназначенные для ИИ-отрасли. Дело в том, что они используют американские технологии. Соответственно, обязаны соблюдать правила экспорта, установленные регуляторами США. В целом, компании так и делают, но есть и небольшие хитрости, позволяющие продолжать поставки современного оборудования покупателям из Китая.

Например, Nvidia создала урезанную версию ускорителя А100 под названием А800. Его отличием от оригинала стала пониженная примерно на треть скорость двунаправленной передачи данных (bidirectional transfer rate; BTR), что и позволило обойти новые ограничения.

Ну а чуть позже появилась и урезанная версия Н100, которую Nvidia модифицирует для китайских потребителей. Кастомизированная версия системы продается под другим названием — не H100, а Н800.

Насколько известно, вариант системы, которая поставляется в Китай, искусственно «замедлен». Т.е. у ускорителя сниженные характеристики пропускной способности. Так, если у H100 это 300 Гбит/с, то у китайской версии — всего 150 Гбит/с.

Не только Nvidia, но и Intel тоже не желает терять покупателей из Поднебесной. Ранее стало известно о том, что корпорация Intel начала продажу Китаю ускорителей Habana Gaudi 2. Как и в случае систем от Nvidia, они предназначены для работы с задачами глубинного обучения и инференса (обеспечение работы предварительно обученной нейросети на конечном устройстве). При этом сам по себе ускоритель — система, которую нельзя в текущем виде поставлять в Китай, в силу ограничений, наложенных США на эту страну.

Но теперь все эти возможности канули в Лету, поскольку США ужесточило санкции, в результате чего ни полноценные, ни урезанные ИИ-чипы не могут поставляться в КНР.

А что предприняли китайцы?


Они стали закупать огромное количество современных игровых видеокарт Nvidia GeForce RTX 4090 производства различных компаний. Но не для создания игровых ПК, а для того, чтобы превратить графические адаптеры в ускорители для искусственного интеллекта.



Карта 4090 была выбрана потому, что это наиболее продвинутый графический адаптер в мире. Вскоре после выхода она стала дефицитом, и не только потому, что ее стали разбирать геймеры. Скорее, потому, что Китай стал закупать эти адаптеры едва ли не тоннами, несмотря на то, что стоимость одного устройства составляет примерно $2000.

К слову, сейчас и 4090 попали под запрет в плане поставок в Китай. Но еще до введения этого запрета компании КНР успели закупить огромное количество видеокарт. Предварительно была разработана схема кастомизации таких модулей, с тем, чтобы можно было превратить их в ИИ-ускорители. Китайцы разработали для них новую схему, так что после доработки 4090 карты занимают уже не 3-4 слота в блоке, а всего 2. А значит, их можно устанавливать в сервера.


Работа при этом достаточно кропотливая, поскольку приходится выполнять большинство операций вручную. Китайцы разбирают карты, ликвидируя систему охлаждения, а затем основные компоненты. Для создания ИИ-ускорителя разработана специальная плата, на которую эти компоненты и переносятся. Итоговый продукт отлично работает в серверах, выполняя нужную КНР работу.

Весь процесс достаточно сложный, почти все этапы реализуются людьми, так что приходится тщательно проверять работоспособность адаптеров. Это китайцы делают весьма тщательно. Кроме специализированного софта, вроде Furmark, карты тестируют и в приложениях искусственного интеллекта. Если с картами все хорошо, их отправляют китайским же компаниям, которые разрабатывают ИИ-продукты.

Гибридный графический адаптер закупаются операторами дата-центров Китая, компаниями, которые производят решения для ИИ-отрасли. Внутренний рынок страны действительно очень большой, так что для компаний, которые перерабатывают новые графические адаптеры, действительно есть смысл выполнять такую работу.


Ну а основу, плату без чипа 4090 и пары других компонентов, китайцы тоже продают, только уже на запчасти. Сервисные центры подобное охотно закупают, поскольку если плата видеокарты выходит из строя (физическое воздействие, серьезное выгорание разъемов питания и т.п.), что ее можно восстановить, используя донора — ту самую «голую» плату от 4090.


Ну хорошо, а что с самими картами?


Как и говорилось выше, они быстро стали дефицитом. Но сейчас США запретили компаниям поставлять в Китай и их, так что игроки рынка надеются на скорое восстановление баланса спрос/предложение. В течение относительно которого времени Китайцы создали настолько ажиотажный спрос, что и так вовсе не низкая цена на 4090-карты поднялись очень высоко. Ну а сами карты стали дефицитом.

Специалисты надеются, что после вступления запрета на поставку адаптеров китайцев спрос быстро придет в норму, а цены попадают.

Другие интересные материалы


Комментарии (28)


  1. namikiri
    26.11.2023 02:31
    +19

    Интересно, а где же эти платы производятся...


  1. interprise
    26.11.2023 02:31
    +1

    Просто для понимания. не лучшу было рейзоры поставить? или есть какието подводные камни


    1. ivankudryavtsev
      26.11.2023 02:31
      +2

      Место в датацентрах не резиновое. Райзеры по типу как в майнинг-фермах используется никому не нужны. Есть стандартные промышленные решения на 2/4/8 карт в 2 слота.


    1. Arhammon
      26.11.2023 02:31
      +3

      Единственное, что можно предположить - мешается питание, видимо настолько выгоднее делать единый питач, что проще спаять чип. чем делать кастомную разработку на основе имеющихся карт даже с компактной СО.

      Да и сама операция не факт что сильно затратная для них - отнес гербер "в соседнее здание", через день получил прототип платы, сходил в другое "соседнее здание" взял катушки с деталями, на станке 1 раз подобрал термопрофиль для снятия чипа (китайцы выпускают станции с автоматическим поднятием чипа), сделал трафарет для шаров и вперёд в продакшен. Не исключено, что вообще просушивание карт и чипов перед распайкой будет самой затратной операций...


    1. ProFfeSsoRr
      26.11.2023 02:31
      +1

      не лучшу было рейзоры поставить?

      Так они обычно и стоят в серверных корпусах, разворачивая дополнительные платы вдоль материнки, а не поперек. Не будут ж серьезные решения собирать совсем без корпусов, как в майнинг-фермах. Тут серьезный бизнес - а значит нормальные дата-центры, со стандартными 19" стойками под стандартные корпуса.


    1. ProKn1fe
      26.11.2023 02:31
      +1

      В серверах нужна полная скорость да и рейзеры не самая надёжная штука.


    1. dkashkarev
      26.11.2023 02:31

      Многие ИИ модели работают на чипах Nvidia, архитектура Radeon-ов не позволяет запускать этот софт,а партирование замедляет процесс ввода в эксплуатацию.


  1. DaneSoul
    26.11.2023 02:31
    +2

    Кастомизированная версия системы продается под другим названием — не H100, а Н800.

    Мне крайне интересно какой логикой руководствовались при даче номера версии, что урезанный 100 стал 800.


    1. ivankudryavtsev
      26.11.2023 02:31
      +1

      Ну так и конкурент LC 300 у Китайцев Tank 500. Просто учет культурных особенностей.


      1. sva89
        26.11.2023 02:31

        Или 50TFSI от Ауди как аналог 30i у БМВ / X300 у Мерседеса.


    1. GennPen
      26.11.2023 02:31
      +5

      Возможно, потому что у китайцев 8 - счастливое число. =)


  1. vaslobas
    26.11.2023 02:31
    +1

    А как в РФ обстоят дела с ИИ картами?


    1. saga111a
      26.11.2023 02:31
      +1

      на авито успешно торгуют А100 и другими. Отсюда предполагаю что все хорошо.


      1. vaslobas
        26.11.2023 02:31

        В штучных количествах, а потребность в тысячах же.


        1. saga111a
          26.11.2023 02:31

          Есть подозрения что рынок ИИ карточек в рф в целом мал и такой серый импорт остается незамеченным со стороны штатов. Я могу ошибаться конечно, но масштабы работы у нас почти во всех областях очень скупые.


          1. vaslobas
            26.11.2023 02:31

            У Яндекса, Сбера есть же свои вычислительные центры ИИ. А там уже должны быть масштабы и регулярное обновление, чтобы успевать за лидерами рынка.

            https://ru.wikipedia.org/wiki/Суперкомпьютеры_«Кристофари»


            1. bit8
              26.11.2023 02:31

              Ну так они будут скрывать ведь как покупают карточки. Не напишут на главном сайте мы купили карточки для ИИ, так и так и потратили столько и столько.
              Но думаю через позредников покупают или компании однодневки и все.


              1. vaslobas
                26.11.2023 02:31

                Так почему Китай тогда так не делает? А занимается свистопляской с кустарной переделкой 4090?


  1. Busla
    26.11.2023 02:31
    +1

    Карта 4090 была выбрана потому, что это наиболее продвинутый графический адаптер в мире.

    для ИИ используются неграфические возможности ускорителя. Но если и так судить, то на офсайте самой nvidia написано:

    NVIDIA RTX™ A6000 — самым мощным в мире графическим процессором для визуальных вычислений на настольных рабочих станциях

    (это та, что на Ampere, хотя у них уже есть ещё более интересная NVIDIA RTX™ 6000 на Ada Lovelace)


    1. bloomdido
      26.11.2023 02:31
      +7

      Какие там "неграфические возможности" вы нашли? CUDA? Tensor cores? RT cores? Контроллер питания? xD


  1. dimnsk
    26.11.2023 02:31
    -1

    >> с задачами глубинного обучения

    глубокого


    1. dimnsk
      26.11.2023 02:31

      идитенахерминусаторы вместе с хабровской тупейшей системой


  1. gaba_m
    26.11.2023 02:31
    +6

    Вспомнилась бородатая байка про японцев, закупающих советские телевизоры ради деревянных корпусов.


    1. ABy
      26.11.2023 02:31

      Есть байка что японские лазерные проекторы Casio серии xj покупали в промышленных масштабах чтобы доставать из них лазерные модули.


  1. qw1
    26.11.2023 02:31

    Что дальше? 4080, 4070Ti?


    1. balamutang
      26.11.2023 02:31

      4080Ti сначала, а там уже и 5090 подвезут


      1. qw1
        26.11.2023 02:31

        Нет, не что NVidia выпустит скоро (4080 Super только анонсировали, до 5090 ещё пару лет). А что китайцы будут скупать, когда закончатся 4090.


  1. moonland
    26.11.2023 02:31

    Селектел, давай прекращай снижение качества контента. про dgu и прочие сервера нвидиа было более интересно.

    Китайцы сами их и производят эти 4090, какой им смысл сначала делать готовое изделие, потом снимать чипы.

    никто чипы не снимает, все это высосано из пальца, фото нет, источников нет.

    Но есть путаница в материале, сначала идёт речь про снижение толщины. не знаю как 4090, а 3090 можно вполне сделать толщиной 1 слот с водяным охлаждением, даже не кастомным, стоковым. это скорее всего и есть цель, тк в сервера действительно принято запихивать не толще 2 слотов карты. там и серверных плат под это дело имеется и всем по 16 линий pci будет.

    нет никакого смысла паять чип на что к своё, быстрее не будет, а головняка - вагон.