Торговый конфликт Китая и США продолжается. Вот-вот Соединенные Штаты могут ввести новые ограничения на поставку Китаю современных чипов, включая ИИ-ускорители. После введения в силу новых экспортных запретов, не имея возможности пополнить запасы, у Китая могут начаться серьезные проблемы. Поэтому Поднебесная не ждет появления новых санкций, а пытается решить эти, пока что вероятные, проблемы массовыми закупками ускорителей. Подробности — под катом.
Что снова происходит?
Китайские компании выделают миллиарды долларов США на закупки разного оборудования в США и других странах, которые зависят от технологий Штатов. Делается это для того, чтобы накопить солидные запасы электронных систем и компонентов, которые нужны китайским компаниям. По данным Financial Times, они уже потратили свыше $5 млрд на закупки, в том числе, ИИ-ускорителей.
Сейчас Китай не может покупать (во всяком случае, официально) ускорители А100 и Н100. Но Nvidia ранее выпустила искусственно урезанные версии этих систем, А800 и Н800. Сделано это для обхода экспортных ограничений.
Среди тех компаний, которые закупают ускорители — AliExpress, ByteDance (компания, создавшая TikTok) и u Baidu вместе с Tencent. По данным аналитиков, указанные компании оформили предзаказ примерно на 100 тыс. ускорителей. И это лишь 20% об планируемого объема закупок.
Зачем все это? Дело в том, что такого рода ускорители используются в системах для высокопроизводительных вычислений. В том числе, суперкомпьютеров, отрасли, в которой Китай традиционно силен, а также ИИ-отрасли.
Nvidia обязалась предоставить ИИ-ускорители до конца 2023 года — во всяком случае, большей части заказчиков из Китая. Поднебесная надеется приобрести до 1 млн ускорителей к концу 2024 года — именно тогда США могут ввести новые санкции.
Почему Nvidia не может поставлять более продвинутые ускорители?
Это на все 100% американская компания. Соответственно, она обязана соблюдать правила экспорта, установленные регуляторами США. В целом, она так и делает, но есть и небольшие хитрости, позволяющие продолжать поставки современного оборудования покупателям из Китая.
Сначала появилась урезанная версию ускорителя А100 под названием А800. Его отличием от оригинала стала пониженная примерно на треть скорость двунаправленной передачи данных (bidirectional transfer rate; BTR), что и позволило обойти новые ограничения.
Ну а чуть позже появилась и урезанная версия Н100, которую Nvidia модифицирует для китайских потребителей. Кастомизированная версия системы продается под другим названием — не H100, а Н800.
Насколько известно, вариант системы, которая поставляется в Китай, искусственно «замедлен». Т.е. у ускорителя сниженные характеристики пропускной способности. Так, если у H100 это 300 Гбит/с, то у китайской версии — всего 150 Гбит/с.
Что касается характеристик «оригинала», т.е. модели Н100, то она включает 80 млрд транзисторов. Кроме того, это первый в мире укоритель с поддержкой шины PCIe Gen5 и высокоскоростной оперативной памяти HBM3. Впечатляет и пропускная способность памяти — около 3 ТБ/с.
Благодаря новой высокопроизводительной шине NVLink, между собой можно соединить сразу 256 ускорителей Н100. Конечно, система с такими характеристиками не могла пройти мимо внимания китайских корпораций. Ну а Nvidia не хочет терять клиентов, ведь китайский рынок поистине огромен, кому захочется упустить доход в сотни миллионов долларов США?
Американская компания разработала урезанные версии ускорителей в конце 2022 года, практически сразу после того, как американские власти ужесточили правила поставок в Китай различных hi-tech технологий.
Понятно, что такие мощные ускорители покупают не частные лица или небольшие компании, а мощнейшие корпорации из КНР. Все те, у кого есть дата-центры и развернутая облачная инфраструктура.
Intel тоже не хочет терять китайский рынок
Не только Nvidia, но и Intel тоже не желает терять покупателей из Поднебесной. Ранее стало известно о том, что корпорация Intel начнет продажу Китаю ускорителей Habana Gaudi 2. Как и в случае систем от Nvidia, они предназначены для работы с задачами глубинного обучения и инференса (обеспечение работы предварительно обученной нейросети на конечном устройстве). При этом сам по себе ускоритель — система, которую нельзя в текущем виде поставлять в Китай, в силу ограничений, наложенных США на эту страну.
Для того, чтобы обойти ограничения и получить прибыль, Intel изготовит экспортный вариант Gaudi. Если раньше прилагательное «экспортный» подразумевало улучшенную версию экспортируемого товара, будь это автомобиль, пиво или что-то еще. То в случае Intel все наоборот — Gaudi несколько урежут в функциональности. В таком виде GPU и будут продавать в КНР, не опасаясь проблем с регуляторными органами США.
К сожалению, что именно будет урезано/сокращено, компания не раскрывает. Вероятно, это станет известно уже после старта продаж GPU в Китай. Что касается самой системы, то это конкурент Nvidia A100 — это тоже ускоритель, который используется во многих отраслях, связанных с ИИ, включая обучение больших языковых моделей, включая GPT. Производительность GPU от Intel примерно равна производительности системы конкурента, во всяком случае, при использовании бенчмарков ResNet-50 и BERT.
Вероятно, подобных примеров сотрудничества между китайскими и американскими компаниями можно ожидать и в будущем. Дело в том, что многие представители бизнеса не согласны с санкциями США в отношении Китая. Например, финансовый директор Nvidia Коллет Кресс (Colette Kress) заявил о том, что что ограничения поставок в Китай оборудования для искусственного интеллекта «приведут к постоянной потере возможностей для промышленности США».
Возможно, эти тексты тоже вас заинтересуют:
→ Рутина продакта: путешествие из ХЗ в ТЗ
→ «20% оборудования не приедет в срок, а 10% — не приедет никогда». Параллельный импорт глазами провайдера инфраструктуры
→ Учимся разрабатывать REST API на Go на примере сокращателя ссылок
Комментарии (17)
mishkin79
14.08.2023 00:39А можно натренировать ИИ чтобы он выдал варианты реализации физической базы для собственного экзистенциализма? Варианты "хочу быть кисой" не рассматривать.
ivankudryavtsev
14.08.2023 00:39Вообще, пропускная способность этой самой шины не всегда является ограничением, так что ускорители вполне себе можно считать полноценными для многих задач. Особенно, если не тренировать модели, а делать инференс правильным способом. А hpc может быть Китаю не так и нужен, как цифровой концлагерь.
CKA304HUK
14.08.2023 00:39Почти во всех этих AI'х, когда ты оптимизировал все (инференс и тренинг) - ты уткнулся в IO. Если повезло - в ио на борту карты, если не повезло - в ио на материнке.
ivankudryavtsev
14.08.2023 00:39Объясните насчет лимита пропускной способности на pci-e gen4 для инференса, скажем видео?
ivankudryavtsev
14.08.2023 00:3964 потока hevc 4k залетают в gpu, требуя меньше 1 гбит/сек пропускной способности.
Arhammon
14.08.2023 00:39+2Интересно по цене их продают дороже не урезанных? А-то бизнес 100500 левла - продать на хайпе кучу неконкурентоспособных, по сравнению с неурезанными, ускорителей. И бабки есть и рынок не перегреется...
По-моему это не Китай пользуется лазейкой, а Китаем пользуются...
nidalee
14.08.2023 00:39+4А какие у них еще варианты? Либо урезанные, либо никаких. Тут можно даже и больше ценники заряжать, никуда с подводной лодки не денутся...
VitalySh
14.08.2023 00:39-1Аппаратная начинка, количество транзисторов - всё такое же. Плюс партии очевидно меньше. То есть стоимость производства для NVIDIA как минимум не меньше, чем у оригиналов.
По всем правилам такие урезанные адаптеры должны быть дороже, но никак не дешевле.
bit8
14.08.2023 00:39Я так и не понял из статьи, где именно урезание. На программном уровне или чипы просто слабее.
Просто если программный уровень, то его могут обойти, а вот если чипы сразу произведены слабее, то, к сожалению, не обойти.
sa1ntik
14.08.2023 00:39Я так и не понял из статьи, где именно урезание. На программном уровне или чипы просто слабее.
Просто если программный уровень, то его могут обойти, а вот если чипы сразу произведены слабее, то, к сожалению, не обойти.
А вы как себе это представляете? Допустим что одна компания фиктивно продаёт другой компании искусственно заторможенный товар. Делает это исключительно для того, чтобы обойти ограничения регулятора.
И представители этих обеих компаний такие "да так то вообще фигня, одной перемыкой разгоняется", да?
Думаю, тут немного не тот масштаб денег и власти, чтобы факт лёгкого оверклокинга(вернее приведения в норму) был публичен и широко известен.
Nick_Shl
Не понимаю я этих маркетологов...
Почему не A67?
Почему не H50?
wazzard
Китайцы любят восьмерки
dragonnur
Потому что маркетинг!