Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia / AMD / forpes.ru

Главная
Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia / AMD

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia / AMD +5

07.09.2025 07:00

Eskimo 11 3400 Источник

Статья - частичный перевод поста на Rest Of World: China’s chip startups are racing to replace Nvidia и собственного дополнения (характеристики и сравнения с ближайшими аналогами от Nvidia). Для сбора информации о железе использовался в том числе Perplexity Deep Research.

После введения экспортного контроля США за чипами ИИ, китайские инвесторы присматриваются к локальным стартапам-производителям ИИ-чипов. А те на инвестициях переманивают экс-сотрудников Nvidia.

DeepSeek в прошлом месяце заявила, что новая версия модели совместима с китайскими AI-чипами, которые будут выпущены в ближайшее время. Это вызвало всплеск интереса к нескольким китайским производителям.

На фондовом рынке технологических компаний Китая - стартап-разработчик чипов Cambricon стал самой дорогой акцией на рынке.

Инвесторы делают ставки на то, что экспортный контроль США заставит Китай ускорить развитие собственной чип-экосистемы для снижения зависимости. Группа китайских компаний по производству чипов и AI-моделей недавно объявила о создании альянса (чип + модель) для обеспечения технологической независимости, а компании разработчики AI-чипов готовят IPO, пока инвесторами интересно.

Стартапы со своими ИИ-чипами

Cambricon Technologies

Cambricon была основана в 2016 году двумя братьями, Чэнь Юньцзи и Чэнь Тяньши. Оба учились в престижной молодёжной программе в Китайском университете науки и технологий, известном подготовкой научных вундеркиндов.

Старший Чэнь, сейчас ему 42 года, покинул Cambricon, чтобы работать исследователем в государственном исследовательском институте Китайской академии наук, а младший Чэнь, 40 лет, остался председателем компании.

После размещения акций в Шанхае в 2020 году компания получала большую часть доходов от нескольких крупных государственных дата-центров, при этом фиксируя большие убытки. В 2024 году она запустила свой 7-нанометровый AI-чип Siyuan 590, смоделированный по образцу Nvidia A100, и впервые стала прибыльной.

Текущие чипы Cambricon:

Siyuan 590 (2024):

Процесс: 7нм (SMIC)
FP32: 24 TFLOPS (~80% от A100)
INT8: 512 TOPS (vs 624 TOPS у A100)
Память: 32GB HBM2
Пропускная способность памяти: 1,2 TB/s
Ближайший аналог: Nvidia A100 (2020) — отстает на ~4 года

Siyuan 690 (в разработке, 2025-2026):

Ожидается производительность близкая к Nvidia H100
Цель: сократить разрыв с H100 до 2-3 лет

В 2022 году Cambricon была добавлена в Список субъектов под ограничениями и санкциями США. Это заблокировало размещение заказов у Taiwan Semiconductor Manufacturing Company (TSMC).

Moore Threads

Пекинская Moore Threads была основана в 2020 году Джеймсом Чжан Цзяньчжуном, который ранее работал глобальным вице-президентом Nvidia и генеральным менеджером в Китае. Два других со-основателя также ранее работали в Nvidia.

MTT S80 (2022):

Процесс: TSMC 12нм
FP32: ~10-12 TFLOPS
Память: 32GB GDDR6X
Ближайший аналог: Nvidia RTX 3090/RTX 4090 (игровые чипы)

MTT S4000 (2023-2024):

Улучшенная архитектура для AI/ML
FP16: ~80-120 TFLOPS (оценка)
Поддержка DeepSeek и Qwen моделей
Ближайший аналог: между A100 и H100 по производительности

Moore Threads была добавлена в санкционный список субъектов США в 2023 году. Сейчас убыточная, компания подала заявку на IPO в Шанхае в июле и планирует привлечь около 8 миллиардов юаней ($1,1 миллиарда).

Biren Technology

Шанхайская Biren была основана в 2019 году Чжан Вэнем, выпускником Гарварда и бывшим президентом AI-компании SenseTime. Два других со-основателя с опытом работы в Qualcomm, Nvidia и Advanced Micro Devices (AMD) с тех пор покинули компанию.

BR100 (2022):

Процесс: TSMC 7нм
Транзисторы: 77 миллиардов
FP32: 256 TFLOPS vs 19,5 TFLOPS у A100
BF16: 1024 TFLOPS vs 312 TFLOPS у A100 (без sparsity)
INT8: 2048 TOPS vs 624 TOPS у A100
Память: 64GB HBM2E
Пропускная способность: 1,64 TB/s
Энергопотребление: 550W vs 400W у A100
Ближайший аналог: Nvidia A100/H100 — заявляет превосходство над A100

BR104 (2022):

Половина мощности BR100
FP32: 128 TFLOPS
INT8: 1024 TOPS
Память: 32GB HBM2E
Энергопотребление: 300W
Ближайший аналог: Nvidia A40/RTX A6000

Biren была добавлена в Список субъектов под ограничениями и санкциями США в 2023 году и была оценена в $2 миллиарда перед раундом финансирования в июне. Планирует разместиться в Гонконге.

MetaX

MetaX со штаб-квартирой в Шанхае была основана в 2020 году бывшим топ-менеджером AMD Чэнь Вэйляном. Недавно она представила новый чип C600, разработанный для поддержки обучения и инференса AI.

C500 серия (2023):

Процесс: 7нм
Производительность: сравнимо с Nvidia A100 (2020)
Ближайший аналог: Nvidia A100 — отстает на 3-4 года

C600 (2024-2025):

Улучшенная архитектура с продвинутой упаковкой
Повышенное энергопотребление за счет производительности
Слегка пониженная пропускная способность межкарточных соединений
Ближайший аналог: между A100 и H100

C700 серия (в разработке):

Цель: производительность Nvidia H100
Ожидается к 2025-2026 году
Ближайший аналог: Nvidia H100 (2022) — отстаёт на 3-4 года

MetaX страдала от нехватки площадок производства и упростила дизайны для производства на TSMC. Не наложены ограничения США. Планирует привлечь $545 миллионов в рамках IPO в Шанхае.

Enflame

Enflame была основана в 2018 году бывшими топ-менеджерами AMD Чжао Лидуном и Чжан Ялином. Поддерживаемая Tencent компания поставляла чипы нескольким местным дата-центрам.

Yunsu i20 (2021):

Процесс: GlobalFoundries 12нм
FP32: 32 TFLOPS vs 19,5 TFLOPS у A100
TF32: 128 TFLOPS vs 156 TFLOPS у A100
FP16/BF16: 128 TFLOPS vs 312 TFLOPS у A100
INT8: 256 TOPS vs 624 TOPS у A100
Память: 16GB HBM2e
Пропускная способность: 819 GB/s
Ближайший аналог: между A40 и A100

GCU-CARE 2.5 (текущий):

В 1.8 раза лучше FP производительности предшественника
В 3.6 раза лучше INT вычислений
Энергоэффективность сравнимая с 7нм GPU
Ближайший аналог: Nvidia A100 уровня

Enflame не находится в торговых чёрных списках США, поэтому имеет доступ к TSMC. Также планирует стать публичной.

Hygon Information Technology

Чиповый бизнес Hygon начался в 2016 году, когда её китайская материнская компания создала совместное предприятие с AMD и лицензировала архитектуру дизайна чипов x86.

DCU C86 серия:

Основано на лицензированной архитектуре AMD GCN
Производительность сравнима с AMD RX Vega уровня
Ближайший аналог: AMD MI25/MI50 поколения

В 2019 году Hygon была добавлена в Список субъектов под ограничениями и санкциями США. AMD прекратила поддержку, и Hygon заявила, что смогла продолжить работу с собственными технологиями.

Техгиганты и их чиповые решения

Huawei Ascend: серьёзный конкурент H100

Huawei разработала линейку чипов Ascend, использующих собственную архитектуру Da Vinci.

Ascend 910B (2023):

Процесс: SMIC 7нм
FP16: ~1000+ TFLOPS (оценочно)
Память: 64GB HBM
Ближайший аналог: между A100 и H100

Ascend 910C (2024):

Производительность FP16: ~800 TFLOPS vs 989 TFLOPS у H100
Память: 128GB HBM3 (превосходит 80GB у H100)
Энергопотребление: ~310W vs 700W у H100
Практическая производительность: 60% от Nvidia H100 в задачах инференса
Ближайший аналог: Nvidia H100 — достигает 60% производительности

Ascend 920 (2025):

Ожидается дальнейшее сближение с H100 по производительности
FP16: ~900 TFLOPS (прогноз)

Baidu Kunlun: трёхкратный рост производительности

Kunlun 1 (2019):

Процесс: Samsung 14нм
INT8: 256 TOPS
FP16: 64 TOPS
FP32: 16 TFLOPS
Ближайший аналог: Nvidia V100 уровня

Kunlun 2 (2021):

Процесс: 7нм
INT8: 512-768 TOPS (сравнимо с 624 TOPS у A100)
FP16: 128-192 TOPS vs 312 TOPS у A100
FP32: 32-48 TFLOPS vs 19,5 TFLOPS у A100
В 2-3 раза выше производительность предшественника
Ближайший аналог: Nvidia A100 — сравнимая производительность в некоторых задачах

Core P800:

На 20-50% лучше производительности в 8-битном инференсе
Оптимизация для специфических AI задач

Alibaba: сразу ARM и RISC-V

Yitian 710 (ARM серверный, 2021):

Процесс: TSMC 5нм
Ядра: 128 ARMv9, 3,2 GHz
Транзисторы: 60 миллиардов
SPECint2017 score: 440
На 20% выше производительности и на 50% энергоэффективнее современных ARM-серверов
Ближайший аналог: ARM Neoverse N2 уровня

XuanTie C930 (RISC-V для AI/HPC, 2025):

Частота: до 3,4 GHz
SPECint2006 score: 15,2/GHz (в 2 раза выше C920)
Поддержка векторных вычислений до 512-bit
Специальный тензорный движок TPE с 96,8% утилизацией
Ближайший аналог: специализированный AI-ускоритель уровня Google TPU

Прогнозы

Какая компания заполнит пустоту Nvidia, пока неясно. Huawei - текущий лидер рынка. Многие другие разработчики чипов пытаются побороть дороговизну исследований и разработки, небольшую клиентскую базу из гос. предприятий, попаданием в чёрные списки США и ограниченными производственными мощностями по изготовлению чипов.

"Успех отечественных производителей AI-чипов будет зависеть от их успеха в обеспечении коммерческих партнёров, помимо государственных компаний," - сказал Рэй Ван, аналитик по полупроводникам исследовательской компании The Futurum Group.

"В глобальном масштабе для GPU действительно есть только два крупнейших победителя, и все остальные стартапы борются или имеют ограниченные доли рынка. Что-то подобное произойдёт в Китае — возможно, выживут топ-3 компании," - сказал он.

Мини-рейтинг: китайские чипы относительно западных конкурентов:

Топовый уровень (60-80% производительности от западных лидеров):

Huawei Ascend 910C: 60% от H100, превосходит по памяти и энергоэффективности
Biren BR100: заявляет превосходство над A100, но используется TSMC 7nm

Средний уровень (40-60% от лидеров):

Cambricon Siyuan 590: 80% от A100 (опаздывает на 4 года)
Baidu Kunlun 2: сравнимо с A100 в некоторых задачах
Enflame Yunsu i20: между A40 и A100

Догоняющие (20-40% от лидеров):

Moore Threads S4000: игровой GPU
MetaX C600: уровня A100 с опозданием в несколько лет

Почему отстают?

Производственные процессы: 7nm SMIC против 4nm TSMC у лидеров
Нету доступа к EUV-литографии: ограничивает переход на 5nm и меньше
Память: меньшие объемы HBM и пропускная способность
Экосистема софта: CUDA остается стандартом де-факто
Энергоэффективность: часто хуже на единицу производительности

Перспективы:

Китайские производители демонстрируют впечатляющие темпы развития. За 5 лет они смогли создать чипы, обеспечивающие 60-80% производительности мировых лидеров. Это достаточно для большинства внутренних применений и обучения моделей. Но ограничения в доступе к передовым технологиям производства означают, что полное технологическое равенство в среднесрочной перспективе все еще сложная задача.

PS: если вам нравятся посты про ИИ в менеджменте, метрики команд и продуктовые стартапы - буду рад видеть вас в моем телеграм-канале. Этот пост не очень характерен сему блогу, но было интересно поисследовать тему.

Комментарии (11)

ivankudryavtsev
07.09.2025 07:03
#28806264
Фантастические твари и где они обитают…

doitagain
07.09.2025 07:03
#28806874
В очередной раз вспомним просирание нанометров

Liprekon
07.09.2025 07:03
#28807356
А почему сравнивание идёт с h100? Вы говорите что есть у китайцев на данный момент и сравнивание со старой h100... Есть h200 и с ней надо бы сравнивать в 2025г. А то это сравнение идёт как Эльбрус и пентиум 4!
1. Eskimo Автор
  07.09.2025 07:03
  #28807650
  Логика такая: H100 это де факто самый массовый GPU на рынке и по нему удобнее сравнивать - так как ты сравниваешь с базовым рыночным решением (а не премиумом, который ему сейчас H200).
  
  Если с 200й сравнивать, там разрыв космически растет :)
1. bolk
  07.09.2025 07:03
  #28808274
  А чего ж не с B200?
  1. Eskimo Автор
    07.09.2025 07:03
    #28808350
    Так как китайцы часто сами позиционируют и сравнивают с H100, проще и реалистичнее найти сравнение с ней
    
    bolk
    07.09.2025 07:03
    #28809244
    Написано же — давайте сравним с H200, я говорю — а чего же не с B200?
    
    Где тут H100?
    
    Eskimo Автор
    07.09.2025 07:03
    #28809588
    а, не так прочел) сорян

raf329
07.09.2025 07:03
#28807380
Какой из чипов работает с CUDA?

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia / AMD +5

Стартапы со своими ИИ-чипами

Cambricon Technologies

Текущие чипы Cambricon:

Moore Threads

Biren Technology

MetaX

Enflame

Hygon Information Technology

Техгиганты и их чиповые решения

Huawei Ascend: серьёзный конкурент H100

Baidu Kunlun: трёхкратный рост производительности

Alibaba: сразу ARM и RISC-V

Прогнозы

Мини-рейтинг: китайские чипы относительно западных конкурентов:

Почему отстают?

Перспективы:

Комментарии (11)

ivankudryavtsev

doitagain

Liprekon

Eskimo Автор

bolk

Eskimo Автор

bolk

Eskimo Автор

raf329