Статья - частичный перевод поста на Rest Of World: China’s chip startups are racing to replace Nvidia и собственного дополнения (характеристики и сравнения с ближайшими аналогами от Nvidia). Для сбора информации о железе использовался в том числе Perplexity Deep Research.
После введения экспортного контроля США за чипами ИИ, китайские инвесторы присматриваются к локальным стартапам-производителям ИИ-чипов. А те на инвестициях переманивают экс-сотрудников Nvidia.
DeepSeek в прошлом месяце заявила, что новая версия модели совместима с китайскими AI-чипами, которые будут выпущены в ближайшее время. Это вызвало всплеск интереса к нескольким китайским производителям.
На фондовом рынке технологических компаний Китая - стартап-разработчик чипов Cambricon стал самой дорогой акцией на рынке.
Инвесторы делают ставки на то, что экспортный контроль США заставит Китай ускорить развитие собственной чип-экосистемы для снижения зависимости. Группа китайских компаний по производству чипов и AI-моделей недавно объявила о создании альянса (чип + модель) для обеспечения технологической независимости, а компании разработчики AI-чипов готовят IPO, пока инвесторами интересно.

Стартапы со своими ИИ-чипами
Cambricon Technologies
Cambricon была основана в 2016 году двумя братьями, Чэнь Юньцзи и Чэнь Тяньши. Оба учились в престижной молодёжной программе в Китайском университете науки и технологий, известном подготовкой научных вундеркиндов.
Старший Чэнь, сейчас ему 42 года, покинул Cambricon, чтобы работать исследователем в государственном исследовательском институте Китайской академии наук, а младший Чэнь, 40 лет, остался председателем компании.
После размещения акций в Шанхае в 2020 году компания получала большую часть доходов от нескольких крупных государственных дата-центров, при этом фиксируя большие убытки. В 2024 году она запустила свой 7-нанометровый AI-чип Siyuan 590, смоделированный по образцу Nvidia A100, и впервые стала прибыльной.
Текущие чипы Cambricon:
Siyuan 590 (2024):
Процесс: 7нм (SMIC)
FP32: 24 TFLOPS (~80% от A100)
INT8: 512 TOPS (vs 624 TOPS у A100)
Память: 32GB HBM2
Пропускная способность памяти: 1,2 TB/s
Ближайший аналог: Nvidia A100 (2020) — отстает на ~4 года

Siyuan 690 (в разработке, 2025-2026):
Ожидается производительность близкая к Nvidia H100
Цель: сократить разрыв с H100 до 2-3 лет
В 2022 году Cambricon была добавлена в Список субъектов под ограничениями и санкциями США. Это заблокировало размещение заказов у Taiwan Semiconductor Manufacturing Company (TSMC).
Moore Threads
Пекинская Moore Threads была основана в 2020 году Джеймсом Чжан Цзяньчжуном, который ранее работал глобальным вице-президентом Nvidia и генеральным менеджером в Китае. Два других со-основателя также ранее работали в Nvidia.
MTT S80 (2022):
Процесс: TSMC 12нм
FP32: ~10-12 TFLOPS
Память: 32GB GDDR6X
Ближайший аналог: Nvidia RTX 3090/RTX 4090 (игровые чипы)

MTT S4000 (2023-2024):
Улучшенная архитектура для AI/ML
FP16: ~80-120 TFLOPS (оценка)
Поддержка DeepSeek и Qwen моделей
Ближайший аналог: между A100 и H100 по производительности
Moore Threads была добавлена в санкционный список субъектов США в 2023 году. Сейчас убыточная, компания подала заявку на IPO в Шанхае в июле и планирует привлечь около 8 миллиардов юаней ($1,1 миллиарда).
Biren Technology
Шанхайская Biren была основана в 2019 году Чжан Вэнем, выпускником Гарварда и бывшим президентом AI-компании SenseTime. Два других со-основателя с опытом работы в Qualcomm, Nvidia и Advanced Micro Devices (AMD) с тех пор покинули компанию.
BR100 (2022):
Процесс: TSMC 7нм
Транзисторы: 77 миллиардов
FP32: 256 TFLOPS vs 19,5 TFLOPS у A100
BF16: 1024 TFLOPS vs 312 TFLOPS у A100 (без sparsity)
INT8: 2048 TOPS vs 624 TOPS у A100
Память: 64GB HBM2E
Пропускная способность: 1,64 TB/s
Энергопотребление: 550W vs 400W у A100
Ближайший аналог: Nvidia A100/H100 — заявляет превосходство над A100

BR104 (2022):
Половина мощности BR100
FP32: 128 TFLOPS
INT8: 1024 TOPS
Память: 32GB HBM2E
Энергопотребление: 300W
Ближайший аналог: Nvidia A40/RTX A6000
Biren была добавлена в Список субъектов под ограничениями и санкциями США в 2023 году и была оценена в $2 миллиарда перед раундом финансирования в июне. Планирует разместиться в Гонконге.
MetaX
MetaX со штаб-квартирой в Шанхае была основана в 2020 году бывшим топ-менеджером AMD Чэнь Вэйляном. Недавно она представила новый чип C600, разработанный для поддержки обучения и инференса AI.
C500 серия (2023):
Процесс: 7нм
Производительность: сравнимо с Nvidia A100 (2020)
Ближайший аналог: Nvidia A100 — отстает на 3-4 года

C600 (2024-2025):
Улучшенная архитектура с продвинутой упаковкой
Повышенное энергопотребление за счет производительности
Слегка пониженная пропускная способность межкарточных соединений
Ближайший аналог: между A100 и H100
C700 серия (в разработке):
Цель: производительность Nvidia H100
Ожидается к 2025-2026 году
Ближайший аналог: Nvidia H100 (2022) — отстаёт на 3-4 года
MetaX страдала от нехватки площадок производства и упростила дизайны для производства на TSMC. Не наложены ограничения США. Планирует привлечь $545 миллионов в рамках IPO в Шанхае.
Enflame
Enflame была основана в 2018 году бывшими топ-менеджерами AMD Чжао Лидуном и Чжан Ялином. Поддерживаемая Tencent компания поставляла чипы нескольким местным дата-центрам.
Yunsu i20 (2021):
Процесс: GlobalFoundries 12нм
FP32: 32 TFLOPS vs 19,5 TFLOPS у A100
TF32: 128 TFLOPS vs 156 TFLOPS у A100
FP16/BF16: 128 TFLOPS vs 312 TFLOPS у A100
INT8: 256 TOPS vs 624 TOPS у A100
Память: 16GB HBM2e
Пропускная способность: 819 GB/s
Ближайший аналог: между A40 и A100
GCU-CARE 2.5 (текущий):
В 1.8 раза лучше FP производительности предшественника
В 3.6 раза лучше INT вычислений
Энергоэффективность сравнимая с 7нм GPU
Ближайший аналог: Nvidia A100 уровня
Enflame не находится в торговых чёрных списках США, поэтому имеет доступ к TSMC. Также планирует стать публичной.
Hygon Information Technology
Чиповый бизнес Hygon начался в 2016 году, когда её китайская материнская компания создала совместное предприятие с AMD и лицензировала архитектуру дизайна чипов x86.
DCU C86 серия:
Основано на лицензированной архитектуре AMD GCN
Производительность сравнима с AMD RX Vega уровня
Ближайший аналог: AMD MI25/MI50 поколения

В 2019 году Hygon была добавлена в Список субъектов под ограничениями и санкциями США. AMD прекратила поддержку, и Hygon заявила, что смогла продолжить работу с собственными технологиями.
Техгиганты и их чиповые решения
Huawei Ascend: серьёзный конкурент H100
Huawei разработала линейку чипов Ascend, использующих собственную архитектуру Da Vinci.
Ascend 910B (2023):
Процесс: SMIC 7нм
FP16: ~1000+ TFLOPS (оценочно)
Память: 64GB HBM
Ближайший аналог: между A100 и H100
Ascend 910C (2024):

Производительность FP16: ~800 TFLOPS vs 989 TFLOPS у H100
Память: 128GB HBM3 (превосходит 80GB у H100)
Энергопотребление: ~310W vs 700W у H100
Практическая производительность: 60% от Nvidia H100 в задачах инференса
Ближайший аналог: Nvidia H100 — достигает 60% производительности
Ascend 920 (2025):
Ожидается дальнейшее сближение с H100 по производительности
FP16: ~900 TFLOPS (прогноз)
Baidu Kunlun: трёхкратный рост производительности

Kunlun 1 (2019):
Процесс: Samsung 14нм
INT8: 256 TOPS
FP16: 64 TOPS
FP32: 16 TFLOPS
Ближайший аналог: Nvidia V100 уровня
Kunlun 2 (2021):
Процесс: 7нм
INT8: 512-768 TOPS (сравнимо с 624 TOPS у A100)
FP16: 128-192 TOPS vs 312 TOPS у A100
FP32: 32-48 TFLOPS vs 19,5 TFLOPS у A100
В 2-3 раза выше производительность предшественника
Ближайший аналог: Nvidia A100 — сравнимая производительность в некоторых задачах
Core P800:
На 20-50% лучше производительности в 8-битном инференсе
Оптимизация для специфических AI задач
Alibaba: сразу ARM и RISC-V
Yitian 710 (ARM серверный, 2021):
Процесс: TSMC 5нм
Ядра: 128 ARMv9, 3,2 GHz
Транзисторы: 60 миллиардов
SPECint2017 score: 440
На 20% выше производительности и на 50% энергоэффективнее современных ARM-серверов
Ближайший аналог: ARM Neoverse N2 уровня
XuanTie C930 (RISC-V для AI/HPC, 2025):

Частота: до 3,4 GHz
SPECint2006 score: 15,2/GHz (в 2 раза выше C920)
Поддержка векторных вычислений до 512-bit
Специальный тензорный движок TPE с 96,8% утилизацией
Ближайший аналог: специализированный AI-ускоритель уровня Google TPU
Прогнозы
Какая компания заполнит пустоту Nvidia, пока неясно. Huawei - текущий лидер рынка. Многие другие разработчики чипов пытаются побороть дороговизну исследований и разработки, небольшую клиентскую базу из гос. предприятий, попаданием в чёрные списки США и ограниченными производственными мощностями по изготовлению чипов.
"Успех отечественных производителей AI-чипов будет зависеть от их успеха в обеспечении коммерческих партнёров, помимо государственных компаний," - сказал Рэй Ван, аналитик по полупроводникам исследовательской компании The Futurum Group.
"В глобальном масштабе для GPU действительно есть только два крупнейших победителя, и все остальные стартапы борются или имеют ограниченные доли рынка. Что-то подобное произойдёт в Китае — возможно, выживут топ-3 компании," - сказал он.
Мини-рейтинг: китайские чипы относительно западных конкурентов:
Топовый уровень (60-80% производительности от западных лидеров):
Huawei Ascend 910C: 60% от H100, превосходит по памяти и энергоэффективности
Biren BR100: заявляет превосходство над A100, но используется TSMC 7nm
Средний уровень (40-60% от лидеров):
Cambricon Siyuan 590: 80% от A100 (опаздывает на 4 года)
Baidu Kunlun 2: сравнимо с A100 в некоторых задачах
Enflame Yunsu i20: между A40 и A100
Догоняющие (20-40% от лидеров):
Moore Threads S4000: игровой GPU
MetaX C600: уровня A100 с опозданием в несколько лет
Почему отстают?
Производственные процессы: 7nm SMIC против 4nm TSMC у лидеров
Нету доступа к EUV-литографии: ограничивает переход на 5nm и меньше
Память: меньшие объемы HBM и пропускная способность
Экосистема софта: CUDA остается стандартом де-факто
Энергоэффективность: часто хуже на единицу производительности
Перспективы:
Китайские производители демонстрируют впечатляющие темпы развития. За 5 лет они смогли создать чипы, обеспечивающие 60-80% производительности мировых лидеров. Это достаточно для большинства внутренних применений и обучения моделей. Но ограничения в доступе к передовым технологиям производства означают, что полное технологическое равенство в среднесрочной перспективе все еще сложная задача.
PS: если вам нравятся посты про ИИ в менеджменте, метрики команд и продуктовые стартапы - буду рад видеть вас в моем телеграм-канале. Этот пост не очень характерен сему блогу, но было интересно поисследовать тему.
Комментарии (8)
Liprekon
07.09.2025 07:03А почему сравнивание идёт с h100? Вы говорите что есть у китайцев на данный момент и сравнивание со старой h100... Есть h200 и с ней надо бы сравнивать в 2025г. А то это сравнение идёт как Эльбрус и пентиум 4!
Eskimo Автор
07.09.2025 07:03Логика такая: H100 это де факто самый массовый GPU на рынке и по нему удобнее сравнивать - так как ты сравниваешь с базовым рыночным решением (а не премиумом, который ему сейчас H200).
Если с 200й сравнивать, там разрыв космически растет :)
ivankudryavtsev
Фантастические твари и где они обитают…