Статья - частичный перевод поста на Rest Of World: China’s chip startups are racing to replace Nvidia и собственного дополнения (характеристики и сравнения с ближайшими аналогами от Nvidia). Для сбора информации о железе использовался в том числе Perplexity Deep Research.

После введения экспортного контроля США за чипами ИИ, китайские инвесторы присматриваются к локальным стартапам-производителям ИИ-чипов. А те на инвестициях переманивают экс-сотрудников Nvidia.

DeepSeek в прошлом месяце заявила, что новая версия модели совместима с китайскими AI-чипами, которые будут выпущены в ближайшее время. Это вызвало всплеск интереса к нескольким китайским производителям.

На фондовом рынке технологических компаний Китая - стартап-разработчик чипов Cambricon стал самой дорогой акцией на рынке.

Инвесторы делают ставки на то, что экспортный контроль США заставит Китай ускорить развитие собственной чип-экосистемы для снижения зависимости. Группа китайских компаний по производству чипов и AI-моделей недавно объявила о создании альянса (чип + модель) для обеспечения технологической независимости, а компании разработчики AI-чипов готовят IPO, пока инвесторами интересно.

Стартапы со своими ИИ-чипами

Cambricon Technologies

Cambricon была основана в 2016 году двумя братьями, Чэнь Юньцзи и Чэнь Тяньши. Оба учились в престижной молодёжной программе в Китайском университете науки и технологий, известном подготовкой научных вундеркиндов.

Старший Чэнь, сейчас ему 42 года, покинул Cambricon, чтобы работать исследователем в государственном исследовательском институте Китайской академии наук, а младший Чэнь, 40 лет, остался председателем компании.

После размещения акций в Шанхае в 2020 году компания получала большую часть доходов от нескольких крупных государственных дата-центров, при этом фиксируя большие убытки. В 2024 году она запустила свой 7-нанометровый AI-чип Siyuan 590, смоделированный по образцу Nvidia A100, и впервые стала прибыльной.

Текущие чипы Cambricon:

Siyuan 590 (2024):

  • Процесс: 7нм (SMIC)

  • FP32: 24 TFLOPS (~80% от A100)

  • INT8: 512 TOPS (vs 624 TOPS у A100)

  • Память: 32GB HBM2

  • Пропускная способность памяти: 1,2 TB/s

  • Ближайший аналог: Nvidia A100 (2020) — отстает на ~4 года

Siyuan 690 (в разработке, 2025-2026):

  • Ожидается производительность близкая к Nvidia H100

  • Цель: сократить разрыв с H100 до 2-3 лет

В 2022 году Cambricon была добавлена в Список субъектов под ограничениями и санкциями США. Это заблокировало размещение заказов у Taiwan Semiconductor Manufacturing Company (TSMC).

Moore Threads

Пекинская Moore Threads была основана в 2020 году Джеймсом Чжан Цзяньчжуном, который ранее работал глобальным вице-президентом Nvidia и генеральным менеджером в Китае. Два других со-основателя также ранее работали в Nvidia.

MTT S80 (2022):

  • Процесс: TSMC 12нм

  • FP32: ~10-12 TFLOPS

  • Память: 32GB GDDR6X

  • Ближайший аналог: Nvidia RTX 3090/RTX 4090 (игровые чипы)

MTT S4000 (2023-2024):

  • Улучшенная архитектура для AI/ML

  • FP16: ~80-120 TFLOPS (оценка)

  • Поддержка DeepSeek и Qwen моделей

  • Ближайший аналог: между A100 и H100 по производительности

Moore Threads была добавлена в санкционный список субъектов США в 2023 году. Сейчас убыточная, компания подала заявку на IPO в Шанхае в июле и планирует привлечь около 8 миллиардов юаней ($1,1 миллиарда).

Biren Technology

Шанхайская Biren была основана в 2019 году Чжан Вэнем, выпускником Гарварда и бывшим президентом AI-компании SenseTime. Два других со-основателя с опытом работы в Qualcomm, Nvidia и Advanced Micro Devices (AMD) с тех пор покинули компанию.

BR100 (2022):

  • Процесс: TSMC 7нм

  • Транзисторы: 77 миллиардов

  • FP32: 256 TFLOPS vs 19,5 TFLOPS у A100

  • BF16: 1024 TFLOPS vs 312 TFLOPS у A100 (без sparsity)

  • INT8: 2048 TOPS vs 624 TOPS у A100

  • Память: 64GB HBM2E

  • Пропускная способность: 1,64 TB/s

  • Энергопотребление: 550W vs 400W у A100

  • Ближайший аналог: Nvidia A100/H100 — заявляет превосходство над A100

BR104 (2022):

  • Половина мощности BR100

  • FP32: 128 TFLOPS

  • INT8: 1024 TOPS

  • Память: 32GB HBM2E

  • Энергопотребление: 300W

  • Ближайший аналог: Nvidia A40/RTX A6000

Biren была добавлена в Список субъектов под ограничениями и санкциями США в 2023 году и была оценена в $2 миллиарда перед раундом финансирования в июне. Планирует разместиться в Гонконге.

MetaX

MetaX со штаб-квартирой в Шанхае была основана в 2020 году бывшим топ-менеджером AMD Чэнь Вэйляном. Недавно она представила новый чип C600, разработанный для поддержки обучения и инференса AI.

C500 серия (2023):

  • Процесс: 7нм

  • Производительность: сравнимо с Nvidia A100 (2020)

  • Ближайший аналог: Nvidia A100 — отстает на 3-4 года

C600 (2024-2025):

  • Улучшенная архитектура с продвинутой упаковкой

  • Повышенное энергопотребление за счет производительности

  • Слегка пониженная пропускная способность межкарточных соединений

  • Ближайший аналог: между A100 и H100

C700 серия (в разработке):

  • Цель: производительность Nvidia H100

  • Ожидается к 2025-2026 году

  • Ближайший аналог: Nvidia H100 (2022) — отстаёт на 3-4 года

MetaX страдала от нехватки площадок производства и упростила дизайны для производства на TSMC. Не наложены ограничения США. Планирует привлечь $545 миллионов в рамках IPO в Шанхае.

Enflame

Enflame была основана в 2018 году бывшими топ-менеджерами AMD Чжао Лидуном и Чжан Ялином. Поддерживаемая Tencent компания поставляла чипы нескольким местным дата-центрам.

Yunsu i20 (2021):

  • Процесс: GlobalFoundries 12нм

  • FP32: 32 TFLOPS vs 19,5 TFLOPS у A100

  • TF32: 128 TFLOPS vs 156 TFLOPS у A100

  • FP16/BF16: 128 TFLOPS vs 312 TFLOPS у A100

  • INT8: 256 TOPS vs 624 TOPS у A100

  • Память: 16GB HBM2e

  • Пропускная способность: 819 GB/s

  • Ближайший аналог: между A40 и A100

GCU-CARE 2.5 (текущий):

  • В 1.8 раза лучше FP производительности предшественника

  • В 3.6 раза лучше INT вычислений

  • Энергоэффективность сравнимая с 7нм GPU

  • Ближайший аналог: Nvidia A100 уровня

Enflame не находится в торговых чёрных списках США, поэтому имеет доступ к TSMC. Также планирует стать публичной.

Hygon Information Technology

Чиповый бизнес Hygon начался в 2016 году, когда её китайская материнская компания создала совместное предприятие с AMD и лицензировала архитектуру дизайна чипов x86.

DCU C86 серия:

  • Основано на лицензированной архитектуре AMD GCN

  • Производительность сравнима с AMD RX Vega уровня

  • Ближайший аналог: AMD MI25/MI50 поколения

В 2019 году Hygon была добавлена в Список субъектов под ограничениями и санкциями США. AMD прекратила поддержку, и Hygon заявила, что смогла продолжить работу с собственными технологиями.

Техгиганты и их чиповые решения

Huawei Ascend: серьёзный конкурент H100

Huawei разработала линейку чипов Ascend, использующих собственную архитектуру Da Vinci.

Ascend 910B (2023):

  • Процесс: SMIC 7нм

  • FP16: ~1000+ TFLOPS (оценочно)

  • Память: 64GB HBM

  • Ближайший аналог: между A100 и H100

Ascend 910C (2024):

  • Производительность FP16: ~800 TFLOPS vs 989 TFLOPS у H100

  • Память: 128GB HBM3 (превосходит 80GB у H100)

  • Энергопотребление: ~310W vs 700W у H100

  • Практическая производительность: 60% от Nvidia H100 в задачах инференса

  • Ближайший аналог: Nvidia H100 — достигает 60% производительности

Ascend 920 (2025):

  • Ожидается дальнейшее сближение с H100 по производительности

  • FP16: ~900 TFLOPS (прогноз)

Baidu Kunlun: трёхкратный рост производительности

Kunlun 1 (2019):

  • Процесс: Samsung 14нм

  • INT8: 256 TOPS

  • FP16: 64 TOPS

  • FP32: 16 TFLOPS

  • Ближайший аналог: Nvidia V100 уровня

Kunlun 2 (2021):

  • Процесс: 7нм

  • INT8: 512-768 TOPS (сравнимо с 624 TOPS у A100)

  • FP16: 128-192 TOPS vs 312 TOPS у A100

  • FP32: 32-48 TFLOPS vs 19,5 TFLOPS у A100

  • В 2-3 раза выше производительность предшественника

  • Ближайший аналог: Nvidia A100 — сравнимая производительность в некоторых задачах

Core P800:

  • На 20-50% лучше производительности в 8-битном инференсе

  • Оптимизация для специфических AI задач

Alibaba: сразу ARM и RISC-V

Yitian 710 (ARM серверный, 2021):

  • Процесс: TSMC 5нм

  • Ядра: 128 ARMv9, 3,2 GHz

  • Транзисторы: 60 миллиардов

  • SPECint2017 score: 440

  • На 20% выше производительности и на 50% энергоэффективнее современных ARM-серверов

  • Ближайший аналог: ARM Neoverse N2 уровня

XuanTie C930 (RISC-V для AI/HPC, 2025):

  • Частота: до 3,4 GHz

  • SPECint2006 score: 15,2/GHz (в 2 раза выше C920)

  • Поддержка векторных вычислений до 512-bit

  • Специальный тензорный движок TPE с 96,8% утилизацией

  • Ближайший аналог: специализированный AI-ускоритель уровня Google TPU

Прогнозы

Какая компания заполнит пустоту Nvidia, пока неясно. Huawei - текущий лидер рынка. Многие другие разработчики чипов пытаются побороть дороговизну исследований и разработки, небольшую клиентскую базу из гос. предприятий, попаданием в чёрные списки США и ограниченными производственными мощностями по изготовлению чипов.

"Успех отечественных производителей AI-чипов будет зависеть от их успеха в обеспечении коммерческих партнёров, помимо государственных компаний," - сказал Рэй Ван, аналитик по полупроводникам исследовательской компании The Futurum Group.

"В глобальном масштабе для GPU действительно есть только два крупнейших победителя, и все остальные стартапы борются или имеют ограниченные доли рынка. Что-то подобное произойдёт в Китае — возможно, выживут топ-3 компании," - сказал он.

Мини-рейтинг: китайские чипы относительно западных конкурентов:

Топовый уровень (60-80% производительности от западных лидеров):

  • Huawei Ascend 910C: 60% от H100, превосходит по памяти и энергоэффективности

  • Biren BR100: заявляет превосходство над A100, но используется TSMC 7nm

Средний уровень (40-60% от лидеров):

  • Cambricon Siyuan 590: 80% от A100 (опаздывает на 4 года)

  • Baidu Kunlun 2: сравнимо с A100 в некоторых задачах

  • Enflame Yunsu i20: между A40 и A100

Догоняющие (20-40% от лидеров):

  • Moore Threads S4000: игровой GPU

  • MetaX C600: уровня A100 с опозданием в несколько лет

Почему отстают?

  1. Производственные процессы: 7nm SMIC против 4nm TSMC у лидеров

  2. Нету доступа к EUV-литографии: ограничивает переход на 5nm и меньше

  3. Память: меньшие объемы HBM и пропускная способность

  4. Экосистема софта: CUDA остается стандартом де-факто

  5. Энергоэффективность: часто хуже на единицу производительности

Перспективы:

Китайские производители демонстрируют впечатляющие темпы развития. За 5 лет они смогли создать чипы, обеспечивающие 60-80% производительности мировых лидеров. Это достаточно для большинства внутренних применений и обучения моделей. Но ограничения в доступе к передовым технологиям производства означают, что полное технологическое равенство в среднесрочной перспективе все еще сложная задача.

PS: если вам нравятся посты про ИИ в менеджменте, метрики команд и продуктовые стартапы - буду рад видеть вас в моем телеграм-канале. Этот пост не очень характерен сему блогу, но было интересно поисследовать тему.

Комментарии (8)


  1. ivankudryavtsev
    07.09.2025 07:03

    Фантастические твари и где они обитают…


  1. doitagain
    07.09.2025 07:03

    В очередной раз вспомним просирание нанометров


  1. Liprekon
    07.09.2025 07:03

    А почему сравнивание идёт с h100? Вы говорите что есть у китайцев на данный момент и сравнивание со старой h100... Есть h200 и с ней надо бы сравнивать в 2025г. А то это сравнение идёт как Эльбрус и пентиум 4!


    1. Eskimo Автор
      07.09.2025 07:03

      Логика такая: H100 это де факто самый массовый GPU на рынке и по нему удобнее сравнивать - так как ты сравниваешь с базовым рыночным решением (а не премиумом, который ему сейчас H200).

      Если с 200й сравнивать, там разрыв космически растет :)


    1. bolk
      07.09.2025 07:03

      А чего ж не с B200?


      1. Eskimo Автор
        07.09.2025 07:03

        Так как китайцы часто сами позиционируют и сравнивают с H100, проще и реалистичнее найти сравнение с ней


  1. raf329
    07.09.2025 07:03

    Какой из чипов работает с CUDA?