CloudBear BI-672 – самое производительное процессорное ядро, разработанное в России / forpes.ru

Главная
CloudBear BI-672 – самое производительное процессорное ядро, разработанное в России

CloudBear BI-672 – самое производительное процессорное ядро, разработанное в России +32

26.09.2025 15:41

Armmaster 19 3300 Источник

На проходящей в эти дни конференции Микроэлектроника 2025 анонсировано новое процессорное ядро компании CloudBear на архитектуре RISC-V – BI-672. Согласно представленным материалам, данное ядро преодолело рубеж микроархитектурной скорости 1 на GHz на SpecInt2017, что является значимым достижением и делает его самым производительным из когда-либо разработанных в России. Давайте вкратце пробежимся по деталям, доступным на данный момент.

На одном из первых слайдов можно видеть, какой прогресс был совершён по сравнению с предыдущей версией BI-671 с OoO исполнением:

Чтобы достигнуть таких результатов, потребовалась большая работа. Итоговая микроархитектура выглядит следующим образом:

Подробнее, вклад в улучшение производительности выглядит следующим образом:

Улучшение Микроархитектуры:

Декодирование до 3-х инструкций в такт
Новая подсистема подкачки кода
Окно внеочередного исполнения 96 команд
Увеличены размеры OoO структур
Новый блок Load/Store с улучшенными механизмами внеочередного исполнения
2-х уровневая подсистема трансляции виртуальных адресов
8-канальные кэши инструкций и данных размером 32 КБ с поддержкой parity/ECC
7 каналов исполнения инструкций: branch, 3 ALU, 2 FPU, Load/Store (комбайнинг до 4 инструкций)

Подсистема подкачки кода:

Подкачка по 16 байт в такт
L0 микро BTB (Branch Target Buffer)
L1 основной BTB
Branch History Table
Return Address Stack
Предсказание косвенных переходов I-BTB
Раздельные очереди для подкачки кода и предсказания переходов
Неблокируемый предсказатель переходов работает как префетчер для L1 кэша
Объединение последовательностей из 2-х часто встречающихся команд в макро-операции

Блок управления чтением/записью (load/store unit):

Внеочередное и спекулятивное исполнение операций

Load вперед load

Load вперед store

Store вперед load

Store to Load forwarding – использование данных из store буфера для load операций
Комбайнинг чтений/записей до 4-х подряд идущих операций
Канал чтения/записи в D-кэш шириной 32 байта
Отдельные каналы трансляции виртуальных адресов для чтений и записей
Поддержка невыравненного доступа (обязательна в RVA22)

Подсистема трансляции виртуальных адресов:

Режим виртуальной памяти Sv39
Полностью ассоциативные I-TLB и D-TLB 1-ого уровня с кэшированием страниц любых размеров (по 64 элемента каждый)
Отдельные каналы load и store в D-TLB
Кэш 4КБ страниц в S-TLB 2-ого уровня (2-канальный кэш с 1024 элементами)
Аппаратный обход таблицы трансляции для нескольких промахов в I-TLB/D-TLB параллельно
Аппаратное обновление A/D флагов (Svadu)
Поддержка Svnapot расширения: 64КБ страницы (=16x4КБ) с заполнением 4КБ страниц в S-TLB кэш

Подсистема памяти:

Полностью когерентный кластер с общим L2
Поддержка снуп-запросов в I и D кэшах
Неблокируемая внеочередная обработка L1/L2 запросов
L2 префетчерс определяемым шагом
Parity в L1 I-кэше
ECC в L1 D и L2 кэше
Поддержка poison бит с гранулярностью L1 – 32 бита, L2 - 64 бита
Поддержка Cache Management операций
Новые типы сообщений в протоколе когерентности

Теперь посмотрим, как новое ядро выглядит на тесте Coremark по сравнению с конкурентами:

Coremark, конечно, хорошо, но как мы знаем, всё же это «детский» тест. А серьёзно говорить о производительности процессорного ядра можно только имея на руках цифры SpecINT2006/2017. И авторы порадовали нас и такими результатами:

Также присутствует данные для SpecFP2006/2017, которые являются чуть менее важными для процессорного ядра общего назначения, но тем не менее тоже интересны:

Конечно, данные графики показывают не настоящий перф, а лишь «микроархитектурную скорость», что часто является очень спекулятивной вещью. Для понимания настоящей производительности нам необходимо как минимум знать частоту, на которой может процессор работать. И эта информация также присутствует, частота может достигать 1.8 ГГц на 12нм техпроцессе:

Суммарно, можно резюмировать, что новое ядро BI-672 является большим шагом вперёд для отечественной индустрии разработки процессоров. Оно (и его младшие братья) позволяет закрыть все потребности от микроконтроллеров до встраиваемых систем и десктопов среднего класса, приближаясь в своих характеристиках к достаточно серьёзному ядру Arm Cortex A75. Да, для серверных решений и high-end десктопов оно ещё слабовато, но вектор развития, выбранный компанией CloudBear, позволяет надеяться на достижение и этих амбициозных целей.

Планы по разработке на следующий год выглядят следующим образом:

Желаем нашим коллегам из CloudBear (и, конечно же, всех других компаний, разрабатывающих IP-блоки процессорных ядер) не останавливаться на достигнутом и в ближайшие годы преодолеть гроссмейстерские 2 SpecINT2017 на GHz, а потом и вовсе посрамить своих конкурентов из Arm, AMD, Intel и даже Apple!

Комментарии (19)

byman
26.09.2025 16:06
#28886654
Может Вы в курсе характеристик SCR9 ? Помогает ли ему в соревновании с BI-672 векторное расширение ? :)
1. Armmaster Автор
  26.09.2025 16:06
  #28886676
  К сожалению, точных данных по SCR9 у меня нет, только некоторые слухи и инсайды, на основе которых мне сложно нарисовать картину, за которую я бы хоть сколько-то поручился. Очень надеюсь, что коллеги из Syntacore/Yadro опубликуют официальные данные по своим последним разработкам и может статься, даже отнимут пальму первенства в звании самого производительного отечественного ядра у BI-672.

TimID
26.09.2025 16:06
#28887474
Насколько это ядро эффективнее того же ARM A57 в плане количества транзисторов/плотности размещения на кристалле/доступа к внешним интерфейсам/поддержки многоядерности/энергоэффективности/теплового пакета?
Пока это ведь "сферическое ядро в вакууме".
Когда планируется к внедрению?
1. Armmaster Автор
  26.09.2025 16:06
  #28887592
  На презентации прозвучало, что при переходе от in-order BI-652 (можно считать близким аналогом ARM A57) к OoO BI-672 рост производительности составил 2х, при росте площади ядра в 1.8х. Т.е. удельная производительность на кремний выросла. В целом, BI-672 выглядит вполне на мировом уровне для такого класса ядер

checkpoint
26.09.2025 16:06
#28887614
Сильно смущает отсутствие RVV.

Озвучены ли какие-то планы/сроки по выпеканию BI-672 в кремнии ?
1. Armmaster Автор
  26.09.2025 16:06
  #28888340
  RVV будет добавлено в течение ближайшего года.
  
  Про планы/сроки по кремнию ничего не было озвучено, что понятно, т.к. это уже зависит от покупателя ядра и разработчика Asic, а не IP-хауса, которым является CloudBear

Khort
26.09.2025 16:06
#28888174
Не очень понятно, на каком питании меряется архитектурная скорость на гигагерц. Если указанный ТТ 1В, то это очень много для указанной технологии, должно быть где то 0.8-0.85, а все что выше будет слишком горячим/потребляющим. Этот ТТ - уже разгон, фактически.

И еще я полагаю что 0.72В это низ работы SRAM, т.е. дизайн еще не пытались перевести на разные питания и домены. И DFT там наверное нет, т.е. сделано максимально облегченно и быстро, чисто для бенчмарка. В реальном же чипе все эти режимы питания и тестирования будут, и получится медленнее.

С другой стороны, судя по картинке лейаута, он сильно оценочный, так что и частоты могут быть больше. Все же 1.35 в 0.72 это не много.

Итого, в целом, новость впечатляет, но низкие частоты и нереалистичный ТТ - есть над чем поработать.
1. Armmaster Автор
  26.09.2025 16:06
  #28888396
  Архитектурная скорость мерялась на fpga прототипе, вестимо. Все остальные цифры по углам, вольтажу и тд можно резюмировать тем, что ядро заработает на 1.8 ГГц

edo1h
26.09.2025 16:06
#28888608
Coremark, конечно, хорошо, но как мы знаем, всё же это «детский» тест. А серьёзно говорить о производительности процессорного ядра можно только имея на руках цифры SpecINT2006/2017

ой ли. specint — синтетическая синтетика, для процессорного ядра общего назначения не так уж и интересна.

и да, если мы говорим про самое производительное процессорное ядро, разработанное в России, то где сравнение с шумевшим не так давно эльбрусом?

и да, в статье свершенно не упоминается что это — arm, risc-v, что-то ещё; ядро создано на основе какого-то или с чистого листа, и прочие детали.
1. Sly_tom_cat
  26.09.2025 16:06
  #28889048
  Автор видимо счел, что упоминание поддержки спецификации RVA-22 все всем объяснит.....
1. Armmaster Автор
  26.09.2025 16:06
  #28890170
  ой ли. specint — синтетическая синтетика, для процессорного ядра общего назначения не так уж и интересна.
  
  SpecInt это главный тестбенч, на котором в профессиональном сообществе принято сравнивать именно производительность ядер общего назначения. Это не синтетика никакая, а набор реальных нагрузок.
  
  и да, если мы говорим про самое производительное процессорное ядро, разработанное в России, то где сравнение с шумевшим не так давно эльбрусом?
  
  Разработчики BI-672 не привели цифр для Эльбруса. По всей видимости потому, что они в нормальном виде нигде не опубликованы
  
  и да, в статье свершенно не упоминается что это — arm, risc-v, что-то ещё; ядро создано на основе какого-то или с чистого листа, и прочие детали.
  
  это RISC-V ядро, разработанное с нуля.

Vedomir
26.09.2025 16:06
#28888632
Вдвойне отличная новость - и то что российский процессор и то что открытый, в отличие от Эльбруса, очень перспективное в мировом плане направление. Здесь мы как раз вписываемся в опережающий мировой тренд.

Sly_tom_cat
26.09.2025 16:06
#28889038
Автору на заметку: тут могут не все быть в курсе про какую архитектуру речь если в тексте архитектора и поддерживаемые спецификации в рамках этой архитектуры ни разу не прозвучали.
1. vikarti
  26.09.2025 16:06
  #28889280
  в тегах есть :)
  
  Ну и RVA-22 это намек...ЕСЛИ знать что это такое или хотя бы kagi (ну или хоть яндекс/chatgpt) спросить
  1. Groh
    26.09.2025 16:06
    #28889334
    А ещё лучше написать, потому что гуглить пойдут от силы несколько процентов читателей
    
    edo1h
    26.09.2025 16:06
    #28889404
    проблема даже не загуглить, а догадаться какое ключевое слово выбрать для гугления
1. Armmaster Автор
  26.09.2025 16:06
  #28890182
  добавил упоминание про RISC-V, хотя не скрою, мне казалось это очевидным.
  1. Sly_tom_cat
    26.09.2025 16:06
    #28890434
    Вот так - сильно лучше!
  1. Sly_tom_cat
    26.09.2025 16:06
    #28890452
    Любые ваши "очевидно" очевидны только для вас. Когда вы пишите на широкую аудиторию нужно по меньше рассчитывать на то, что ВСЕМ будет очевидно то, что очевидно для вас. Я всегда свои выступления/статьи стараюсь либо кому-то довольно постороннему дать вычитку, либо старательно включаю у себя "блондинку".

CloudBear BI-672 – самое производительное процессорное ядро, разработанное в России +32

Комментарии (19)

Armmaster Автор

Armmaster Автор

Armmaster Автор

Armmaster Автор

Armmaster Автор

Armmaster Автор