На пути к вершине: Магма и Кузнечик на Эльбрусе / forpes.ru

Главная
На пути к вершине: Магма и Кузнечик на Эльбрусе

На пути к вершине: Магма и Кузнечик на Эльбрусе +43

17.06.2021 12:08

shcher 33 10400 Источник

В последнее время всё чаще появляются статьи о производительности российских процессоров Эльбрус на различных задачах. Тема криптографии пока что остаётся за кадром, хотя в разное время были упоминания то о высоких возможностях Эльбруса (некий ГОСТ лучше в 9 раз на Эльбрус-4С, чем на Intel Core i7-2600), то о плохой оптимизации компилятора и, соответственно, крайне низкой скорости реализованных алгоритмов (Кузнечик в 100 раз медленнее, чем на Intel?). Предлагаю наконец разобраться, что может Эльбрус, на примере двух ГОСТ алгоритмов симметричного шифрования.

Чтобы статья не вышла слишком большой, будем считать, что читатель имеет общее представление об архитектурах процессоров, в том числе знает об Эльбрусе. Если же нет, на сайте разработчика (компании МЦСТ) есть отличное руководство по программированию и книга об архитектуре в целом. Именно с этих материалов и началось моё знакомство с Эльбрусами. Также отмечу, что в современных процессорах очень много различных механизмов и особенностей, так что в статье буду касаться только тех, которые, на мой взгляд, важны при реализации выбранных алгоритмов.

Что может предложить архитектура Эльбрус

Для выполнения арифметических операций у Эльбруса есть 6 АЛУ (арифметико-логических устройств), способных выполнять операции параллельно. Начиная с версии 5 архитектуры появилась поддержка упакованных (SIMD) инструкций над 128-битными регистрами.

Для хранения промежуточных результатов присутствует большой регистровый файл: суммарно в процедуре можно использовать более 200 (64-битных) регистров общего назначения. Для SIMD вычислений используются те же самые регистры, а не отдельные, как это часто бывает. Соответственно, с 5 версии архитектуры все регистры стали 128-битными.

Задачу симметричного шифрования можно отнести к потоковой обработке массива данных. Для таких ситуаций в Эльбрусе есть механизм асинхронной подкачки данных из памяти — APB (Array Prefetch Buffer). Использование этого механизма позволяет вовремя подгружать данные из памяти, не теряя время на кэш-промахи.

Выбор реализаций

Хорошим подходом было бы взять несколько известных реализаций, оптимизировать их под Эльбрус и посмотреть на результаты. Но, с другой стороны, мы говорим о процессоре общего назначения, поэтому можно сэкономить силы и время, предположив, что лучшие результаты можно ожидать от подходов, которые являются самыми быстрыми на других архитектурах.

Правда, о производительности ГОСТ алгоритмов обычно говорят только в контексте семейства x86-64, другие архитектуры мало кого интересуют. Но это не беда: мне показалось, что при знании команд ассемблера x86-64 ознакомиться с набором целочисленных и логических инструкций Эльбруса проще, чем, скажем, с ARM-овым. То есть прослеживаются определённые параллели, особенно, в области SIMD инструкций, и даже прямые аналоги. В остальном, конечно, у них нет ничего общего.

Итак, для Магмы известна эффективная реализация режимов, допускающих параллельную обработку блоков, то есть когда несколько блоков могут шифроваться независимо друг от друга. Это, например, режимы ECB, CTR, MGM. При этом скорость конкурирует с AES, для которого на x86-64 есть аппаратная поддержка. Реализация заточена именно под параллельную обработку, в случае последовательной (режимы с зацеплением) используются другие подходы. Мне интересно добиться максимальной скорости, поэтому я ограничился только случаем параллельной обработки.

С Кузнечиком немного проще: лучшие результаты что при последовательной, что при параллельной обработке даёт одна и та же реализация — её и берём.

Тестовые машины

То же самое в текстовом виде

Процессор	Версия арх-ры	Кол-во ядер	Тактовая частота	L1d	L1i	L2	L3
Эльбрус-4С	E2Kv3	4	0.75 ГГц	4 x 64 КБ	4 x 128 КБ	4 x 2 МБ	Нет
Эльбрус-1С+	E2Kv4	1	0.985 ГГц	1 x 64 КБ	1 x 128 КБ	1 x 2 МБ	Нет
Эльбрус-8С	E2Kv4	8	1.2 ГГц	8 x 64 КБ	8 x 128 КБ	8 x 512 КБ	16 МБ
Эльбрус-8СВ	E2Kv5	8	1.55 ГГц	8 x 64 КБ	8 x 128 КБ	8 x 512 КБ	16 МБ
Эльбрус-2С3	E2Kv6	2	2 ГГц	2 x 64 КБ	2 x 128 КБ	2 x 2 МБ	Нет
Эльбрус-16С	E2Kv6	16	2 ГГц	16 x 64 КБ	16 x 128 КБ	8 x 1 МБ	32 МБ

Магма

В случае x86-64 быстрая реализация Магмы опирается на использование расширений AVX и AVX2. При этом учитывается наличие в процессоре нескольких АЛУ и возможность параллельного исполнения до 3 векторных инструкций за один такт. Естественно, планирование параллельного исполнения остаётся на откуп процессора.

В случае же Эльбруса есть возможность явно распланировать параллельное исполнение. Опуская некоторые детали, можно считать, что на 3 и 4 поколении возможно исполнить 6 целочисленных векторных операций над 64-битными регистрами, а начиная с 5 поколения — 4 векторных операции уже над 128-битными регистрами.

Для Эльбруса я написал собственную реализацию Магмы. Она использует те же идеи, что и исходная под x86-64, но при этом адаптирована под другой набор инструкций. Рассматривал перспективу написания на ассемблере и даже пробовал, но довольно быстро осознал, что ассемблер у Эльбруса достаточно сложный в плане программирования на нём (например, есть много нюансов по размерам задержек и зависимостям инструкций, которые тяжело учесть вручную). При этом оптимизирующий компилятор делает свою работу действительно хорошо: переставляет инструкции в рамках большого окна и при подборе опций компиляции выдаёт плотность кода, которая не отличается от теоретических оценок на количество инструкций и тактов. Так что я остановился на реализации на языке Си с использованием intrinsic функций для доступа к некоторым инструкциям процессора.

Для измерения скорости был выбран режим ECB. Обычно именно он (или даже его упрощения) используется при сравнении производительности, а скорость других режимов можно оценить на базе полученных результатов, отличия несущественны. Речь идёт о реализации базового алгоритма шифрования, поэтому накладные расходы от смены ключа также не учитываются. Объём данных для замера — порядка 1 ГБ. Естественно, шифрование на одном ядре. Для многоядерной машины можно умножить результат на количество ядер и получить близкую к реальности оценку скорости. По крайней мере, во всех сравнениях я видел именно такую зависимость. Полученные результаты в таблице ниже:

То же самое в текстовом виде

Процессор	Скорость на невыровненных данных	Скорость на выровненных данных	Производительность
Эльбрус-4С	116 МБ/с	137 МБ/с	5.2 такт/байт
Эльбрус-1С+	151 МБ/с	179 МБ/с	5.2 такт/байт
Эльбрус-8С	185 МБ/с	220 МБ/с	5.2 такт/байт
Эльбрус-8СВ	402 МБ/с	520 МБ/с	2.8 такт/байт
Эльбрус-2С3	669 МБ/с	670 МБ/с	2.8 такт/байт
Эльбрус-16С	671 МБ/с	672 МБ/с	2.8 такт/байт

Здесь под выровненными данными подразумевается выравнивание по границе 8 байтов для E2Kv3/E2Kv4 и 16 байтов для E2Kv5/E2Kv6. При наличии такого выравнивания (на версиях до 6) работает механизм APB и данные для шифрования эффективно подкачиваются из памяти. При этом с версии 6 APB уже не требует выравнивания данных, поэтому при любом расположении данных достигается максимальная скорость. Для невыровненных данных на предыдущих версиях архитектуры я не провёл достаточно исследований, так что значения в этом столбце таблицы можно считать нижней границей.

Для сравнения приведу результаты из статьи с описанием базовой реализации на Intel Core i3-7100 @ 3.9 ГГц. При использовании AVX — 458 МБ/с, 8.1 такт/байт; AVX2 — 1030 МБ/с, 3.6 такт/байт. Так что по абсолютной скорости Эльбрус достаточно близок к современным процессорам Intel (это при значительной разнице в тактовой частоте!) и превосходит x86-64 с AVX в тактах более чем в 1.5 раза (для 3 и 4 поколения), а x86-64 с AVX2 — в 1.3 раза (для 5 поколения).

Кузнечик

По сравнению с Магмой, структура Кузнечика является более сложной. Несмотря на то, что удалось декомпозировать нелинейное преобразование S, техники реализации, основанные на широком использовании SIMD-инструкций, пока что отстают от "классической" реализации со склеенным LS (линейным и нелинейным) преобразованием и таблицей предвычислений размером 64 КБ (упоминается в статье под именами с LS или более простое описание на Хабре).

В случае x86-64 Кузнечик эффективнее всего реализуется с использованием AVX-инструкций (удобно работать со 128-битными регистрами, так как длина блока и размер значений в таблице равны в точности 128 битам). При этом для вычислений адресов в таблице не удаётся воспользоваться эффективной адресацией Scale-Index-Base-Displacement (именование из статьи), так как в качестве Scale нужно значение 16, а максимально возможное — 8. На Эльбрусе можно ожидать конкурирующих результатов за счёт большого кэша L1d (64 КБ) и наличия 4 АЛУ, обеспечивающих произвольный доступ к памяти (насколько мне известно, у абсолютного большинства процессоров x86-64 2 порта для загрузки данных).

Как и в случае с Магмой, для Кузнечика я написал отдельную реализацию на Си под Эльбрус, чтобы добиться максимальных результатов. Начиная с 5 версии архитектуры я явным образом использовал тип __v2di (см. e2kintrin.h в составе компилятора), чтобы быть уверенным, что получится использовать регистры как 128-битные.

Техника замера скорости полностью совпадает с уже описанным случаем Магмы, так что повторяться не буду. Только напомню, на всякий случай, что речь идёт о скорости на одном ядре. Почему-то у многих это вызывало вопросы и ещё чаще удивление.

Итак, в случае строго последовательной обработки данных:

То же самое в текстовом виде

Процессор	Скорость на невыровненных данных	Скорость на выровненных данных	Производительность
Эльбрус-4С	52 МБ/с	69 МБ/с	10.4 такт/байт
Эльбрус-1С+	63 МБ/с	90 МБ/с	10.4 такт/байт
Эльбрус-8С	80 МБ/с	110 МБ/с	10.4 такт/байт
Эльбрус-8СВ	95 МБ/с	150 МБ/с	9.9 такт/байт
Эльбрус-2С3	170 МБ/с	171 МБ/с	11 такт/байт
Эльбрус-16С	171 МБ/с	172 МБ/с	11 такт/байт

Для сравнения результаты из статьи (лучшие из опубликованных) на Intel Core i7-6700 @ 4 ГГц — 170МБ/с, 22.4 такт/байт. В отличие от Магмы, можно говорить о сопоставимой абсолютной скорости и преимуществе в тактах более чем в 2 раза.

В таблице заметен интересный момент: результаты ощутимо колеблются среди последних 3 версий Эльбруса. Такое поведение я заметил буквально недавно и начал обсуждение с коллегами из МЦСТ, так что есть надежда, что результаты удастся немного улучшить при доработке компилятора.

С параллельной обработкой ситуация намного интереснее:

То же самое в текстовом виде

Процессор	Скорость на невыровненных данных	Скорость на выровненных данных	Производительность
Эльбрус-4С	78 МБ/с	83 МБ/с	8.6 такт/байт
Эльбрус-1С+	102 МБ/с	108 МБ/с	8.7 такт/байт
Эльбрус-8С	126 МБ/с	133 МБ/с	8.6 такт/байт
Эльбрус-8СВ	248 МБ/с	291 МБ/с	5.1 такт/байт
Эльбрус-2С3	453 МБ/с	454 МБ/с	4.2 такт/байт
Эльбрус-16С	454 МБ/с	455 МБ/с	4.2 такт/байт

И традиционное сравнение с Intel Core i7-6700 @ 4 ГГц: на нём достигается 360 МБ/с, 10.6 такт/байт. В отличие от случая последовательной обработки, у E2Kv3 и E2Kv4 преимущество Эльбруса не такое большое, предположительно из-за того, что реализация обработки нескольких блоков вместе обладает более высокой степенью параллельности и планировщику на x86-64 легче справиться с выявлением независимых операций. А вот появление у 5 поколения Эльбруса 128-битных регистров и загрузок из памяти позволяет ему сохранить преимущество в тактах более чем в 2 раза.

Сравнивать E2Kv6 с i7-6700 оказалось несолидно, поэтому я взял ассемблерную реализацию режима ECB и провёл собственный замер. В статье с описанием результатов на i7-6700 данные шифруются «на месте», без работы с памятью, поэтому у честного режима ECB результат чуточку хуже: на самом мощном из доступных мне процессоров — Intel Core i7-9700K @ 4.7 ГГц — вышло 411 МБ/с, 10.9 такт/байт. Эльбрус оказался быстрее, обеспечивая преимущество в тактах в 2.5 раза.

Заключение

На основании полученных результатов я делаю вывод, что Эльбрус обладает отличными возможностями для высокопроизводительной реализации шифрования данных, несмотря на отсутствие в выпущенных версиях архитектуры какой-либо аппаратной поддержки криптографических операций.

За время изучения архитектуры Эльбруса у меня сложилось впечатление, что многие полезные инструкции исторически добавлялись для обеспечения работы двоичного транслятора, но ситуация изменилась с 5 версии: Эльбрус начал больше развиваться собственным путём. Эту положительную динамику невозможно не отметить.

С другой стороны, сложившаяся похожесть ряда инструкций упрощает разработку и оптимизацию под Эльбрус. Можно сказать, что эта статья предлагает простой способ портирования и оптимизации алгоритмов под Эльбрус: достаточно взять хорошо зарекомендовавший себя на Intel/AMD алгоритм и немного адаптировать его под Эльбрус. Я искренне верю, что в результате практически любой алгоритм должен работать по крайней мере не хуже, чем в разницу тактовых частот.

Если немного поразбираться и осторожно писать код на Си, компилятор прекрасно справляется с задачей оптимизации и не оставляет человеку шансов написать на ассемблере более эффективный код.

P.S.

Эта статья написана по мотивам моего устного доклада на конференции РусКрипто. По ссылке можно найти презентацию, которая является краткой выжимкой с основными результатами на тот момент. К моменту же написания статьи удалось улучшить некоторые результаты, а также проверить реализации на новом поколении процессоров.

Несмотря на то, что для получения описанных результатов мне удалось разобраться с Эльбрусом на основании только открытой информации и документации к компилятору, я хочу выразить благодарность сотрудникам МЦСТ, в особенности, Александру Трушу, за ответы на периодически возникавшие у меня вопросы и, конечно, за предоставление удалённого доступа к новым процессорам.

Комментарии (33)

stilet69
18.06.2021 16:12
#23159544
+5
Спасибо, очень интересная статья.

X-Ray_3D
18.06.2021 17:23
#23159856
+7
Как же хочется заиметь Эльбрус-2С3 для личного использования и тестирования.

Kelbon
18.06.2021 17:58
#23160020
-8
Круто, таблицы в которых есть только «свои». Молодцы, адекватно, честно. Хоть бы не позорились 50мб блет в секунду.
1. stgunholy
  19.06.2021 01:15
  #23161162
  -6
  с удовольствием плюсанул бы… :(

wigneddoom
19.06.2021 00:38
#23161096
А 16C и 2C3 уже вышли из опытных образцов?
1. Lirein
  19.06.2021 05:45
  #23161442
  +3
  30 июня ждем коммерческий релиз платы mATX на Эльбрус-2C3, должны быть доступны для заказа. Подробнее можно уточнить у Максима Горшенина из МЦСТ.

stgunholy
19.06.2021 01:15
#23161160
что-то последнее время прям серия Хея-Хея статей про Эльбрусы…

BugM
19.06.2021 02:50
#23161288
Криптография без аппаратного ускорения это печально. На ваших скоростях сервер не построишь. Он на гигабит шифрованного трафика будет расходовать почти все ядра. А ведь уже 10 гбит линки почти везде. Такой вообще не утилилизировать.

А бизнес логику на соседнем сервере считать?
А если все внутри сети тоже шифровать надо? По заветам Гугла.

Даже странно. Казалось бы аппаратное ускорение для российской криптографии просто напрашивается. Ан нет.
1. gudvinr
  19.06.2021 03:17
  #23161312
  Кроме AES и SHA (и то не все) больше ничего не поддерживается в широко используемых процессорах. Про ГОСТ-алгоритмы естественно даже речи не идёт, но и для Salsa20/Curve25519/Poly1305, которые в TLS начиная с 1.2 использются, тоже все реализации используют SIMD. Поэтому это не проблема Эльбруса, в сущности. Тем более, что пространство для оптимизации алгоритмов, которые используют SIMD, у процессора с VLIW даже больше.
  1. BugM
    19.06.2021 03:37
    #23161330
    Вот поэтому мир и захватил AES. Он просто быстрее.
    
    Не то чтобы проблема. Скорее серьезная недоработка. Есть возможность получить конкурентное преимущество. Которое конкуренты не сделают примерно никогда. Оно долго будет радовать покупателей. Как раз в нужной им сфере. И оно не используется.
    
    Nordicx86
    19.06.2021 07:46
    #23161580
    хардовая поддержка криптографии — а оно в реальном приложении нужно? сейчас в любой момент алгоритмы поменяться могут в любую сторону…
    На мой ограниченный взгляд при выходе в массу разумнее сразу вставлять ППВМ для таких задач в чип или отдельным кристаллом на подложку чиплета — и уже на нем реализовывать «аппаратную» поддержку…
    
    BugM
    19.06.2021 10:49
    #23162148
    Слово AES уже два раза написали. Это как раз алгоритм ускоренный аппаратно на всех более-менее современных процессорах. И он же самый используемый алгоритм шифрования а Интернете.
    AES уже 20 лет. Используется. Самый массовый. Критично не изменяется.
    Шифруется все. Скорость работы это важнейший критерий после безопасности. На потраченные деньги скорость работы влияет напрямую.
    
    Nordicx86
    19.06.2021 11:24
    #23162316
    -1
    он Американский — даже если у нас его стандартизируют он всё равно будет вторичным.
    И чем интеграция ППВМ на чиплет помешает на ней поднять «Хардовую» реализацию AES? просто мир имеет свойство меняться…
    
    BugM
    19.06.2021 12:02
    #23162498
    Он первичный в мире. Во всем мире. Сервера у всех одинаковые. И платят за ядра все одинаково.
    Мешает не мешает. Это разговоры для бедных. Или работает или не работает. Лучше всего из коробки без дополнительной платы.
    
    shcher Автор
    19.06.2021 12:12
    #23162544
    +2
    Указанными двумя решениями подходы не ограничиваются. В соседней презентации описаны и другие способы.
    Как уже написал, про AES никто не забывает, он тоже есть в планах на будущее.
    Кстати, у AES структура значительно отличается от Кузнечика, для него известен целый ряд программных реализаций, которые так и просятся на Эльбрус. Надеюсь, найду время сделать обзор на эту тему.
    
    Nordicx86
    19.06.2021 16:40
    #23163808
    с учетом текущих тенденций — не совместимость с мировым стандартом может резко стать плюсом…
    а в целом я же не говорю что нет — но смысл ограничивать возможности своего чипа зашивая в него что-то чуждое и используемое дай боже в 10% задач, если можно сделать более универсальное решение?
    
    BugM
    19.06.2021 18:50
    #23164268
    Ещё раз. Все основное мировое шифрование работает на аппаратно ускоренном алгоритме. Это аппаратное ускорение полностью бесплатно для пользователя и работает само. Для серверов оно экономит значительные суммы денег, это важно.
    Если есть желание сделать своё шифрование, то надо делать как минимум не хуже. Это означает что нужно аппаратное ускорение. Бесплатное и работающее само. Чтобы пользователю не стало хуже. Без аппаратного ускорения получается хуже. Это деньги.
    Отсюда у меня и возник вопрос почему не делают? Оказалось что уже обсуждают. Это хорошо и радует. Лучше поздно, чем никогда.
1. shcher Автор
  19.06.2021 09:09
  #23161780
  +5
  Не уловил способ расчёта. В статье данные в мегабайтах в секунду. Соответственно, на 16С на одном ядре Магма больше 5 гигабит/с, а Кузнечик 3.5. Если взять грубую оценку прикладного использования (TLS 1.3, режим MGM), то выйдет на одном ядре 2.5 и 1.75 гигабит/с для Магмы и Кузнечика, соответственно. Так что на одном 16С хватит 4-6 ядер из имеющихся 16 для обеспечения 10 Гбит/с. Насколько я слышал, для серверов чаще используются двух- и четырёхпроцессорные машины.
  А про аппаратное ускорение: в следующем поколении архитектуры планируется введение аппаратной поддержки. Сейчас обсуждаем, что можно сделать. Более того, в планах МЦСТ учесть интересы не только российской криптографии, чтобы другие алгоритмы тоже можно было ускорить.
  1. BugM
    19.06.2021 11:00
    #23162188
    Я взял первую табличку. Разделил на Пи. Реальные цифры и вылизанные тесты обычно примерно так и отличаются. И прикинул навскидку.
    Сложно когда тесты неповторяемые. Железки доступной нет, OpenSSL на котором можно прогнать тест нет. Приходится странными вычислениями заниматься.
    Планы на аппаратную поддержку это отлично.

VlaoMao
19.06.2021 09:48
#23161922
Я извиняюсь, а примеры кода будут?
1. shcher Автор
  19.06.2021 09:51
  #23161936
  Это коммерческая разработка, поэтому код попадает под имущественные права, а статья посвящена описанию концептуальных подходов.

uis246
19.06.2021 11:13
#23162262
Занятно... Мануалы на ISA опубликовали? В прошлом году чутка приоткрыли. Что с приобритением железа?
1. shcher Автор
  19.06.2021 12:59
  #23162772
  В статье как раз есть ссылка на руководство, в нём уже много информации (это как раз в мае прошлого года случилось). Больше открытой информации пока не было, но и имеющейся достаточно для хорошего старта.
  По поводу приобретения лично пока не интересовался, но у физических лиц уже достоверно есть машины в личном пользовании, в чате могут проконсультировать.

Albert2009ru
19.06.2021 13:45
#23162982
Интересно, а Эльбрус он 100% российский, т.е. российский внутренний производитель владеет полным циклом производства микросхемы?

Master_Dante
19.06.2021 15:37
#23163532
-2
Что за Магма и Кузнечик? Мне кажется что здесь втирают какую то дичь. Где тесты AES и RSA, которые используются во всем мире. Где сравнение на вашем чудестном Эльбрусе с АМД, и Интел. Где сорцы. Брехня для ОРТ. Итог статьи такой, никому не нужные(а может и вредные) крипто алго, тестят на никому не нужном железе, с никому не нужной архитектурой.
1. LynXzp
  19.06.2021 15:59
  #23163614
  Потому что в гос конторах не нужен AES и RSA, т.к. они не сертифицированы государством для хранения секретной документации. В РФ свои криптоалгоритмы, в Украине свои. Мамкины криптографы. Это создает кучу проблем на подобии отсутствия open source реализаций, потому что для сообщества эти алгоритмы полностью не интересны и каждая контора пишет свой велосипед. В итоге главные принципы криптографии ломаются. Но чиновникам все равно.
1. gendos1
  21.06.2021 18:17
  #23173188
  +1
  Закладки могут быть в чужих алгоритмах шифрования, впрочем как и в отечественных. Потому и нужны свои.
  А на Магму к слову до сих пор нет практически осуществимых алгоритмов атак, хоть он и разработан при СССР еще.

gendos1
19.06.2021 11:16
#23165810
В исходниках VeraCrypt можно найти хорошо оптимизированную версию Кузнечика - core i7 показывает более 10 гбит при параллельном выполнении.
1. shcher Автор
  19.06.2021 11:20
  #23165818
  Что именно вы хотите этим сказать? Если пересчитать данные из статьи, то выходит, что core i7-9700K показывает больше 25 Гбит/с на всех ядрах, а Эльбрус-16С может выдать порядка 56 Гбит/с.
  1. gendos1
    21.06.2021 17:16
    #23172970
    Хотел сказать где можно найти весьма неплохую реализацию Кузнечика - может кому пригодится. Перепроверил, i7-8700K выдает 3 гбит на одном ядре и 18 гигабит на 12.

Timofei4
21.06.2021 22:00
#23174012
-1
Опять, подробное описание сферического коня в вакууме?
Есть у моего знакомого одна штука… Она, уууух, как умеет! 50 попугаев в тесте 2003 года выдает. И вообще, наша промышленность прямо прет!
… Извините… прорвалось…
1. shcher Автор
  21.06.2021 22:09
  #23174046
  В существование чего именно вы не верите? Описание реализаций достаточно подробное, можете самостоятельно повторить результаты и даже, вполне возможно, превзойти их. Стандарты на эти шифры достаточно свежие, идеи, лежащие в основе реализаций, тоже не назовёшь слишком старыми, так что аналогия с абстрактным тестом 2003 года мне не ясна. Если нет уверенности в существовании процессоров, то вынужден огорчить: они существуют и к ним легко можно получить удалённый доступ. Кроме, пожалуй, инженерных образцов последнего поколения, они пока не выставлены в общий доступ.

edo1h
22.06.2021 06:31
#23174676
На основании полученных результатов я делаю вывод, что Эльбрус обладает отличными возможностями для высокопроизводительной реализации шифрования данных, несмотря на отсутствие в выпущенных версиях архитектуры какой-либо аппаратной поддержки криптографических операций.
только, увы, это одна из немногих задач, в которых эльбрус хорош.

Это коммерческая разработка, поэтому код попадает под имущественные права, а статья посвящена описанию концептуальных подходов.
то есть, получается, просто поставить openssl и использовать потенциал эльбруса для криптографии не выйдет. тем более печально для эльбруса.

На пути к вершине: Магма и Кузнечик на Эльбрусе +43

Что может предложить архитектура Эльбрус

Выбор реализаций

Тестовые машины

Магма

Кузнечик

Заключение

P.S.

Комментарии (33)

shcher Автор

shcher Автор

shcher Автор

shcher Автор

shcher Автор

shcher Автор