Самый быстрый компилятор aka compiler-benchmark / forpes.ru

Главная
Самый быстрый компилятор aka compiler-benchmark

Самый быстрый компилятор aka compiler-benchmark +15

13.11.2020 11:24

Siemargl 34 3200 Источник

От переводчика: все началось с топика на форуме D.

После оценки скорости компиляции D по сравнению с другими языками мне было интересно, существует ли какой-нибудь язык, который компилируется в нативный код почти так же быстро или быстрее, чем D, за исключением C?
Если да, то скорее всего, он должен использовать бэкэнд, отличный от LLVM.
Я думаю, что Jai способен на это, но он еще не вышел в релиз.

Бенчмарки скорости компиляции различных комбинаций языков и компиляторов. Поддерживаемые языки:

Компиляторы в нативный код

C (gcc, clang и cproc),
C++ (g++ и clang++),
D (dmd ldmd2, и gdc),
Go (go и gccgo),
Swift (swiftc),
Rust (rustc),
Julia (julia).
Ada (gnatgcc),
Zig (zig),
V (v),
Vox (vox),
C3 (c3c),

Компиляторы в байт-код

OCaml (using ocamlopt),
C# (mcs),
Java (javac).

Сколько-то из них может быть установлено на Ubuntu (проверено на 20.04) скриптом ./install-compilers-on-ubuntu-20.04.sh из этого репозитория.

Как это сделано

Бенчмарк запускается так

./benchmark     --function-count=$FUNCTION_COUNT     --function-depth=$FUNCTION_DEPTH     --run-count=5

для подходящих значений $FUNCTION_COUNT и $FUNCTION_DEPTH или просто

./benchmark

для значений по умолчанию.
Можно указать тесты выборочно, например

./benchmark --languages=C++,D,Rust

Это сгенерирует код в каталог generated и затем для каждой комбинации языка, типа операции и компилятора запустит поддерживаемые бенчмарки. В итоге на стандартный вывод выдается таблица в формате Markdown, показывающая результаты бенчмарка. Обратите внимание, что время компиляции в этой таблице в столбце Time [us/#fn] является нормализацией микросекунд к количеству сгенерированных тестовых функций, т.е делится на (args.function_count * args.function_depth).

GCC и Clang не выполняют все семантические проверки для C++ (потому что это слишком дорого). Это контрастирует с компиляторами D и Rust, которые выполняют все из них.

Пример сгенерированного кода

Чтобы понять, как работает генерация кода, мы можем, например, сделать следующее

./benchmark --function-count=3 --function-depth=2 --run-count=5

Это для C, сгенерирует файл generated/c/main.c содержащий

long add_long_n0_h0(long x) { return x + 15440; }
long add_long_n0(long x) { return x + add_long_n0_h0(x) + 95485; }

long add_long_n1_h0(long x) { return x + 37523; }
long add_long_n1(long x) { return x + add_long_n1_h0(x) + 92492; }

long add_long_n2_h0(long x) { return x + 39239; }
long add_long_n2(long x) { return x + add_long_n2_h0(x) + 12248; }

int main(__attribute__((unused)) int argc, __attribute__((unused)) char* argv[]) {
    long long_sum = 0;
    long_sum += add_long_n0(0);
    long_sum += add_long_n1(1);
    long_sum += add_long_n2(2);
    return long_sum;
}

Кэширование компиляторами

Числовые константы рандомизируются при каждом вызове. Это делает невозможным для любого компилятора использовать какой-либо механизм кэширования при последовательных вызовах с одними и теми же опциями компиляции. Это делается для того, чтобы сделать более справедливым сравнение между компиляторами с различными уровнями кэширования.

Например, механизм кэширования эталонного компилятора Go больше не может быть отключен опциями.

Дженерики

Для каждого языка $LANG, поддерживающего дженерики, наряду с main.$LANG будет сгенерирован дополнительный шаблонный исходный файл main_t.$LANG, эквивалентный содержимому main.$LANG, за исключением того, что все функции (кроме main) являются шаблонами. Этот шаблонный исходный файл также будет пробенчмаркан. Колонка Templated в таблице ниже показывает, использует ли компиляция шаблонированные функции или нет.

Прим.пер. Здесь не различаются дженерики и шаблоны, что есть большая разница, как справедливо заметили на форуме. Но пользователю языка это неважно — обычно в языке присутствует единственный механизм.

Выводы (из приведенного ниже проведенного бенчмарка)

Проверка и сборка Vox, по большому счёту, самая быстрая. В 3-4 раза быстрее своего ближайшего конкурента, dmd. Обратите внимание, что Vox, однако, является высокоэкспериментальным языком, не имеющим статуса официального релиза, с бэкэндом только для Windows и обладающим меньшим количеством языковых возможностей, чем большинство других языков, прошедших бенчмаркинг.

На втором месте находятся эталонный компилятор D dmd и cproc. Однако, обратите внимание, что cproc — это высокоэкспериментальный компилятор Си без встроенной поддержки препроцессора Си.

Производительность как GCC, так и Clang значительно ухудшается с каждым новым релизом (в настоящее время 8, 9, 10 в таблице ниже).

Шаблонный (дженерик) исходный код C++ проверяется примерно в 3 раза медленнее, чем не-шаблонный при использовании gcc-8, и примерно в 2.3 раза медленнее для gcc-10. Для clang++-10 замедление составляет примерно 1.6. Соответствующее замедление для шаблонов D (dmd) примерно в 2.5 раза. С другой стороны, интересно, что версию с дженериками Rust обрабатывает в 2-3 раза быстрее, чем не-дженерик версия.

JIT-компилятор Джулии (в настоящее время) очень нуждается в памяти. Максимально рекомендуемое произведение function-count и function-depth для Julia — 5000. Таким образом, при достижении этого максимума Джулия будет исключена из бенчмарка.

Оптимизирующий нативный компилятор OCaml ocamlopt очень медленный для больших входных файлов и поэтому отключается, когда произведение function-count и function-depth превышает 10000.

Пример запуска бенчмарка

Вывод на моем Intel Core i7-4710HQ CPU @ 2.50GHz ? 8 с 16 GB памяти под Ubuntu 20.04 для вызова

./benchmark --function-count=200 --function-depth=450 --run-count=3

или же, используя для более быстрой генерации кода Pypy 3

pypy3 ./benchmark --function-count=200 --function-depth=450 --run-count=3

Результаты вывода в таблице

От переводчика. Таблица, где свалено все подряд, показалась мне малочитаемой — пришлось даже порыть исходники, чтобы понять смысл. Потому я рассортировал и сделал графики различных сущностей — время полной сборки с генерацией объектных файлов отдельно от проверки синтаксиса против шаблонного/дженерик кода отдельно от нешаблонного. Итого 4 графика.
Посередине графика строка с коэффициентом относительно лидера. Этот коэффициент приведен отдельно среди всех проверок синтаксиса (с и без дженериков), и аналогично среди всех полных компиляций в бинарник.

Значение для Ады — 5746,1

Шкала логарифмическая

Доделать

поддержку языка C3
время полной сборки и проверки синтаксиса собрать в одну строку в разные столбцы
добавить измерение потребляемой памяти с помощью Питоновского Subprocess
распараллелить вызовы проверки и сборки
добавить Fortran
добавить Pony

Ссылки

Время компиляции Go по сравнению с C++, D, Rust, Pascal (кросс-пост)

Мнение от переводчика

Данный бенчмарк показывает только синтетический результат, бесконечно далекий от реальности. К примеру в том же D стандартная библиотека Phobos абсолютно шаблонизирована, что замедляет компиляцию даже простых программ, и чем больше кода — тем медленнее, притом нелинейно.

С другой стороны — не учитывается медлительность систем сборки при перепроверках билда, и кроме того — я переводил пример, где одна и та же программа потребовала 12 пакетов зависимостей для D и около 230 для Rust, что делает сравнение времени в общем случае невозможным.

По ссылке же из соответствующего раздела можно увидеть не только сравнение с другими языками, отсутствующими тут, но и то, как далеко шагнуло компиляторостроение за 4 года в плане сборки огромных программ.

Комментарии (34)

tumaso
13.11.2020 15:19
#22300908
Я конечно извиняюсь, а где же сравнение с компиляцией на Delphi? Кодогенерация у делфи в натив конечно не самая лучшая, но вот что касается скорости компиляции, то здесь у делфи дела весьма неплохи.

UPD. ограничен в количествах постов в сутки, поэтому отвечу тут.

Речь при сравнении не шла исключительно о бесплатных компиляторах или компиляции только на Linux.
При этом есть и бесплатная Community Edition, за $0 (не реклама, если что, просто констатация факта), которая компилирует с той же скоростью, что и платные версии.

Поэтому на вопрос
После оценки скорости компиляции D по сравнению с другими языками мне было интересно, существует ли какой-нибудь язык, который компилируется в нативный код почти так же быстро или быстрее, чем D, за исключением C?
ответ — есть :-)
1. Siemargl Автор
  13.11.2020 15:29
  #22300950
  Предлагаете купить Дельфи за 1000$ чтобы потешить Ваш интерес?
  
  Это еще если dcc запустится на Ubuntu =)
  1. Siemargl Автор
    18.11.2020 11:38
    #22320332
    Поправка, для Линух-таргета нужны старшие редакции Дельфи, так что 2000$
1. Siemargl Автор
  13.11.2020 15:46
  #22301064
  Community Edition не умеет компилировать для Линукс — таргета.
  
  Кроме того, в Дельфи сейчас два или даже три разных компилятора под разные платформы. И очень разной степени качества генерируемого кода — вдвое для Win32 и Win64, недавно проверял.
  
  По ссылке в разделе Ссылки есть тестирование FPC 3.0

speshuric
13.11.2020 16:34
#22301332
В начале Java упомянута, а результатов нет (ни в картинках, ни в таблице).
1. Siemargl Автор
  13.11.2020 16:43
  #22301378
  Да, и в Доделать нет тоже. Ocaml аналогично. ?\_(?)_/?
  1. speshuric
    13.11.2020 17:00
    #22301474
    Авторы не дождались? :)
    В исходнике тоже нет — это не ошибка перевода, конечно, не к вам вопрос, а скорее риторический.

Fregl
13.11.2020 16:34
#22301334
Lazarus и free Pascal где?

0xd34df00d
13.11.2020 20:10
#22302212
А в чем смысл этих бенчмарков? Запускать компилятор вместе по-хорошему для обычной разработки в большинстве случаев не нужно, хватает LSP и тому подобных вещей для проверки кода по мере набора, и ~~системы типов вместо~~ репла для тестов.

ghc, например, очень медленный, но я эту медленность не чувствую, так как запускаю его очень редко.
1. Siemargl Автор
  14.11.2020 22:15
  #22302508
  Тут тестируются программы на > 30к строк текста, а не хелловорлды.
  1. 0xd34df00d
    14.11.2020 22:18
    #22302520
    А это как-то инвалидирует мой предыдущий комментарий?
    
    А ещё у языков разная выразительность, и 30 kloc кода на go не то же самое, что 30 kloc кода на окамле.
    
    Siemargl Автор
    14.11.2020 22:44
    #22302590
    А дочитать до конца? Там описано мое мнение =)
    
    0xd34df00d
    13.11.2020 23:00
    #22302648
    Там немножко другое. Даже если бы результат компиляции не был синтетическим (и учитывалась бы какая-нибудь стандартная библиотека D и что-нибудь ещё), то я всё равно не понимаю смысла таких тестов.
    
    Ну давайте ещё размер компилятора в байтах сравним, почему нет?
    
    Siemargl Автор
    13.11.2020 23:26
    #22302746
    Например, оценить нижнюю границу ожидания конца компиляции.
    
    0xd34df00d
    13.11.2020 23:35
    #22302778
    Окей, давайте с другой стороны.
    
    Как вы считаете, имеет смысл бенчмаркать сборку с оптимизациями или без?
    
    Siemargl Автор
    13.11.2020 23:38
    #22302802
    Без оптимизаций — отладочные сборки гораздо чаще приходится собирать.
    
    0xd34df00d
    13.11.2020 23:41
    #22302806
    Отлично, здесь мы согласны.
    
    А теперь представьте себе, что у вашего языка запущен демон, который выполняет онлайн-проверку вашего кода, и ничего отдельно запускать не нужно. Зачем тогда проверять скорость сборки?
    
    Siemargl Автор
    13.11.2020 23:58
    #22302846
    Например, чтобы CI/CD не сдох по времени.
    
    Такой демон возможен не всегда, не для всех языков, и не для всех размеров проектов.
    Intellisense для С++ чинили лет 10, в Дельфи аналог глючит до сих пор, а такой демон для D, DCD тоже имеет много нареканий.
    
    0xd34df00d
    14.11.2020 00:06
    #22302870
    Например, чтобы CI/CD не сдох по времени.
    Поставьте там таймаут побольше. Это не время программиста, его не так жалко.
    
    Я видел фирмы, где link line для плюсового кода строилась почти брутфорсом, что занимало кучу ресурсов билдфермы, и за десятилетия это никто не поправил. И ничего, всех всё устраивает.
    
    Такой демон возможен не всегда, не для всех языков, и не для всех размеров. Intellisense чинили лет 10, в Дельфи аналог глючит до сих пор, а такой демон для D, DCD тоже имеет много нареканий.
    Поэтому на существование этого демона мы забьём и будем бенчмаркать языки в заведомо неравных условиях, ок.
    
    Бенчмарк, который на самом деле важен — как быстро я получаю отклик от тайпчекера на свой код. Реализовано ли это через дико быстрый компилятор, или через демона, или ещё как, меня не очень волнует.
    
    Siemargl Автор
    14.11.2020 00:22
    #22302906
    Как будто скорость отклика демона это не тот же самый бенчмарк проверки синтаксиса =)
    
    0xd34df00d
    14.11.2020 00:37
    #22302942
    Таки нет.
    
    ghc медленный даже без оптимизаций, но reload в репле — очень быстрый. idris даже запускается медленно, но после запуска ответы от тайпчекера приходят очень быстро.

MrSmith33
13.11.2020 20:58
#22302332
Могу добавить что Vox уже может компилировать под линукс.
1. Siemargl Автор
  14.11.2020 22:15
  #22302512
  Разве из результатов теста это не очевидно? =)
  1. MrSmith33
    14.11.2020 22:54
    #22302630
    По результатам можно понять только то, что сам компилятор работает на Ubuntu. При этом в тексте есть примечание:
    
    с бэкэндом только для Windows
    
    На момент написания оригинального текста компилятор под линуксом мог компилировать код только для Windows. Поэтому уточняю. =)
    
    Siemargl Автор
    13.11.2020 22:59
    #22302646
    В таблице есть время исполнения программ. Run Time [us/#fn]
    
    Ну да, про бекенд устарело.
    
    Siemargl Автор
    14.11.2020 02:25
    #22303088
    Тогда наверное на гитхабе Vox'a нужно поправить фразу ?
    Target platforms (Only win64 is supported now):
    А лучше весь абзац, я так и не понял из него допустимые пары хост-таргет.
    
    MrSmith33
    14.11.2020 02:53
    #22303116
    Пофиксил

inv2004
14.11.2020 22:45
#22302600
Включить Zig, но не включить Nim? Странная выборка.
1. Siemargl Автор
  14.11.2020 22:49
  #22302608
  Ним мало смысла мерить, он компилируется в С, а потом уже…
  
  Так что это будет время С-компилятора + что-то.
  1. inv2004
    14.11.2020 22:57
    #22302638
    Я два раза перечитал, в статье написано "за исключением C", собственно это "что-то" + C и интересно сравнить
  1. endeveit
    17.11.2020 10:47
    #22315240
    Так V тоже компилируется сначала в C…

apevzner
14.11.2020 00:48
#22302968
gccgo — странный выбор.

У Go есть 2 компилятора, «родной» и на основе gcc. Тот, который на основе gcc представляет пока что лишь академический интерес. Мало того, что он очень медленный, он еще и код во многих случаях генерирует хуже, хоть у него и gcc внутри.

NeoCode
14.11.2020 01:42
#22303040
Спасибо за ссылки на V, Vox и C3, не знал о таких языках. Читаю про них сейчас, очень интересно.

Self_Perfection
14.11.2020 12:39
#22303728
Сравнивать скорости компиляторов без TCC от Фабриса Беллара очень странно

Самый быстрый компилятор aka compiler-benchmark +15

Компиляторы в нативный код

Компиляторы в байт-код

Как это сделано

Пример сгенерированного кода

Кэширование компиляторами

Дженерики

Выводы (из приведенного ниже проведенного бенчмарка)

Пример запуска бенчмарка

Доделать

Ссылки

Мнение от переводчика

Комментарии (34)

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор

Siemargl Автор