Системные тесты CPU
Наш первый набор тестов — общие системные тесты. Этот набор тестов призван эмулировать по большей части то, что люди обычно делают с компьютером, например, открытие больших файлов или обработка небольших стеков данных. Это несколько отличается от нашего офисного тестирования, где используются тестирование по индустриальным стандартам. Некоторые из тестов здесь относительно новые и необычные.
Обработка FCAT: link
Одной из наиболее интересных нагрузок, которая используется на нашем стенде в последних кварталах, является FCAT — инструмент, который мы используем для измерения задержек в играх из-за упавших или пропущенных кадров. Процесс FCAT требует включения цветного оверлея в игру, записи игрового процесса и последующего анализа видеофайла с помощью соответствующего программного обеспечения. Такой софт обычно однопоточный, поскольку видео в примитивном RAW формате, что предполагает большой размер файла, и требует перемещения большого количества данных. Для нашей проверки мы берем 90-секундную запись теста Rise of the Tomb Raider, работающего на GTX 980 Ti на 1440p, размер которой составляет около 21 ГБ, и измеряем время, необходимое для обработки с помощью инструмента визуального анализа.
FCAT однопоточный тест, однако даже в этом тесте 5,0 ГГц процессор не на вершине.
Dolphin Benchmark: link
Многие эмуляторы связаны однопроцессорной производительностью процессора, а общие отчеты, как правило, предполагают, что Haswell значительно повысит производительность эмулятора. Этот бенчмарк запускает программу Wii, в которой луч отслеживает сложную трехмерную сцену внутри эмулятора Dolphin Wii. Результаты этого теста – вполне надежный показатель скорости процессорной эмуляции Dolphin, которая представляет собой интенсивную одноядерную задачу, использующую большинство аспектов процессора. Результаты приведены в минутах, где сам Wii показал результат 17,53 минуты (1052 секунды).
На этом тесте хваленые 5,0 ГГц наносят удар, и 8086K ставит рекорд на Dolphin.
3D Movement Algorithm Test v2.1: link
Это последняя версия написанного нами 3DPM бенчмарка. Цель 3DPM – симулировать частично оптимизированные научные алгоритмы, взятые непосредственно из моей докторской диссертации. Версия 2.1 отличается от 2.0 тем, что передает основные структуры частиц ссылкой, а не значением, и уменьшает количество преобразований double->float->double, выполняемых компилятором. Это дает ускорение на 25% по сравнению с версией 2.0, что означает новые данные.
В 3DPM 8086K показывает себя на одном уровне с 8700K.
DigiCortex v1.20: link
Хотя и устаревшее на пару лет, программное обеспечение DigiCortex является домашним проектом для визуализации активности нейронов и синапсов в мозге. Программное обеспечение поставляется с различными эталонными тестами, и мы берем небольшой бенчмарк, который запускает симуляцию мозга на 32 тысячи нейронов / 1.8 миллиарда синапсов. Результаты теста обозначают способность системы вести эмуляцию в режиме реального времени, а значит, любой результат выше единицы подходит для эмуляции. Бенчмарк предлагает режим «без испускания нейронов синапсами», который, по сути, показывает скорость DRAM и шины. Мы же берем режим «firing», который добавляет нагрузку на ЦП при каждом запуске нейронов.
Несмотря на более высокую одноядерную частоту, этот тест, ограниченный DRAM, по-видимому, загружает другое ядро и не позволяет 8086K достигнуть 5,0 ГГц.
Agisoft Photoscan 1.3.3: link
Photoscan остался в нашем тестовом наборе из предыдущей версии тестов, однако теперь мы работаем в Windows 10, поэтому в игру вступают такие функции, как Speed Shift на новейших процессорах. Концепция Photoscan – преобразование множества 2D-изображений в 3D-модель — поэтому чем более детализированы изображения, и чем больше таковых, тем лучше модель. Алгоритм состоит из четырех этапов: нескольких однопоточных и нескольких многопоточных, а также имеет некоторую зависимость от кэша и памяти. Для некоторых более разнообразных рабочих задач с многопоточными функциями такие опции, как Speed Shift и XFR, смогут использовать преимущества ожидания или простоев CPU, давая значительный прирост производительности на новых микроархитектурах.
Agisoft имеет переменную многопоточность, но 8086K все равно немного отстает от 8700K.
CPU Rendering Tests
Рендеринг тесты – давно признанный фаворит обзоров и тестов, поскольку код, используемый пакетами рендеринга, обычно оптимизирован, чтобы выжать каждый бит производительности. Иногда рендеринг программ также сильно зависит от памяти — когда у вас есть много потоков, переносящих тонны данных, память с малой задержкой отклика может быть ключом ко всему. Здесь мы берем несколько обычных пакетов рендеринга под Windows 10, а также несколько новых интересных тестов.
Corona 1.3: link
Corona — это автономный пакет, предназначенный для поддержки программного обеспечения, такого как 3ds Max и Maya, фотореализмом с помощью трассировки лучей. Это просто – направляешь лучи, получаешь пиксели. Ладно, немного сложнее, но этот бенчмарк рендерит фиксированную сцену шесть раз, и выдает результаты в разрезе времени и количества лучей в секунду. В официальных таблицах бенчмарка представлены результаты пользователей с точки зрения времени, однако я считаю, что «лучей в секунду» является лучшим показателем (да и в общем, результаты, где «больше означает лучше», проще объяснять). Corona любит нагромождать потоки, поэтому результаты оказываются в сильной зависимости именно от количества потоков.
Corona — полностью многопоточный тест, и поэтому удивительно видеть отставание 8086K от 8700K. Вероятно, это связано с тем, что заимствованная тестовая система не идеально соответствует нашему стандарту тестирования.
Blender 2.78: link
Старик в мире рендеринг-тестов, Blender все еще очень популярный инструмент. Нам удалось запустить стандартную рабочую нагрузку на билде Blender от 5 февраля, и измерить время, необходимое для рендеринга первого кадра сцены. Блендер является одним из крупнейших инструментов с открытым исходным кодом, это означает, что как AMD, так и Intel работают активно, чтобы помочь улучшить кодовую базу, что может идти как на пользу, так и во вред их собственной микроархитектуре.
Blender также любит создавать потоки, а 8086K, как и раньше, отстает от близнеца.
LuxMark v3.1
Как синтетический тест, LuxMark может показаться несколько ненадежным в качестве средства визуализации, учитывая, что он в основном используется для тестирования графических процессоров. Однако он предлагает как OpenCL, так и стандартный режим C ++. В этом случае, помимо сравнения в каждом варианте кодирования ядер и IPC, мы можем видеть, что код C ++ и OpenCL показывают разную производительность на одних и тех же процессорах.
POV-Ray 3.7.1b4
Еще один регулярный бенчмарк в большинстве наборов — POV-Ray. Еще один трассировщик лучей с многолетней историей. Как это часто случается, во время подготовки AMD к запуску Ryzen, база кода стала активно обновляться, разработчики вносили изменения в код и выпускали новые апдейты. Наша версия для тестов была взята как раз перед началом таких событий, но со временем мы видим, что код POV-Ray корректируется в соответствии с новыми требованиями.
Практически идентичные результаты у 8086K и 8700K в тесте POV-Ray.
Cinebench R15: link
Последняя версия CineBench стала одной из тех программ, которые использовались везде, в частности, как индикатор производительности одного потока. Высокий уровень IPC и высокая частота дают производительность в Single-Threading, тогда как наличие хорошего масштабирования и многих ядер — это залог успеха Multi-Threading.
8086K получает звание нового чемпиона в однопоточном тестировании в CineBench R15 ST, но немного отстает от 8700K в тестировании многопоточном.
CPU Encoding Tests
Одним из интересных элементов современных процессоров является производительность кодирования. Это включает в себя шифрование / дешифрование, а также перекодирование видео из одного видеоформата в другой. В случае шифрования / дешифрования производительность по-прежнему актуальна для шифрования конфиденциальных данных «на лету» — процесса, с помощью которого современные устройства обычно обеспечивают безопасность программного обеспечения. В последнее время использование перекодирования видео для подгонки качества, размера файла и разрешения видеофайла испытывает настоящий бум. Это необходимо для подгонки видео под девайс потребителя, или для гейм-стримеров, которые желают выгружать перекодированный поток видео с камеры в режиме реал-тайм. По мере того, как мы переходим в живое 3D-видео, эта задача будет еще более приоритетной, и оказывается, что быстродействие определенных алгоритмов определяется функцией ввода / вывода содержимого.
7-Zip 9.2
Одним из фриварных архиваторов, позволяющих оценить производительность процессоров, является 7-Zip. Он работает под лицензией с открытым исходным кодом, является быстрым и простым в использовании инструментом для опытных пользователей. Мы запускаем тестовый режим через командную строку, выполняем четыре цикла и получаем результат.
Снова наблюдается противостояние с 8700K, но новый 8086 немного отстает.
WinRAR 5.40
Для тестового пакета 2017 мы воспользуемся последней версией WinRAR в нашем тесте архиваторов. WinRAR в некоторых аспектах более удобен для пользователя, чем 7-Zip, поэтому мы решили включить его в пакет. Вместо использования бенчмарк режима, как в случае с 7-Zip, здесь мы берем набор файлов, представляющих общий стек (33 видеофайла в 1,37 ГБ, 2834 файла меньшего размера в 370 папках по 150 МБ) сжимаемых и несжимаемых форматов. Показанные результаты — это время, затраченное на кодирование файла. Из-за кэширования DRAM мы запускаем тест 10 раз и получаем среднее значение для последних пяти запусков, когда бенчмарк находится в устойчивом состоянии.
И это еще один тест, где 8086K уступает «не лимитированному» 8700K.
AES Encoding
Алгоритмы, использующие AES-кодирование, широко распространились по всему миру в качестве вездесущего инструмента для шифрования. Однако, это еще один тест-для-ЦПУ, а современные ЦПУ имеют расширение системы команд AES для увеличения производительности шифрования. Мы часто рассматриваем масштабирование как по частоте, так и по ядрам с помощью этого бенчмарка. Мы используем последнюю версию TrueCrypt и запускаем его в бенчмарк-режиме с 1 ГБ данных в DRAM. Показанные результаты — это среднее значение GB / s для шифрования и дешифрования.
При кодировании AES мы получили буквально одинаковые результаты.
HandBrake v1.0.2 H264 и HEVC
Как упоминалось выше, перекодирование видео (как кодирование, так и декодирование) является горячей темой в показателях производительности, поскольку темпы создания нового контента нарастают. Первое предположение – изменение стандарта форматирования видео, которое может происходить как с потерей, так и без потери качества. Так же возможно уменьшение качества видео в угоду размера файла. Наряду с любимым кодеком Google, VP9, есть еще два других часто используемых: H264, старый кодек, есть практически везде и оптимизирован для видео 1080p, и HEVC (или H265), целью которого является обеспечение того же качества, что и H264, но при более низком размере файла (или более высоком качестве для одного и того же размера). HEVC важен, поскольку способен передавать потоковое видео в качестве 4к, что означает передачу меньшего количества бит для одного и того же качественного контента.
Handbrake является предпочтительным инструментом для перекодирования, поэтому наш тестовый режим покрывает три области.
Низкое качество / разрешение H264: здесь мы перекодируем 2-часовую 640x266 H264 видеозапись и меняем кодировку с Main profile на High profile, используя very-fast предустановку.
Высокое качество / разрешение H264: аналогичный тест, но на этот раз мы берем десятиминутный double 4K файл (3840x4320), отображаемый на частоте 60 Гц и перекодированный с Main на High, используя very-fast предустановку.
Тест HEVC: используя то же видео в HQ, мы меняем разрешение и кодек исходного видео с 4K60 в H264 на 4K60 HEVC.
CPU Office Tests
Офисные программы, которые мы используем для бенчмаркинга, — это не конкретные программы, а отраслевые стандартные тесты, они имеют вес в профессиональной среде. Цель этих тестов — использовать набор программ и методов, с которыми может столкнуться обычный офисный пользователь, например, видеоконференции, редактирование документов, архитектурное моделирование и так далее и тому подобное.
Chromium Compile (v56)
Наш новый тест компиляции использует Windows 10 Pro, VS Community 2015.3 с Win10 SDK для компиляции ночной сборки Chromium. Мы подготовили тест для сборки в конце марта 2017 года, и в нашем тесте мы запускаем новую полную компиляцию. Компиляция — типичный пример рабочей нагрузки с переменной многопоточностью — некоторые процессы компиляции и привязки линейны, тогда как другие части являются многопоточными.
Это еще один случай, когда я думаю, что наш импровизированный тестовый стенд сыграл большую роль, и я хотел бы позднее повторить его на своем стандартном стенде. Поскольку компиляция дает тяжелую нагрузку не только на процессор.
GeekBench4
По многочисленным запросам GeekBench 4 теперь входит в наш пакет. GB4 представляет собой синтетический тест с использованием алгоритмов, часто встречающихся в высокопроизводительных рабочих нагрузках, а также серию тестов, ориентированных на память. Самое большое достижение GB4 – вывод результата всего тестирования в виде единой цифры, что, по-видимому, нравится его поклонникам, хотя такой результат не всегда легко применить для сравнения производительности в реальных условиях.
Как и в CineBench, Core i7-8086K берет верх на синтетическом однопоточном тесте.
PCMark8: link
Несмотря на то, что PCMark впервые появился на свет в 2008/2009 году, Futuremark поддерживает PCMark8. В масштабах сложных задач PCMark больше ориентируется на низкопроцентный диапазон профессиональных нагрузок, что делает его хорошим индикатором того, что люди считают «офисной работой». Мы запускаем бенчмарк из командной строки в «традиционном» режиме, то есть C ++ без OpenCL, чтобы удалить графическую карту из уравнения и сосредоточиться исключительно на процессоре. PCMark8 предлагает Home, Work и Creative рабочую нагрузку, при этом некоторые тесты программного обеспечения являются общими, а другие уникальны для каждого набора тестов.
Здесь 8086K наконец обгоняет своего брата 8700K, хотя и совсем ненамного.
CPU Legacy Tests
Наши устаревшие тесты представляют собой контрольные показатели, которые когда-то были впереди своего времени. Некоторые из них являются синтетическими стандартами в промышленности, и у нас есть данные, приходящие в течение уже 10 лет. Все данные здесь были повторно запущены в Windows 10, и мы планируем вернуться к нескольким поколениям компонентов, чтобы узнать, как развилась производительность.
3D Particle Movement v1
3DPM — это написанный нами тест, применяющий базовые алгоритмы 3D-движения, используемые в симуляциях Броуновского движения, и их тестирование на скорость. Высокая производительность вычислений с плавающей точкой, МГц и IPC покажут себя в версии с одним потоком, тогда как многопоточная версия работает с потоками и любит много ядер. Это оригинальная версия, написанная в стиле типичного не-компьютерного студента, кодирующего алгоритм для теоретической проблемы. Она поставляется без каких-либо неочевидных оптимизаций, которые еще не выполняются компилятором, например false sharing.
CineBench 11.5 and 10
Cinebench — широко известный инструмент для измерения производительности, имеющий отношение к анимационному программному обеспечению MAXON Cinema 4D. Cinebench оптимизировался в течение десятилетия и фокусируется только на мощности процессора. Это означает, что, если есть несоответствие характеристик пропускной способности, Cinebench, скорее всего, покажет это несоответствие. Возможно, другое программное обеспечение не использует все доступные инструменты для нагрузки процессора, поэтому релевантность теста для реального мира может быть чисто академической, но, учитывая нашу большую базу данных для Cinebench, трудно игнорировать небольшой пятиминутный тест. В этом тесте мы запускаем современную версию 15, а также старые 11,5 и 10 из-за наших сохраненных данных.
x264 HD 3.0
Аналогично, пакет x264 HD 3.0, который мы здесь используем, также хранится для исторических регрессионных данных. Последняя версия 5.0.1, и она кодирует видеоролик 1080p в высококачественный x264-файл. Версия 3.0 выполняет то же тест в файле 720p, и в большинстве случаев производительность программного обеспечения достигает предела для high-end процессоров, но все еще хорошо работает для среднего и младшего уровня. Кроме того, эта версия выполняется всего несколько минут, тогда как последняя может занять более 90 минут.
Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?
Комментарии (15)
tangro
31.07.2018 11:02+3Итого: 8700K лучше почти во всём, дешевле на 70 баксов и его проще достать.
forcewake
31.07.2018 14:08Будем надеятся что 9900K будет работать на Z370 без стандартных интеловских отговорок (питание и тд) — и можно смело брать)
dartraiden
01.08.2018 04:09Поддержку 8-ядерников уже добавляют даже в биосы материнок на H310. То бишь, работать-то будет.
iTichok
01.08.2018 12:30Он то работать будет, вот только питальник даже нынешних топовых Z370 (Хиро, Тайчи) с натяжечкой держит напряжение 1.4+ на 8700k, так что вряд ли нынешние матери справятся нормально с 9900к.
krab90
31.07.2018 14:54Разве? Я во многих многопоточных тестах вижу серьезное преимущество у ryzen 7 2700x 105w, во всех однопоточных же да плоховато.
SmartyTimmi
31.07.2018 19:22Наверное комментатор сравнивал только линейку Intel )
tangro
31.07.2018 23:28как-то глаз настолько привык выбрасывать из сравнений амд, что я тут даже и не заметил, как его не заметил :)
vesper-bot
31.07.2018 12:40+1Интересно, с чем связан проигрыш 8086 против 8700K в мультипоточных бенчмарках, особенно тех, где однопоточный вариант выигрывает из-за частоты. Вроде как по описанию частОты всех ядер у 8086 выше, чем у 8700K. Или я что-то серьезное упустил?
iTichok
31.07.2018 15:54Ничего не упущено, я чего-то тоже не особо понимаю результатов тестов. 8086k это и есть 8700k, только отобраны удачные камни и изменен всего лишь турбобуст на одно ядро (турбобуст остальных ядер идентичный), что по сути влияет только на разгон, но большинство 8700k тоже могут потянуть 5Ггц, что делает 8086 и 8700 одинаковыми процессорами (в рамках этого тестирования, где 8086 гонится только до 5ггц). Так что результаты тестов очень странные (по крайней мере графики).
AndreyTsy
31.07.2018 19:23Владею 8700к точно так же гонится до 5Ггц и не капли больше. Видимо 8086 для коллекционеров.
iTichok
01.08.2018 00:03Через мои руки прошёл тоже только один экземпляр 8086. И гнался он ну прям совсем чуточку лучше чем мой 8700к. Разница была в районе 0.005 вольта для 5Ггц. Выше так же не стартанул. Так что да, скорее для коллекционеров.
knutov
01.08.2018 14:43Все показанные результаты тестов как бы намекают, что с охлаждением во время тестов было не очень и, вероятно, 8086 в некоторых тестах проигрывает 8700 из-за троттлинга.
greabock
Много замеров, спасибо. Надо бы к скринам прилагать легенду «больше лучше/меньше лучше». Ну или хотябы единицы измерения указывать на скринах.