Почти каждый год на рынок выходит новое поколение центральных процессоров Intel Xeon E5. В каждом поколении попеременно меняются сокет и технологический процесс. Ядер становится всё больше и больше, а тепловыделение понемногу снижается. Но возникает естественный вопрос: «Что даёт новая архитектура конечному пользователю?»

Для этого я решил протестировать производительность аналогичных процессоров разных поколений. Сравнивать решил модели массового сегмента: 8-ядерные процессоры 2660, 2670, 2640V2, 2650V2, 2630V3 и 2620V4. Тестирование с подобным разбросом поколений является не совсем справедливым, т.к. между V2 и V3 стоит разный чипсет, память нового поколения с большей частотой, а самое главное — нет прямых ровесников по частоте среди моделей всех 4-х поколений. Но, в любом случае, это исследование поможет понять в какой степени выросла производительность новых процессоров в реальных приложениях и синтетических тестах.

Выбранная линейка процессоров имеет много схожих параметров: одинаковое количество ядер и потоков, 20 MB SmartCache, 8 GT/s QPI (кроме 2640V2) и количество линий PCI-E равное 40.

Для оценки целесообразности тестирования всех процессоров, я обратился к результатам тестов PassMark.

Ниже привожу сводный график результатов:



Так как частота существенно отличается, сравнивать результаты не совсем корректно. Но несмотря на это, с ходу напрашиваются выводы:

1. 2660 эквивалентен по производительности 2620V4
2. 2670 превосходит по производительности 2620V4 (очевидно, что за счёт частоты)
3. 2640V2 проседает, а 2650V2 бьёт всех (также из-за частоты)

Я поделил результат на частоту и получил некое значение производительности на 1 ГГц:



Вот тут уже результаты получились более интересные и наглядные:

1. 2660 и 2670 — неожиданный для меня разбег в рамках одного поколения, 2670 оправдывает только то, что общая производительность у него весьма высока
2. 2640V2 и 2650V2 — весьма странный низкий результат, который хуже чем у 2660
3. 2630V3 и 2620V4 — единственный логический рост (видимо как раз за счёт новой архитектуры...)

Проанализировав результат я решил отсеять часть неинтересных моделей, которые не имеют ценности для дальнейшего тестирования:

1. 2640V2 и 2650V2 — промежуточное поколение, и не очень удачное, на мой взгляд — убираю из кандидатов
2. 2630V3 — отличный результат, но стоит необоснованно дороже 2620V4, учитывая аналогичную производительность и, к тому же — это уже уходящее поколение процессоров
3. 2620V4 — адекватная цена (сравнивая с 2630V3), высокая производительность и, самое главное — это единственная модель 8-ядерного процессора последнего поколения с Hyper-threading в нашем списке, поэтому однозначно оставляем для дальнейших тестов
4. 2660 и 2670 — отличный результат в сравнении с 2620V4. На мой взгляд, именно сравнение первого и последнего (на данный момент) поколения в линейке Intel Xeon E5 представляет особый интерес. К тому же у нас на складе остались достаточные запасы процессоров первого поколения, поэтому для нас это сравнение весьма актуально.

Стоимость серверов на базе процессоров 2660 и 2620V4 может отличаться почти до 2 крат не в пользу последних, поэтому сравнив их производительность и выбрав сервер на процессорах V1 — можно существенно сократить бюджет на покупку нового сервера. Но об этом предложении я расскажу после результатов тестирования.

Для тестирования было собрано 3 стенда:

1. 2 x Xeon E5-2660, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
2. 2 x Xeon E5-2670, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
3. 2 x Xeon E5-2620V4, 8 x 8Gb DDR4 ECC REG 2133, SSD Intel Enterprise 150Gb

PassMark PerformanceTest 9.0


При отборе процессоров на тесты я уже пользовался результатами синтетических тестов, но сейчас интересно сравнить эти модели более детально. Сравнение сделал группами: 1-ое поколение против 4-го.



Более подробный отчёт о тестировании позволяет сделать некоторые выводы:

1. Математика, в т.ч. и с плавающей точкой, в основном зависит от частоты. Разница в 100 МГц позволила 2660 опередить 2620V4 в расчётных операциях, в шифровании и компрессии (и это не смотря на существенную разницу в частоте памяти)
2. Физика и вычисления с использованием расширенных инструкций на новой архитектуре выполняются лучше, не смотря на низкую частоту
3. Ну и, разумеется, тест с использованием памяти прошёл в пользу процессоров V4, так как в данном случае соревновались уже разные поколения памяти — DDR4 и DDR3.

Это была синтетика. Посмотрим что покажут специализированные бенчмарки и реальные приложения.

Архиватор 7ZIP




Тут результаты перекликаются с предыдущим тестом — прямая привязка к частоте процессора. При этом не важно, что установлена более медленная память — процессоры V1 уверенно берут первенство частотой.

CINEBENCH R15


CINEBENCH — это бенчмарк для оценки рабочих характеристик компьютера для работы с профессиональной программой для создания анимации MAXON Cinema 4D.



Xeon E5-2670 вытянул по частоте и побил 2620V4. А вот E5-2660, имеющий не столь видимое преимущество по частоте, проиграл процессору 4-го поколения. Отсюда вывод — этот софт использует полезные дополнения новой архитектуры (хотя возможно всё дело в памяти...), но не на столько, чтобы это было решающим фактором.

3DS MAX + V-Ray


Для оценки производительности процессоров при рендеринге в реальном приложении я взял связку: 3ds Max 2016 + V-ray 3.4 + реальная сцена с несколькими источниками света, зеркальными и прозрачными материалами, и картой окружения.



Результаты получились схожи с CINEBENCH: Xeon E5-2670 показал самое низкое время рендеринга, а 2660 не смог обойти 2620V4.

1С: SQL/File


В заключение тестирования прилагаю результаты тестов gilev для 1С.



При тестировании базы с файловым доступом уверенно лидирует процессор E5-2620V4. В таблице приведены средние значения 20 прогонов одного и того же теста. Разница между результатами каждого стенда в случае с файловой базой была не больше 2%.

Однопоточный тест базы SQL показал весьма странные результаты. Разница получилась незначительной, учитывая разную частоту у 2660 и 2670, и разную частоту у DDR3 и DDR4. Была попытка оптимизировать настройки SQL, но результаты оказались хуже, чем было, поэтому я решил тестировать все стенды на базовых настройках.



Результаты многопоточного теста SQL оказались ещё куда более странными и противоречивыми. Максимальная скорость 1 потока в МБ/с была эквивалентна индексу производительности в предыдущем однопоточном тесте.

Следующим параметром была максимальная скорость (всех потоков) — результат получился практически идентичным у всех стендов. Так как результаты разных прогонов сильно колебались (+-5%) — иногда они были у разных стендов с существенным отрывом как в одну так и в другую сторону. Одинаковые средние результаты многопоточного теста SQL наводят меня на 3 мысли:

1. Такая ситуация вызвана неоптимизированной конфигурацией SQL
2. SSD стал узким местом системы и не позволил процессорам разогнаться
3. Разницы между частотой памяти и процессоров под эти задачи почти нет (что крайне маловероятно)

Если у Вас есть достоверные объяснения подобных результатов — прошу Вас поделиться ими в комментариях.

Также оказался необъяснимым результат по параметру «Рекомендуемое кол-во пользователей». Средний результат у 2660 оказался выше всех — и это при низких результатах всех тестов.
По этому вопросу также буду рад увидеть Ваши комментарии.

Выводы


Результаты нескольких разносторонних вычислительных тестов показали, что частота процессора в большинстве случаев оказалась важней поколения, архитектуры и даже частоты памяти. Безусловно есть современный софт, который использует все улучшения новой архитектуры. Например, транскодирование видео иногда производится в т.ч. с использованием инструкций AVX2.0, но это специализированное ПО — а большинство серверных приложений по прежнему привязаны к количеству и частоте ядер.

Разумеется я не заявляю, что разницы между процессорами нет совсем никакой, я лишь хочу отметить, что для определённых приложений нет смысла в «плановом» переходе на новое поколение.

Если Вы со мной не согласны или у Вас есть предложения для тестирования — стенды пока не разобраны, и я буду рад произвести тестирование Ваших задач.

Экономическая выгода


Как я уже писал в начале статьи — мы предлагаем линейку серверов на базе процессоров Xeon E5 первого поколения, которые по стоимости существенно бюджетней серверов на E5-2620V4.
Это такие же новые серверы (не путать с б/у) с гарантией 3 года.

Ниже привожу ориентировочный расчет:

Сервер STSS Flagman RX227.4-008LH в конфигурации 2 х Intel Xeon E5-2620V4 + 8 x 8Gb DDR4 ECC REG в розницу стоит на сегодняшний день 265065р.

Аналогичная конфигурация STSS Flagman EX227.3-008LH на базе 2 х Intel Xeon E5-2660 + 8 x 8Gb DDR3 ECC REG по акции доступна за 175275р.

Читатели Хабра могут получить при заказе дополнительную скидку 5%. Для этого необходимо выбрать нужный форм-фактор корпуса из списка моделей на нашем сайте. Модель EX217.3-004LH выполнена в 1U-корпусе, EX227.3-008LH — 2U, а EX240.3-008LH построена на базе корпуса Tower/4U.
В конфигураторе модели можно подобрать необходимые параметры памяти, дисковой подсистемы и дополнительных устройств. При отправке заявки на расчет необходимо указать промокод HABRAHABR.

Спасибо за внимание! Буду ждать Ваших комментариев и пожеланий по тестам.

Написание статьи и тестирование: Usikoff
Тестирование 1C: sarge74
Поделиться с друзьями
-->

Комментарии (18)


  1. ximik13
    02.03.2017 11:17
    +2

    Если говорить про обработку транзакционной нагрузки на дисковую подсистему, то сталкивался с тем что Xeon E5140 2.33 GHz упирался в 100% утилизации примерно на 75k IOPS. При этом Xeon E5640 2.66 GHz при той же нагрузке был утилизирован не более чем на 10%. Т.е. разность поколений сказалась намного сильнее, чем в ваших тестах.


    1. equand
      03.03.2017 14:03
      +3

      51-52-53-54xx разница против 55xx-56xx++ существенная. Разная архитектура (Core vs Nehalem и *** Bridges)


  1. Usikoff
    02.03.2017 11:31
    +6

    Разумеется, мы ведь сравнивали ровесников — у них почти все, кроме техпроцесса совпадает. А в Вашем случае разница более существенная: http://ark.intel.com/compare/47923,27214


  1. yous
    02.03.2017 11:48

    вот бы сравнение старенького AMD PHENOM 555 с современными ))


  1. Re1ter
    02.03.2017 11:48
    +2

    Сравнение не совсем корректно:

    • сравниваются процессоры разной ценовой категории: 2620v4 стоит $417 против $1329 у 2660. Логичнее было бы сравнивать 2660 и 2660v4 — они сопоставимы по цене
    • максимальный объём поддерживаемой памяти у 2660 составляет 384Gb против 1536Gb у новенького 2620v4, всё чаще это довольно критично
    • TDP новинки меньше на 10W

    Учитывая, что 2620v4 втрое дешевле предшественника при сходных или более высоких характеристиках, это сложно назвать отсутствием прогресса.
    Гораздо интереснее смотрелся бы обзор 2660 vs. 2660v4


    1. 23derevo
      02.03.2017 12:08
      +4

      И кроме того диаграмма с голубыми столбиками — некорректная. Надо было бы от 0 ее рисовать, а не от 4.4, чтобы результаты выглядели корректно. И еще можно было бы производительность-на доллар нарисовать. Это был бы полезный на практике график. Особенно если считать стоимость не чисто процессора, а процессор + все остальное. Типа, «система на таком процессоре обходится в $4000, а на таком — в $5000.»


      1. Usikoff
        02.03.2017 12:19
        +3

        Вот тут согласен, увидел сам после публикации. Мне долго не давала покоя такая визуальная разница между 2660 и 2670. Выглядит страшно, а по цифрам не так всё и плохо.
        А по поводу производительности на доллар — тут сложней. От какой цены плясать? На 2620V4 цена актуальная — они есть на рынке. V3 уже уходят, а лежат на складах по старым высоким ценникам. V2 уже давно не доступны. V1 мы покупали в своё время по $ тысяче с лишним, а сейчас отдаём за бесценок.
        Поэтому оценить можно только стоимость реальных серверов на данный момент, а разница получается существенная.


        1. 23derevo
          02.03.2017 12:22

          да, я оценивал бы разницу в стоимости реальных серверов на данный момент. Тогда можно было бы сделать какие-то практические выводы в плане выбора, что купить.


          1. Usikoff
            02.03.2017 12:25
            +3

            В конце статьи я как раз представил эти расчёты на примере наших моделей. С помощью конфигуратора моделей можно сравнить свои конфигурации, с дисками, контроллерами и пр.


    1. Usikoff
      02.03.2017 12:09
      +3

      В данном сравнении был здравый смысл — отбирались процессоры полностью идентичные по кол-ву ядер, кэшу, частоте шины и т.д. На сколько можно заметить, с каждым новым поколением, модель процессоров Intel с определённым числом ядер «сползала» вниз на один шаг. Так в первом поколении с 8-ю ядрами мы видим 2670 и 2660, во втором уже 2650V2 и 2640V2, а дальше соответственно 2630V3 и 2620V4.
      Причем маркетинговое и ценовое разделение Intel осталось без изменений: есть процессоры начального уровня (маленький кэш, отсутствие HT, низкая частота, нет турбобуста), среднего уровня и топовые — максимальное количество ядер и увеличенный кэш. Но за 4 поколения максимальное количество ядер увеличилось кратно, поэтому 2660 трудно назвать аналогом 2660V4 — хотя когда-то давно он был в такой же ценовой категории.
      Главное сейчас то, что по производительности V1 эквивалентны V4 в большинстве задач, а стоимость сервера с V1 (с учётом скидки за «неактуальность» поколения) получается гораздо интересней чем стоимость аналога на V4.
      В период кризиса многие компании решаются на покупку б/у серверов, а тут — новый сервер с гарантией 3 года при существенной экономии бюджета.


      1. Re1ter
        02.03.2017 12:24

        а стоимость сервера с V1 (с учётом скидки за «неактуальность» поколения) получается гораздо интересней чем стоимость аналога на V4

        А можно хотя бы примерно, чтобы порядок цен сравнить? 2620v4 и сам по себе совсем не дорог.


        1. Usikoff
          02.03.2017 12:27
          +3

          Примерно что? Цена на серверы разных поколений есть в конце статьи. Конфигуратор с автоматическим калькулятором цены поможет рассчитать свою конфигу.


          1. Re1ter
            02.03.2017 12:37
            +1

            Извините, не заметил.


        1. molnij
          03.03.2017 10:38

          б\у 2670v1 сейчас лежат за настолько смешные деньги (6-8Крублей), что я на них перевел пару серверов просто потому что практически бесплатно.


      1. u010602
        03.03.2017 04:13
        +1

        Было бы интересно зафиксировать либо производительность, либо цену. Например насколько больше производительности получим если возьмем Б\У за цену нового сервера. Или сколько сэкономим если возьмем Б\У с той-же производительностью. Но в принципе у вас практически и получился второй вариант, разница в производительности около 5% по-моему не существенна, при разнице в цене в 1.5 раза.

        А так большое спасибо за статью, было познавательно.


  1. Iaroslav_Olegovich
    02.03.2017 16:10
    +3

    Столкнулись с похожей дилеммой. Б/у 2670v1 (2690) до сих пор является очень востребованным как у геймеров (в том числе и на однопроцессорных материнских платах), так и в начальном/средней руки бизнесе как самая дешёвая числодробилка. Под очередной заказ решили посмотреть, есть ли новый король, так как уже хочется купить платформу поновее, особенно привлекает DDR4. Так вот, за вменяемые деньги — пока ничего интересного нет, оверклокеры советуют инженерные 2683v3. Но в продакшн, конечно же, такое не поставишь( Кажется, интел сами себя перехитрили, во многих случаях самая выгодная стратегия — не торопиться покупать последние поколения процессоров за невменяемую цену, особенно в странах, где сравнительно недорогая электроэнергия.


    1. DjOnline
      05.03.2017 19:06
      +1

      Для многопотока 2683v3 неплох, но для домашнего применения, где бывает однопоток, высокая частота важнее. Поэтому например для домашнего применения остановился на нетронутом 4930k за 10к с Avito, по сравнению с 2670 получил на 50% быстрее однопоток при практически равной скорости многопотока.

      Хотя для числодробилок (кроме float) на сегодня уже появился более быстрый ryzen 1700, который при небольшом разгоне на 0%-10% быстрее в однопотоке и +50% в многопотоке (x264, рендеринг) и сравнимой скорости в том же photoshop и прочих.


  1. molnij
    03.03.2017 10:42
    +1

    В целом согласуется с некоторыми нашими внутренними тестами.
    У меня был линейный рост по ядрам и частоте(что, впрочем, неудивительно), при укладывающемся в погрешность росте между поколениями