Applied Micro анонсировал распространение образцов X-Gene 3, системы на кристалле для серверов на архитектуре ARM третьего поколения. В соответствии с отчетом Linley Group новая платформа обеспечит сопоставимую с новейшими процессорами Intel Xeon производительность за значительно меньшую цену.



Applied Micro, которая сейчас входит в состав производящей полупроводниковые приборы фирмы MACOM, официально представила X-Gene 3 в ноябре прошлого года, однако на этой неделе стало известно о распространении образцов микросхем и доставке клиентам, что означает, что свободная их продажа начнется уже в этом году. Помимо Applied Micro/MACOM, новые разработки на архитектуре ARM в 2017 году на рынок выставят также Cavium и Qualcomm, процессоры ThunderX2 и Centriq 2400 SoCs, соответственно.



Схема X-Gene 3. Процессор содержит 32 ядра, 32Мб кэша L3, восемь каналов DDR4-2667 DRAM и 42 линии PCI Express Gen3.


Сравнительный анализ этих технологий друг с другом и с нынешним лидером серверных процессоров Intel Xeon провел в последнем докладе Линли Гвенапп (Linley Gwennap), главный аналитик The Linley Group и главный редактор Microprocessor Report. Гвеннап полагает, что с рабочими нагрузками при облачных вычислениях новый X-Gene будет справляться так же хорошо или даже лучше, чем Xeon, как и в случае некоторых приложений для высокопроизводительных вычислений. Новая платформа Applied Micro по производительности названа в исследовании лидером.


Производительные мощности X-Gene 3 — результат его относительно высокой тактовой частоты и пропускной способности памяти. Процессор работает на 32 ядрах с базовой частотой 3,0 ГГц и может достигать 3,3 ГГц в турборежиме. Чип включает в себя восемь каналов памяти, которые могут обслуживать устройства DDR4 с частотой до 2667 МГц, обеспечивая пропускную способность 170 ГБ/с. Система на кристалле также включает 42 линии PCIe 3.0 для внешних соединений.


По словам Гвеннапа, это привело к нескольким впечатляющим показателям производительности. Из отчета:


«Основываясь на тестировании текущей конфигурации частоты процессора 3,0 ГГц и DDR4-2400, можно ожидать, что чип будет обеспечивать SPECint_rate2006 (пиковый) балл не менее 500 при работе на максимальной скорости 3,3 ГГц и DDR4-2667 и с некоторым дополнительным аппаратным обеспечением и компилятором. Этот показатель намного опережает аналогичный показатель любого другого ARM-процессора и аналогичен таковому у основных процессоров Xeon E5».


Табличное сравнение с сопоставимыми процессорами Intel Xeon приведено ниже:



Сравнительная таблица характеристик высокомощных серверных процессоров. X-Gene 3 обладает очевидными преимуществами в пропускной способности памяти, не уступая во всем прочем.


Гвеннап делает вывод, что существующие сегодня общедоступные Xeon’ы с большим количеством ядер или более высокой тактовой частотой, чем у E5-2680, будут работать лучше, чем X-Gene 3. Но это чипы высшего класса стоимостью выше 2000 долларов, не нацеленные на рынок облачных вычислений или корпоративного клиента, на которых рассчитывает Applied Micro.


Что касается ARM-конкуренции, то Гвеннап утверждает, что X-Gene 3 в состоянии обогнать как последнюю версию Cantium ThunderX2 SoC, так и новый чип Centriq 2400 от Qualcomm. Хотя производительность ядра ThunderX2 в расчете на ядро должна значительно улучшиться, конкуренции более производительному X-Gene 3 эта модель не составит. Также Гвеннап предполагает, что предложение Qualcomm будет иметь аналогичную ThunderX2 производительность, хотя он признает, что о его технических возможностях известно меньше.


В отчете также говорится, что X-Gene 3 может обрабатывать «широкий спектр облачных рабочих нагрузок, включая масштабирование приложений». Он должен быть особенно хорошо приспособлен для т.н. приложений для больших данных (таких, как обработка базы данных в памяти) благодаря своей превосходной пропускной способности. По совпадению (но совпадение ли это?) AMD анонсирует выход своего нового чипа Naples x86 для очень схожих задач на той же 8-канальной схеме.



Важное предостережение: X-Gene 3 не конкурирует с Xeon в отношении производительности в задачах с плавающей запятой, и этот разрыв только увеличится с появлением в доступе процессоров Skylake с поддержкой AVX. Это, однако, не касается приложений HPC. В качестве одного из примеров в исследовании приводятся некоторые типы приложений для биоинформатики, которые в основном используют скалярную обработку. Но для рабочих нагрузок в высокопроизводительных вычислениях чтобы обеспечить конкурентоспособную производительность X-Gene 3 будет вынужден полагаться на графический процессор или другой ускоритель вычислений с плавающей запятой.


Нет ничего особенно удивительного в достижении сравнимой с Intel Xeon производительности, но Applied Micro считает, что ей удастся сделать для рынка серверных процессоров очень выгодное предложение. Хотя конкретная ценовая политика X-Gene 3 еще не обнародована, они скорее всего урежут на треть стоимость Xeon E5-2680 в $1745. Другие производители микросхем ARM также попытаются составить достойную конкуренцию Intel. Та в свою очередь всегда может снизить свои цены или предложить другие финансовые стимулы для сокращения этой разницы в стоимости.


Которыми, судя по всему, ей придется воспользоваться. Учитывая конкуренцию с выходящим на рынок процессором AMD, Intel, вероятно, должна будет сократить маржу на продуктах Xeon, чтобы сохранить долю на рынке. Кроме того, недавно Microsoft продемонстрировала свою работу с Cavium и Qualcomm над созданием серверов на основе ARM для их собственных ЦОДов. Идея заключается в том, чтобы частично развернуть их на территории компаний, а частично — в облаке Azure. Если гамбит Microsoft окажется выгодным, то скоро мы все станем свидетелями того, как на серверы ARM начнут переезжать очень многие. Одно удовольствие будет следить за интереснейшей динамикой рынка, всеми ходами и контр-ходами между всеми этими производителями чипов, которая развернется в следующие 12 месяцев.

Поделиться с друзьями
-->

Комментарии (24)


  1. old_bear
    28.03.2017 13:23

    А где сравнение полосы пропускания L3?


    1. Valeriy_Squadra
      28.03.2017 16:31

      В таблице пятая строка — но это общая полоса, отдельно сравнения по L3 в статье нет


      1. old_bear
        28.03.2017 22:42

        Что есть «общая полоса»? В таблице указана полоса во внешнюю память, которая довольно слабо связана со скоростью поступления данных в исполнительный конвейер процессора.


  1. VioletGiraffe
    28.03.2017 13:28

    Я вот чего не понимаю: если ядра Intel могут работать на 4+ ГГц, почему намного более простые ядра АРМ не могут хотя бы на такой же?


    1. brooth
      28.03.2017 14:29
      +3

      C вами много денег не заработаешь


    1. NLO
      28.03.2017 16:48

      НЛО прилетело и опубликовало эту надпись здесь


    1. maaGames
      28.03.2017 18:19

      Думаю, дело в потребляемой мощности. Тут вдвое больше ядер, при том же теплопакете.


      1. VioletGiraffe
        28.03.2017 18:36

        Логично, тоже об этом подумал.
        Интересно, АРМ когда-нибудь сделает конкурентоспособные десктопные ЦП? Или они умышленно не выходят в этот сегмент?


        1. maaGames
          28.03.2017 18:59

          Они уже «делают» в плане энергопотребления.) Гигагерцы тоже ни о чём не говорят. Я в архитектуре ARM даже не пытался разбираться, так что не представляю, возможно ли там в принципе сделать столь же эффективные наборы инструкций. Тут вот видим, что AMD десятиление пытается подтянуться, при одном и том же наборе инструкций, но разной архитектуре. А тут и архитектура разная и наборы инструкций разные… Короче, мне тоже интересно.)


  1. grossws
    28.03.2017 18:33

    А что такое "архитектуре ARM третьего поколения", позвольте узнать?


  1. grossws
    28.03.2017 18:38
    +1

    появлением в доступе процессоров Skylake с поддержкой AVX

    AVX уже был в E5-2650 (2012 год), если что.


    1. zxweed
      29.03.2017 09:43

      там каждый раз новый AVX, он расширяется же постоянно…


      1. grossws
        29.03.2017 10:39

        Что добавили в avx (не в avx-2.0 или avx-512)?


        1. zxweed
          29.03.2017 13:26

          почему это не в 2.0? новая редакция — новые добавления…


          1. homm
            29.03.2017 13:31
            +1

            Grossws хочет сказать, что в статье ошибка и имеется в виду конечно же AVX-512, а не AVX. В сам AVX, конечно, ничего добавить не могут.


          1. grossws
            29.03.2017 13:46

            Фраза, которую я процитировал меня несколько смутила. Формально она корректна: Skylake-based Xeon'ы будут поддерживать первый AVX, но это кагбэ ожидаемо. Когда говорили «поддерживает SSE» по умолчанию не подразумевали, что речь про SSE4.2, так и в случае «поддерживает AVX» не говорит о поддержке AVX-2.0, AVX-512F и прочих радостей.


    1. ZekaM
      29.03.2017 12:04

      Там будет AVX-512


      1. grossws
        29.03.2017 12:35

        Откуда дровишки? Разве Intel обещал, что AVX-512 выйдет за пределы Xeon Phi? Вышедшие в Q1'17 E3 v6 имеют SSE4.1/4.2, AVX 2.0 согласно ark.intel.


        1. homm
          29.03.2017 13:30

          https://en.wikipedia.org/wiki/AVX-512#CPUs_with_AVX-512


          Правда не понятно, что такое Purley


          1. grossws
            29.03.2017 13:38

            Надо дождаться их выхода, пока E5 v5 нет на ark говорить можно только о слухах и пресс-релизах. Они ещё с avx-512 заложили гадость, т.к. «процессор, поддерживающий avx-512» говорит мало и надо знать, какие субнаборы инструкций из него поддерживаются.


            1. homm
              29.03.2017 13:51

              Таблица соответствия как раз по ссылке.


              1. grossws
                29.03.2017 13:56

                Да, видел. Я скорее про удобство указания опций компиляции и подобных развлечений.


  1. zirf
    29.03.2017 10:01
    -1

    Это все интересно, но сравнивать надо готовые решения. MS давно работает с ARM архитектурой, так как такие процессоры идут в мобильные устройства, но Windows Mobile и подобные — не серверные системы. NT кроме х86 до NT 4.0 SP6 поддерживала еще DEC Alpha. Но если MS не критичен, то под Linux IBM лихо выкатывает Linux-on-Power. Естественно Power8 выиграет у Xeon, но тут есть одно но, при сравнении показывают базовые конфигурации и цены сравнимы, а цена/производительность лучше у Power, но реальное решение для ЦОДа разукрасят своими хранилками и прочей совсем не дешёвой мишурой. IBM PureFlex с теми и другими серверами в одной коробке — отдельная песня.


    1. FlameDancer
      30.03.2017 09:30

      TALOS, где процессором power 8, не взлетел. По их бенчам что публиковались на сайте где сбор средств шел, power 8 до xeon все же кое-где не дотянул, кое-где чуть опередил. Т.е. сомнительно утверждение что «power 8 естественно выигрывает у xeon». Основное преимущество Power — быструю память — вроде как раз порежут в Power 9 что бы снизить стоимость, жаль.
      Ну и еще я слышал можно сказать в частном порядке от щупавшего power 8 на вычислительных задачах — «в лучшем случае до ксеона дотягивает».