Сегодня на технологической конференции Computex 2017 компания ARM представила новые процессоры, которые планирует вывести на рынок в течение года. Это мощный процессор Cortex-A75 и энергоэффективный процессор Cortex-A55, а также новый графический процессор Mali-G72.

Cortex-A75 и A55 стали первыми чипами с технологией DynamIQ big.LITTLE, о которой рассказывали ранее. Она специально оптимизирована для приложений ИИ, которые станут обычным делом в смартфонах будущего, для новых интерфейсов (управление голосом) и виртуальной реальности. Наверное, аппаратная поддержка ИИ полезна ещё и для единой распределённой системы ИИ, которая может работать на миллиардах смартфонов Android — такую систему разработала и сейчас начинает опробовать компания Google.

С аппаратной поддержкой машинного обучения и ИИ разработчикам станут доступны новые специальные процессорные инструкции (например, вычисления с ограниченной точностью). Новые процессоры обеспечат значительную прибавку производительности в приложениях ИИ, в сравнении с нынешними системами на базе Cortex-A73.



ARM big.LITTLE — это гетерогенная вычислительная архитектура, где на CPU выделено место для специальных аппаратных ускорителей приложений машинного обучения. Особенность состоит в наличии процессорных ядер двух типов: относительно медленных, энергоэффективных (LITTLE) и относительно мощных и прожорливых (big). Фоновые задачи на смартфоне или другом устройстве удобно решать с маленькими ядрами, которые потребляют очень мало энергии. В случае необходимости процессор активирует мощные прожорливые ядра, которые в многопоточном режиме, работая сообща, демонстрируют особенно высокую производительность. В принципе, у всех ядер есть доступ к общей памяти, так что задачи можно ставить для выполнения на обоих типах ядер одновременно. То есть большие и маленькие переключаются на лету.



DynamIQ big.LITTLE — эволюционный шаг вперёд. Новая архитектура позволяет задействовать разнообразные сочетания больших и малых ядер, которые раньше не были возможны. Например, 1+3, 2+4 или 1+7. В каждом кластере может располагаться до восьми ядер. Кластеры DynamIQ практически неограниченного масштаба с общей памятью — это предложение создавать мощные вычислительные системы самого разного назначения.

Cortex-A75 (4 больших ядра + 4 маленьких)


Процессор Cortex-A75 (3 ГГц), по заявлению британской компании, обеспечивает производительность уровня современного ноутбука, потребляя не больше энергии, чем нынешние смартфоны. Процессор идёт на смену Cortex-A73 (2,8 ГГц), и по тесту SPECint2006 его производительность на 20-40% превышает предшественника.







Cortex-A75 предполагается использовать не только в смартфонах и планшетах, но и в ноутбуках (вроде хромбуков), автомобилях и других устройствах с большим экраном — везде, где нужна высокая производительность.

Cortex-A55 (1 большое ядро + 7 маленьких)


Cortex-A55 — совсем другая птица. Он оптимизирован для экономии энергии и потребляет в 2,5 раза меньше, чем процессоры нынешнего поколения Cortex-A53 (прибавка производительности 14-97%). Его будут использовать в тех же смартфонах и планшетах, если высокая производительность не требуется, а также в разнообразных устройствах Интернета вещей.





Cortex-A55 (16 нм) заменит Cortex-A53 (28 нм) — уже относительно старый CPU, который стал самым популярным 64-битным процессором в истории компьютерной техники.

В обоих процессорах есть нативная поддержка HDR и новой подсистемы безопасности CryptoCell-712.

Mali-G72


Новый графический процессор Mali-G72 обещает на 40% большую производительность, чем процессоры и устройствах 2017 года выпуска, и на 25% лучшую энергоэффективность.

Графический процессор специально разработан с расчётом на виртуальную реальность. Например, он поддерживает Multi-View — продвинутую функцию рендеринга, которая используется в шлемах виртуальной реальности Samsung Gear VR, поддерживает технику Foveated Rendering для слежения за направлением взгляда в шлемах VR, а также адаптивное масштабируемое сжатие текстур (ASTC), мультисэмпловое сглаживание (MSAA) и сглаживание углов объектов.



Этот чип тоже оптимизирован на приложения ИИ — например, умножения матриц (GEMM) здесь на 17% эффективнее, заявила ARM. Предполагается, что в устройствах графика Mali-G72 будет использоваться вместе с процессором Cortex-A75 или Cortex-A55. По статистике ARM, в прошлом году 50% проданных смартфонов и 50% шлемов VR работали на графике Mali.

У производителей аппаратных устройств новые чипы должны появиться в I кв. 2018 года.
Поделиться с друзьями
-->

Комментарии (11)


  1. loly_girl
    30.05.2017 06:44

    Что-то как-то они не упоминают про грядущую совместимость х86-винды и ARM. На месте маркетологов я бы кричала на каждом углу, и уж точно в этом анонсе. Неужели с ней не всё так гладко?


    1. FernandoAlfonso
      30.05.2017 08:00

      Они о своих достижениях пишут, совместимость с виндой зависит от Микрософта, а не от ARM.


    1. DWiz
      30.05.2017 08:23

      Так этим не ARM, а Qualcomm вместе с MS занимается.


    1. izzholtik
      30.05.2017 13:23

      Интересно, удастся ли запускать таким же способом, например, х86 линукс. Не знаю, зачем, но интересно.


  1. serghs
    30.05.2017 08:23

    На графике у Cortex-A75 производительность выросла, а эффективность не изменилась (по сравнению с A73). Как так?.. Я чего-то недопонял?


  1. uSasha
    30.05.2017 11:16

    Довольно странно, что они говорят про ИИ, машинное обучение и тд, но никаких новых инструкций для работы с матрицами не упоминают, такое впечатление, что это просто чтобы быть в тренде, а по сути они усовершенствовали процессор общего назначения.

    Не так давно читал статью про гугловский TPU (сопроцессор для ускорения операций предсказания в нейронных сетях). Они очень сильно упростили вычислительные блоки (они не умеют работать с плавающей точкой и быстро работают только с 8 битными целыми) но там 256х256=64К блоков умножения с накоплением и они умеют работать не с векторами как GPU, а с сразу с матрицами.

    Вот таких блочков добавить в процессора было бы интересно.


    1. SvSh123
      30.05.2017 11:52
      +1

      1. uSasha
        30.05.2017 14:26

        Сложно сказать, по описанию похоже, что по ссылке классический DSP, он RISC и инструкции работают с векторами (одномерными массивами), тут же изюминка в том, что инструкции работают с матрицами (двумерными массивами) но из-за этого пришлось перейти на CISC, т.к. там коэфициенты при умножении сдвигаются «по слоям».
        Там вообще много не трендовых упрощений и «шагов назад», которые позволили очень эффективно выполнять конкретную задачу.


        1. SvSh123
          30.05.2017 15:43

          NeuroMatrix все-таки не DSP, их основное предназначение — как раз нейронные сети.
          Гугловская схема — еще более узкоспециализированное решение. И потребление энергии у нее по меркам ARM великовато. Может, со временем и до мобильных устройств с таким сопроцессором дойдет.


          1. leshabirukov
            30.05.2017 21:55
            +1

            NeuroMatrix действительно задумывался для симуляции НС, но в то время бум НС закончился пшиком, и основным предназначением NeuroMatrix-а стала та самая обработка сигналов. К счастью, на этом поле он оказался вполне пригодным.
            А по архитектуре основного вычислительного узла это действительно физическая матрица для умножения с накоплением, много меньше по размерам чем TPU, но зато гораздо гибче, можно скажем, умножить за одну инструкцию матрицу 32х32 2-битных числа на 32х8 8-битных числа.


            1. SvSh123
              31.05.2017 09:12
              +1

              Ну, сейчас эта тема снова в моде, глядишь, и по прямому назначению применять будут. :)