Постепенно в индустрии производства процессоров развиваются альтернативные архитектуры, на базе которых создают весьма примечательные чипы. Так, стартап Esperanto Technologies представил собственную версию RISC-V процессора, причем не обычного, а высокопроизводительного, предназначенного для работы с ИИ-системами и машинным обучением. Мы уже не раз писали об экспериментах в этой отрасли, давайте посмотрим, что это за новинка.

Немного об архитектуре


Что касается архитектуры RISC-V, то она основана на идее адаптировать создание конкретных микросхем с возможностью выбирать, какие расширения набора команд будут использоваться. В основе архитектуры — свободные система команд и, собственно, сама процессорная архитектура на базе концепции RISC.

Что касается ее особенности, то в описании архитектуры — около 50 стандартных инструкций. Если использовать расширения, можно получить дополнительные 53 инструкции.

Чипы на базе RISC-V стали выпускать не так давно — примерно с 2017 года, не считая всяких прототипов и лабораторных образцов. Начиная с 2018 года, RISC-V Foundation тесно сотрудничает с The Linux Foundation.

RISC-V отлично подходит для работы с приложениями с параллельными вычислениями. К ним, кроме всего прочего, относится машинное обучение, а также ИИ-системы. Именно поэтому сразу несколько компаний разрабатывают процессоры на базе RISC-V. Не сказать, что у всех все идет гладко, но есть и успешные примеры. Можно надеяться, что Esperanto станет одним из них.

Ну окей, так что это за процессор такой?


По словам разработчиков, чип отлично подходит для работы в сфере ИИ и машинного обучения.

Название модели — ET-SoC1 (Esperanto Technologies Supercomputer-on-Chip 1), ее разработчики называют AI Inference Accelerator. Появился процессор не вчера, разрабатывается он уже больше года, так что новинкой можно назвать чип условно. Но вот тестироваться сторонними компаниями он стал только сейчас. Из особенностей — 1088 энергоэффективных 64-разрядных ядер RISC-V общего назначения с модулями векторных/тензорных вычислений для оптимизации и ускорения операций, которые связаны с ИИ и машинным обучением. Кроме того, чип включает четыре высокопроизводительных ядра RISC-V, 160 млн байт встроенной SRAM-памяти (152 мегабайта), плюс интерфейсы для подключения flash-памяти и внешних модулей DRAM. Насколько известно, всего в ET-SoC1 23.8 млрд транзисторов.


Источник

Одно из достоинств новой разработки — высокая энергоффективность, то есть пониженное потребление энергии при очень высокой производительности. Понятно, что «каждый сверчок хвалит свой шесток, но разработчики утверждают, что создали самый быстрый на данный момент процессор такого типа на базе RISC-V архитектуры.

Максимальная эффективность чипа наблюдается при работе в рекомендательных системах на основе машинного обучения. Если сам процессор настолько хорош, как о нем рассказывают разработчики, то он сможет найти применение в системах гипермасштабируемых ЦОД крупнейших компаний мира. Но, конечно, для того, чтобы произошло, процессор необходимо протестировать — в „полевых условиях“, а не лабораториях компании, которая его разработала. И этим уже занимаются — например, компания Samsung.

Если вы читаете наш блог, вас могут заинтересовать эти тексты:

Как оптимизировать траты на аренду инфраструктуры
Готовый реестр контейнеров — кому нужен и как использовать
Как мы запустили удаленный регион облака в Узбекистане

Что говорят представители Samsung


По их словам, чип действительно неплохо справляется с поставленными задачами. Команда тестировщиков из Samsung SDS заявила, что процессор демонстрирует высокую масштабируемость. В целом, об этом говорилось выше, когда мы обсуждали RISC-V, и по словам представителей Samsung, при увеличении количества чипов в системе обработки данных ее производительность быстро растет. Стоит отметить, что это далеко не всегда происходит с традиционными чипами — производительность системы даже с очень большим их количеством растет до определенного момента, после чего дальнейший рост либо очень сильно замедляется, либо и вовсе останавливается. Системы на базе нового чипа показывают же почти линейный рост производительности при масштабировании.

По результатам проведенных тестов оказалось, что ET-SoC1, показывая очень высокую производительность с такими моделями, как ResNet 50, DLRM и Tranformer, потреблял (из расчета на один процессор) всего 20 Вт.


Кроме Samsung, тестировали процессор и в Cambrian-AI Research. По словам представителей этой компании, показатели производительности процессора в ходе тестов продемонстрировали близкие к заявленным разработчиками результаты. Глава команды тестировщиков Карл Фрёйнд (Karl Freund) сообщил, что ядра RISC-V выполняют основную нагрузку, не перекладывая при этом матричные мультипликаторы на MAC-ядра или GPU.

Что дальше?


Положительные отзывы — это, конечно, хорошо, но до коммерческого использования чипа в среде крупных корпораций еще далеко. Сейчас компания Esperanto заявила, что приглашает новых партнеров к тестированию своего чипа для решения самых разных задач, а не только использованию его в рекомендательных системах. Программа тестирования дает возможность партнерам тестировать разные модели, типы данных и вычислительные системы вплоть до 32 кластеров.

До момента, пока на Esperanto не обратят внимание крупнейшие корпорации (что, в принципе, понемногу уже происходит), производителям ИИ-систем вроде Nvidia беспокоиться нечего. Но это только пока, ситуация может измениться в любой момент.

Комментарии (7)


  1. t38c3j
    27.04.2022 08:57
    +1

    показывают же почти линейный рост

    Задачи распределяться по процессорам в таких конфигурациях чтоб не было траты времени на перегонку данных?


    1. DanilinS
      27.04.2022 09:14

      Скорее всего да. Специфичные задачи с минимальным обменом с другими ядрами и памятью.


    1. Sdima1357
      27.04.2022 09:20
      +3

      Это пересказ одного изнасилованного ученым журналиста другому журналисту. Они явно исследовали какой-то специальный отдельный случай (см " закон Амдала ")


      1. Hardcoin
        27.04.2022 10:21
        +1

        Да, речь об одном, специальном отдельном случае вычислений - большие нейросети. В статье это много раз упомянуто.


        1. Sdima1357
          27.04.2022 10:59

          В целом, об этом говорилось выше, когда мы обсуждали RISC-V, и по
          словам представителей Samsung, при увеличении количества чипов в системе
          обработки данных ее производительность быстро растет. Стоит отметить,
          что это далеко не всегда происходит с традиционными чипами —
          производительность системы даже с очень большим их количеством растет до
          определенного момента, после чего дальнейший рост либо очень сильно
          замедляется, либо и вовсе останавливается.

          1 Причем тут RISC-V и чем он лучше "чем другие" ?

          2 В чем именно этот чип отличается от "традиционных" - с "dedicated core memory" ? Таких тоже полно было. GPU все равно положит этого уродца на обе лопатки, там коры проще и соотвественно производительтней на ватт. Как IBM Cell и интела с его уродливым Larraby(x86xN) и его наследниками.


  1. ZlodeiBaal
    27.04.2022 17:33
    +1

    Штука в том что процессоров для ML сейчас сотни (вот тут подборка github.com/basicmi/AI-Chip/blob/master/README.md ). И до массового применения доходят единицы. Ещё десятки это очень corner-case для специфических применений (та же ambarella).
    И гадать чем этот хорош — абсолютно бесполезно обычно, так как 99% информации держится в секрете..:)


  1. romxx
    27.04.2022 21:19

    Ну такое себе название. Тоже "всем интересен, но в реальной жизни никто не пользуется, кроме горстки чудиков"?