На конференции ISC High Performance 2020 словацкая компания Tachyum анонсировала 128-ядерные процессоры Prodigy, а также ИИ-комплекс на их основе.

Процессоры планируется использовать в крупных ЦОД, высоконагруженных платформах, ИИ-системах и прочих направлениях, где нужна высокая производительность. Чип очень сложный, как сам по себе, так и в производстве, поэтому его разработка ведется не самыми быстрыми темпами. Но компания делает, что может, и действует весьма неплохо. О том, чего уже удалось достичь — под катом.

Что это вообще за процессор?


Компания Tachyum позиционирует его как чип для высоконагруженных систем. Одно из основных направлений — использование процессора в системах обучения ИИ. Дело в том, что готовые сценарии не нуждаются в суперпроизводительных системах — достаточно специализированного чипа от любого из производителей. А вот обучение ИИ-платформ, тем более, масштабных — это уже другое дело, здесь нужны машинные ресурсы и время на обучение.

Разработчики заявили, что их процессор и инфраструктура, разработанная под этот чип, способны предоставить необходимые ресурсы. Суперкомпьютер, основа которого чипы Prodigy, достаточно мощный — 125 Пфлопс на стойку и 4 экзафлопса на полный комплекс, состоящий из 32 стоек высотой 52U.

Каждый процессор предоставляет до 625 Тфлопс, это примерно 2,5 Пфлопс на каждый сервер. Для обеспечения работы системы используется сервер-модуль собственной разработки компании. Достоинство чипов и систем Tachyum, по словам ее представителей, не только в мощных чипах и инфраструктуре, но и меньшем энергопотреблении и стоимости — не только самих систем, но и их эксплуатации.


Что касается самих процессоров, то они выделяются среди «коллег» не только количеством ядер, но и архитектурой. Она универсальная, что дает возможность задействовать чипы не только в сфере ИИ, но и многих других отраслях.


За один такт процессор выполняет две две 512-битные операции типа multiply-add, 2 операции load и одну операцию store. Блок вычислений с плавающей точкой поддерживает как двойную, так и одинарную и половинную точность по стандартам IEEE. При необходимости можно задействовать и поддержку 8-битных типов данных с плавающей запятой.


Стоит рассказать и о подробностях архитектуры. Так вот, процессор разрабатывается по 7-нм техпроцессу. Старшая версия содержит 128 ядер с частотой работы каждого до 4 ГГц, 12 каналов памяти DDR5-4800, 48 линий PCI Express 5.0 и два контроллера 400GbE.

Еще есть версия с 64 ядрами, которая содержит восьмиканальный контроллер DDR5, контроллер PCI Express 5.0 на 64 линии и два сетевых интерфейса 400GbE.


Что касается системных плат, то есть два варианта:
  • Полноразмерные с 4 процессорами для HPC-сегмента.
  • Компактные с 1 процессором для модульных систем высокой плотности.

ПО на системах с новыми чипами может запускаться в виде бинарных файлов x86, ARMv8 или RISC-V. К сожалению, скорость работы будет несколько меньшей, чем в случае запуска на «родной» архитектуре — падение составляет от 25% до 40%. Но можно и скомпилировать исходники под новую архитектуру, если скорость работы критична.

Любим обозревать на Хабре самые интересные и дискуссионные темы из мира IT. Если хотите быть в курсе новостей, традиционно входящих в топ читаемых, подписывайтесь на наш блог.

Этапы разработки чипа


Аппаратный эмулятор

Как уже говорилось выше, предварительная информация о чипах появилась еще в 2020 году. Но наиболее активно проект стал развиваться уже в 2021.

Так, в конце марта компания заявила о готовности аппаратного эмулятора, который дает возможность оценить возможности и производительность нового процессора.

Эмулятор разработан на базе FPGA (перепрограммируемые вентильные матрицы) и плат ввода-вывода. Системная плата эмулятора включает четыре программируемых матрицы, которые имитируют работу сразу восьми ядер Prodigy. К прототипу добавлены платы ввода/вывода. Поставляемый прототип уже можно установить в 19" стойку. Если взять несколько эмуляторов, их можно соединять между собой, моделируя разные конфигурации процессоров.

Получение дополнительных инвестиций

Никто не сомневается, что выпуск настолько высокотехнологической продукции, как процессоры, требует огромного объема ресурсов. Это, в первую очередь, деньги, время, помощь профессионалов.

Компания Tachyum в июле 2021 года смогла получить новые средства от инвесторов, в результате чего капитализация Tachyum выросла сразу в три раза. К сожалению, точный объем полученных средств компания не указала.

Тем не менее, после этого представители компании заявили об активизации разработки процессоров и начале работы над суперкомпьютером на базе чипов Prodigy.

Запуск Linux на прототипе Tachyum Prodigy


Уже в сентябре на базе FPGA-прототипа удалось запустить Linux. Ранее компания заявила о готовности UEFI для Prodigy, но теперь прототип процессора может обеспечить полную поддержку операционной системе.


В ходе тестов компания смогла запустить ОС и простое приложение, после чего систему отключили. Понятно, что это не бог весть что, но разработчики стремились показать работоспособность прототипа. Процессор спокойно отрабатывает прерывания и исключения, переключая режимы и обеспечивая корректные тайминги. Есть демонстрация работы прототипа. Видео, к сожалению, доступно только на сайте компании, его не выложили на YouTube.

На днях компания заявила, что планирует показать в ближайшее время работу ряда сервисов, приложения и пользовательские сессии.

«Реализация успешной загрузки Linux всего через два месяца после разработки прототипа материнской платы FPGA IO — огромное достижение завершение определенного этапа развития. Переходя к дальнейшей отладке и тестированию, мы с нетерпением ждем возможности запускать более «тяжелые» приложения на прототипе Prodigy уже в следующем месяце», — заявил представитель компании.

К слову, конечная цель Tachyum — создание суперкомпьютера или целой системы их суперкомпьютеров, способной моделировать работу человеческого мозга.

Комментарии (11)


  1. edo1h
    06.09.2021 21:00

    фотография платы на фоне стойки смешная, ни разу не видел подобных кулеров в стоечном оборудовании (разве что на сетевых платах)


    1. Areso
      06.09.2021 23:49
      +13

      Завтра в новостях:

      'Эксперт с Хабра оценил потребление 128 ядерных чипов на уровне сетевого коммутатора'

      /s


  1. 3Dvideo
    07.09.2021 10:16
    +2

    Господа!

    Вы пересказали по сути рекламную презентацию Tachyum, сделанную на конференции в июне 2020, т.е. больше года назад.

    Привели утверждения Faster than GPU/TPU и ни одного графика или сравнения!

    Это, возможно, неочевидно, но пиковая производительность и высокая пропускная способность шины не означают автоматически хоть сколь-нибудь конкурентоспособных характеристик на реальном обучении нейросетей.

    Tachyum строчит пресс-релизы как из пулемета (2-3 в месяц), но при этом не участвуют в MLPerf и вообще избегают сравнений. Рассказывают про большие помещения, но при этом в LinkedIn у них 43 сотрудника (включая бывших).

    Вас ничего не смущает?


    1. ioccy
      07.09.2021 10:46

      Нет. Мы все еще ждем бритву Skarp.


      1. 3Dvideo
        07.09.2021 20:01

        Единственное, что извиняет Selectel - явно поставлена ссылка на годичной давности пост https://servernews.ru/1014281, откуда взяты все картинки поста (кроме КДПВ). Интересно, что по ссылке вдвое больше слайдов (12 против 6).

        И опять таки - в оригинале был скепсис в конце (и больше анализа), а тут скепсис заменили на замечательную цель "моделировать работу человеческого мозга". Проклятые маркетологи...

        Ну и это не первая компания, которая (с теми же слайдами!) про Tachyum пишет:
        https://habr.com/ru/company/cloud_mts/news/t/538808/

        С другой стороны - зачем материал делать лучше (и реально копать), если уполовиненная информация годичной давности чуть разбавленная свежими пресс-релизами вполне заходит (народ лайкает, вопросов не задает)...


  1. lab412
    07.09.2021 11:26

    Никогда не думал что жители словакии имеют азиатские корни. На фото ну явно коренной житель словакии держит плату )


    1. shushu
      07.09.2021 12:53
      +1

      да, словаки нынче поши не те....


  1. kspshnik
    07.09.2021 13:07
    +1

    Передайте, пожалуйста, вашему переводчику, что для FPGA в русском языке да-а-авно уже есть свой акроним: ПЛИС (Программируемая Логическая Интегральная Схема). Зачем вот это всё городить за вентили? :)

    P.S. Было бы категорически здорово, если бы переводы вычитывали профильные инженеры - они подобную ерунду выловят на раз.


  1. kulikovDenis
    07.09.2021 14:58

    Это же "тупиковый" VLIW, от которого все отказались, все мировые эксперты на нем поставили крест. Хотя, конечно, звучит все еще не очень оптимистично.


    1. MZjr
      08.09.2021 00:05

      Та же мысль возникла)) Плюсанул бы, если б карма позволяла))


    1. n0isy
      09.09.2021 14:50

      Он тут в роли специального инструмента, а не процессора общего назначения.