16 июня 2016 года в рамках симпозиума 2016 Symposium on VLSI Technology and Circuits, прошедшего недавно в Гонолулу, группой специалистов факультета Электроники и Вычислительной техники (Department of Electrical and Computer Engineering) Калифорнийского Университета в Дэвисе был представлен действующий прототип чипа KiloCore, на кристалле которого уместилась тысяча независимых программируемых процессоров. Общее число транзисторов на кристалле чипа составило 621 миллион единиц, а максимально развиваемое быстродействие приблизилось к рекордной отметке 1.78 триллиона операций в секунду.

image

«Помимо того, что созданный нами чип — это первый в мире чип с тысячей процессоров, это еще и процессоры с самой высокой тактовой частотой, из когда-либо созданных в стенах нашего заведения» — поясняет Бевэн Баас (Bevan Baas), профессор электротехники и вычислительной техники и руководитель группы специалистов, разработавших микропроцессорную архитектуру KiloCore. Здесь следует уточнить, что чип KiloCore — не единственный в мире чип с большим количеством вычислительных ядер. Вместе с тем, согласно аналитическому отчету, предоставленному Баасом, максимальное число ядер процессоров — конкурентов пока не достигло и 300. Абсолютное большинство таких «гиперядерных» процессоров создавались исключительно в исследовательских целях и лишь единицы пребывают в стадии перехода на коммерческий уровень.

Прототип чипа KiloCore был изготовлен на производственных мощностях IBM по 32-нм CMOS-технологии. Каждое его ядро, независимо от остальных, способно решать свои вычислительные задачи. Такой подход оказывается значительно более гибок, нежели подход «Одна инструкция, множество данных» (Single-Instruction-Multiple-Data), реализованный в многоядерных графических процессорах (GPU). Идея, воплощенная в архитектуре процессора KiloCore, состоит в автоматическом разбиении программы на отдельные небольшие подпрограммы, исполняемые независимо друг от друга на различных ядрах. Это позволяет улучшить сразу два принципиально важных показателя: добиться кардинального повышения производительности системы в целом и достичь кардинального улучшения энергоэффективности, поскольку, если вычислительная мощность отдельного процессора не востребована в текущий момент времени, он прекращает свою работу.

image

Тактовая частота каждого ядра составляет 1.78 ГГц, при этом ядра располагают возможностью передавать друг другу данные напрямую, а не использовать области общей памяти, что становится узким местом большинства многоядерных вычислительных систем.

Как отмечают его создатели, чип KiloCore сегодня — это самый энергоэффективный многоядерный процессор. Так, к примеру, развивая производительность в 115 миллиардов операций в секунду, все 1000 процессоров будет рассеивать при этом не более 0.7 Ватта энергии. Для эффективной работы чипа, отмечают специалисты, будет достаточно обеспечить ток, вырабатываемый одной единственной батарейкой типа АА. Результаты тестирования позволили утверждать, что чип KiloCore выполняет инструкции с эффективностью, как минимум в 100 раз превышающей эффективность работы самых современных процессоров, возглавляющих существующие флагманские линейки многоядерных микропроцессоров для ноутбуков и планшетных компьютеров.

Под процессор KiloCore уже разработано несколько «тяжелых» приложений, нуждающихся в параллельной обработке данных и высокой производительности. К их числу относятся приложения, решающие задачи кодирования-декодирования информации, передаваемой при помощи радиосигналов, обработки видеорядов, шифрования, обработки данных научного характера, обработки потоков данных ЦОД, и прочие задачи, связанные с параллельной обработкой больших массивов данных.



В настоящее время группой специалистов уже закончена работа над автоматическими средствами отображения для программирования чипа и компилятора, производящего разбивку кода программы на небольшие подпрограммы в автоматическом режиме, которые могут выполняться отдельными ядрами процессора KiloCore.

Первоисточник


На этом всё, с вами был Dronk.Ru. Не забывайте возвращать деньги за покупки в Китае и подписываться на наш блог, будет ещё много интересного.

image

Рекомендуем:
Экономим до 8% с каждой покупки на AliExpress и других интернет-магазинах Китая
Почему интернет-магазины отдают деньги за покупки?
Верните свои деньги — Выбираем кэшбэк-сервис для Aliexpress
История развития Dronk.ru — от выбора квадрокоптеров до возвращения денег за покупки на AliExpress и не только
Лучший кэшбэк сервис или 5 основных критериев оценки кэшбэк-сервиса
Поделиться с друзьями
-->

Комментарии (20)


  1. kraidiky
    24.06.2016 09:00
    -1

    Это ж наш Эльбрус! :)))
    Только не отягощённый ограничениями обратной совместимости. :)


    1. beeruser
      24.06.2016 13:50
      +1

      Казалось бы причём тут Эльбрус?
      Это процессор с grid-топологией наподобие RAW, Parallela, Kalray и т.п.
      https://streamcomputing.eu/blog/2016-06-09/an-introduction-to-grid-processors-parallella-kalray-and-knupath/

      PS: Над названием они не долго думали.
      Не нужно путать правильный 1000 ядерный KiloCore от сего заведения, с почившим ныне 1025 ядерным Kilocore от Rapport Inc


      1. LifeKILLED
        24.06.2016 16:56
        +2

        >> с почившим ныне 1025 ядерным Kilocore от Rapport Inc

        Нечего было выпендриваться, вот сделали бы 1024, тогда бы дело пошло…


    1. mishast
      24.06.2016 14:45

      Эльбрус, насколько я помню, обычной архитектуры.
      Мне больше МультиКлет вспоминается.
      Мне вот интересно становится не лучше ли подойдут для нейронный сетей в перспективе мультиклеточные процессоры, да ПЛИСы, чем, как сейчас GPU.


  1. drsmoll
    24.06.2016 09:14

    что-то по подводимым кАбелям питания и разъемам не скажешь, что ежу достаточно одной АА, если только на очень короткое время.


    1. sim2q
      24.06.2016 13:46

      особенно те два, что от машинного прикуривателя :)
      ps на самом деле там питание 0.56...1.1V но преобразователь не на плате около CPU как на материнках, видимо обезопасились от падения напряжения на проводах


  1. Segmentq
    24.06.2016 09:22

    Без результатов сравнительных тестов, как-то не понятен масштаб прорыва.


  1. Disasm
    24.06.2016 10:30

    Архитектурой TIS-100 вдохновлялись, не иначе.


  1. Disasm
    24.06.2016 10:51
    +1

    Ссылка на тезисы, если кому интересно: http://vcl.ece.ucdavis.edu/pubs/2016.06.vlsi.symp.kiloCore/2016.vlsi.symp.kiloCore.with.note.pdf
    В пике потребляет 39.6Вт, на частоте 115МГц потребляет 1.3Вт. Не знаю, откуда в статье 0.7Вт получилось.


    1. Varkus
      24.06.2016 14:45

      57МГЦ, не?


    1. DronkRU
      24.06.2016 14:49
      -1

      The chip is the most energy-efficient “many-core” processor ever reported, Baas said. For example, the 1,000 processors can execute 115 billion instructions per second while dissipating only 0.7 Watts, low enough to be powered by a single AA battery. — так они указывают у себя на сайте (ссылочка в публикации в конце). Производительность 115 млрд. операций/сек = потери 0.7 Вт.


    1. earl911
      28.06.2016 12:42

      115Ггц?


      1. Disasm
        28.06.2016 19:42

        На 1000 процессоров поделить не забыли?


  1. Torvald3d
    24.06.2016 10:51

    Звучит фантастически. Вот бы рейтрейсер запилить на нем


  1. venyaz
    24.06.2016 13:01
    -2

    Товарищи что не знают какое именно «тяжелое» приложение надо было первым написать? Майнинг основных криптовалют! Быстренько финансирвание бы нашлось и уже бы отгружали вагонами :)


  1. ThisIsSparta
    24.06.2016 14:52

    Так 1000 ядер или процессоров?


    1. VoiceDao
      24.06.2016 14:53

      Microchip containing 1,000 independent programmable processors…


      1. old_bear
        27.06.2016 15:12

        Я дико извиняюсь, но 128 слов памяти инструкций слабо тянут на процессор в 2016-м году. :)
        Но очень интересно посмотреть на тот софт, который программу бьёт на ядра. Основная неприятность даже не в разделении на отдельно выполняемые блоки, а в синхронизации между этими блоками. Как FPGA-дизайнер могу сказать, что при недостаточно точном согласовании передачи данных между этапами этого, по сути, большого конвейера из маленьких процессоров, вся их вычислительная мощь уйдёт как вода в песок.
        Поэтому, если у них есть софт, который корректно выполняет эту задачу для произвольного кода (пусть даже написанного с учётом каких-то требований), а не для одного единственного образцово-показательного примера, я склонен согласиться, что проект имеет перспективу. А если нет, то уже проще (в плане достижения нужной производительности) на FPGA сделать, без дополнительных ограничений на набор инструкций, тип межблоковой коммутации и т.п.


  1. stychos
    26.06.2016 03:38

    Закон Амдала отменили, или это подразумевается только для каких-то нишевых вещей?


  1. AWCS
    27.06.2016 15:16

    правильно ли я понимаю, что с соответствующей обвязкой может быть очень интересным решением для реализации довольно продвинутого АФАР?