Корпорация IBM на днях опубликовала данные о новом процессоре, который предназначен для ИИ-вычислений. По словам представителей компании, чип разрабатывали в исследовательской лаборатории IBM в течение 8 лет. Базируется новинка на ряде идей предыдущей модели чипа, TrueNorth, будучи при этом в 4 000 раз быстрее предшественника.
Что это за процессор?
Техпроцесс вовсе не новый, чип выполнен по 12-нм техпроцессу. Всего у процессора 22 млрд транзисторов и 256 ядер. Каждое из них может производить 2 048 вычислений за цикл с 8-битной точностью. Для 2- и 4-битной точности количество выполняемых операций удваивается и учетверяется соответственно. Команде разработчиков пришлось создать собственное ПО, определяющее минимальный уровень точности, который нужен для каждого из уровней вычислений.
При этом для каждого из ядер предусмотрен определённый объём памяти, в которой хранятся данные, используемые в ходе вычислений. При этом все элементы процессора находятся на минимальном расстоянии друг от друга, что позволяет снизить затраты времени на передачу данных. Соответственно, повышается производительность.
У архитектуры фон Неймана «бутылочное горлышко» — как раз разделение памяти и процессора. Разработчикам IBM удалось решить эту проблему, создав процессор, который хранит данные внутри самого чипа, не отправляя их на внешние устройства. Архитектура процессора практически размыла границу между терминами «вычисления» и «память». Так, на уровне отдельных ядер NorthPole — архитектура memory-near-compute, а снаружи, на уровне ввода-вывода, он работает как активная память.
В чипе фактически четыре автономные сети. Часть из них занимается переносом информации в ходе выполнения вычислений в вычислительные же блоги, где данные могут понадобиться. Часть применяется для реконфигурации массива вычислительных блоков, предоставляя нейронные веса и код. Они необходимы для выполнения задач нейронки одного уровня в то время, пока продолжаются вычисления предыдущего уровня.
Кроме того, процессор ещё и энергоэффективный — над этим велась дополнительная работа. Снова-таки частично высокой степени энергоэффективности удалось добиться благодаря тому, что память встроена в ядра. Тесты проводились посредством открытой модели для распознавания изображений ResNet-50, которая применяется для проверки работы различных ИИ-чипов.
По словам представителей корпорации, процессор в 25 раз энергоэффективнее прочих чипов, включая как графические, так и обычные процессоры на базе 12- и 14-нм техпроцессов. По мнению игроков рынка, энергоэффективность сейчас играет очень большую роль для компаний-операторов ЦОДов.
Другие примеры нейроморфных чипов
Один из первых проектов — совместная работа IBM и DARPA. Она началась ещё в 2008 году, когда обе компании занялись реализацией программы SyNAPSE, в рамках которой разрабатывались компьютерные архитектуры, отличные от фон Неймановских. Тогда удалось создать ядро с 256 нейронами и 256 синапсами. А ещё спустя несколько лет был представлен чип TrueNorth с 4 096 ядрами (это свыше 1 млн нейронов), о котором говорилось выше. Чип стали использовать в распознавании жестов и речи.
Ещё один пример — самообучающийся нейроморфный процессор Loihi от Intel Labs. Первый чип получил 128 ядер по 1 204 нейрона в каждом из них. В итоге получилась система со 130 тыс. нейронов и примерно 130 млн синапсов. Размер чипа составляет всего 60 мм. При таких размерах он весьма эффективен: например, для обучения обнаружения определённых запахов этому чипу нужно обучиться на данных, объём которых в 3 тыс. раз меньше, чем в случае обучения обычной нейросети. А энергии требуется примерно в 1 000 раз меньше.
Наконец, в 2001 году появилось второе поколение этого чипа. Его размер удалось в два раза сжать, а вот число искусственных нейронов — в 8 раз увеличить. Чип работал на целый порядок быстрее, чем его предыдущая модель.
Чип от Intel был задействован в специализированной системе. Одна из них — Intel Kapoho Bay с двумя процессорами и 262 тыс. нейронов. По словам разработчиков, система в состоянии распознавать жесты, «читать» шрифт Брайля, определять запахи и т. п. Более того, на базе этой системы была разработана другая, аналог системы обоняния человека.
Ещё одну систему создала команда из Национального университета Сингапура (NUS). Учёные разработали роботизированную руку с искусственной кожей и датчиками зрения, оснастив её нейроморфным процессором, о котором шла речь выше. Рука в итоге стала определять прикосновение в 1 000 раз быстрее нервной системы человека, плюс её обучили определять форму, текстуру и твёрдость объектов, причём быстрее, чем человек.
Что ещё?
Процессор NorthPole «заточен» под работу в области обработки изображений, прежде всего цифрового машинного зрения. Речь идёт об автопилотировании, роботах-диагностах и т. п.
NorthPole может устанавливаться, например, в роботизированных автомобилях. Дело в том, что для процессора не нужно дополнительное охлаждение — стандартного вполне хватает, поэтому и задействовать разработку можно в большем количестве самых разных проектов из разных отраслей.
В целом чип разработан специально для нейронных сетей, которые предназначены для реализации логических выводов. Как и говорилось выше, в проекте использовались некоторые технологии, применённые ещё в TrueNorth. В ближайшее время корпорация будет продолжать работу по модернизации чипа, добавляя новые возможности.