Приветствуем наших читателей на страницах блога iCover! На прошедшей в начале февраля в Сан-Франциско Международной конференции International Solid State Circuits Conference (ISSCC-2016) группа разработчиков из MIT (Massachusetts Institute of Technology) продемонстрировала действующий прототип чипа нового поколения Eyeriss, создававшегося как концептуальное решение, позволяющее воссоздавать возможности алгоритмов нейронных сетей в широком спектре устройств малой мощности.
Одной из объективных причин, по которой искусственные нейронные сети не получили должного развития в наших смартфонах или планшетах – отсутствие компактного источника питания достаточной мощности. Ведь так называемые brain-like, “мозгоподобные” системы искусственного интеллекта, по крайне мере в том виде, в котором они представлены современными технологиями зависят в своей работе от мощных многоядерных процессоров, потребляющих в сравнении с нашим мозгом, невероятное количество энергии. Представить себе подобные решения на уровне устройств пользовательского класса во всяком случае до недавнего времени возможным не представлялось. Вместе с тем, идея “миниатюризации” искусственного интеллекта будоражит умы разработчиков достаточно давно и, как выясняется, уже приносит свои достаточно ощутимые плоды.
Нейронные сети оказались в центре внимания ученых с первых дней исследования искусственного интеллекта, но в 1970-х, они были несколько забыты. В последнее десятилетие, технологии, связанные с использованием возможностей нейронных сетей изучаются на уровне программ «глубокого обучения» (Deep learning).
«Глубокое обучение имеет множество сфер применения, таких как распознавание объекта, речи или лиц» — отмечают Вивьен Зи (Vivienne Sze) и Эмануэль Е. Ландсман (Emanuel E. Landsman) — доцент кафедры Массачусетского технологического института электротехники и компьютерных наук, группа которого разработала новый чип. «Сейчас, нейронные сети довольно сложны и, работают, в основном, на мощных чипах. Представьте себе, что вы сможете перенести эту функциональность на свой мобильный телефон или встроенное устройство и затем обрабатывать колоссальные массивы информации не используя Wi-Fi — соединение. Обработка больших массивов данных на вашем смартфоне позволит избежать задержки, возникающей за счет обмена данных с сетью, что, в свою очередь, позволит многим приложениям работать значительно эффективнее. А кроме того, предложенное решение позволит обеспечить новое качество защиты конфиденциальной информации».
Нейронные сети, как правило, реализуются на базе многоядерных графических процессоров (GPU). На Международной конференции в Сан-Франциско исследователи MIT представили новый 168-ядерный чип, разработанный с целью реализации алгоритмов искусственного интеллекта на основе нейронных сетей. В сравнении с мобильным GPU (не указывается, в сравнении с каким именно) процессор продемонстрировал в 10 раз большую эффективность, что позволяет использовать пользовательское мобильное устройство для локального запуска мощных алгоритмов искусственного интеллекта без необходимости отправки данных для облачной обработки. Основные моменты разработки отражены в пресс-релизе MIT от 3 февраля 2016 года.
Новый чип, названный разработчиками «Eyeriss», может найти широкое применение в «Интернете вещей», носимой электронике, самоуправляемых транспортных средствах, производственном оборудовании, и даже в сельском хозяйстве, помогая с решением и координацией текущих задач. С алгоритмами искусственного интеллекта на борту мобильные устройства смогут принимать решения на локальном уровне, предоставив пользователю в качестве руководства к действию уже готовый результат, а не набор “сырых” данных из сети интернет. И, конечно, одно из применений локальных нейронных сетей – их использование при создании автономных роботов самого разного назначения.
Нейронные сети, как правило, имеют многослойную структуру и каждый слой содержит большое количество обрабатывающих узлов. На начальном этапе обработки данные приходят и распределяются между узлами нижнего слоя. После обработки полученных данных каждым из узлов результат передается для обработки узлам следующего слоя. На выходе последнего слоя формируется результат решения поставленной задачи. Соответственно, для решения масштабных задач по описанному алгоритму потребуются значительные вычислительные ресурсы.
Требования, изначально предъявленные к чипу самими разработчиками поставили их в достаточно жесткие рамки: с одной стороны решение должно оказаться энергоэффективным, с другой – оперировать простыми блоками информации. Наконец, чип должен располагать возможностью моделирования различных типов нейронных сетей с учетом поставленных перед ним текущих задач. Все эти требования были успешно реализованы в процессоре Eyeriss.
Чип, разработанный в лаборатории MIT, представляет собой уже сформированную нейронную сеть, локализованную на уровне 168-ядерного процессора, который в перспективе сможет быть встроен в мобильные устройства.
Ключ к эффективности Eyeriss — минимизация частоты обмена данными между ядрами и внешними банками памяти, операции, связанной с большим энергопотреблением и временными затратами. В то время как ядра традиционных GPU завязаны на один общий банк памяти, каждое ядро Eyeriss располагает собственной памятью. Помимо этого, данные, перед оправкой на соседние ядра проходят процедуру сжатия.
Еще одно достоинство реализуемого алгоритма — возможность ядер “общаться” друг с другом напрямую, минуя “посредника” в виде шины системной памяти. Это критически важная особенность для имитации работы «сверточной нейронной сети» (Convolutional Neural Network – CNN). Вся вычислительная работа, необходимая для распознавания образов и речи, выполняется в Eyeriss локально, без необходимости обращения к сетевым ресурсам, что позволяет обеспечить возможность эффективного функционирования устройства даже в условиях отсутствия внешней сети.
Наконец, еще одним достоинством Eyeriss становится принцип “умного” распределения отдельных вычислительных задач между ядрами в рамках единой решаемой задачи. В своей локальной памяти ядро должно хранить не только данные обрабатываемые узлами, но и данные, описывающие сами узлы. С целью обеспечения максимальной производительности процесса обработки данных, а также для загрузки Eyeriss максимальным объемом данных из основной памяти алгоритм распределения данных обоих типов оптимизируется специально предназначенной для этой цели микросхемой в режиме реального времени с учетом особенностей актуальной нейронной сети.
На мероприятии International Solid State Circuits Conference в Сан-Франциско команда разработчиков, использовав возможности чипа Eyeriss «пользовательского» уровня, продемонстрировала реализацию алгоритма распознавания образов в пределах локальной нейронной сети. Аналогичная задача – отмечается в пресс релизе – была реализована ранее, но на уровне государственных проектов самых современных из созданных нейронных сетей.
«Эта работа очень важна, поскольку демонстрирует, насколько эффективно встроенные процессоры для глубокого изучения способны обеспечить требуемую мощность и производительность оптимизации и принести сложные вычислительные процессы из облака на мобильные устройства» — говорит Майк Полли, старший вице-президент лаборатории мобильных процессоров Innovations Lab Samsung, дополняя: «В дополнение к инновационному комплексу аппаратных решений, исследование специалистов MIT наглядно демонстрирует, как можно сделать встроенное ядро полезным для разработчиков приложений с использованием стандартной сетевой архитектуры AlexNet и Caffe».
Финансирование проекта Eyeriss, начиная с создания подразделения на базе лаборатории MIT, частично осуществлялось на средства американского оборонного ведомства DARPA. Не удивительно, что первым, кто откликнулся на анонс процессора внушительным редакционным материалом, стал известный военный аналитик Патрик Такер (Patrick Tucker). Новые процессоры Eyeriss, установленные на мобильные девайсы солдат США, по его убеждению, будут способны решать сложнейшие вычислительные задачи, связанные с обработкой колоссальных объемов информации без подключения к общей сети.
Так, в настоящее время ВВС США ежесуточно получают с дронов, парящих над Афганистаном, до 1500 часов HD-видео и до 1500 фотографий сверхвысокого разрешения. Причем весь этот нескончаемый поток информации приходится по старинке визуально анализировать операторам, поскольку существующее компьютерное ПО не в состоянии отличить крестьянина, бредущего с палкой по горной тропинке, от террориста с пусковой установкой для управляемых ракет. Для решения подобных задач изначально и начинали создаваться методы машинного обучения, основанные на репрезентационном обучении.
Процессоры Eyeriss идеально подойдут для установки на беспилотные военные дроны, поскольку позволят проводить интеллектуальную обработку массива изображений и видео с применением технологий «глубокого обучения» непосредственно на борту летательного аппарата. При этом отсеянные полезные данные можно было бы отсылать непосредственно в боевые подразделения, действующие в указанном регионе минуя центр анализа оперативной информации.
Краткое резюме
В ходе экспериментов чип Eyeriss продемонстрировал уровень энергоэффективности, в десять раз превосходящий показатели современных мобильных графических чипов. При этом с его помощью оказывается технологически возможно обеспечить работу алгоритмов искусственного интеллекта на устройствах, обладающих компактными размерами – от смартфонов и планшетов — до носимой электроники. Задержки, создаваемые сетями при обмене данными для такого процессора оказываются сводятся к минимуму, поскольку большинство вычислений чип сможет выполнить локально. На базе Eyeriss можно будет создавать не только всевозможные «умные устройства», но и роботов, обладающих некоторой степенью самостоятельности в принятии решений.
Конкретных временных интервалов в течение которых Eyeriss сможет трансформироваться в коммерческий продукт и во всей мощи раскрыть свои возможности на уровне потребителя разработчики из MIT пока не называют. Определенный оптимизм внушает причастность к разработке ведущих специалистов NVIDIA и живой интерес ответственных научных сотрудников из Samsung.
Источник
Уважаемые читатели, мы всегда с удовольствием встречаем и ждем вас на страницах нашего блога. Мы готовы и дальше делиться с вами актуальными новостями, обзорными материалами и другими публикациями, и постараемся сделать все возможное для того, чтобы проведенное с нами время было для вас полезным. И, конечно, не забывайте подписываться на наши рубрики.
Другие наши статьи и события
Одной из объективных причин, по которой искусственные нейронные сети не получили должного развития в наших смартфонах или планшетах – отсутствие компактного источника питания достаточной мощности. Ведь так называемые brain-like, “мозгоподобные” системы искусственного интеллекта, по крайне мере в том виде, в котором они представлены современными технологиями зависят в своей работе от мощных многоядерных процессоров, потребляющих в сравнении с нашим мозгом, невероятное количество энергии. Представить себе подобные решения на уровне устройств пользовательского класса во всяком случае до недавнего времени возможным не представлялось. Вместе с тем, идея “миниатюризации” искусственного интеллекта будоражит умы разработчиков достаточно давно и, как выясняется, уже приносит свои достаточно ощутимые плоды.
Нейронные сети оказались в центре внимания ученых с первых дней исследования искусственного интеллекта, но в 1970-х, они были несколько забыты. В последнее десятилетие, технологии, связанные с использованием возможностей нейронных сетей изучаются на уровне программ «глубокого обучения» (Deep learning).
«Глубокое обучение имеет множество сфер применения, таких как распознавание объекта, речи или лиц» — отмечают Вивьен Зи (Vivienne Sze) и Эмануэль Е. Ландсман (Emanuel E. Landsman) — доцент кафедры Массачусетского технологического института электротехники и компьютерных наук, группа которого разработала новый чип. «Сейчас, нейронные сети довольно сложны и, работают, в основном, на мощных чипах. Представьте себе, что вы сможете перенести эту функциональность на свой мобильный телефон или встроенное устройство и затем обрабатывать колоссальные массивы информации не используя Wi-Fi — соединение. Обработка больших массивов данных на вашем смартфоне позволит избежать задержки, возникающей за счет обмена данных с сетью, что, в свою очередь, позволит многим приложениям работать значительно эффективнее. А кроме того, предложенное решение позволит обеспечить новое качество защиты конфиденциальной информации».
Нейронные сети, как правило, реализуются на базе многоядерных графических процессоров (GPU). На Международной конференции в Сан-Франциско исследователи MIT представили новый 168-ядерный чип, разработанный с целью реализации алгоритмов искусственного интеллекта на основе нейронных сетей. В сравнении с мобильным GPU (не указывается, в сравнении с каким именно) процессор продемонстрировал в 10 раз большую эффективность, что позволяет использовать пользовательское мобильное устройство для локального запуска мощных алгоритмов искусственного интеллекта без необходимости отправки данных для облачной обработки. Основные моменты разработки отражены в пресс-релизе MIT от 3 февраля 2016 года.
Новый чип, названный разработчиками «Eyeriss», может найти широкое применение в «Интернете вещей», носимой электронике, самоуправляемых транспортных средствах, производственном оборудовании, и даже в сельском хозяйстве, помогая с решением и координацией текущих задач. С алгоритмами искусственного интеллекта на борту мобильные устройства смогут принимать решения на локальном уровне, предоставив пользователю в качестве руководства к действию уже готовый результат, а не набор “сырых” данных из сети интернет. И, конечно, одно из применений локальных нейронных сетей – их использование при создании автономных роботов самого разного назначения.
Разделяй и властвуй
Нейронные сети, как правило, имеют многослойную структуру и каждый слой содержит большое количество обрабатывающих узлов. На начальном этапе обработки данные приходят и распределяются между узлами нижнего слоя. После обработки полученных данных каждым из узлов результат передается для обработки узлам следующего слоя. На выходе последнего слоя формируется результат решения поставленной задачи. Соответственно, для решения масштабных задач по описанному алгоритму потребуются значительные вычислительные ресурсы.
Требования, изначально предъявленные к чипу самими разработчиками поставили их в достаточно жесткие рамки: с одной стороны решение должно оказаться энергоэффективным, с другой – оперировать простыми блоками информации. Наконец, чип должен располагать возможностью моделирования различных типов нейронных сетей с учетом поставленных перед ним текущих задач. Все эти требования были успешно реализованы в процессоре Eyeriss.
Чип, разработанный в лаборатории MIT, представляет собой уже сформированную нейронную сеть, локализованную на уровне 168-ядерного процессора, который в перспективе сможет быть встроен в мобильные устройства.
Ключ к эффективности Eyeriss — минимизация частоты обмена данными между ядрами и внешними банками памяти, операции, связанной с большим энергопотреблением и временными затратами. В то время как ядра традиционных GPU завязаны на один общий банк памяти, каждое ядро Eyeriss располагает собственной памятью. Помимо этого, данные, перед оправкой на соседние ядра проходят процедуру сжатия.
Еще одно достоинство реализуемого алгоритма — возможность ядер “общаться” друг с другом напрямую, минуя “посредника” в виде шины системной памяти. Это критически важная особенность для имитации работы «сверточной нейронной сети» (Convolutional Neural Network – CNN). Вся вычислительная работа, необходимая для распознавания образов и речи, выполняется в Eyeriss локально, без необходимости обращения к сетевым ресурсам, что позволяет обеспечить возможность эффективного функционирования устройства даже в условиях отсутствия внешней сети.
Наконец, еще одним достоинством Eyeriss становится принцип “умного” распределения отдельных вычислительных задач между ядрами в рамках единой решаемой задачи. В своей локальной памяти ядро должно хранить не только данные обрабатываемые узлами, но и данные, описывающие сами узлы. С целью обеспечения максимальной производительности процесса обработки данных, а также для загрузки Eyeriss максимальным объемом данных из основной памяти алгоритм распределения данных обоих типов оптимизируется специально предназначенной для этой цели микросхемой в режиме реального времени с учетом особенностей актуальной нейронной сети.
На мероприятии International Solid State Circuits Conference в Сан-Франциско команда разработчиков, использовав возможности чипа Eyeriss «пользовательского» уровня, продемонстрировала реализацию алгоритма распознавания образов в пределах локальной нейронной сети. Аналогичная задача – отмечается в пресс релизе – была реализована ранее, но на уровне государственных проектов самых современных из созданных нейронных сетей.
«Эта работа очень важна, поскольку демонстрирует, насколько эффективно встроенные процессоры для глубокого изучения способны обеспечить требуемую мощность и производительность оптимизации и принести сложные вычислительные процессы из облака на мобильные устройства» — говорит Майк Полли, старший вице-президент лаборатории мобильных процессоров Innovations Lab Samsung, дополняя: «В дополнение к инновационному комплексу аппаратных решений, исследование специалистов MIT наглядно демонстрирует, как можно сделать встроенное ядро полезным для разработчиков приложений с использованием стандартной сетевой архитектуры AlexNet и Caffe».
Финансирование проекта Eyeriss, начиная с создания подразделения на базе лаборатории MIT, частично осуществлялось на средства американского оборонного ведомства DARPA. Не удивительно, что первым, кто откликнулся на анонс процессора внушительным редакционным материалом, стал известный военный аналитик Патрик Такер (Patrick Tucker). Новые процессоры Eyeriss, установленные на мобильные девайсы солдат США, по его убеждению, будут способны решать сложнейшие вычислительные задачи, связанные с обработкой колоссальных объемов информации без подключения к общей сети.
Так, в настоящее время ВВС США ежесуточно получают с дронов, парящих над Афганистаном, до 1500 часов HD-видео и до 1500 фотографий сверхвысокого разрешения. Причем весь этот нескончаемый поток информации приходится по старинке визуально анализировать операторам, поскольку существующее компьютерное ПО не в состоянии отличить крестьянина, бредущего с палкой по горной тропинке, от террориста с пусковой установкой для управляемых ракет. Для решения подобных задач изначально и начинали создаваться методы машинного обучения, основанные на репрезентационном обучении.
Процессоры Eyeriss идеально подойдут для установки на беспилотные военные дроны, поскольку позволят проводить интеллектуальную обработку массива изображений и видео с применением технологий «глубокого обучения» непосредственно на борту летательного аппарата. При этом отсеянные полезные данные можно было бы отсылать непосредственно в боевые подразделения, действующие в указанном регионе минуя центр анализа оперативной информации.
Краткое резюме
В ходе экспериментов чип Eyeriss продемонстрировал уровень энергоэффективности, в десять раз превосходящий показатели современных мобильных графических чипов. При этом с его помощью оказывается технологически возможно обеспечить работу алгоритмов искусственного интеллекта на устройствах, обладающих компактными размерами – от смартфонов и планшетов — до носимой электроники. Задержки, создаваемые сетями при обмене данными для такого процессора оказываются сводятся к минимуму, поскольку большинство вычислений чип сможет выполнить локально. На базе Eyeriss можно будет создавать не только всевозможные «умные устройства», но и роботов, обладающих некоторой степенью самостоятельности в принятии решений.
Конкретных временных интервалов в течение которых Eyeriss сможет трансформироваться в коммерческий продукт и во всей мощи раскрыть свои возможности на уровне потребителя разработчики из MIT пока не называют. Определенный оптимизм внушает причастность к разработке ведущих специалистов NVIDIA и живой интерес ответственных научных сотрудников из Samsung.
Источник
Уважаемые читатели, мы всегда с удовольствием встречаем и ждем вас на страницах нашего блога. Мы готовы и дальше делиться с вами актуальными новостями, обзорными материалами и другими публикациями, и постараемся сделать все возможное для того, чтобы проведенное с нами время было для вас полезным. И, конечно, не забывайте подписываться на наши рубрики.
Другие наши статьи и события