Microsoft выложила в открытый доступ исходный код инструментов, которые используются в компании для ускорения разработок в области искусственного интеллекта: набор Computational Network Toolkit опубликован на Github.

Как сообщается в официальном блоге, исследователям пришлось создать набор инструментов CNTK из необходимости. Ведущий специалист Microsoft по системам распознавания речи Сюэдун Хуан (Xuedong Huang) говорит, что разработчики в его группе были озабочены проблемой, как ускорить процесс распознавания речи компьютерами, а имеющиеся инструменты работали слишком медленно.

Поэтому группа добровольцев вызвалась решить проблему самостоятельно, используя собственное решение, которое ставило производительность на первое место.

Усилия окупились сполна.

Во внутренних тестах CNTK показал более высокую производительность, чем четыре других популярных вычислительных инструментария, которые разработчики используют для создания моделей глубинного обучения в задачах вроде распознавания речи и распознавания образов, за счёт лучших коммуникационных возможностей.

«Инструментарий CNTK просто невероятно более эффективен, чем всё, что нам доводилось видеть», — признаёт Сюэдун Хуан.

Прирост производительности такого рода исключительно важен для стремительно развивающейся области глубинного обучения, потому что некоторые из самых сложных задач глубинного обучения могут вычисляться неделями.



За последние несколько лет область глубинного обучения сделала большой шаг вперёд, поскольку всё больше исследователей запускают алгоритмы машинного обучения с использованием глубоких нейросетей. Многие считают, что глубинное обучение имеет потенциал для улучшений в области искусственного интеллекта, пишет Microsoft.

Достигнутый прогресс позволил создавать системы, которые точно распознают и даже переводят речь, а также системы распознавания изображений, способные даже отвечать на вопросы о них.

В компании Microsoft инструментарий CNTK используется на кластере мощных компьютеров с GPU. Оказалось, что GPU идеально подходят для обработки таких алгоритмов, благодаря им произошёл такой рывок в технологиях синтеза, распознавания и понимания речи, распознавания изображений и движения на видео.

Пользу от инструментов CNTK может извлечь каждый: от разработчика с ограниченным бюджетом и единственным компьютером до компании, способной поднять целый кластер серверов с GPU. Разработчики Microsoft утверждают, что CNTK масштабируется для параллельной работы на многих GPU-машинах гораздо лучше, чем другие публично доступные инструменты такого рода.

В апреле прошлого года Microsoft открыла CNTK для академических исследователей через Codeplex под более ограниченной свободной лицензией. Начиная с понедельника CNTK доступен абсолютно для всех.

Независимые разработчики выражают удовольствие такими положительными действиями Microsoft, но при этом не упускают возможности подколоть компанию: «Только Microsoft могла открыть документацию на гитхабе в формате docx», — пишет один из них.

Комментарии (8)


  1. fr33z3
    26.01.2016 11:39
    +4

    Вообще очень интересно, когда Microsoft делает что-то интересное. Начинаешь Microsoft уважать все больше и больше.


  1. iroln
    26.01.2016 13:55

    Инструментарий может и хороший… но документация в docx-файлах? Отлично! :)
    github.com/Microsoft/CNTK/tree/master/Documentation/Documents

    Но с этой штукой зато, наверное, не будет проблем при работе под Windows, как со всеми остальными.


    1. varagian
      26.01.2016 14:08
      +3

      Вот тут и tutorial, и white paper в pdf, вроде выгдлядит прилично.


  1. Andriyevski
    27.01.2016 01:37
    -6

    Билл Гейст филантроп и его точка зрения в компаннии тут же подхватывается жополизами и выкидывается в продакшн, а после выхода в мир, любое детище и идея становится мейнстримом, давайте вспомним немножко.
    Windows ХР при весе в 800 Мегабайт в среднем — Багнутое угище, но после Windows Милениум, 95,98, 2000 таким не казалось.
    Windows Vista в 1.5 гигабайта — Воплощение ада на земле, все говорили о том какой он висячий и глючный но опять же повторюсь… (все о нем говорили) пиар черт возми Бил, где такому научился?
    Windows 7 с весом в 24 гигабайта, видимо все прежние версии остались на новой винде в корзине- после Vista никто не узнал Windows ХР с новыми сервиспаками и модами и UI. Хитер бобер )))
    Windows 8\8.1 с весом в 20 гигабайт, кое что удалили, походу виндоус ХР — действительно наново переписаная ось новой кровью вошедшей в компанию, пацаны просто не могли криво что то написать, так как Бил и Майкрософт не успела их научить чему то плохому… Хотя позже к каждой винде под Windows 8 они крепили названия Ентерпрайз, ПРо, Мега про, нубила едишн и остальные типа нужные версии.
    Перебьюсь перед следующим релизом, случился ужас, поддержка Windows ХР и IE прекратилась, по всюдду должна быть паника, все нервно скрябут по стенах и думают что их жизнь приходит к концу, но тут Бил спасает беспомощьных вафрике\ отступился…
    Релиз Windows 10 — Билл прочитал книгу Андроид для новичков, и понял что нужно создать свою, по книге конечно же, но он был умнее и придумал что нужно замутить под все устройства. Теперь ее можна запускать даже в микроволновке.
    И помните, ваш бутерброд теперь будет под лицензией всемирного зла, а микроволновка работает только 30 дней в триал режиме :D


    1. iTs
      27.01.2016 03:00
      +4

      Что за поток сознания? Причём здесь Гейтс?


    1. Mixim333
      27.01.2016 17:41
      +1

      Товарищ, Вы ничего не путаете: «27 июня 2008 года стал последним для Билла Гейтса в должности руководителя Microsoft»(Wiki)?

      Молодцы, что исходники открывают, думаю многие найдут там много чего интересного!


  1. SkidanovAlex
    27.01.2016 03:01
    +2

    Там на картинке утверждается что только CNTK умеет на несколько машин работать. Это, конечно, не так, mxnet умеет почти с самого зарождения. Учитывая, что у mxnet столько же звезд на GitHub сколько у Theano, странно, что они о нем не знают.