Компания Baidu в начале ноября выпустила DuerOS — новую операционную систему, которая должна будет подстегнуть разработку систем искусственного интеллекта. По словам разработчиков, ОС позволит быстрее развивать интерактивные возможности ИИ: распознавание и генерацию речи.

Об особенностях DuerOS и функциях операционных систем будущего расскажем далее.


/ фото montillon.a CC

О системе


Хотя официальный запуск DuerOS состоялся в ноябре, проект тестируется уже с начала этого года. DuerOS быстро стала популярной среди производителей оборудования в Китае. Они интегрировали её в сотни устройств: от холодильников и кондиционеров до смартфонов и роботов.

Особенность операционки — мощный пакет машинного обучения для распознавания голоса. Компания планирует открыть доступ к тысяче часов аудиозаписей мандаринского языка. Это позволит разработчикам обучать устройства «слышать» человеческую речь в сложных условиях, например в окружении шума.

Создатели также откроют доступ к 500 тысячам слов-обращений на китайском языке: «xiaodu xiaodu» для активации DuerOS и др. Помимо этого, разработчики проекта предлагают сотрудничество и финансовые вознаграждения за помощь в развитии обработки естественного языка виртуального собеседника. Baidu планируют разрабатывать курсы и проводить семинары в университетах и исследовательских институтах, чтобы обмениваться идеями об интерактивном искусственном интеллекте.

В течение 2017 года компания активно продвигала свой продукт: в июле Baidu и NVIDIA объявили о расширении партнерских отношений. Компании работают над решениями на базе искусственного интеллекта в разных сферах: облачная инфраструктура, автопилотируемые машины и домашние роботы.

Платформа глубокого обучения Baidu будет работать на процессорах NVIDIA Volta. Эти компании и китайские автопроизводители внедрят платформу NVIDIA Drive PX в системы автопилотируемых машин. DuerOS также интегрируют в приставку NVIDIA Shield TV китайского производства.

Ещё один союз — Baidu и компания аудиософта Conexant. Они объединились для продвижения продуктов и услуг с поддержкой распознавания голоса на базе искусственного интеллекта.

Операционные системы нового поколения


Эволюция технологий искусственного интеллекта и стремление повысить производительность мобильных устройств стали основой для создания операционных систем нового поколения. По мнению представителей индустрии, ОС будущего должны обладать расширяемой семантической структурой, то есть учиться понимать новые слова и расширять язык взаимодействия автоматически. Например, пока что в сервис Google Now разработчики вносят всю необходимую информацию «вручную».

Кроме того, ОС научится понимать пользователя. Пассивное получение рекомендаций превратится в систему интерактивных запросов, которая будет предугадывать желания пользователя. Также операционные системы будущего должны овладеть грамматикой по типу «оператор + данные».

Кто этим занимается


Разработкой подобных систем, помимо Baidu, занимается команда WEAVE.AI. Их продукт WeaveOS на базе искусственного интеллекта уже содержит некоторые из перечисленных компонентов ОС будущего. Другая команда энтузиастов — Airocorp. По замыслу разработчиков, их решение FI-OS упростит жизнь пользователей и превратит компьютер из рабочего инструмента в компаньона человека, изучающего поведение и привычки пользователя.

Энди Рубин, один из создателей Android, тоже считает, что искусственный интеллект — операционная система будущего. Рубин разрабатывает смартфон Essential и решение для «умного» дома Essential Home на операционной системе Ambient. Цель разработчика — создать единую платформу для всех устройств и приложений.

Исследователи Оксфордского и Йельского университетов полагают, что в течение следующих десяти лет машины смогут переводить тексты, писать школьные сочинения и проводить хирургические операции лучше людей. По их словам, вероятность того, что искусственный интеллект за 45 лет превзойдет людей во всех видах деятельности, равна 50%.

О компании Baidu

Baidu — китайская компания, предоставляющая веб-сервисы. Основной из них — одноимённая поисковая система. Baidu также имеет онлайн-энциклопедию — Энциклопедию Байду, которая обогнала по популярности Википедию в Китае.



P.S. Еще несколько материалов из Первого блога о корпоративном IaaS:

Комментарии (18)


  1. MetaDone
    22.11.2017 17:15

    Первая ассоциация — https://www.kinopoisk.ru/film/ona-2013-577488/


    1. dmitrykabanov
      22.11.2017 20:22

      У меня не было такой ассоциации, кстати. Думаю, что далеко еще до чего-то подобного на практике, но единая платформа — это то, что точно позволит итеративно двигаться в этом направлении. Акцент на микс систем ИИ и IoT интригует, конечно.


  1. potan
    22.11.2017 20:51

    Операционные системы и так стали слишком умные. Всегда придумают, как захватить побольше ресурсов и ничего не делать.



  1. wxmaper
    23.11.2017 04:39

    Так и не увидел что взято за основу для этой ОС. Не с чистого же файла они ее писали.


    1. izzholtik
      23.11.2017 13:48
      +1

      Есть сильное подозрение, что просто андроид с кастомной оболочкой и тонной китайского мусора внутри.


      1. izzholtik
        25.11.2017 16:15

        Так и оказалось.


  1. iSergios
    23.11.2017 07:19

    Кроме того, ОС научится понимать пользователя. Пассивное получение рекомендаций превратится в систему интерактивных запросов, которая будет предугадывать желания пользователя.


    Т.е. теперь ноутбук будет не только хранить всю информацию о пользователе, но и в прямом смысле слова знать о нем все. Пожалуй, я пас. По крайней мере до тех пор, пока ноутбуки и настольные ПК не научатся бегать и защищаться)


    1. farwayer
      23.11.2017 13:31

      Стадия первая: отрицание ;) Я хочу сказать, что нужно принять, что это неизбежно, и думать, как с этим дальше жить.


      1. fatronix
        23.11.2017 15:23

        Что неизбежно? Использование китайских ботнетов на своих устройствах?


        1. farwayer
          23.11.2017 15:43

          Причем тут ботнеты? Разговор был про «расшаривание себя» электронным помощникам и построение на основе этих данных личных рекомендаций. Между удобством и сохранением личных данных в тайне люди всегда будут выбирать удобство.


          1. T-362
            23.11.2017 16:27

            Между удобством и наглым втюхиванием маркетингом есть огромная разница.


            Удобство это когда говоришь девайсу "я хочу сходить покушать стейк" и девайс тебе выдает адреса ближайших кафешек, которые сейчас работают и у которых в меню есть стейк. Для этого не нужны никакие личные данные или предпочтения — только точка на карте и текущее время.


            А сейчас мы имеем — девайс подслушав беседу запомнил о тебе 'стейк', потом сам прочесал список и на основе данных какая кафешка больше заплатила за рекламу "советует" тебе — "вечереет, кушать небось охота, вот тут в %кафешканейм% есть стейки". Сплошной маркетинг.


            1. farwayer
              23.11.2017 18:35

              Есть компании, которые продают продукты, а есть компании, которые продают пользователей. И промежуточные варианты между двумя этими крайностями. Эта старая схема прекрасно ляжет на новую нишу.


      1. AllexIn
        23.11.2017 21:45

        Вполне избежно.
        Я страшный противник того, чтобы устройства умного дома чето там светили в инет, также я страшный противник того, чтобы речь с микрофона отдавалась куда нибудь для распознавания, я страшный противник того, чтоюы инфа с моих камер передавалась куда-то в интернет.
        При это у меня весь дом обвешан камерами, всё управляется системами умного дома, центральный терминал управляется голосом.
        Мне не нужно принимать правила производителей. У меня всю своё, на базе Open Source.
        Голос, например, распознаетс яна локальном сервере с помощью Sphinx. Гн сильно хуже гугла или яндекса. Но всё своё, родное.
        Отрицать прогресс бессмысленно. Лудиты неизбежно проигрывают. Но если что-то не нравится, надо просто делать так, чтобы было то, что понравится.


  1. Px2
    23.11.2017 09:25
    +1

    Прикрутили распознавание голоса и уже это новая ОС?
    А еще вот это мне понравилось: «вероятность того, что искусственный интеллект за 45 лет превзойдет людей во всех видах деятельности, равна 50%.».
    Ну да, либо превзойдет, либо нет.


  1. chernish2
    23.11.2017 09:32
    +1

    Помнится ещё OS/2 ver. 4 понимала голосовые команды, на 486 процессоре.


  1. farwayer
    23.11.2017 13:36

    Ну а где подроности? Или кроме пакета для распознавания и генерации китайской речи ничего «умного» в этой ОС больше нету? И, я так понимаю, акцент на китайский рынок?


  1. Idot
    23.11.2017 13:57

    Видео, или хотя бы скриншоты, где?