Цель проекта HELIOS — расширение и дополнение возможностей человеческого восприятия за счет современных технологий зрения. В исследовании, опубликованном Всемирной организацией здравоохранения, говорится о том, что около 285 миллионов человек в мире страдают нарушениями зрения: насчитывается 39 миллионов слепых и 246 миллионов человек с ослабленным зрением. Мы считаем, что очень важно повысить мобильность, безопасность и возможности доступа к знаниям для людей с нарушениями зрения.

Мы используем компьютерное зрение, искусственный интеллект и технологию Intel RealSense, чтобы создать современные решения, способные помочь людям с нарушениями зрения в решении целого ряда повседневных проблем. Наш подход состоит в разработке интеллектуальной головной гарнитуры, помогающей людям с частичной или полной потерей зрения.



Модели и возможности головных гарнитур HELIOS


Головные гарнитуры HELIOS предоставляют ряд специальных возможностей для людей с нарушениями зрения, помогая им проще и увереннее выполнять различные действия и задачи.

?HELIOS Touch


Гарнитура HELIOS Touch предназначена для людей с тяжелым нарушением зрения или с полной слепотой. В этом решении применяется интерфейс HTI для передачи пользователю визуальных данных посредством тактильных сигналов. За счет этого реализуются возможности ориентации в ближайшем пространстве и уклонения от препятствий.


Трехмерная модель HELIOS Touch

?HELIOS Light


Гарнитура HELIOS Light помогает людям с ослабленным зрением. С помощью технологий дополненной и виртуальной реальности гарнитура расширяет возможности визуального восприятия пользователей. Потоки цветного изображения и данных глубины, полученных от Intel RealSense, формируют адаптируемые визуальные подсказки, помогающие при выполнении разнообразных повседневных задач.


Трехмерная модель HELIOS Light

Основное назначение HELIOS — предоставить пользователю более полную информацию об окружающем пространстве, что существенно повышает свободу движения и безопасность пользователя.

Еще одна важная функция — возможность чтения текста без использования шрифта Брайля. Гарнитура HELIOS может читать содержимое книг, журналов и других печатных материалов, например меню в ресторанах.

Кроме того, HELIOS предоставляет новый уровень контекста для личного взаимодействия за счет распознавания лиц друзей и социальных сигналов.

Описание оборудования


?Технология Intel RealSense


Камеры Intel RealSense обеспечивают съемку в цвете и измерение расстояния. Благодаря этому система HELIOS получает высококачественные данные глубины и цветное изображение. Благодаря своей функциональности, производительности и компактности эти компоненты идеально подходят для интеграции в систему HELIOS.


Камера Intel RealSense R200. Дополнительные сведения см. в этой статье


Razer Stargazer — версия камеры Intel RealSense SR300 стороннего производителя

?Тактильный интерфейс HTI*


HTI — аппаратный компонент HELIOS Touch, разработанный нашей командой. Он предназначен для преобразования визуальных данных в тактильные сигналы, обеспечивая дополнительный уровень информации, которая подается точно и ненавязчиво.


Тестовая плата HTI

?Виртуальная реальность и открытый исходный код


Razer OSVR Hacker Development Kit — платформа виртуальной и дополненной реальности с широкими возможностями настройки. Это идеальный готовый компонент для HELIOS Light благодаря использованию открытого исходного кода, возможностям расширения и удачной конструкции оборудования.


Razer OSVR HDK

?Intel NUC


Последнее поколение компактных ПК Intel — мощная платформа для выполнения программных компонентов HELIOS в реальном времени с высокой производительностью, низким расходом электроэнергии и высокой мобильностью.


Intel NUC

Программное обеспечение. Intel RealSense SDK


Пакет Intel RealSense SDK — основной программный компонент системы HELIOS. Этот пакет без дополнительной настройки обеспечивает доступ к цветному изображению с высокой кадровой скоростью, к потокам изображения глубины и инфракрасного изображения, поддерживает широкий набор алгоритмов компьютерного зрения для таких задач, как отслеживание человека, распознавание лиц, создание трехмерных карт. SDK поставляется с огромным набором образцов проектов, для него подготовлена обширная документация.

В следующем примере кода показаны основные компоненты для разработки модуля преобразования текста в речь с помощью RealSense и UWP (универсальной платформы Windows):

Пример кода
public async void StartRealSenseStreaming()

{

    Status streamingStatus;



    // Set RealSense sample reader and bind SetOcrFrame event

    SampleReader sampleReader = SampleReader.Activate(senseManager);

    sampleReader.SampleArrived += SetOcrFrame;



    // Set RGB stream profile and device info filter

    Dictionary<StreamType, PerceptionVideoProfile> profiles = new Dictionary<StreamType, PerceptionVideoProfile>();

    profiles[StreamType.STREAM_TYPE_COLOR] = ColorProfile;

    sampleReader.EnableStreams(profiles);

    readers.Add(sampleReader);

    if (currentRealSenseDevice != null)

        senseManager.CaptureManager.FilterByDeviceInfo(currentRealSenseDevice.DeviceInfo);



    // Set streaming status message

    if ((streamingStatus = await senseManager.InitAsync()) == Intel.RealSense.Status.STATUS_NO_ERROR)

    {

        if ((streamingStatus = senseManager.StreamFrames()) == Intel.RealSense.Status.STATUS_NO_ERROR)

        {

            StatusMessage = "Streaming started";

        }

        else

        {

            StatusMessage = "Failed to stream: " + streamingStatus.ToString();

        }

    }

    else

    {

        StatusMessage = "Initialization failed: " + streamingStatus.ToString();

    }



    IsStreaming = true;

}



private void SetOcrFrame(Object module, SampleArrivedEventArgs args)

{

    // Setting current frame for OCR processing

    Sample sample = args.Sample;

    if (sample == null) return;



    var localOcrFrame = sample.Color;

    if (localOcrFrame == null) return;



    lock (sample)

    {

        ocrFrame = localOcrFrame.SoftwareBitmap;

    }

}
private async void TextToSpeech()

{

    // setup OCR engine for English

    OcrEngine ocrEngine = OcrEngine.TryCreateFromLanguage(new Language("en"));



    // recognize text from the RealSense OcrFrame

    var ocrResult = await ocrEngine.RecognizeAsync(RealSense.OcrFrame);



    if (!String.IsNullOrEmpty(ocrResult.Text))

    {

        // setup speech synthesizer

        var voice = SpeechSynthesizer.AllVoices;

        using (SpeechSynthesizer speechSynthesizer = new SpeechSynthesizer())

        {

            speechSynthesizer.Voice = voice.First(v => v.Gender == 0);

            var voiceStream = await speechSynthesizer.SynthesizeTextToStreamAsync(ocrResult.Text);



            // setup playback of voice synthesis

            PlaybackVoice(voiceStream);

        }

    }

}


Тестирование и проверка


Михай Леовенау (Mihai Leoveanu) обладает врожденным тяжелым нарушением зрения, но это не помешало ему стать выдающимся человеком.

Он убежденный оптимист и один из лучших учеников в своем выпускном классе. В настоящее время он работает над дипломным проектом, посвященным оснащению исторической достопримечательности — королевского двора Тырговиште — для повышения удобства в отношении специальных возможностей. Благодаря предполагаемым улучшениям туристы с нарушениями зрения смогут получить более полную информацию об этом историческом месте.
Михай стал первым испытателем нашей головной гарнитуры.


Михай тестирует HELIOS в действии


Михай читает с помощью HELIOS

В процессе экспериментов Михай предоставил отзывы обо всех использованных им возможностях системы HELIOS. Он естественным образом воспринял новые источники информации и уже через несколько минут смог успешно пользоваться головной гарнитурой для получения более точной информации об окружающем пространстве.

Заключение


Результаты разработки и тестирования весьма обнадеживающие. Для пользователей значительно упрощаются такие задачи, как восприятие окружающего мира и чтение без использования шрифта Брайля. При дальнейшем развитии система HELIOS станет незаменимым и очень полезным помощником для людей с нарушениями зрения.
Поделиться с друзьями
-->

Комментарии (8)


  1. tmin10
    14.11.2016 11:27

    Не очень понятно, что из себя представляет HTI и каким образом формируется тактильные сигналы. Фотография платы не даёт какой-то информации, а звёздочка у HTI так и не раскрыта дальше… А в этой части, как я понял, сама основа устройства.


  1. maslyaev
    14.11.2016 12:28

    Очень хочется подробностей про тактильный интерфейс.


  1. gsaw
    14.11.2016 12:36
    +1

    Я надеялся увидеть, что то вроде очков как у Джорди ла Форджа, а у видел рекламу Intel RealSense, как всегда на самом низком уровне :(

    Как я понял, парень слепил в кучу что было и получил очки, которые могут определить дистанцию до объектов и повирбрировать моторчиком (тактильные ощущения) если пользователь приближается к препятствию, Определить предметы на изображении с помощью нейронной сети (искуственный интелект) и назвать их вслух. И может зачитывать все, что распознал как текст.

    Согласен, первое и второе это хорошо, если оно работает. А вот последнее я сомневаюсь. Современный слепой вряд ли будет читать обычные книжки. Скорее все запустит синтезатор речи благо сейчас почти все книги в цифре. Я сколько не пробовал софт, который читает все, что на экране, все ерунда получалась. Он читает все, что видит, и то, что меня не интересует. Пока доберется до нужного места, мне все надоест. Так же в ресторане, пока оно зачитает, все, что в меню, слюной подавишься. Вот если ИИ дать почитать все меню, а потом спросить, что-нибудь мясное и ИИ тебе прочтет только нужное, вот это был бы прорыв. Хотя наверное проще спросить официанта.


    1. MAXInator
      14.11.2016 17:32

      Современный слепой вряд ли будет читать обычные книжки. Скорее все запустит синтезатор речи благо сейчас почти все книги в цифре.

      Табличка на стене не даст запустить на ней синтезатор речи, например.


      1. gsaw
        14.11.2016 18:12

        В статье два примера приведены. Книги и ресторан. Вы смешали их. Я имею ввиду, что если зачитывать все подряд, то это вряд ли принесет пользу. Нужен ИИ который знает, что я хочу. Что то на подобие как в гуглемобиле или машиных теслы. Что бы могло вести по улице. До того этим очкам явно далеко. парень судя по профилю в LinkedIn один занимается очками, это даже не Интел и тем более не научный проект. У него в профиле С++/C# и OpenCV. OpenCV мне кажется не достаточно.


  1. rPman
    14.11.2016 13:43

    где можно приобрести по адекватной цене носимую камеру, в идеале закрепляемую в наушнике и с адекватным сенсором?
    просто представил, как будет странно выглядеть человек, идущий по улице с такой огромной коробкой на лице.

    intel realsence — пока они не сделают свое оборудование меньше и легче на порядок, быть им только в стационарном варианте, максимум ноутбуки.
    p.s. у них сенсор уже перестал шуметь?


    1. tmin10
      14.11.2016 19:24

      А камера в наушнике куда будет смотреть, в бок? Или наушники закрытые?


      1. rPman
        15.11.2016 00:52

        в торце наушника, смотреть вперед

        ошибся, мне нужна не камера а быстрый видеосенсор с линзой в сборе, с подключением usb или какой-либо популярной плате по открытому протоколу (с проводами порядка 20см)

        на aliexpress можно найти разные spy камеры, но они — готовое устройство, со своим аккумулятором и пишут на карту памяти, а мне нужно подключение к заметно мощному процессору (в кармане рубашки или на груди)