Эту фотографию ты скоро забудешь




Исследователи из лаборатории компьютерных наук и искусственного интеллекта в Массачусетском технологическом институте разработали алгоритм, который определяет запоминаемость изображений. Более того, на основе этого алгоритма создано приложение для улучшения фотографий, чтобы они хорошенько впечатались в мозг.

Как можно догадаться, алгоритм разработан путём обучения нейросети. Тренировка происходила на людях. Во время обучения каждую фотографию из альбома показывали 600 миллисекунд, затем пауза 800 миллисекунд, потом следовали десятки других снимков. Через случайное время первая фотография повторялась. Некоторые другие фотографии тоже потом повторялись. В любой момент пользователь мог нажать кнопку и сигнализировать о том, что он узнал фотографию. Таким образом, в нейросеть поступала информация о том, какие фотографии лучше запоминаются.

В результате обучения нейросеть научилась буквально предсказывать человеческую память. Более того, она выделяет в кадре области с высокой и низкой запоминаемостью, за счёт чего фотографию можно оптимизировать.



В результате исследователи составили большую базу данных из 60 000 фотографий с указанием индекса запоминаемости — LaMem (Large-scale Memorability Dataset).

Алгоритм называется MemNet, в онлайне есть демонстрационная страница.

Предварительно подготовленную модель нейросети можно скачать и опробовать в офлайновом режиме, используя фреймворк Caffe.

«Понимание запоминаемости поможет в создании систем, которые сохраняют самую важную информацию или, наоборот, сохранить ту информацию, которую люди, скорее всего, забудут, — говорит аспирант лаборатории компьютерных наук и искусственного интеллекта Адитья Косла (Aditya Khosla), ведущий автор научного проекта. — Это как иметь в своём распоряжении мгновенно доступную фокусную группу, которая говорит о вероятности запомнить то или иное визуальное сообщение».

Такую систему можно применять в различных областях: от повышения эффективности рекламных объявлений и сообщений в социальной сети до разработки более эффективных учебных материалов. Или как персонального ассистента, который приводит для вас информацию в наиболее запоминающийся вид.

Разработчики проекта не только опубликовали дизайн нейросети, но и готовы предоставить всем желающим базу данных LaMem с 60 000 аннотированных фотографий (по запросу).

Более подробно об обучении свёрточной нейросети и работе алгоритма MemNet рассказано в научной работе. В ней описано, как составлялась база, как во время обучения нейросети проводилась игра на визуальную память и, в конце концов, как проверялись результаты работы нейросети после её обучения.

Комментарии (6)


  1. AlexanderS
    18.12.2015 23:14
    +4

    Интересно, на заглавной картинке только я попытался ползунок передвинуть? =)


    1. DuDDiTs
      19.12.2015 08:23

      Не только. 8 часов утра в субботу: вижу ползунок — не замечаю препятствий :)


    1. Mad__Max
      21.12.2015 00:17

      Более того — у меня он успешно подвинулся!
      И только когда полученный эффект (двоение изображения на фотографии) не совпал с ожидаемым я понял что тут что-то не так и я просто целиком фотографию перетаскиваю: в FF если тащить фотку — появляется полупрозрачная ее копия следующая за курсором наложенная на исходную создает видимость сдвига ползунка (и двоения всего остального).


  1. Keyten
    19.12.2015 19:12

    Несколько субъективная вещь. У каждого свой опыт и своя на его основе запоминаемость различных тем.

    Так, человек, знакомый с KOTOR, первую в статье картинку будет помнить гораздо дольше.


  1. ra3vdx
    19.12.2015 20:42

    Если планируется получать доход от алгоритма путём оптимизации рекламы, пусть обратят внимание на вчерашний пост.

    Или на каноничное
    image


  1. KOLANICH
    19.12.2015 21:41

    ИМХО неплохо было бы делать оконное преобразование фурье и подавать нейросети не саму картинку, а её спектр в окрестности каждой точки, так как чем размытее изображение («нифига не видно»), тем менее оно запоминаемое.

    Я тут попробовал картинки скормить их сервису, почти у всех за 0.9.

    Интересно, а можно ли эту нейросеть использовать для создания запоминаемых изображений для аутентификации?