Нейросеть определяет запоминаемость изображений / forpes.ru

Главная
Нейросеть определяет запоминаемость изображений

Нейросеть определяет запоминаемость изображений +4

18.12.2015 19:02

alizar 6 5300 Источник

Эту фотографию ты скоро забудешь

Исследователи из лаборатории компьютерных наук и искусственного интеллекта в Массачусетском технологическом институте разработали алгоритм, который определяет запоминаемость изображений. Более того, на основе этого алгоритма создано приложение для улучшения фотографий, чтобы они хорошенько впечатались в мозг.

Как можно догадаться, алгоритм разработан путём обучения нейросети. Тренировка происходила на людях. Во время обучения каждую фотографию из альбома показывали 600 миллисекунд, затем пауза 800 миллисекунд, потом следовали десятки других снимков. Через случайное время первая фотография повторялась. Некоторые другие фотографии тоже потом повторялись. В любой момент пользователь мог нажать кнопку и сигнализировать о том, что он узнал фотографию. Таким образом, в нейросеть поступала информация о том, какие фотографии лучше запоминаются.

В результате обучения нейросеть научилась буквально предсказывать человеческую память. Более того, она выделяет в кадре области с высокой и низкой запоминаемостью, за счёт чего фотографию можно оптимизировать.

В результате исследователи составили большую базу данных из 60 000 фотографий с указанием индекса запоминаемости — LaMem (Large-scale Memorability Dataset).

Алгоритм называется MemNet, в онлайне есть демонстрационная страница.

Предварительно подготовленную модель нейросети можно скачать и опробовать в офлайновом режиме, используя фреймворк Caffe.

«Понимание запоминаемости поможет в создании систем, которые сохраняют самую важную информацию или, наоборот, сохранить ту информацию, которую люди, скорее всего, забудут, — говорит аспирант лаборатории компьютерных наук и искусственного интеллекта Адитья Косла (Aditya Khosla), ведущий автор научного проекта. — Это как иметь в своём распоряжении мгновенно доступную фокусную группу, которая говорит о вероятности запомнить то или иное визуальное сообщение».

Такую систему можно применять в различных областях: от повышения эффективности рекламных объявлений и сообщений в социальной сети до разработки более эффективных учебных материалов. Или как персонального ассистента, который приводит для вас информацию в наиболее запоминающийся вид.

Разработчики проекта не только опубликовали дизайн нейросети, но и готовы предоставить всем желающим базу данных LaMem с 60 000 аннотированных фотографий (по запросу).

Более подробно об обучении свёрточной нейросети и работе алгоритма MemNet рассказано в научной работе. В ней описано, как составлялась база, как во время обучения нейросети проводилась игра на визуальную память и, в конце концов, как проверялись результаты работы нейросети после её обучения.

Комментарии (6)

AlexanderS
18.12.2015 23:14
#8918072
+4
Интересно, на заглавной картинке только я попытался ползунок передвинуть? =)
1. DuDDiTs
  19.12.2015 08:23
  #8918300
  Не только. 8 часов утра в субботу: вижу ползунок — не замечаю препятствий :)
1. Mad__Max
  21.12.2015 00:17
  #8919712
  Более того — у меня он успешно подвинулся!
  И только когда полученный эффект (двоение изображения на фотографии) не совпал с ожидаемым я понял что тут что-то не так и я просто целиком фотографию перетаскиваю: в FF если тащить фотку — появляется полупрозрачная ее копия следующая за курсором наложенная на исходную создает видимость сдвига ползунка (и двоения всего остального).

Keyten
19.12.2015 19:12
#8918574
Несколько субъективная вещь. У каждого свой опыт и своя на его основе запоминаемость различных тем.

Так, человек, знакомый с KOTOR, первую в статье картинку будет помнить гораздо дольше.

ra3vdx
19.12.2015 20:42
#8918602
Если планируется получать доход от алгоритма путём оптимизации рекламы, пусть обратят внимание на вчерашний пост.
Или на каноничное

KOLANICH
19.12.2015 21:41
#8918632
ИМХО неплохо было бы делать оконное преобразование фурье и подавать нейросети не саму картинку, а её спектр в окрестности каждой точки, так как чем размытее изображение («нифига не видно»), тем менее оно запоминаемое.

Я тут попробовал картинки скормить их сервису, почти у всех за 0.9.

Интересно, а можно ли эту нейросеть использовать для создания запоминаемых изображений для аутентификации?

Нейросеть определяет запоминаемость изображений +4

Эту фотографию ты скоро забудешь

Комментарии (6)

AlexanderS

DuDDiTs

Mad__Max

Keyten

ra3vdx

KOLANICH