Известный сайт для хранения и публикации фотографий столкнулся с характерной проблемой любых автоматических средств, которые пытаются заменить человека при анализе нестандартной информации. Пользователи заметили, что функция автоматического присваивания тегов зачастую распознаёт объекты на фотографиях мало того, что некорректно, так ещё и многие теги оказываются просто оскорбительными. К примеру, фотографии чернокожего мужчины, по мнению Flickr, должны быть присвоены кроме прочих теги «animal»(животное) и «ape» (человекообразная обезьяна).

Обвинять алгоритмы системы распознавания образов Flickr в расовой дискриминации не стали, поскольку попадаются фотографии людей европейского типа, которые, однако, тоже получили малоприятные теги, говорящие, что тут изображено «животное» и, по всей видимости, «обезьяна». С другой стороны, по мнению Flickr этой фотографии печально известных ворот концентрационного лагеря нацистов Дахау кроме вполне корректных подходят теги “jungle gym” и «sport».

Во Flickr признали наличие проблемы благодаря большому числу негативных комментариев пользователей. Из тегов, которые система может автоматически присвоить фотографии, постарались удалить «обезьяну» и пообещали отрегулировать использование тега «спорт», в частности, удалить его из описания фотографий концлагерей. Спикер компании говорит, что в целом гордится новой функцией, но согласился, что над ошибками распознавания ещё надо будет работать. Система учитывает то, как пользователи редактируют теги, и, вероятно, ещё «не научилась» учитывать их мнение при распознавании содержимого фотографии.

В прошлом году сотрудники Google Research показали свой алгоритм распознавания изображений, основанный на нейронных сетях. Он пытается не только назвать объекты, присутствующие на фотографии, а и пытается описать её на «человеческом языке». Почти такой же результат получен независимо от Google в Стэнфордском университете. К примеру, их алгоритм безошибочно считает, что на этой фотографии «маленькая девочка ест кусок торта»:

image

Комментарии (19)


  1. Color
    20.05.2015 23:50
    +1

    «Система учитывает то, как пользователи редактируют теги, и, вероятно, ещё «не научилась» учитывать их мнение при распознавании содержимого фотографии»
    Добавить плюсовалку/минусовалку для тэгов, вот тебе и система обучения. Учитывая, что будут больше минусовать, чем плюсовать, помножить это на некий эмпирический коэффициент


    1. Tribe
      21.05.2015 02:49
      +1

      Ага, только пользователи не всегда плюсуют честно. Так, например, в стиме под тегом casual game вполне нормально лежит Dark Souls II.


      1. Color
        21.05.2015 02:51
        +3

        «не всегда»
        резко выбивающиеся значения можно отбрасывать как ошибочные. Это вопрос тонкой настройки и подгонки алгоритма


      1. susnake
        21.05.2015 05:56
        +6

        Да, но ведь это действительно casual game...