Разработчики сайта Wolfram Alpha добавили в копилку уникальных возможностей системы ещё одну удивительную функцию – распознавание любых фотографий. Каждый желающий может опробовать ImageIdentify в работе. Достаточно загрузить картинку на демонстрационный сайт и через несколько секунд вы получите ответ. Как утверждают сами разработчики – почти всегда правильный.
Стивен Вольфрам, основатель и главный идеолог компании, подробно описывает работу системы в записи в своём блоге. Стивен говорит, что 40 лет ждал момента, когда компьютеры научатся распознавать изображения, и был уверен в том, что этот момент настанет. Задача распознавания – одна из самых базовых для человека, и одна из самых сложных – для компьютерных систем и алгоритмов.
Стивен пишет, что хотя алгоритм и не всегда распознаёт изображения верно, даже его ошибки сильно напоминают человеческие.
Распознавание изображений теперь работает не только на демонстрационном сайте, но и в самом Wolfram Language. Можно задать изображение, получить его описание, а потом использовать уже само описание – получить, например, определение предмета из словарной статьи, или построить облако слов из статьи в Википедии.
Можно написать программу, автоматически анализирующую фотографии и составляющую статистику, делающую какие-либо другие подсчёты, связанные с содержанием картинок, или разбивающую их на категории. Также функция распознавания доступна через API.
Для тренировки системы разработчики использовали десятки миллионов изображений. С точки зрения Стивена это сравнимо с тем количеством информации, которое человек получает за первые пару лет жизни. Также Стивен подробно рассказывает в блоге, как разрабатывали систему машинного обучения на нейронных сетях, и какие при этом возникали проблемы. Например, когда систему ещё не научили распознавать лица, она, обработав портрет Индианы Джонса, выдала результат «Шляпа».
Для проверки системы Вольфрам пробовал скармливать ей разные противоречивые картинки и получал иногда странные, иногда – забавные или даже милые результаты.
Некоторые ошибки распознавания оказались не только вполне объяснимыми, но и даже весьма «очеловеченными». Также интересным оказался опыт распознавания абстрактной живописи – эти картины работали как своеобразные «тесты Роршаха».
В данный момент ImageIdentify способна распознавать до 10000 различных объектов. Пока она плохо справляется с распознаванием конкретных людей, произведений искусства и редких объектов.
Довольно забавно играть с системой, подсовывая ей не самые лёгкие варианты картинок и получая довольно своеобразные ответы.
Проект Wolfram Alpha был запущен в 2009 году. Система способна отвечать на заданные ей на обычном языке вопросы, и, используя данные из открытых источников, подсчитывать ответы. Например, на вопрос, заданный со смартфона, «Какие самолёты сейчас есть у меня над головой?» система ответит, определив местоположение по GPS, и укажет список самолётов, исходя из данных по рейсам авиаперевозчиков.
eduard93
Вот так вот.
rstepanov
www.imageidentify.com/result/0r89a1s3hhivh
Ну, в некотором роде это девайс, да…
dbanet
noonv
Очень интересно! Спасибо!
Boctopr
О чем они вообще ведут речь, когда не смогли распознать эталонную фотографию. Небольшое пояснение wiki.
FakeFactFelis
В классическом варианте картинка распознаётся корректно www.imageidentify.com/result/059tpvb1p5eei
valplo
Пытался скормить ему персонажей Хоумстака и XCKD. В общем, восстания машин можно не опасаться: рисованных персонажей он распознает как «устройства». Что, вообще, странно, т. к. у Джона все «фитчи» person-ы есть.
CAJAX
Скормить побольше пятен роршаха и узнать, что затевает этот ИИ.
sockeye
Всё плохо
Oxyd
Похоже всё что не смог распознать он относит к девайсам.
Turbo
А API у них нет? Я бы свой небольшой архивчик протежил )
UUSER
www.imageidentify.com/result/09ystr7r10fqh
Sing
Лого хабра www.imageidentify.com/result/1wj8qypkqny4a
kmx
www.imageidentify.com/result/04rfe01uqzic9
za121
Главное, что нашего президента узнает. ))
www.imageidentify.com/result/09k3vrotzp2ld
Banzeg
Про Обаму — не, не слышал
www.imageidentify.com/result/1svnulr73tejo
Oxyd
Не узнаёт. Зато правильно определил, что на изображении присутствуют артефакты. ;)
IJIL
В чем отличие от Гугл Картинки?
Oxyd
Фигня какая-то. ;)
fog
Для чистоты эксперимента сфотографировал несколько объектов — рюкзак, ручной эспандер, кофейный стаканчик, php-слоника, связку ключей, смарт-ключ от машины. Результат — для рюкзака сказали Pack, для бумажного стаканчика для кофе — glass cup, остальное сильно мимо. Ну, треть весьма близко — имхо это уже круто, а обучат ещё — будет ещё лучше.
Lsh
Вроде бывает и круче: www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures
pali
Неплохо опознало «Тигр»
www.imageidentify.com/result/0wuxml0e75h99
Psychosynthesis
Эх… похоже я так и не узнаю что изображено на этом фото =(
www.imageidentify.com/result/1pbe0o5gxn138
Shultc
Теперь вы и меня заинтриговали!
DIHALT
Печаль, он даже не смог распознать кисоньку!
Человечество может спать спокойно!
PavlovM
«Это не кошка!» (с) Джо из «Друзей»
DIHALT
Вы совершенно правы! Это кот!
eaterman99
Кисонька это еще ладно:
Oxyd
Какой неполиткорректный вольфрам.
iago
Странно! У меня жену с котом он тоже распознал как sleeping bag. Неспроста это…
AdvanTiSS
зато он опознал спальную корзину, видать, для ИИ коте не авторитет )))
kidar2
У меня зависло на сисьсках
Corpsemeister
Спутал луну с мячиком для гольфа. Закат угадал (солнце). Старый автомобиль Audi 80 B4 как ни странно угадал, назвав station wagon. Все фотографии первый раз покинули мой компьютер.
Suntechnic
Угу, а шестерка у него electric car. Правда это второй вариант — первый был шуба O_o
OsipovRoman
Официальный и полный перевод статьи Стивена Вольфрама «Искусственный интеллект в Wolfram Language: проект по идентификации изображений» habrahabr.ru/company/wolfram/blog/258003
Исправьте пожалуйста название вашего поста. Не Wolfram Alpha, а Wolfram Language, научился описывать содержимое любых картинок и фото. Это важно, потому что Wolfram Alpha — это вычислительный движок знаний, написанный на Wolfram Language. Это разные объекты: Wolfram Mathematica, Wolfram Alpha, Wolfram Cloud. Все они реализованы на одном языке Wolfram, но в Wolfram Alpha пользователь не может программировать напрямую на языке Wolfram. В целом это распространенные заблуждения на счёт устройства и связей между технологиями Wolfram Research.
Scogun
Ни Гагарина, ни Шепарда, ни Королева не узнал…
komr
www.imageidentify.com/result/1pc2yep85yidr
komr
висит уже несколько минут
Chamie
Опознал, значит…
Suntechnic
www.imageidentify.com/result/1cpxes8tjf20l
Ну… даже для России это перебор.