Распознавание изображений — одна из задач, с которой лучше всего справляются сервисы с элементами искусственного интеллекта. Корпорация IBM запустила в тестовом режиме проект, который позволяет любому пользователю проверить возможности когнитивной системы Watson касательно распознавания изображений.
Сервис работает с фотографиями или картинками (можно загружать свои файлы, указывать адрес картинки в Сети или попробовать поработать с фотографией, представленной компанией). Если распознавание прошло успешно, система укажет список объектов, предположительно изображенных на картинке или фото, а также покажет вероятность каждого предположения. При желании можно создать собственную категорию объектов (уточнить существующую категорию, либо создать новую).
Обычно распознавание изображений работает в полуавтоматическом режиме — на картинке выделяются определенные объекты, которые уже должен идентифицировать пользователь. Но сервис IBM (доступен по ссылке) самостоятельно выполняет такую работу, используя семантические классификаторы, создаваемые самой системой и вводимые разработчиками в процессе обучения. Распознавать когнитивная система может не только объекты, но и события или условия среды, при помощи таких характеристик, как цвет, текстура, форма или края изображения.
В работе сервис использует также платформу IBM Multimedia Analysis and Retrieval System (IMARS). Это дает возможность разработчикам обучать Watson, а также создавать приложения для своих нужд на основе возможностей когнитивной системы. Например, ритейлер может создавать тег, классификатор, имеющий отношение к его одежде (брюки определенной марки). И тогда при необходимости сервис может идентифицировать такую одежду, если фотография с ней появляется в сети. То есть продавец (или производитель) одежды может видеть, насколько популярен его товар среди пользователей Сети.
Кстати, сервис уже работает в тестовом режиме в интересах компании MP Maritime (доставка грузов морем). При помощи ресурсов IBM эта компания получает возможность отслеживать крупные грузовые корабли на спутниковых снимках. Возможности сервиса можно опробовать в среде Watson Developer Cloud на Bluemix.
Доступ к API — здесь. Есть также документация и форк сервиса на Github (здесь и здесь).
Комментарии (9)
MichaelBorisov
01.04.2016 21:11Пока еще слабенько. Фотографию электрички классифицировал как "Cake". Самолет, снятый снизу, определил как "Church". Предупреждающий знак "точка сбора" классифицировать не смог, хотя некоторые другие знаки распознал. В остальном вроде более-менее справляется. Жаль, что нет возможности подсказывать свой вариант.
6opoDuJIo
01.04.2016 23:00http://cs409619.vk.me/v409619477/260/K0nvrCn95eY.jpg
dog 50%
странно
http://cs319126.vk.me/v319126477/7ee/MH2n4NOZO3g.jpg
отказ
http://cs302402.vk.me/v302402477/14f5/QvoLT4uar-E.jpg
96% cat
scifix
03.04.2016 13:59Не удержался, попробовал) По ощущениям, нормально узнает людей, и то средненько. Но вот как можно было не узнать льва?
ZlodeiBaal
А какие проценты по ImageNet/Другим популярным конкурсам?
Пока чего-то шедеврального не вижу. Где-то 30% изображений уходят в отказ, ещё 30% неправильно распознаются. Доходя до такого:
И прочие примеры…
https://habrastorage.org/files/3b4/49e/c94/3b449ec947db47b1834f907b1492dc6d.JPG
https://habrastorage.org/files/4b6/25e/3e5/4b625e3e5e9e4e049e572258c6f44a91.JPG
https://habrastorage.org/files/598/c2a/759/598c2a75917b4256bc4193fdea5dfd04.JPG
https://habrastorage.org/files/455/484/fa8/455484fa8243470db10b55419d087464.JPG
https://habrastorage.org/files/49f/317/53a/49f31753a6d747c29cd74f19175c6676.JPG
По ощущениям вполне обычный процент должно показывать.