Приложение Zensors, уникальным образом сочетающее краудсорсинг и машинное обучение для обработки информации с любых изображений и создания на их основе уведомлений, перешло в стадию беты и предлагает всем желающим принять участие в тестировании. Проект был представлен на этой неделе на конференции «Взаимодействие человека с компьютером» в Сеуле.
Стартап, созданный студентами Университета Карнеги Мелон, предлагает возможность превратить смартфон (или веб-камеру) в интеллектуальное устройство наблюдения. Вы открываете в приложении картинку, которую показывает камера, обводите пальцем интересующий вас фрагмент, и задаёте в свободной форме вопрос, касающийся этого фрагмента. Занято ли место на парковке? Есть ли очередь в кассу? Есть ли ещё корм в миске? Не воруют ли банкомат из магазина? Завезли ли в столовую сосиски?
Заданный вопрос поступает на обработку краудсорсинговой платформе. В процессе тестирования разработчики использовали платформу Amazon’s Mechanical Turk. Люди за символическую плату проверяют изображение и в случае наступления события оповещение поступает в систему, и приходит на ваш смартфон.
Краткое описание работы
Интересной особенностью Zensors является происходящее параллельно с работой краудсорсинга машинное обучение. Система сопоставляет ответы людей с изображениями и в какой-то момент обретает возможность самостоятельно отвечать на поставленный вопрос. В этом случае процесс автоматизируется, и лишь иногда изображение всё равно отправляется на проверку человеком для контроля работы алгоритма. В процессе тестов разработчики выяснили, что стоимость обработки одной картинки — 2 цента, и стоимость обучения алгоритма для автономной работы составляет около $15. Такие затраты не сравнимы с расходами времени и денег на написание аналогичной программы, распознающей изображения, на заказ.
«Обработка естественного языка, машинное обучение и компьютерное зрение – это три сложнейших задачи в компьютерной области,- говорит Крис Харрисон, ассистент-профессор университета, специализирующийся по взаимодействиям человека с компьютером. – Использование краудсорсинга позволяет нам обойти эти сложности. При этом мы используем людей для настроечной работы, и получаем все преимущества машинного обучения».