Фото: Michaela Rehle / REUTERS
Сегодня стали известны итоги конкурса алгоритмов по распознаванию лиц Megaface. Как оказалось, российская компания N-tech.lab вошла в первую пятерку во всех номинациях, а в двух из них стала победителем, обойдя Google. В конкурсе требовалось идентифицировать изображения людей из двух коллекций, с использованием коллекций в большой базе фотографий, пишут «Ведомости». В первой коллекции содержалось около 100 тысяч изображений людей (одного возраста), во второй — около 900 тысяч изображений людей разных возрастов. Поиск проводился участниками конкурса в базе с 1 млн изображений.
Устроители конкурса предусмотрели четыре номинации. При этом для участия в Megaface зарегистрировались 100 участников. Каждая команда могла участвовать в одной из двух категорий. Первая предполагала отсутствие ограничений на количество фотографий для обучения своего алгоритма, во второй было ограничение на полмиллиона фотографий.
Алгоритм отечественной компании смог распознать более 73% лиц из первой коллекции в базе с миллионом фотографий. У Google результат несколько хуже — чуть более 70%. Во второй категории, с ограничением в 500 тысяч снимков для обучения компания N-tech.lab оказалась второй. Компания Google вышла победителем в распознавании 900 изображений из второй коллекции без ограничения количества фотографий для обучения алгоритма. Результат Google в этом случае — 74%. Российский стартап здесь оказался вторым с результатом в 52%. А вот при поиске 900 изображений в категории с ограничением в 500 тысяч снимков российская компания оказалась первой.
«Мы считаем это победой, ведь наш алгоритм показал лучший результат в основной категории. Особенно приятно, что мы обучали наш алгоритм на трех компьютерах, в то время как Google понадобилось 1000 серверов», – говорит основатель N-tech.lab Артем Кухаренко.
Компания N-tech.lab основана в этом году. В скором времени стартап планирует выпустить ряд коммерческих продуктов с использованием своего алгоритма. При этом один такой проект будет работать в развлекательной сфере. Речь идет о сервисе знакомств, который позволяет искать пользователей со внешностью определенного типа.
Комментарии (8)
SkidanovAlex
08.12.2015 07:38+3Есть подозрение, что Google гонял свой старый DistBelief, который на процессорах, а не новый TensorFlow, который на GPU, отсюда 1000 серверов. Для TensorFlow на таком количестве фотографий даже для их Inception моделей 1000 серверов не нужно. Ну а сравнивать 1000 CPUs с тремя GPUs не имеет смысла.
Но вообще было бы очень интересно почитать детали реализации у наших ребят. Какая модель, какие фреймворки, какая революционная технология позволила получить такие хорошие числа.zm_llill
10.12.2015 13:48Молодцы, конечно. И да, были бы очень интересны технические подробности… хоть какие-то, а то 3 сервера, это совсем скудные данные.
Firsto
08.12.2015 07:45Особенно приятно, что мы обучали наш алгоритм на трех компьютерах, в то время как Google понадобилось 1000 серверов
Ого, это же вообще прорыв.
Молодцы!
1514m
08.12.2015 08:02+1А какими были бы результаты, если бы искать пришлось не только среди изображений лиц? Интересует процент ложноположительных срабатываний.
RZimin
09.12.2015 12:02+3Кто-то может пролить свет на разницу между 52% и 74%? В первых двух категориях разница в проценты, а тут сразу 22%.
Спасибо.
tas
Очень приятно за N-tech.lab! Мои поздравления и пожелания удачно монетизировать свои преимущества!