Kaggle: Какой клиент – счастливый клиент?
Призовой фонд:
1 место – 30000 $
2 место – 20000 $
3 место – 10000 $
Дедлайн: 2 мая 2016
Удовлетворенность клиентов – ключевой критерий успеха для всех, от служб поддержки до топ-менеджеров. Недовольные клиенты больше не возвращаются и, что хуже, редко выражают свою неудовлетворенность перед тем, как уйти. Банк Сантандер просит пользователей Kaggle помочь определять неудовлетворённых клиентов на ранней стадии взаимоотношений. Это даст возможность банку предпринять упреждающие шаги для повышения удовлетворённости клиента ещё до того, как станет слишком поздно. В этом соревновании вы будете работать с сотнями анонимизированных признаков для оценки того, насколько доволен клиент своим опытом общения с банком.
Соревнование уже подходит к концу. Конкуренция очень высока. На данный момент — более 5000 участников.
Данные: www.kaggle.com/c/santander-customer-satisfaction/data
Описание: www.kaggle.com/c/santander-customer-satisfaction
Рейтинг участников: www.kaggle.com/c/santander-customer-satisfaction/leaderboard
Kaggle: Отель какого типа забронирует пользователь Expedia?
Призовой фонд:
1 место – 12500 $
2 место – 7500 $
3 место – 5000 $
Дедлайн: 10 июня 2016
Планирование отпуска вашей мечты или даже кратковременного бегства на уикенд может быть умопомрачительным делом. Среди сотен и тысяч отелей на выбор по каждому направлению трудно заранее определить, какой из них наилучшим образом будет соответствовать вашим личным предпочтениям. Отправиться в тихий патриархальный отель с подушками, набитыми мятой, которые так вам нравится, или рискнуть двинуть в новый, с модным баром при бассейне? Expedia хочет помочь своим пользователям в поиске отелей, предоставляя персонализированные рекомендации. Это непростая задача для сайта с сотнями миллионов посетителей каждый месяц! Сейчас Expedia использует параметры поиска для уточнения рекомендаций различных отелей, но в них недостаточно специфичных клиентских запросов для персонализации рекомендаций под каждого пользователя.
В этом соревновании Expedia просит пользователей Kaggle сопоставить данные клиентов и предсказать вероятность того, на какой из 100 различных групп отелей остановится пользователь. Данные в этом конкурсе – случайная выборка из реальных данных Expedia.
Данные: www.kaggle.com/c/expedia-hotel-recommendations/data
Описание: www.kaggle.com/c/expedia-hotel-recommendations
Рейтинг участников: www.kaggle.com/c/expedia-hotel-recommendations/leaderboard
BlackBox Challenge — обучение ботов играть в играх с неизвестными правилами
Призовой фонд:
1 место: 300 тыс. рублей
2 место: 170 тыс. рублей
3 место: 125 тыс. рублей
Следующим пятерым лучшим участникам подарят по Microsoft Xbox One.
Дедлайн: 30 мая 2016
Объявление победителей: 10 июня 2016
BlackBox Challenge – открытое соревнование по обучению и программированию бота с ИИ (искусственным интеллектом). В его ходе участники должны обучить своего агента играть в игру с неизвестными заранее правилами. На каждом этапе бот узнает состояние игровой среды и выбирает в нем между четырьмя возможными действиями. За свои ходы бот получает награду, но иногда не сразу, так что не всегда может оценить правильность своего выбора. Мало того, в наградах присутствует элемент случайности, чтобы избавиться от детерминированности игры и сделать её непредсказуемой.
Для участия надо скачать симулятор игровой среды и тренировочные данные, создать модель и обучить агента играть, пользуясь любыми доступными методами. Код решения загружается на сайт, система чрезвычайно быстро проверяет его и сообщает результат. Участники ранжируются по лучшему результату каждого. При маловероятном одинаковом результате двух участников место выше будет у того, кто ранее загрузит выигравшее решение.
Страничка соревнования: blackboxchallenge.com/home
Рейтинг участников: blackboxchallenge.com/leaders
Kaggle: Может ли компьютер определить, что водитель отвлёкся?
Призовой фонд:
1 место – 30000 $
2 место – 20000 $
3 место – 15000 $
Дедлайн: 1 августа 2016 года
Мы все бывали в такой ситуации: на перекрестке зажигается зелёный, а машина перед нами не трогается с места. Или ничем не примечательное авто на трассе внезапно замедляется и начинает выписывать кренделя. Когда вы минуете проблемного водителя, что вы ожидаете увидеть? Вы не удивитесь, если он отправляет сообщение с мобильника или находится в процессе живой беседы по смартфону, который прижимает к уху одной рукой.
По данным отдела безопасности транспортных средств Центра по контролю заболеваний США (CDC), одно из каждых 5 ДТП происходит по вине отвлёкшегося водителя. Иначе говоря: в США по вине отвлекающихся водителей ежегодно травмируется 425 тысяч и погибает 3 тысячи человек, а ежедневно гибнет более 8 человек и 1,161 получает травмы.
Компания State Farm надеется улучшить эту пугающую статистику и уберечь своих клиентов, экспериментируя над тем, могут ли видеорегистраторы автоматически выявлять отвлекающихся водителей. Предоставляя массивы изображений с видеорегистраторов, State Farm просит пользователей Kaggle классифицировать поведение каждого из водителей. Управляют ли они машиной внимательно, пристегнувшись ремнём или снимают селфи с друзьями на заднем сиденье? Участники конкурса получают изображения водителей, занятых непосредственно вождением или чем-то посторонним. Их задача – создать программу, которая определяет то, насколько водитель отвлекается от управления автомобилем на каждом из представленных изображений.
Отвлечения от управления можно разделить на 3 основных типа: зрительное, когда водитель отрывает взгляд от дороги, ручное, когда он отрывает руки от руля, и мысленное, когда он отвлекается на общение.
Занятия, отвлекающие водителя, включают разговоры по сотовому телефону, отправку сообщений, еда за рулём, разговоры с соседями. Использование встроенной в машину аппаратуры (такой, как навигационные системы или радио) тоже может быть источником отвлечения. Все эти занятия могут создавать угрозу безопасности водителя и других участников движения, но набор и отсылка сообщений во время вождения особенно опасна, потому что сочетает все три типа отвлечений.
Данные: www.kaggle.com/c/state-farm-distracted-driver-detection/data
Описание: www.kaggle.com/c/state-farm-distracted-driver-detection
Рейтинг участников: www.kaggle.com/c/state-farm-distracted-driver-detection/leaderboard
Конкурс на автоматическое распознание изображений таблеток
Призовой фонд:
1 место – 25000$
2 место – 15000$
3 место – 5000$
Два поощрительных приза по 2500$.
Период подачи заявок: 4 апреля – 16 мая 2016
Объявление победителей: 1 августа 2016
Национальная библиотека медицины США (NLM) в январе этого года опубликовала уведомление о конкурсе на программы распознавания изображений таблеток. От участников требуется вклад в разработку высококачественных алгоритмов и программ, которые смогут сопоставлять известные изображения таблеток, используемых в рецептах, со снимками из базы данных RxIMAGE NLM. NLM планирует использовать работу участников конкурса для создания будущего программного обеспечения и API, которые будут искать наилучшие совпадения в базе RxIMAGE со снимками неизвестных таблеток, сделанными на смартфон.
Инструкции для подачи заявок на конкурс содержат:
Ссылки на данные, которые будут использованы, включая характеристики файлов; Детали заявок, включающие спецификации софта, примеры, детали о подаче заявок, спецификации виртуальной машины, систему оценки; Критерии оценки и выбора победителей; Программный код софта, который будет использован для оценки.
Созданный участниками софт должен быть способен принимать в качестве исходных данных директории, содержащие произвольное число снимков, присланных клиентами и контрольных изображений и ранжировать их в порядке того, насколько они сходны.
Страничка соревнования: pir.nlm.nih.gov/challenge
ViZDoom: Visual Doom AI Competition @ CIG 2016
Дедлайн подачи заявок на разминочный турнир: 31.05.2016
Дедлайн подачи заявок на финальный турнир: 15.08.2016
Объявление результатов (CIG): 20-23.09.2016
Doom считается одним из наиболее значимых тайтлов в игровой индустрии: авторы игры популяризировали жанр шутера от первого лица (FPS) и были пионерами 3D-графики с эффектом присутствия. Хотя с выхода Doom прошло более 20 лет, методы разработки ботов с ИИ в современных шутерах изменились не сильно. В частности, боты по-прежнему должны читерить, получая доступ к внутренним данным игры, таким, как карты, локации и позиции. Геймеры-люди, напротив, могут играть в FPS, используя в качестве информации только экран компьютера. Может ли ИИ эффективно играть в Doom, используя только непосредственную зрительную информацию?
Цель: Участники соревнования Visual Doom AI должны отправить контроллеры (на C++, Python или Java). Предоставленный софт дает в режиме реального времени доступ к экранному буферу, как единственной информации, на которой бот может основывать свои решения. Победитель соревнования будет определен по итогам турнира ботов на выбывание.
Хотя участникам позволено использовать любую технику для создания контроллера, дизайн и эффективность окружения Visual Doom AI позволяет и поощряет участников использовать методы машинного обучения, такие, как глубокое обучение с подкреплением (reinforcement deep learning).
Ход соревнования
1. Ограниченный турнир на выбывание на известной карте.
Единственное доступное оружие – ракетница, с которой стартуют агенты. Кроме того, они могут получить медицинские наборы и боеприпасы.
2. Турнир без ограничений на выбывание на неизвестной карте.
Доступны различное оружие и предметы. Для тренировки предоставляются две карты. Финальная оценка будет на трёх картах, ранее неизвестных участникам.
На что будет похож финальный матч?
Ваш контроллер будет сражаться против всех других контроллеров 10 минут на простой карте. Каждая игра повторится 12 раз для части 1 и 4 раза для части 2, что включает 3 карты. Место контроллеров будет определяться по числу фрагов.
В случае подачи множества заявок пройдёт несколько отборов.
Техническая информация
Каждый контроллер должен действовать на отдельном компьютере с одним ЦП и графическим процессором в его полном распоряжении. Спецификация компьютеров: Intel® Core(TM) i7-4790 CPU @ 3.60GHz + GTX 960 4GB. ОС: Windows или Ubuntu Linux 15.04
Как подать заявку?
Для подачи заявки нужны: название команды, её участники и сведения о них; не более 2 страниц описания метода, использованного для создания контроллера (PDF); список (разумный) требований к софту для агента (запрашивается заранее); ссылка на программный код контроллера и дополнительных файлов (всего не более 1GB); инструкция по созданию контроллера и управлению им. Форма подачи заявок будет предоставлена позже. В духе открытой науки все заявки будут опубликованы на сайте после окончания соревнования.
Страничка соревнования: vizdoom.cs.put.edu.pl/competition-cig-2016
Комментарии (10)
Turbo
26.04.2016 13:26Тут указано только 6 соревнований, но на самом деле их больше. Накидайте, пожалуйста ссылок на наиболее интересные в комменты. Спасибо.
dissident
27.04.2016 10:01+1Довольно интересный конкурс от Microsoft Decoding Brain Signals. Дата проведения 30.03.2016 — 1.07.2016. И еще тут периодически проходят хакатоны по ML
Turbo
27.04.2016 11:59Decoding Brain Signals — залез почитать. Они хотят что бы всё делалось на какой-то их платформе. Зашел туда посмотреть, какие-то диаграммы, ничего не понятно. )
Turbo
27.04.2016 12:10Спасибо по второй ссылке будет соревнование с 29 апреля по 1 мая с призовым фондом 1800$:
http://datahack.analyticsvidhya.com/contest/the-seers-accuracy
pro_co_ru
27.04.2016 10:03В начале этого года обратил внимание на Kaggle.
Решил попробовать свои силы в www.kaggle.com/c/the-winton-stock-market-challenge
В качестве инструмента использовал FANN ( leenissen.dk ).
С помощью подсчёта корреляций участков данных сгруппировал и рассортировал эти данные по группам.
Далее использовал рекуррентные нейронные сети и бустинг, для получания output данных, и получение первой из более чем 60 требуемых колонок данных потребовало примерно 5 дней работы алгоритма на моём домашнем компьютере. Понял что такими темпами к сроку не успеть и мой алгоритм ориентировочно бы работал порядка не менее 300 дней. В итоге так и не закончил свою разработку, но желание всё же довести дело до конца осталось.
Может кто знает, есть ли бесплатные или недорогие сервисы/песочницы/площадки/API, где можно было бы поэксперементировать и погонять свои идеи такого плана в облаке или на кластере?
В закладки себе добавил из нагугленного несколько ссылок:
bigml.com/accounts/login/?next=/dashboard/sources/new
cloud.google.com/prediction/docs
indico.io/product
Но это не совсем то что мне нужно.
Слышал, что есть hadoop, но пока не разбирался с тем что это из себя представляет.
Может оно как раз то что мне нужно?
Заранее благодарю за дельные советы.Turbo
27.04.2016 12:03В этом соревновании за исключением ТОП10, никто ничего хорошего не добился. Особенно если учесть, что вывести все 0 (Zero Prediction) выше середины таблицы участников. )
acherednychenko
27.04.2016 12:26+1Позавчера закончился Homedepot competition на kaggle. занял 24ое место. если есть вопросы — задавайте
https://www.kaggle.com/c/home-depot-product-search-relevance/leaderboardchechevatov
29.04.2016 07:35Как всегда, хотелось бы услышать что делалось с данными и как была построена модель. Можно без мелких деталей, только основные шаги, повлиявшие на результат.
glebreutov
У Виздум отдельный челлендж — собрать симулятор. Я конечно не гуру make но так и не смог его собрать ни на одной платформе