Этой осенью мы вновь организуем большое соревнование по машинному обучению Sberbank Data Science Journey. Каждый год мы охватываем какую-то новую тему и теперь приглашаем вас попробовать силы в AutoML. Если конкретнее — в разработке очень умелого мета-алгоритма, способного самостоятельно создавать модели машинного обучения: с обработкой данных, построением признаков, обучением моделей, подбором их параметров и предсказанием целевой переменной.
В этом году за решение задачи мы наградим сразу 13 команд. Остальные подробности — далее в посте.
Условия задачи этого года подробно изложены на GitHub. Если вкратце, то нужно создать алгоритм машинного обучения, который автоматически выполняет предобработку данных, выбор семейства моделей, а также подбор гиперпараметров. И, конечно, соответствует всем поставленным условиям. Для работы, помимо этих условий, дается публичный набор датасетов.
Каждой команде участников будет предоставлен личный кабинет на сайте конкурса. В команду могут входить максимум четыре человека. Во время соревнования, с 19 сентября по 3 ноября участники смогут загружать в личный кабинет до пяти решений-алгоритмов ежедневно. Все эти решения попадают в общий рейтинг, где в режиме онлайн регулярно проверяются на наборе закрытых тестовых данных. Из результатов составляется таблица общего зачета, открытая всем — можно всегда прикинуть свои успехи. Загрузка решений будет доступна до 3 ноября, 23:59:59 (здесь и далее — по московскому времени).
Среди всех своих загруженных решений каждая команда должна будет выбрать два, которые представят ее в финале. На это дополнительно дается 12 часов. Дедлайн по выбору — 4 ноября, 12:00.
И наконец, следующие 12 часов мы будем прогонять данные на финальных решениях и объявим призерова на сайте соревнования к концу этого периода.
Разработчики десяти решений с наибольшим итоговым рейтингом будут награждены денежными призами: 1 000 000 рублей за первое место, 500 000 — за второе, 300 000 — за третье, 200 000 — за четвертое и пятое. Все остальные места до десятого включительно получат по 100 000 рублей.
Кроме того, если команда не поленится опубликовать решение на GitHub, то может получить еще 100 000 рублей. Мы разыграем три таких премии среди наилучших решений, которые будут выложены для публичного пользования. И кстати, этот дополнительный приз не исключает основной.
Официальное награждение пройдет 10 ноября на конференции «Sberbank Data Science Day». О конфе мы еще напишем дополнительно. Транспортные расходы разработчиков из других городов берем на себя, но даже если и это не заманит вас в столицу, приз все равно выплатим.
На случай разных непоняток вся информация о мероприятии сухим юридическим языком доступна в отдельном документе. Если не нашли ответ там или вопрос касается технической части, задавайте его на форуме или в комментариях к посту. Будем рады вашему участию!
Полезные ссылки:
В этом году за решение задачи мы наградим сразу 13 команд. Остальные подробности — далее в посте.
Условия и расписание
Условия задачи этого года подробно изложены на GitHub. Если вкратце, то нужно создать алгоритм машинного обучения, который автоматически выполняет предобработку данных, выбор семейства моделей, а также подбор гиперпараметров. И, конечно, соответствует всем поставленным условиям. Для работы, помимо этих условий, дается публичный набор датасетов.
Каждой команде участников будет предоставлен личный кабинет на сайте конкурса. В команду могут входить максимум четыре человека. Во время соревнования, с 19 сентября по 3 ноября участники смогут загружать в личный кабинет до пяти решений-алгоритмов ежедневно. Все эти решения попадают в общий рейтинг, где в режиме онлайн регулярно проверяются на наборе закрытых тестовых данных. Из результатов составляется таблица общего зачета, открытая всем — можно всегда прикинуть свои успехи. Загрузка решений будет доступна до 3 ноября, 23:59:59 (здесь и далее — по московскому времени).
Среди всех своих загруженных решений каждая команда должна будет выбрать два, которые представят ее в финале. На это дополнительно дается 12 часов. Дедлайн по выбору — 4 ноября, 12:00.
И наконец, следующие 12 часов мы будем прогонять данные на финальных решениях и объявим призерова на сайте соревнования к концу этого периода.
Награды
Разработчики десяти решений с наибольшим итоговым рейтингом будут награждены денежными призами: 1 000 000 рублей за первое место, 500 000 — за второе, 300 000 — за третье, 200 000 — за четвертое и пятое. Все остальные места до десятого включительно получат по 100 000 рублей.
Кроме того, если команда не поленится опубликовать решение на GitHub, то может получить еще 100 000 рублей. Мы разыграем три таких премии среди наилучших решений, которые будут выложены для публичного пользования. И кстати, этот дополнительный приз не исключает основной.
Официальное награждение пройдет 10 ноября на конференции «Sberbank Data Science Day». О конфе мы еще напишем дополнительно. Транспортные расходы разработчиков из других городов берем на себя, но даже если и это не заманит вас в столицу, приз все равно выплатим.
На случай разных непоняток вся информация о мероприятии сухим юридическим языком доступна в отдельном документе. Если не нашли ответ там или вопрос касается технической части, задавайте его на форуме или в комментариях к посту. Будем рады вашему участию!
Полезные ссылки: