Привет, Хабр!

Мы с AI Community и AI Today проводим онлайн-чемпионат по анализу данных Sibur Challenge 2021. Участвовать могут все, кто занимается машинным обучением. Призовой фонд в 650 000 рублей между собой разделят 5 первых мест:

1 место – 250 000;

2 место – 175 000;

3 место – 100 000;

4 место – 75 000;

5 место – 50 000.

А самым активным участникам мы подарим плащи СИБУР х WOS, каски СИБУР Диджитал, плюс сертификаты на обучение, рюкзаки и худи. Под активностью, кстати, мы понимаем продуктивное общение в Telegram-чате челленджа, репосты наших анонсов, хорошие вопросы по сути задания и творческий подход к решению задачи!

Теперь о задании

Продукты СИБУРа покупают в 90 странах по всему миру, и у нас большая и разветвлённая сеть поставок, которая при этом состоит из широкой линейки продуктов.

У нашего «дерева продуктов» есть своя специфика – допустим, у нас есть различные марки пропиленов, и мы должны выбрать, какую из них продавать. Для каждой из них используются разные технологические операции – при производстве используются различные добавки, катализаторы и т.д.

Соответственно, нам нужно максимально заранее приобрести сырьё, чтобы успеть не только произвести, но и довезти наш продукт. До Австралии, например, он будет плыть довольно долго. Потому чем раньше мы поймём, что хотим производить – тем лучше. Для этого и нужны прогнозы.

Прогнозную модель месячного спроса нужно построить на основе исторических данных по продажам за последние 4 года по всем направлениям. Для каждой из сделок указан объем продукции, клиент, регион, группа продукта с многоуровневой детализацией, тип контракта, точная дата и другие показатели. Всего в наборе 914 групп продуктов, для каждой из которых мы хотим построить предсказание на месяц.

Для участия нужно лишь заполнить форму по ссылке. А выполнить задание можно до 7 декабря, 23:59.  

На платформу Sibur Challenge нужно будет загрузить код, который генерирует предсказания. Результат каждого участника будет определяться его положением на лидерборде, а положение на лидерборде – качеством модели (для оценки качества мы используем RMSLE).

В общем, приглашаем!

Как избежать популярных ошибок

  1. Отправляйте инференс;

  2. Не забывайте паковать файлы в архивы (платформа не рассматривает predict.py как валидный файл);

  3. Не пакуйте файлы с директорией внутри — predict.py, к примеру, потом не находится, и ничего не работает. То есть, файл должен лежать в корне;

  4. Зависимости нужно добавлять в requirements.txt. Но только реально нужные :)

Комментарии (1)


  1. TiesP
    02.12.2021 19:54

    Можно было и пораньше написать)