image

И снова привет! Совсем недавно на Хабре публиковалась статья о больших данных металлургической промышленности и других технологиях. Кроме того, в том же материале рассказывалось о хакатоне с «Норникелем», который, как и планировалось, проходил с 16 по 18 апреля. Результаты уже известны, так что самое время их оценить. Все самое интересное, как водится — под катом.
Что за хакатон?

Это был 36-часовой онлайн-хакатон для:

  • разработчиков
  • дата сайентистов
  • аналитиков
  • менеджеров

Состоял он из двух основных треков:

Пенная вечеринка — определение по видео скорости потока пены с металлом и других параметров флотации для оптимизации работы оператора на производстве.

Больничные листы — создание модели предсказания ухода на больничный сотрудников в одном из производственных цехов Норникеля с использованием обезличенных данных о сотрудниках и их окружении.

Общий призовой фонд хакатона составил 500 000 рублей: по 250 000 рублей на каждый трек. Плюс каждый из участников получает мерч. Более того, за приз зрительских симпатий участники получают AirPods Pro, и доступны еще промокоды «Яндекс.Плюс», Okko, Gmoji.

Технологическим партнёром по вычислительным мощностям выступила компания SberCloud, выделившая участникам ресурсы облачной платформы ML Space и суперкомпьютера «Кристофари».

Немного важных цифр


На участие в хакатоне подали заявки 1027 человек — это отличный результат.

Тщательный отбор прошли заявки 25 команд, всего 98 участников. Забегая наперед, скажем, что 23 сдали решения по завершении, то есть справились с основной задачей. Ну а победителей определяло жюри.

Кстати, география участников была достаточно обширной — заявки поступили из Москвы, Санкт-Петербурга, Новосибирской, Свердловской, Калининградской областей, республики Татарстан, Краснодарского и Красноярского края. Всего мы насчитали 65 регионов!

Ну а теперь — к победителям


Для удобства будем указывать победителей для каждой из двух секций.

Призеры «Пенной вечеринки»


Команда «Random Seed and Nickel», которая заняла первое место. Ее участники — Андрей Рагимов, Валерий Шляпников, Сергей Соловьев, Никита Бузанов.



В ходе реализации проекта команда реализовала ряд алгоритмов и подходов, включая как State Of The Art алгоритмы предсказания Optical Flow, так и более традиционные классические метрики. Для нахождения пузырьков участники дотренировали алгоритм PointRend с хорошего чекпойнта и получили очень хорошие результаты. Комбинированное решение из Deep Learning и Classic CV алгоритмов показывает отличные результаты, обеспечивая хорошую комбинацию качества и скорости.

Комментарий команды: «Мы просто хотели решить задачу не хуже других команд. Упаковать решение и удивить судей. Считаем, что нам это удалось».

Команда также рассчитывает на продолжение сотрудничества, с реализацией как предложенной на хакатоне идеи, так и дополнительных идей.

Ну а приз — 120 000 рублей. Неплохо!

Команда DigitalRover, она заняла второе место. Ее участники —
Эдуард Шамшурин, Мария Галкина, Михаил Дмитриев, Станислав Лебёдкин, Олег Черемисин.



Проект этой команды — интерактивный аналитический дашборд для контроля и управления флотационной машиной. Аналитика строится на как на принципах классического компьютерного зрения, так и на современных высокоскоростных нейронных архитектурах (YOLOv4) и собственного исследования автоэнкодеров. Отличительной особенностью является децентрализованная архитектура на Nvidia Jetson NANO.

Комментарий команды: «Хотели поработать над решением интересной реальной задачи такого гиганта, как Норникель. И, конечно, получить приз. Цели достигли, все отлично».

Участники Digital Rover также планируют продолжить сотрудничество с «Норникелем» для реализации своего решения.

Размер приза, который получила команда — 80 000 рублей.

Команда AutoDS, занявшая третье место. Участники —
Максим Орехов, Алексей Клоков, Артём Сенин, Игорь Иноземцев.



Для определения по видео скорости потока пены с металлом и других параметров флотации команда разработала:
  • Variational autoencoder для детектирования аномалий.
  • Классические CV-алгоритмы для определения характеристик пены.

Проект был представлен в виде демо-визуализации с приближенной к финальной версии архитектурой. Оценить проект можно вот здесь (это репозиторий демо-визуализации).

Приз — 50 000 рублей.

Призеры «Больничных листов»


Команды «Канапе» и Team Datamotion заняли первое место. Жюри просто не смогло отдать предпочтение кому-то одному, уж слишком интересными оказались оба проекта.



Состав команды «Канапе» — Максим Шевченко, Андрей Захаров,
Николай Попов. Кстати, эта команда получила еще и приз зрительских симпатий с призом — AirPods Pro для всей команды.

Суть проекта — базовое решение для предложенной задачи, с которым удалось занять первое место на публичном лидерборде. Помимо решения основной задачи участники предложили другие задачи, которые могут быть решены на основе этого набора данных.



Состав команды Team Datamotion — Георгий Рак, Evgenii Munin, Илья Ревин, Артем Савинов, Али Сафиуллин.

Суть проекта — 12 моделей с разными горизонтами прогнозирования (Catboost + LSTM + LogReg). Сгенерированные фичи: заболеваемость в отделах, фичи рабочего графика/часов работы, фичи родственников и другие возможности. В качестве исходных данных использовали информацию за 2015 — 8/2019: сезонная заболеваемость в регионе, данные погоды, данные о вредности производства. Финальное решение: Блендинг лучших моделей (Catboost + LSTM + LogReg).

Приз — по 75 000 рублей каждой из команд.

Команда «Скажите А» заняла второе место.

Состав команды: Светлана Сущинская, Ольга Филиппова, Елена Твердохлебова.



Суть проекта — Lightgbm с временным фичами, ситуацией, родственниками и другими возможностями. Команда настраивала лимит вероятности с расчетом на ковидный год. Валидация проводилась по последнему году.

Приз — 50 000 рублей.

Ну и команда «PyPyPy» заняла третье место.

Состав команды: Никита Фомичев, Александр Абрамов.



Суть ее проекта — модель предсказания заболеваемости на основе данных о предыстории болезней. Участники сделали небольшой граф взаимодействия смен и отделов через сотрудника, плюс использовали SHAP для интерпретации влияния фичей на заболеваемость.

Приз — 50 000 рублей.

Поздравляем победителей!

Подводя итоги, стоит вспомнить ожидания организаторов хакатона: «Хочется, как и всегда – довольных участников. При прочих равных, участники хакатона – это самый дорогой ресурс. Если сделать участников довольными с помощью интересных прикладных задач, а еще и к этому добавить промокоды на еду, призы, подарки, то они сами создадут почву для исследований, новые пул-реквесты, запустят новые стартапы или устроятся работать в «Норникель»».

Что же, участники, жюри, организаторы — все остались довольны результатами. Хотелось бы надеяться на то, что некоторые из предложенных идей будут реализованы уже на производстве.