Приглашаем всех 15 декабря принять участие в очном хакатоне по анализу данных «Новый Год hack 2019» в Москве в Научном парке МГУ.
Хакатон проводят компании Лаборатория Наносемантика и Контакт-центр «Гран» вместе с МФТИ и МГУ.
Под катом — описание задач, критериев оценки, условий участия и призы.
Участникам соревнования будет предложено 4 задания:
Участникам соревнования предлагается построить алгоритмы, которые будут для задач 1, 3 и 4 решать задачу классификации, для задачи 2 – возвращать для каждого предложения исправленное. Решения принимаются в формате docker-контейнеров. Метрики качества решений задач 1, 3 и 4 — F1-score, для задачи 2 – также F1-score, но с увеличенными штрафными коэффициентами: за пропуск ошибки штраф увеличивается вдвое (FN с коэффициентом 2), за ложную детекцию – в 30 раз (FP с коэффициентом 30).
До 14 декабря 17:59 — подача заявки.
Вы получите доступ к тренировочному датасету.
15 декабря — День Хакатона
10:00 — Выдаем датасеты, начинается разработка.
14:00 — Приезжает обед.
18:59 — Крайний срок сдачи работ.
20:00 — Объявляем победителей.
Организаторы хакатона: Лаборатория Наносемантика, Контакт-центр «Гран», МФТИ и МГУ.
Операторы площадки: Data Souls + Open Data Science.
> Подать заявку на участие можно на странице соревнования
Хакатон проводят компании Лаборатория Наносемантика и Контакт-центр «Гран» вместе с МФТИ и МГУ.
Под катом — описание задач, критериев оценки, условий участия и призы.
Описание и задачи
Участникам соревнования будет предложено 4 задания:
- Классификация интентов.
Интент запроса – это намерение пользователя, цель его обращения к некоторой поисковой системе. Например, в случае с технической поддержкой классификация интентов может помочь автоматически кластеризовать запросы по их тематикам для формирования ответа, либо быстрого перенаправления к нужным специалистам. - Исправление орфографических ошибок.
Полезная задача как для собственной проверки правописания, так и для исправления возможных опечаток пользователей, к примеру, при обращениях к чат-ботам. - Предсказание оценок в чатах.
В данной задаче предлагается найти корреляцию между ответами специалистов технической поддержки в чатах и их итоговыми оценками, выставленными пользователями. - Обнаружение фальсификации телефонной статистики.
Недобросовестные операторы иногда пытаются фальсифицировать статистику звонков своих колл-центров. Ключевой показатель, который стремятся подделать – продолжительность звонка в секундах. Предлагается попытаться определить истинную природу появления цифр в отчётах.
Критерии оценки работ
Участникам соревнования предлагается построить алгоритмы, которые будут для задач 1, 3 и 4 решать задачу классификации, для задачи 2 – возвращать для каждого предложения исправленное. Решения принимаются в формате docker-контейнеров. Метрики качества решений задач 1, 3 и 4 — F1-score, для задачи 2 – также F1-score, но с увеличенными штрафными коэффициентами: за пропуск ошибки штраф увеличивается вдвое (FN с коэффициентом 2), за ложную детекцию – в 30 раз (FP с коэффициентом 30).
Роудмэп хакатона
До 14 декабря 17:59 — подача заявки.
Вы получите доступ к тренировочному датасету.
15 декабря — День Хакатона
10:00 — Выдаем датасеты, начинается разработка.
14:00 — Приезжает обед.
18:59 — Крайний срок сдачи работ.
20:00 — Объявляем победителей.
Условия участия
- вы можете быть гражданином любой страны
- вам может быть сколько угодно лет
- допускаются команды от 1 до 4 человек
Организаторы хакатона: Лаборатория Наносемантика, Контакт-центр «Гран», МФТИ и МГУ.
Операторы площадки: Data Souls + Open Data Science.
> Подать заявку на участие можно на странице соревнования
Комментарии (5)
Miha_S7
04.12.2019 20:24А образ контейнера будет от организаторов? Нужно будет запускать на своём компьютере? Если нет, то на каком железе будет тестироваться контейнер?
Kassiope22n
05.12.2019 09:08Здравствуйте. Образ для локального тестирования будет предоставлен, но сами решения будут запускаться на облачном сервере, техническая спецификация и ограничения решений будут объявлены позднее.
sergeyns
Эх, все никак не доходят руки заботать BERT, да и все находящиеся в инете мануалы, написанные индусами, какие-то кривые…