Приглашаем всех 15 декабря принять участие в очном хакатоне по анализу данных «Новый Год hack 2019» в Москве в Научном парке МГУ.

Хакатон проводят компании Лаборатория Наносемантика и Контакт-центр «Гран» вместе с МФТИ и МГУ.

Под катом — описание задач, критериев оценки, условий участия и призы.

image

Описание и задачи


Участникам соревнования будет предложено 4 задания:

  1. Классификация интентов.
    Интент запроса – это намерение пользователя, цель его обращения к некоторой поисковой системе. Например, в случае с технической поддержкой классификация интентов может помочь автоматически кластеризовать запросы по их тематикам для формирования ответа, либо быстрого перенаправления к нужным специалистам.
  2. Исправление орфографических ошибок.
    Полезная задача как для собственной проверки правописания, так и для исправления возможных опечаток пользователей, к примеру, при обращениях к чат-ботам.
  3. Предсказание оценок в чатах.
    В данной задаче предлагается найти корреляцию между ответами специалистов технической поддержки в чатах и их итоговыми оценками, выставленными пользователями.
  4. Обнаружение фальсификации телефонной статистики.
    Недобросовестные операторы иногда пытаются фальсифицировать статистику звонков своих колл-центров. Ключевой показатель, который стремятся подделать – продолжительность звонка в секундах. Предлагается попытаться определить истинную природу появления цифр в отчётах.

Критерии оценки работ


Участникам соревнования предлагается построить алгоритмы, которые будут для задач 1, 3 и 4 решать задачу классификации, для задачи 2 – возвращать для каждого предложения исправленное. Решения принимаются в формате docker-контейнеров. Метрики качества решений задач 1, 3 и 4 — F1-score, для задачи 2 – также F1-score, но с увеличенными штрафными коэффициентами: за пропуск ошибки штраф увеличивается вдвое (FN с коэффициентом 2), за ложную детекцию – в 30 раз (FP с коэффициентом 30).

Роудмэп хакатона


До 14 декабря 17:59 — подача заявки.
Вы получите доступ к тренировочному датасету.
15 декабря — День Хакатона
10:00 — Выдаем датасеты, начинается разработка.
14:00 — Приезжает обед.
18:59 — Крайний срок сдачи работ.
20:00 — Объявляем победителей.

Условия участия


  • вы можете быть гражданином любой страны
  • вам может быть сколько угодно лет
  • допускаются команды от 1 до 4 человек

Организаторы хакатона: Лаборатория Наносемантика, Контакт-центр «Гран», МФТИ и МГУ.
Операторы площадки: Data Souls + Open Data Science.

> Подать заявку на участие можно на странице соревнования

Комментарии (5)


  1. sergeyns
    04.12.2019 12:38

    Эх, все никак не доходят руки заботать BERT, да и все находящиеся в инете мануалы, написанные индусами, какие-то кривые…


  1. namikiri
    04.12.2019 12:59

    О, «Наносемантика», это же та самая, которая «Ай-яй-яй»! Помнится в мои школьные годы многие заводили себе «инфов», это было очень мило и здорово.


    1. stanislav_as Автор
      05.12.2019 01:00

      Приятно, что помните) Мы в 2020 хотим оживить проект iii.ru.


  1. Miha_S7
    04.12.2019 20:24

    А образ контейнера будет от организаторов? Нужно будет запускать на своём компьютере? Если нет, то на каком железе будет тестироваться контейнер?


    1. Kassiope22n
      05.12.2019 09:08

      Здравствуйте. Образ для локального тестирования будет предоставлен, но сами решения будут запускаться на облачном сервере, техническая спецификация и ограничения решений будут объявлены позднее.