В Москве пройдет хакатон по анализу текстов. Регистрация до 14 декабря / forpes.ru

Главная
В Москве пройдет хакатон по анализу текстов. Регистрация до 14 декабря

В Москве пройдет хакатон по анализу текстов. Регистрация до 14 декабря +7

04.12.2019 08:53

stanislav_as 5 996 Источник

Приглашаем всех 15 декабря принять участие в очном хакатоне по анализу данных «Новый Год hack 2019» в Москве в Научном парке МГУ.

Хакатон проводят компании Лаборатория Наносемантика и Контакт-центр «Гран» вместе с МФТИ и МГУ.

Под катом — описание задач, критериев оценки, условий участия и призы.

Описание и задачи

Участникам соревнования будет предложено 4 задания:

Классификация интентов.
Интент запроса – это намерение пользователя, цель его обращения к некоторой поисковой системе. Например, в случае с технической поддержкой классификация интентов может помочь автоматически кластеризовать запросы по их тематикам для формирования ответа, либо быстрого перенаправления к нужным специалистам.
Исправление орфографических ошибок.
Полезная задача как для собственной проверки правописания, так и для исправления возможных опечаток пользователей, к примеру, при обращениях к чат-ботам.
Предсказание оценок в чатах.
В данной задаче предлагается найти корреляцию между ответами специалистов технической поддержки в чатах и их итоговыми оценками, выставленными пользователями.
Обнаружение фальсификации телефонной статистики.
Недобросовестные операторы иногда пытаются фальсифицировать статистику звонков своих колл-центров. Ключевой показатель, который стремятся подделать – продолжительность звонка в секундах. Предлагается попытаться определить истинную природу появления цифр в отчётах.

Критерии оценки работ

Участникам соревнования предлагается построить алгоритмы, которые будут для задач 1, 3 и 4 решать задачу классификации, для задачи 2 – возвращать для каждого предложения исправленное. Решения принимаются в формате docker-контейнеров. Метрики качества решений задач 1, 3 и 4 — F1-score, для задачи 2 – также F1-score, но с увеличенными штрафными коэффициентами: за пропуск ошибки штраф увеличивается вдвое (FN с коэффициентом 2), за ложную детекцию – в 30 раз (FP с коэффициентом 30).

Роудмэп хакатона

До 14 декабря 17:59 — подача заявки.
Вы получите доступ к тренировочному датасету.
15 декабря — День Хакатона
10:00 — Выдаем датасеты, начинается разработка.
14:00 — Приезжает обед.
18:59 — Крайний срок сдачи работ.
20:00 — Объявляем победителей.

Условия участия

вы можете быть гражданином любой страны
вам может быть сколько угодно лет
допускаются команды от 1 до 4 человек

Организаторы хакатона: Лаборатория Наносемантика, Контакт-центр «Гран», МФТИ и МГУ.
Операторы площадки: Data Souls + Open Data Science.

> Подать заявку на участие можно на странице соревнования

Комментарии (5)

sergeyns
04.12.2019 12:38
#20963372
Эх, все никак не доходят руки заботать BERT, да и все находящиеся в инете мануалы, написанные индусами, какие-то кривые…

namikiri
04.12.2019 12:59
#20963474
О, «Наносемантика», это же та самая, которая «Ай-яй-яй»! Помнится в мои школьные годы многие заводили себе «инфов», это было очень мило и здорово.
1. stanislav_as Автор
  05.12.2019 01:00
  #20965938
  Приятно, что помните) Мы в 2020 хотим оживить проект iii.ru.

Miha_S7
04.12.2019 20:24
#20965314
А образ контейнера будет от организаторов? Нужно будет запускать на своём компьютере? Если нет, то на каком железе будет тестироваться контейнер?
1. Kassiope22n
  05.12.2019 09:08
  #20966434
  Здравствуйте. Образ для локального тестирования будет предоставлен, но сами решения будут запускаться на облачном сервере, техническая спецификация и ограничения решений будут объявлены позднее.

В Москве пройдет хакатон по анализу текстов. Регистрация до 14 декабря +7

Описание и задачи

Критерии оценки работ

Роудмэп хакатона

Условия участия

Комментарии (5)

sergeyns

namikiri

stanislav_as Автор

Miha_S7

Kassiope22n