DialoGPT на русском / forpes.ru

Главная
DialoGPT на русском

DialoGPT на русском +16

30.03.2021 17:36

Grossmend 12 4000 Источник

Всем привет. В конце 2019 года вышла одна из работ по GPT-2. Инженеры из Microsoft обучили стандартную GPT-2 вести диалог. Тогда, прочитав их статью, я очень впечатлился и поставил себе цель обучить такую же модель, но уже на русском языке.

Время шло, и через год Сбер сделал очень хорошее дело, выложив в открытый доступ несколько небольших вариантов моделей GPT-3, обученных на русском языке.

Итак, когда все звёзды сошлись, потратив пару месяцев ночей на конструирование, обработку и очистку датасета, наконец-то обучил модель GPT-3 medium от Сбера вести диалоги. Большое спасибо DevAlone, за то что создал проект Pikastat, без которого потратил бы годы на сбор данных. Модель обучал 2 эпохи на 32 ГБ текста на библиотеке Transformers от Hugging Face. Обучение шло 12 дней на 4x RTX 2080 Ti.

Выражаю благодарность компании ICL Services, которая предоставила вычислительные мощности для обучения модели.

Датасет состоит из цепочек комментариев (~92% Pikabu, ~6% YouTube, ~2% VK). Количество сэмплов для обучения - 41 миллион. От ненормативной лексики датасет специально не очищал, поэтому будьте готовы к "неожиданным" ответам.

Ниже привожу примеры диалогов с обученной моделью. Там, где ответы от GPT длинные (свыше 50 токенов), выбирал наилучший среди трёх сгенерированных ответов. Также на построение каждого диалога были две попытки. В остальном, ничего не изменял и не подстраивал.

На скриншотах реплики от GPT производила полностью модель. А потому "все имена и события вымышлены, любые совпадения случайны".

Посмотреть еще больше диалогов

Посмотреть неудачные (стандартные проблемы диалоговых систем и моделей)

Среднее количество реплик при обучении – 4, потому длинные диалоги (от десяти и более реплик) модель воспринимает тяжело. Кроме того, необходимо помнить, что длина последовательности модели – 256 токенов.

На валидации был только лосс. Поэтому, чтобы самому оценивать качество модели "на глаз", собрал web-приложение. С JavaScript особо не дружу, но реализовал минимальный функционал, который задумывал. Репозиторий приложения лежит тут - там же инструкция для запуска.

Приложение состоит из двух частей:

Сам сайт на Flask (Python)
Сервис-генератор на FastAPI (Python)

После запуска сервиса и приложения взаимодействие будет выглядить примерно так:

Качество ответов сильно зависит от параметров генерации (тут хорошая вводная статья с объяснением параметров). При установке генерации нужной длины ("Length generate" в блоке слева), некоторые параметры также следует изменить для лучшей генерации. Сейчас как раз работаю над их оптимизацией, а также работаю над классификатором, который будет отбирать среди длинных ответов наиболее "удачный".

Теперь посмотрим в каком виде строка кодируется в модель:

Здесь зеленым цветом 0 либо 1, это speaker id. Он показывает какая реплика кому принадлежит. Красным выделен параметр, отвечающий за длину генерации, который принимает следующие значения: [ -, 1, 2, 3].

"-" - означает, что мы не ожидаем от модели какой-то конкретной длины генерации
"1" - модель будет стараться сгенерировать короткий ответ. При обучении диапазон был до 15 токенов
"2" - модель будет стараться сгенерировать средний ответ. При обучении диапазон был от 15 до 50 токенов
"3" - модель будет стараться сгенерировать длинный ответ. При обучении диапазон был от 50 до 256 токенов

В данном примере мы ожидаем от системы "длинный" ответ на вопрос "Что нового?"

Очень рекомендую пообщаться с моделью самим. Делать открытый сайт для общения не стал, так как генерация довольно ресурсоемкая задача. Когда снимал чекпоинты и общался с ней, давно не испытывал таких эмоций: и смешит, и печаль наводит, и ругается. В общем, все как надо для современной ~~молодежи~~ модели.

Также приметил, что неплохо отвечает на философские вопросы.

Но и минусов в данной версии модели тоже достаточно: обучение на небольшом датасете (41 миллион, у Microsoft было 147), генерация плохого качества длинных ответов, выдача "размытых" ответов, недообученность модели, плохой "симбиоз" с весами от Сбера.

Модель доступна на Hugging Face Model Hub. Также можете скачать с Google Drive.

Ну и напоследок: в детстве мне очень нравился фильм "Я робот". Давайте посмотрим, как отвечает модель на вопросы от детектива Спунера:

Видно, что до уровня Санни еще очень далеко. И это хорошо, так как есть куда стремиться.

По всем вопросам и пожеланиям пишите на grossmend@gmail.com. В дальнейшем постараюсь улучшать данную модель и выкладывать обновленные версии. До новых встреч!

Комментарии (12)

Kuprijan
31.03.2021 00:15
#22866558
Круто, надеюсь на мой век будет ИИ, с которым можно будет провести старость).
Но пугает то, что когда-нибудь боты будут проходить тест Тьюринга. Вот познакомился с другом новым, а он потом тебе орифлейм втюхивать начнёт, а ты этого не понимаешь…
1. DeadDevelopmentInc
  31.03.2021 14:19
  #22868572
  Еще хуже если он начнет тебе втюхивать орифлейм, читая тебя как открытую книгу и вот ты уже с новыми духами хотя написал ему привет.

Grossmend Автор
31.03.2021 00:23
#22866566
Есть такой момент)

perfect_genius
31.03.2021 00:55
#22866614
Голову Смита лучше повернуть бы.

Firsto
31.03.2021 08:37
#22867042
А где потестить можно без установки/настройки? :-)
1. Grossmend Автор
  31.03.2021 23:41
  #22870768
  +1
  huggingface.co/Grossmend/rudialogpt3_medium_based_on_gpt2
  В поле где «Hosted inference API» впишите текст в формате: "|0|1|Привет, как дела?|1|1|"
  1. Firsto
    01.04.2021 07:40
    #22871220
    Это видел, а вот в формате чата бы, как на скриншотах в статье...)
    
    Grossmend Автор
    01.04.2021 10:51
    #22871808
    Нет, такого нет, только если самому поставить

evgkul
31.03.2021 23:37
#22870752
Как по мне, реакция на "Повтори это сообщение" вполне адекватна

c00nst
31.03.2021 23:37
#22870754
Было бы прикольно создать модели известных конституций и посмотреть как они чатятся.

mpakep
01.04.2021 10:29
#22871688
На самом интересном обрывается.
Так с каким счетом пройдет игра Россия — Италия в финале чемпионата мира по футболу 2020?
1. Grossmend Автор
  01.04.2021 10:49
  #22871796
  в 2022) 1:0 было)

DialoGPT на русском +16

Комментарии (12)

Grossmend Автор

Grossmend Автор

Grossmend Автор

Grossmend Автор