Этот проект написан на python3 и использует API OpenAI
Получение токенов
Для начала нужно получить token для работы с API и organiztion id. Это можно сделать на следующих страницах:
https://platform.openai.com/account/api-keys
https://platform.openai.com/account/org-settings
Ссылка на страницу с документацией
https://platform.openai.com/docs/api-reference/introduction
Дополнительные настройки
Эти значения надо записать в переменные openai.api_key и openai.organization (13 и 14 строчки в файле ChatGPT.py)
openai.organization = "organiztion id"
openai.api_key = "token"
Менять тип используемой модели можно здесь(38 строчка)
engine='text-davinci-003',
Максимальное количество токенов (слов) в ответе(41 строка).
max_tokens=100,
Количество ограниченно в бесплатной версии.
Необходимые зависимости
Теперь необходимо установить следующие библиотеки
pip install openai
pip install pyaudio
pip install googletrans
pip unstall vosk
pip install pyttsx3
Эти библиотеки необходимы для распознавания речи, перевода текста в английский и обратно и для синтеза речи. В репозитарии на гитхабе уже лежит языковая модель для распознавания русской речи. Хорошо работает только в тишине.
Принцип работы
После запуска программы необходимо произнести слов "слушай". Компьютер ответит "Говори. Слушаю внимательно" и далее все произнесенные слова будут отправлены сначало в гугл переводчик, а затем уже отправлены в бота. Это сделано в целях получения более конкретного ответа от бота. Затем после получения ответа от бота данные отправляются в синтезатор речи.
Ну и результат на видео
Исходники
Комментарии (10)
sartorius9
00.00.0000 00:00-1Ну что-же, давайте будем учить Чатжпт.
Может быть получится.
Ибо учить человеков говорить и слушать - задача поистине невыполнимая.
MrRewolwer
Сделал аналогичное решение для личного использования, но на tts Silero. Взгляните в его сторону, некоторые голоса потрясающи.
interprise
а что посоветуете для распознавания речи?
nnmz
https://habr.com/ru/company/ods/blog/692246/ ?