image

«ВКонтакте» внедрила технологию, которая позволит не слушать, а читать получаемые аудиосообщения. При расшифровке задействован ИИ. Нейросеть распознает речь даже при сложных условиях записи и понимает русскоязычный сленг.

Функция доступна части пользователей мобильного приложения. У всех остальных она появится в ближайшую неделю. Ее можно будет применять и для отправленных голосовых сообщений длительностью до 30 секунд.

Кроме того, голосовые сообщения теперь можно будет находить по простому поиску по тексту.

В будущем планируется внедрить новую функцию и на ПК-версии. Список доступных опций также расширят. В него добавят расшифровку пересылаемых сообщений и более длинных посланий.

Как отмечает команда разработчиков, работа нейросети рассчитана на высокие нагрузки платформы, так как аудиосообщениями ежемесячно обмениваются 30 млн пользователей. Кроме того, она расшифровывает записи быстрее, чем человек, утверждают представители соцсети.

«На самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке», — заявил Павел Калайдин, директор по исследованиям в области искусственного интеллекта соцсети.
См. также: «ВКонтакте, МФТИ и ВШМ СПбГУ создали курс по машинному обучению для преподавателей информатики
Как подчеркивают во «ВКонтакте», распознавание голосовых сообщений полностью автоматизировано, а сотрудники соцсети, как и другие сторонние лица, не обладают доступом к личным сообщениям. Функцию тестировали с марта.
См. также: «Как происходит рендеринг экрана сообщений ВКонтакте