Кажется, что создавать голосовой блокнот в 2022 году, когда есть Google и Speechpad — пустая трата времени. Однако разработчики Диктума с этим не согласятся. Голосовой блокнот Диктум появился, потому что похожие сервисы не вывезли.

Зачем понадобилось создавать свой голосовой блокнот, что у него под капотом и как его продвигают — читайте ниже.

Знакомство с Диктумом

На связи Лика, редактор Слёрма. Недавно мы с коллегами поняли, что хотим рекламировать проекты, которые нам нравятся. Ключевое — нравятся нам. Мы разослали письмо по емейл-базе и предложили подписчикам рассказать нам о своих наработках. Среди тех, кто откликнулся — Виталий Квитковский. Вместе с командой единомышленников он делает голосовой блокнот Диктум.

Услышав о Диктуме, я подумала: «Вау! Это судьба!» Накануне я загадала, что хочу голосовой блокнот для планирования дел. Понятное дело — таких сервисов много. Здесь интерес был в том, чтобы не искать приложение специально, а отправить свою хотелку в космос и посмотреть, что выйдет.

Моё желание сбылось на 50% через несколько дней — мы познакомились с Виталием и его Диктумом. Почему на 50%, а не на 100? Расскажу об этом в конце. А пока поговорим о самом сервисе и о том, почему я в него верю.

Виталий Квитковский, создатель Диктума, бывает разным
Виталий Квитковский, создатель Диктума, бывает разным

Диктум придумали, чтобы спасти шутки

Даже история у приложения интересная. У автора Диктума есть хобби — он придумывает загадки и шутки. Мне кажется, уже это выдаёт в нём необычного человека, который и к своему проекту подходит творчески — дальше я приведу несколько занимательных историй.

Так вот, мозг Виталия может изобрести нечто интересное в любом месте, даже в самом неподходящем. Чтобы не забывать загадки и шутки, Виталий пытался пользоваться голосовыми блокнотами. Он пробовал и Google, и Яндекс, и Speechpad. Эти сервисы хороши и подходят для решения задач.

Раздражало в них только то, что, расшифровывая запись, приложения периодически путали слова и искажали смысл. Они не записывают и не сохраняют аудио, а распознают голос на лету и сразу переводят в текст, поэтому Виталий не мог переслушать то, что наговорил, а мысль забывалась. Так потерялось несколько прекрасных шуток и интересных задумок.

Тогда родилась идея голосового блокнота, который, кроме распознавания, записывает и сохраняет аудио. В этом случае можно переслушать запись хоть сто раз и интеллектуальные изобретения не канут в Лету.

Как выглядит Диктум
Как выглядит Диктум

Трудности с релизом решила статья на Хабре (причём чужая)

Приложение написали за три месяца, а потом… не выпускали ещё пять. Виталий признался, что было страшно: всё время казалось, будто надо добавить фич.

Возможно, сервис не увидел бы свет до сих пор, если бы не статья на Хабре, которая случайно попалась Виталию на глаза. В ней мужик пилил и всё никак не релизил сервис два года. Потом увидел готовое приложение с теми же возможностями, что разрабатывал сам, и купил подписку. Виталий понял, что не хочет повторить судьбу героя статьи, и через пару дней выпустил Диктум в продакшн.

Пока у сервиса два названия — Диктум и Скажиголосом. Слово «диктум» придумал Виталий, оно ему очень нравится. Мне, кстати, тоже: звучное и легко запоминается. Второе имя — это адрес, на который получилось зарегистрировать приложение — скажиголосом.рф. Недавно появился короткий адрес diktuy.ru. Возможно, Диктум переименуют, но это не точно.

Блокнот превратился в сервис голосовых отзывов — идея не взлетела

Диктум разрабатывали как голосовой блокнот, а выпустили как… сервис голосовых отзывов для психологов, коучей, ведущих вебинаров.

От первоначальной задумки отказались по двум причинам. Во-первых, появились сомнения, что кто-то захочет пользоваться Диктумом за деньги — похожими сервисами никого не удивишь.

Во-вторых, Виталий признался, что ему было психологически легче продавать сервис компаниям, а не обычным людям. Предприниматели зарабатывают деньги → приложение приносит им пользу → они делятся деньгами. Эта схема была понятна и комфортна.

Сервис голосовых отзывов не взлетел. Виталий попросил знакомых психологов потестировать приложение и отправить клиентам ссылки на формы, в которые можно наговорить похвалу или критику. Оказалось, людей трудно замотивировать оставлять отзывы, даже если их не нужно писать.

Ребята попробовали запустить акцию добра во ВКонтакте — предлагали подписчикам вспомнить любимых специалистов и наговорить им приятные слова. Диктум расшифровал бы запись, а команда приложения (в которой даже есть филолог!) расставила бы точки и запятые и вернула причёсанный отзыв отправителю.

Пост репостнуло больше 10 человек, но откликов получили только три. Два записал Виталий, один наговорила его жена.

После этого решили искать другое позиционирования для Диктума. Ребята не огорчились — идея сервиса голосовых отзывов им с самого начала не откликалась.

Вот это поворот: Диктум стал сервисом для отелей

Знакомая посоветовала рассказать про Диктум её другу, который владеет глэмпингом (база отдыха с комфортными шатрами). Разработчики задумались, как использовать сервис в туристической сфере. И придумали! Если повесить QR-коды в номерах и других помещениях гостевых домов, отелей, хостелов, то с помощью Диктума постояльцы смогут быстро и без стресса сообщать на ресепшен о проблемах.

Допустим, в туалете закончилась бумага или на кухне перегорела лампочка. Гостю не нужно искать администратора — достаточно навести телефон на QR-код, перейти по ссылке и записать голосовое с просьбой исправить ситуацию. Диктум переведёт аудио в текст и отправит сообщение сотруднику в телеграме. Администратор прочитает и решит вопрос. Все счастливы.

Сейчас глэмпинг тестирует Диктум, и по его просьбе интерфейс приложения доработали — добавили к записям статусы: «Новая заявка», «Прослушано/в процессе выполнения», «Выполнено». Статусы помогают понять, какие запросы клиентов решены, а какие нет.

Глэпминг тестирует Диктум
Глэпминг тестирует Диктум

Думаю, мне бы очень понравилось, если бы в отелях быстро исполнялись мои пожелания и при этом не нужно было бы ни с кем говорить и никому звонить. Я не интроверт, просто не люблю вот это всё: здравствуйте, в туалете бумага закончилась, положите, пожалуйста, ещё 8 рулонов.

Голосовой блокнот, из которого не хочется вылезать

Виталий поработал с психологом над своими убеждениями и всё-таки решил предложить Диктум в качестве голосового блокнота широкой публике.

Сначала планировали, что приложение для обычных пользователей будет выглядеть так же, как для отелей. Но оно оказалось неудобным. Чтобы сделать запись, требовалось выполнить кучу действий: зайти в приложение, ткнуть на нужный блокнот в списке, потом клацнуть на кнопку записи, дальше… В общем, на бегу использовать Диктум было тяжело.

Сервис доработали, оставив только два шага:

  1. зайти в приложение,

  2. нажать на микрофон. Всё.

Как только команда улучшила интерфейс, Виталий перестал вылезать из Диктума. Это ровно то, что ему было нужно. Теперь, чтобы запомнить важную мысль, неважно где — в транспорте, в пылу рабочих задач — он заходит в Диктум, включает запись, наговаривает, что хочет, закрывает приложение и дальше занимается делами. Сервис спас несколько прекрасных шуток и загадок, а также множество идей для развития проекта.

Виталий признался, что теперь ему гораздо легче рассказывать о Диктуме другим людям, ведь он на себе ощущает, как приложение классно работает. Могу сказать по себе, что его рассказы действительно цепляют.

Например, Виталий подсадил на Диктум всю семью. Он повесил QR-код со ссылкой на блокнот «Холодильник», как ни странно, на холодильник, и теперь им пользуются его жена и двое сыновей. Они наговаривают в приложение, что купить: яйца, огурцы, конфеты. Из этих записей собирается общий список покупок. Младший сын про сервис сказал, что удобно. Старший отреагировал «буэ, ну ладно», но парочку заявок оставил.

Как использовать приложение, если у тебя большая голодная семья
Как использовать приложение, если у тебя большая голодная семья

Юмор, запись аудио и кое-что ещё: особенности Диктума

Я уже не раз упоминала в статье, что голосовых блокнотов много. Сейчас будет капелька прагматики — давайте обсудим, чем Диктум отличается от похожих сервисов.

1. Записывает и сохраняет аудио.

Сервис от Гугла и Speechpad работают через интерфейс Web Speech API. Он не записывает голос, а распознает его на лету и сразу переводит в текст.

В Диктуме реализован другой подход. Приложение делает аудио, затем отправляет его на сервер. После этого запись распознаётся с помощью Linux-библиотеки Vosk. Это позволяет сохранить и аудио, и текст.

Однако сервис не работает в Mi-браузере для Xiaomi — тут проблема со стороны гаджета. Скорее всего, Диктум для Xiaomi будет реализован через интерфейс Web Speech API и сможет только распознавать текст.

2. Сделан с креативом и юмором.

То, что Виталий любит придумывать шутки, наложило отпечаток и на его детище. Например, электронный адрес техподдержки Диктума — sovsem@ofige.li.

Виталий предлагает тем, что считает, что разработчики совсем, собака, офигели, писать на этот адрес. Для тех, кто смущается, есть приличный емейл — vitaliy@skazhigolosom.ru.

3. Сервис создают открытые и увлечённые люди.

У Диктума есть группа во ВКонтакте, где честно рассказывают о работе над сервисом. Там не только про радужные успехи, много и про факапы. Одна из моих любимых историй — байка про UX и привычки людей, которые сильно повлияли на интерфейс Диктума.

4. Можно влиять на приложение.

Пользователи могут влиять на возможности сервиса. Команда Диктума старается оперативно реагировать на проблемы и часто внедряет фичи, которые просят клиенты. При условии, что фичи действительно полезные.

Несколько спасённых шуток
Несколько спасённых шуток

Вера в проект

Помните, давным-давно, в начале статьи я рассказывала, что загадала получить голосовой блокнот, и Диктум исполнил моё желание на 50%? Сначала приложение не работало на моём Самсунге. Пока статья готовилась к публикации, разработчики нашли способ это исправить, и теперь я могу наговаривать в Диктум планы на день, жуя вкусный завтрак. Так что запрос в космос выполнен на 100%.

Мне искренне хочется, чтобы сервис взлетел, а Виталий и его команда стали бохатыми и знаменитыми, как Стив Джобс или Павел Дуров. Я верю в проект, потому что вижу, что его делают увлечённые и интересные люди. А ещё мне нравится, что в Диктум привносят юмор и индивидуальность.

Вы тоже можете потестить сервис — это бесплатно в течение двух недель. Если зайдёт — классно. Нет — можно написать в техподдержку, что они там совсем, собака, офигели, и объяснить почему.

Эта статья — социальный эксперимент

Тут камера как бы отъезжает от этой истории, и в кадр попадаю я. Я — Андрей Пшеничнов, занимаюсь спецпроектами и партнёрствами в Слёрме. Эту статью написала моя коллега Лика. Мы вместе с ней слушали истории, которые нам рассказывал Виталий, протагонист.

Меня восхищает, когда люди из разных компаний на время убирают 4-ю стену, перестают взаимодействовать со сцены своих функций, из кабин шагающих меха-ботов, изображающих компании. Встречаются как люди, создают что-то вместе и получают фан. Я хочу научиться так тоже делать. 

Мы выбрали начать с таких вот историй. Пригласили читателей нашей рассылки и телеграмма рассказать про себя и свои проекты (вот текст приглашения). Завернули это как платную маркетинговую услугу: мы пишем историю, публикуем и показываем нашим читателям. Рассказываем только про проекты, которые нам самим нравятся, стоимость определяем после знакомства. За вот эту статью Виталий заплатил нам 1 ₽.

У меня есть внутреннее ощущение, что команда, которая получается от такого взаимодействия, создаёт что-то ценное. И я приглашаю тех, кому это откликается. Если вам интересно поработать с нами в такой команде, приходите рассказывать про себя. Пишите мне в телеграм, https://t.me/afoxinatree

Комментарии (6)


  1. Kriminalist
    25.07.2022 14:14

    Изобрели Google Keep, только за деньги?


    1. integralik
      25.07.2022 14:38
      +2

      Я посмотрел, Google Keep действительно научился сохранять аудио, еще пару лет назад этого не было :)

      Но все-таки здесь значительно больше возможностей. Сбор аудио с других людей, загрузка и распознавание длинных аудио, привязка к блокноту из Телеграма. А еще Google Keep записывает голос только из приложения, а я, например, гораздо чаще записываю с компа.


  1. fougasse
    25.07.2022 14:31
    +3

    Интересно, а если в каждом абзаце ещё чаще упоминать название — это поможет принести больше денег? А если во всех склонениях? И кому профита больше? Какая польза для местной аудитории?


    1. Tomasina
      26.07.2022 16:07

      Это как реклама по ТВ - чем чаще долбит, тем глубже запоминается, отчасти из-за формирования негатива.


  1. domix32
    26.07.2022 00:18
    +2

    Было бы неплохим стресс тестом записать эту же статью только голосом. Ну или другую статью.


    1. integralik
      26.07.2022 12:09
      +2

      Мы записали :) посмотреть можно вот тут: https://скажиголосом.рф/audio/demo/messages/

      В некоторых местах распозналось прямо хорошо, а в некоторых без прослушивания записей не обойтись. Но если человек дальше делает из этого аудио статью, он экономит примерно половину времени на обработку (а на часовое аудио это примерно полдня экономии).

      Собственно, эта статья тоже была написана с помощью нашего сервиса: был разговор примерно на час, и мы туда загнали аудиозапись :)