Сервис перевода Youtube в текст YouScriptor

Честно сказать, меня весьма сокрушает то, что контент в интернете перешел из текста в видео. Читаю я довольно быстро и мне куда проще и быстрее окинуть страницу взглядом, чем пролистивыать видео на несколько десятков минут, пытаясь поскорее найти суть. Подозреваю, что сам видео-формат и продвигается как пожиратель времени.

В Яндексе уже достаточно давно появилась функция пересказ YouTubе - но это именно пересказ и отсебятина, мне это не подходит. Нужен точный текст.

Сейчас очень модно ругать возможности ИИ и рассказывать то что ИИ «заменит программистов» — миф и выдают ЛЛМ «говнокод». Может там временами и говнокод, но иногда для задачи хороший код и не нужен. Нужно просто что бы работало и устраивало пользователей.

Свой проект я создал буквально за выходные и без LLM он точно был бы невозможен. Так как потребовал минимум месяц времени, а у меня столько нет. GPT o1 подсказал все необходимые фреймворки, написал необходимый код и алгоритмы. Предложил структуру БД, написал весь маппинг. Написал бэкграунд сервисы, в которых организует очередь задач на распознавание. Так же создал фронт-энд на Angular. По сути в код я практически не лез - с меня только дизайн и архитектура.

Вишенка на торте - нейминг и лого тоже были созданы LLM. Когда я рассказал другу об идее - он сказал - круто бы в наше время была такая программа - что бы писала за нас конспекты. Я спросил у GPT как можно назвать сервис, который работает с конспектами и транскрибирует ролики с ютуба - референсы - писарь, переписчик, конспекты, ютуб - и он выдал в том числе YouScriptor (scriptor на латыни - писарь). С логотипом тоже долго не возился - просто со второй или третье попытки взял картинку в задании к которой было "minimalistic vectorized web service logo of scriptor"

Безусловно подобные сервисы в интернете есть, но везде нужна оплата, регистрация, нужно прокликать рекламу и не закрывать страницу. YouScriptor.com позволяет без оплаты и регистраций просто кинуть ссылку на распознавание, закрыть страницу и спокойно заниматься своими делами, потом через время просто кинув ссылку заново и получив транскрипцию. Все видео на распознавание будут видны в общей очереди.

Так же важно что используется разметка Markup, в том числе и математические формулы

К примеру вот что выдал для видео о химии https://youscriptor.com/recognized/t1cG8D2mXmE

вот пример видео о квадратных уравнениях https://youscriptor.com/recognized/xJR8oL7UtQY

Комментарии (7)


  1. arkady
    30.01.2025 07:57

    Попробовал, выдало: Error: Ошибка на этапе Error: Нет субтитров для сегментации или ошибка десериализации.

    Проблема сервиса в том, что нет никакой информации чтобы понять какие видео он сможет, а какие нет. Может вместо пустоты дать хотя бы минимальную справку?


    1. xnxn Автор
      30.01.2025 07:57

      Может те видео, где автор не закрыл субтитры. Есть версия кода, который скачивает аудио и распознает самостоятельно, но я пока не выкладывал это в публичный доступ, так как не представляю как сервер будет вести себя под нагрузкой


  1. arkady
    30.01.2025 07:57

    Ну так может об этом сообщить на странице сервиса? На каких языках это работает? Если для получения текста нужны субтитры, может тогда не надо писать про "видео на распознавание" в статье, а говорить как есть: сбор субтитров в текстовый формат.


    1. xnxn Автор
      30.01.2025 07:57

      Я думаю тогда пользователям будет не понятно чем занимается сервис. Людям нужен результат - перевести видео в текст, а что там под капотом не важно и нет смыла расписывать.


    1. xnxn Автор
      30.01.2025 07:57

      Тем более что у 95% видео субтитры включены, не думаю что это критично. Технически собрать субтитры в текстовый формат задача намного сложнее чем просто сделать субтитры из аудио. Субтитры еще лет 5 назад ютуб мог делать. А "собрать субтитры в текстовый формат" нейросети научились только год назад. Просто через сервер гонять аудиопотоки даст большую нагрузку, что бы давать такую возможность всем подряд.


  1. xnxn Автор
    30.01.2025 07:57

    Видно что благодаря посту пошел поток запросов на распознавание. Всплыли некоторые ошибки, которые приходится исправлять в реальном времени. Был английский текст, в котором неправильно распознавался знак $, так же обнаружились (и были исправлены) ошибки, которые неправильно определяли язык субтитров и распознавание не проходило


  1. xnxn Автор
    30.01.2025 07:57

    ответ на удаленный комментарий