В разгар карантина мы с друзьями решили записать подкаст, для души, желательно бесплатно, и обязательно удаленно: они в Ростове, я в Лос-Анджелесе. Совсем бесплатно не вышло, но за полгода мы набрали солидный набор приемов и инструментов для максимально простого и дешевого старта, которыми спешу поделиться.

В теории, подкаст — это просто, проходишь 4 основных шага — профит.

  • Запись

  • Сведение

  • Хостинг

  • Постинг

На практике, на проработку каждого у нас ушли недели и даже месяцы, и я хочу поделиться готовыми рецептами по каждому пункту, а в следующем тем, как мы автоматизировали процесс, чтобы было не только дешево, но и ненапряжно. Все решения ниже подобраны так, чтобы можно было потом передумать и выбрать другое без лишней возни, то есть, как для себя!

Запись: микрофон

Микрофон — единственно заметное начальное вложение, которое нужно сделать с умом. Инструкций и обзоров на эту тему в сети валом, но вкратце они все сведутся примерно к следующему:

  1. Встроенный микрофон ноутбука или веб-камеры — сразу нет, они заточены на то, чтобы ловить звук от далекосидящих людей по всей комнате, и они его ловят, звучишь при этот как из ведра.

  2. Микрофон гарнитуры — ОК, только если не Bluetooth. В блютузу канал не влезает исходящий и входящий поток одновременно. Поэтому операционка переводит гарнитуру в моно-режим с пониженным качеством, как только замечает включение микрофона. Помните как ужасно звучит музыка, когда начинается звонок? Это оно! На проводе такой проблемы нет, а микрофон у рта уже дает хоть какое-то качество, чего не скажешь о встроенных микрофонах размещенных на чашечках. Так что, если в хозяйстве нашлась игровая гарнитура с выносным микрофоном, уже можно начать.

  3. Петличка — дешево и прилично. Можно купить и потом будет не жалко выкинуть, или подарить. Главное — крепить так, чтобы она не болталась и не терлась об одежду в процессе.

  4. Стационарный микрофон, динамический или конденсаторный — самый приятный, глубокий звук. Конденсаторный обычно чуть лучше, но и внешние шумы ловит на раз, придется заморочиться со звукоизоляцией помещения, динамический — чуть хуже но и проблем с шумами меньше. На начальном этапе без хорошей подготовки разница между ними почти не заметна. Зато возможность воткнуть наушники в сам микрофон для мониторинга своего голоса замена сразу и очень помогает не отворачиваться случайно в процессе. Мой выбор (в районе $100):

  • Динамический Audio-Technica ATR2100x 

    • + Цифровой и аналоговый выходы (если захочется расти). Разрешение 24 Bit /192kHz (если захочется писать качественный вокал). Нормальный USB-C. Можно использовать для караоке :)

    • - Бесполезные кнопки. Хлипкая недоподставка.

  • Конденсаторный Blue Yeti 

    • + У всех такой. Ручка уровня записи. Несколько режимов: кардиоид, стерео, круговой, "интервью" (если захочется записаться вдвоем-втроем в одной комнате).

    • - Только USB выход, и тот mini. Тяжелый. Кто-то решил, что расположить половину ручек сзади, а половину спереди — хорошая идея. Низкая недоподставка.

У обоих есть приличные китайские аналоги за 3-4к с аксессуарами, если $100 это много, к обоим нужно сразу купить поп-фильтр, чтобы не было неприятных хлопков, и оба кликают кнопкой mute так, что ее слышно за версту, так что лучше мьютить программно.

Себе я выбрал ATR2100x.

Запись: подготовка места

Пишемся мы не в студии (дешево, сердито же), поэтому нужна минимальная подготовка помещения, особенно с чувствительным стационарным микрофоном. Клики механической клавиатуры и мышки, приземление стакана на стол (а уже после пяти минут разговора хочется попить), убирание в сторону провода — все это будет слышно. Лучше сразу расставить все так, чтобы провода не мешались, стакан не стучал, кресло не каталось. Я пользуюсь тачпадом, и сижу на обычном кухонном стуле, и стараюсь держать руки перед собой. А еще закрываю окна и двери: соседскую собаку и мусоровоз тоже будет отлично слышно. Толстые шторы, ковры, жалюзи — большой плюс и для шумоизоляции и для гашения эха.

Запись: платформа

При записи онлайн обязательно надо писать дорожки локально, на каждой стороне, иначе хороший бесперебойный звук будет только у того, кто пишет. Можно созваниваться в Зуме параллельно писать каким-нибудь Audacity, но потом вручную придется подгонять время старта, а иногда и скорость записи (у нас в тестовой записи часы разошлись больше чем на секунду за 40 минут), это реально, но муторно. Мы искали сервис, который позволит созвониться прямо в нем, при этом сохранит раздельные исходные дорожки для сведения и стартанет их в один момент, чтобы не пришлось подгонять руками, и такой нашелся:

  • Zencastr 

    Автосгенерованный видеокаст в Zencastr
    Автосгенерованный видеокаст в Zencastr
    • + Web-based, не нужен клиент. Отличный бесплатный тариф, в которого хватит с запасом на первый год. Сам сохраняет в Google Drive. Умеет в видео. Умеет в базовый постпроцессинг. Отзывчивая поддержка.

    • - Нет API. Нет звуковых эффектов.

В Zencastr нужно сразу отключить встроенную функцию мониторинга и подавления эха. Мониторинг через сеть приходит с большой задержкой и только мешает, а подавление эха может превратить голос в кашу, когда и эха то не было.

Из прямых конкурентов стоит отметить Cleanfeed, но у них бесплатный тариф годится только для тестов. А из непрямых Podbean и Castbox — это уже хостинги, но они умеют прямо внутри делать прямы трансляции, и сохранять их сразу там как подкасты.

Сведение

Несколько дорожек нужно собрать вместе, выровнять по уровню (очень важно!), почистить от шумов (тоже важно), от хлопков и шипящих (по желанию), добавить заставку и фон. Предобработать голос и подавить шумы можно и в процессе: есть куча инструментов (Rogue AmoebaiZOTOPE, ...), но они или жрут CPU, заставляя шуметь вентилятора, что слышно на записи, или стоят денег, или и то и другое. А постобработка дает вполне приемлемы результат и ее можно сделать один раз на всех. Варианты, которые мы пробовали:

  • Ручное сведение и подгонка уровня с de-noise, de-esser фильтрами в Audacity и Garage Band

    • + Дешевле некуда.

    • - Долго. Неудобно (в Garage Band не смотря на его имидж юзер-френдли инструмента поразительно отвратильные инструменты для управления уровнем звука, Audacity страшен и медлителен).

  • Автосведение в Zencastr

    • + Проще некуда. Может собрать сразу с видео.

    • - Нельзя добавить интро, или фон (но можно собрать там и наложить фон в Audacity). Попросит немного денег после базового лимита.

  • Сборка в Auphonic

    • + Дешево (реально дешево). Много настроек. Умеет в субтитры с разделами. Дружелюбный и быстрый саппорт. Есть интеграции со сторонними сервисами. Есть API.

    • - Не умеет сам подрезать фоновую дорожку.

Я выбрали Auphonic (его же использует под капотом Zencastr), он отлично выравнивает всех ведущих по уровню, и потом подгоняет общий уровень до нужного значения, при этом давит шумы, и умеет полностью их глушить, если понимает, что в этом месте нет разговора. Дает выбрать разные форматы на выбор. Сам берет исходники из Google Drive и складывает обратно результат. А если подключить сторонний сервис распознавания голоса, то может и субтитры сгенерировать (мы ради интереса отправляет все в облако Google: русскую речь он понимает паршиво, но для поиска сгодится).

Если нужна фоновая музыка, то проблему с неумением повторять ее столько сколько идет разговор, можно решить подготовкой очень длинной фоновой дорожки и обрезкой итогового файла вручную, но обрезать нужно в чем-то, что сохранит субтитры, которые Auphonic так хорошо делает, и в формат, который понимает Apple Podcasts. То есть Audacity/Garage Band уже не подходят. Помог консольный ffmpeg. На самом деле он умеет и накладывать дорожки, и делать простые эффекты, так что я фон и заставку даже не отправляю в Auphonic для экономии времени, а собираю локально с помощью одной длинной команды ffmpeg.

Хостинг

Хороших и при этом бесплатных хоcтингов мало, и тут выбор простой:

  • Anchor.fm

    • + Реально бесплатный, даже их иконку можно убрать с аватарки. Сам отправит подкаст во все основные сервисы (например). Есть встроенный онлайн плеер. Умеет в редирект, если захочется переехать на другую платформу.

    • - Не умеет вещать вживую. Нет API. Не знает про Яндекс и ВК.

Можно конечно выкладывать вручную, но тогда придется самому ходить и регистрироваться на подкастинговых платформах (а Энкор скорее хостинг), а так нужно прикрутить только российские социалки. У ВК довольно странная процедура регистрации, но там тоже есть люди, которые слушают подкасты (внезапно), у Яндекса все предельно просто. А вот для доступа к подробной статистике (в Энкоре есть базовая) придется вручную сходить уже везде, и заявить свое авторство, но это тоже просто, и Энкор даже сам предложит инструкции.

Постинг

Когда новый эпизод готов, хочется поделиться им социалках. К сожалению, готовых инструментов для отправки RSS потока подкаста сразу в ВК, Facebook, Telegram или Twitter нет (или мы не нашли), так что приходится раз в неделю ходить нажимать на кнопку "Опубликовать". В ВК есть подкасты, которые прикручиваются к группе, но он не дает ссылки на оригинал, а выкачивает файл себе, конвертирует в mp3 (хорошо хоть починили кривой скрипт импорта) и создает неизменяемый пост, в который нельзя вставить свой текст и картинку.

Автоматизация

Очень хотелось, чтобы на всю подготовку эпизода, после того как он записан, не уходило больше получаса, и мы этого добились частичной автоматизацией, про которую я расскажу в отдельном посте. Вкратце — все файлы хранятся на Google Drive, с которым, нормально интегрируются Zencastr и Аuphonic. Данные об эпизоде мы заносим в Airtable, откуда их сам подхватывает Twitter. В Facebook и в ВК переносим вручную (там надо правильно вставить картинку), и это уже забирает Telegram-бот.

Типовые проблемы и решения

В процессе записи у нас постоянно возникали мелкие проблемы. Мы решали их по ходу дела, и добавляли в чеклист, который проверяем перед каждым эпизодом, как перед полетом:

  • Выключить уведомления на телефоне, часах, компьютере: звенеть будет всегда в самый неподходящий момент.

  • Выключить мессенджеры на компьютере: они не только отвлекают, но и могут начать сами регулировать громкость микрофона (как делал Skype).

  • Проверить выбранный микрофон в браузере, постучав по нему: вечная проблема веб-приложений, они могут потерять, или "забыть" системный мирофон, и начать писать с другого.

  • Проверить уровень звука: в промежутках между записями много чего может поменяться. Если исходный уровень будет слишком высоким, то сигнал будет обрезаться, и никакая обработка не спасет. Низкий уровень не так страшен, но ухудшает качество. Проверять можно с помощью программ вроде Decibel meter — +80-100dB (или -20–0dB на отрицательной шкале) при разговоре идеально.

Часть проблем решаются без чеклиста раз и навсегда:

  • Плавающая громкость на маке: Mac OS любит сама подстраивать громкость микрофона, и это не отключается. Решение — создаем Aggregate Audio Device направляем микрофон в него, туда система уже не лезет.

  • Эхо собеседника: получается от того, что микрофон ловит звук из наушников, фиксится или полностью закрытыми амбушюрами, или компактными затычками.

  • Перебивания невпопад: поначалу мы часто перебивали друг друга, или начинали говорить одновременно, причина — задержка сети, 200мс уже достаточно, чтобы кто-то начал говорить, не зная, что начал не один. Мы решили ее параллельным видео созвоном — глядя на собеседника, быстрее понимаешь, ждет он, или собирается что-то сказать. Сейчас Zencastr научился делать видео-звонки и при этом записывать только аудио, так что все можно делать прямо в нем.

Итог

Ради чего все затевалось? Мы делаем подкаст про науку и технику (еще один, да) как для себя. Мы любим хайтек новости, но не про обзоры гаджетов и не про выгорание тимлидов. А еще любим науку, с исследованиями и фактами, но без погружения в историю развития ядерных реакторов. И еще мы хотели, чтобы каждый эпизод умещался в дорогу на работу 20–40 минут. Перечисленные инструменты позволили нам записываться стабильно, не тратя много времени, и не думая о монетизации, потому, что она не нужна, когда нет затрат.

Что получилось, и как выглядит Anchor, можно посмотреть тут, как из описания эпизода автоматом собирается блог-пост (тоже на бесплатном хостинге), и как Google превращает русскую речь в субтитры видно здесь, исходники всех скриптов автоматизации и сайта лежат в GitHub, но об этом следующий раз

P.S. Если вам есть чем поделиться: своим опытом записи, мыслями по поводу самого подкаста, его оформления, или идеями по улучшению — буду только рад!