Телеграмм-каналы и даже крупные СМИ опубликовали новость о созданном нейросетями выпуске прогноза погоды из Ставрополья. Вот он:

Из пресс‑релиза телеканала «СвоёТВ»:

Метеорологическую сводку озвучит виртуальная ведущая Снежана Туманова.

В эфире телеканала «СвоёТВ. Ставропольский край» стартовал проект «Прогноз будущего». Это уникальный телевизионный продукт, при подготовке которого использовались сразу несколько нейросетей: одна отвечает за виртуального ведущего, другая – за подготовку текста, третья – за генерацию графического сопровождения.

Мы с ребятами из студии давно работаем с графикой, с ТВ в целом и с прогнозами погоды в частности. И мы очень удивлены хайпу вокруг этой новости — огромный респект команде маркетологов канала, которые поймали волну и так удачно написали пресс-релиз.

Но вот только с точки зрения исполнения проект выглядит неудачным и демонстрирует
не в лучшем виде использование технологий.

Снежана Туманова — от такого креатива хочется плакать.

Забудем про имя, давайте лучше про нейросети. Их три.

Первая нейросеть. Она генерирует образ девушки и ее голос. «СвоёТВ» нигде не указывает, что воспользовался сервисом для виртуальных ведущих Movio (аналогичный от Сбера Visper). У него есть API и сайт с интерфейсом для генерации голоса и видео.
Судя по репостам СМИ, никто не уточнял, что эта нейросеть не создавалась телеканалом, а ребята из «СвоёТВ» просто использовали удобный сайт для генерации ведущего.

Обывателей такая новость вводит в заблуждение, что создание нейросети, которая рисует реалистичную девушку, выглядит подъемной задачей даже для регионального СМИ. Да, в основе генерации картинки с ведущим именно нейросеть, но рассказывать про это с такой подачей неуместно. Это всё равно если бы вы, пользуясь навигатором или покупая товары на маркетплейсе, писали на каждом углу, что для поездок в офис и заказа техники используете нейросети.

Что касается генерации голоса — он звучит искусственно, так как используется стандартный инструментарий TextToSpeech от сервиса Movio, который (наверное, потому что зарубежный), не делал при разработке акцент на проработку русской речи. Но у сервиса есть возможность генерации персонажа на основе звуковой дорожки, которую можно синтезировать — например, в лучшем качестве SpeechKit'ом от Яндекса. Предположу, коллеги с телеканала СвоёТВ решили, что четвертая нейросеть это уже чересчур.

Вторая нейросеть, которая готовит текст. Тут сложно сказать, используется ли chatGPT или что то подобное. Но опять же, маловероятно, что своя обученная модель. Варианта два: использовалась нейросеть для формирования целиком прогноза, но с функцией «шутки про человеков», или сетке дали структурные данные погоды и попросили на их основе сделать связный рассказ.

Третья нейросеть. Наша любимая. Она генерирует графическое сопровождение. Что имеется в виду, тут не совсем ясно. Заставка у программы симпатичная, но в основе ручная работа, такое в чистом виде сети не умеют делать. Фон за ведущей — футаж облаков, тоже ручное решение, да еще и в лоб. Расстановка значений по плейсхолдерам
в графике с температурой и осадками? Для такого нейросети не нужны, а если и использовались, то желательно их было обучить следить за версткой.

,
,

Наши выводы:

  1. Не надо поддаваться хайповым восторгам по поводу всех новостей о нейросетях.

  2. Не надо поддаваться панике, делать поспешных выводов и решений.

  3. Хотя использование нейросетей давно используется в творческих и технических задачах на телепроектах, «СвоёТВ» в нужный момент объединил готовые сервисы
    и грамотно преподнес это СМИ. Молодцы!

Хочется закончить известной цитатой мультимиллионера начала ХХ века
Джона Моргана:

«Когда чистильщик обуви начинает интересоваться акциями, надо срочно уходить с рынка».

Но до этого поворотного момента еще есть время. Да и не совсем понятно, что здесь можно потерять, в отличии от волны хайпа криптоволют.

Напишите в комментариях ваше мнение о шумихе вокруг нейросетей для генерации контента. Или поделитесь мыслями, к чему это все нас приведет?

Комментарии (3)


  1. artemev
    00.00.0000 00:00
    +9

    Голос да, подкачал. ИМХО, в остальном все отлично, включая креатив с именем. Если честно вообще не понятны претензии по поводу чужих технологий. А что в этом такого? Они и создаются, чтобы ими пользовались.


  1. Firsy
    00.00.0000 00:00
    +1

    Подобная нейросеть у мэйлру года два назад была помню. Можно было ведущей текст набрать и выбрать ведущую.


  1. nwanomaly
    00.00.0000 00:00

    В детстве читал у Гаррисона (вроде "К звёздам"?) похожее. Только там граждане-богатеи могли для ведущих тв выбирать все параметры, включая пол, одетость и прочее.