Я сейчас пребываю в перманентном шоке от происходящего. И дело все в нейронках, а точнее в NanoBanana, Suno и Kling. Да, нейронки уже сильно задолбали, про них говорят из каждого утюга. Сейчас AI должен быть в любом стартапе, иначе что же это за стартап-то такой? И я не ошибусь, думаю, если укажу, что и дня не пройдет , чтобы на Хабре не вышла статья про нейронку – как использовать, какая лучше пишет код, кто и как ее использует и т.д. Но речь дальше пойдет даже не о них и программировании, а нейронках для создания визуального контента и той скорости, с которой они меняются.

Мы за каких-то три-четыре года дошли от первых попыток через Midjourney сгенерировать что-то реалистичное на фото, до генерации неотличимого от настоящего видео. Да, всего каких-то три года, и все соцсети уже завалены роликами, сгенерированными полностью нейронками. И самое печальное, что теперь непонятно, вот эта говорящая голова настоящая, или это цифровой аватар. А голос настоящий, или нет? Или локация в кадре вообще существует в реальности? Да котикам уже страшно умиляться в нельзаграме, так как непонятно насколько они настоящие. С каждой новой нейронкой уплетание Уилл Смитом пасты выглядит все адекватней и уже больше похоже на рекламу макарон, чем на рекламу рехаба.
Приятного аппетита, У. Смит
Я уж молчу про музыку, очень много треков полностью генерируется через нейронки и попадает в чарты, рекомендации, вирусится в тех же соцсетях. Два года назад два парня выпустили нейро-рок-кавер на Asti в исполнении Хэтфилда из металики, была просто информационная бомба, и чтобы свести полноценный такой трек у них ушло немало времени.
Тот самый кавер
Миллионы просмотров / прослушиваний, журналисты брали интервью, к ним в сообщество пришло много людей в ожидании следующих ремиксов. А сейчас за пару минут и промтов (условно), тебе хоть полная частушка про приключения русалки, хоть Билли Айлиш поет «Прекрасное далеко» и это уже даже не удивляет. Невероятно быстрый прогресс, и с такой же невероятной скоростью это все просачивается в нашу повседневную жизнь. Да что уж там, появились первые нейро-инфоцыгане, которые продают курсы по тому, как создать аватара и как заработать миллионы. Да-да, у людей по 5-20к подписчиков, со всех роликов не наберется и миллион просмотров суммарно, но с радостью впарят курс / гайд / интенсив из информации, которая общедоступная в интернете. И лапши развесят на уши, какие они успешные, как им цифровой аватар приносит по несколько сотен тысяч рублей в месяц, а они тратят лишь 15 минут в день – вот такие вот гении со знаниями, недоступными простым смертным. Ну а что, лох не мамонт, как говорится.
До нейронок и так мало чего было настоящего, нельзяграм и тикитоки были завалены псевдо миллионерами, псевдо успешными людьми и псевдо счастливыми. Да, нужно было держать в уме, что увидел в интернете смело дели на 10 и не ошибешься, но все равно было место искренности – в проблемах, переживаниях, комплексах, в достижениях и т.д. А теперь и этому места останется еще меньше, если и останется вообще – пять минут в нейронке, и вот у тебя реалистичный бывший пожарный без руки, или девушка с ожогом в пол лица, или карлик, разговаривающий басом – все что угодно, насколько хватит фантазии, чтобы привлечь внимание, захватить его и монетизировать. И это уже ставится на поток, поэтому вопрос лишь времени, когда этого станет так много, что люди с их реальными, пусть и не такими "захватывающими" судьбами, но настоящими, просто уйдут на второй план. И по факту каждый релиз таких инструментов, как NanoBanana, Kling и т.д. – это как очередная станция, мимо которой мы проносимся на поезде на огромной скорости, и вернуться назад уже нельзя. И движемся мы все вместе до конечной станции, до матрицы. До какой-то среды, где либо вообще не будет грани между реальностью и вымыслом, либо оба будет очень тонкой, едва заметной. Поэтому хочется немного остановить этот локомотив, пока все это безумие не зашло слишком далеко.

И не удивлюсь, что найдется масса людей, готовых осознано эту грань не замечать, лишь бы получить свою порцию дофамина – побыть пять минут президентом, забить решающий гол в финале Лиге чемпионов, провести вечер с мисс мира: да все что угодно будет сгенерировано за пару минут, вы только подписку оформите. События, которые невозможны для 99,9% людей станут доступны – только попроси нейронку. Да, ненастоящие, но а кто не представлял себя у зеркала в чужой роли или образе? А тут и представлять не надо будет, вы все увидите, что захотите, и все будет в точности так, как именно вы захотите – как от такого устоять?
Но будет мне, я немного спойлерю события. Сейчас пока массовый гражданин умиляется сгенерированным котикам, сопереживает несуществующим людям с их вымышленными судьбами и гадает, с крыши на камчатке в сугроб прыгают по-настоящему или нет. Да, пока еще видны артефакты нейро-видео, пока мало просто написать промт и получить хороший результат, даже 10 секунд сделать сложно – нужно больше деталей, несколько попыток, нужны эффекты, чтобы прятать неестественность сгенерированного персонажа. Но это сейчас и пока, а два года назад вообще не получалось сгенерировать бегущего человека, как ты не проси, а сейчас уже можно указывать как он бежит, во что одет, как наезжает камера, как развиваются волосы, как расставлен свет и т.д – и вот вы имеете шот, который выглядит как полноценный рекламный ролик с бюджетом в пару миллионов. Мы еще далеки от этой, конечной станции, но поезд только набирает ход и тормозов у него нет. И во всем этом нейро хаосе меня одолевают два противоположных чувства.
С одной стороны, я ловлю испанский стыд со всего происходящего. С этой тонны фейковых роликов, с этих неестественных местами аватаров, с людей, которые не понимают ну столь очевидных генераций. Отдельно потешно выглядят блогеры, которые продают мастер классы по использованию нескольких промптов для работы в двух нейронках, скорее всего через хигсфилд. Ну и конечно, золотые горы и обещания успешного успеха, ведь у них получилось – поверь на слово. С другой стороны, у меня появляется какое-то дежавю, что я также реагировал и на биткоин, когда он только появился, мол кому он нужен, ну майнит кто-то его, ну и что дальше. И также реагировал на ролики, когда люди в тик-токе танцевали вирусные танцы или повторяли вирусные тренды, стримили игры или снимали пранки и челленджи. И такое же ровно чувство испытывал от рекомендаций скупать земли, или вкладывать в недвижимость, хотя ставки по ипотекам были 12% – и показал рост цен и текущие события, кто скупил и вложил, скорее выиграл, чем проиграл. И вот думаю, а не новый ли этот голубой океан? Пока одни потребляют такой контент, другие создают, осваивают новые модели, промты, техники и т.д.

И вот уже сейчас бизнес предпочитает в своих помещениях включать нейро-треки, так никому не надо платить отчисления и тебя никто не накажет за авторские права. Через лет 5-10 будут уже вечеринки с полностью сгенерированными аудио треками?
Уже сейчас много карточек на маркетплейсах сгенерировано нейронками, как само описание, так и визуальная часть – фото, видео. И, очевидно, кому-то за это заплатили. Иллюстрации в нейронках к статьям, книгам уже как будто всегда были с нами, а что впереди, через пару лет? При всем этом отторжении к нейро контенту, происходящее вызывает дичайший интерес у меня как у айтишника. А ведь можно это автоматизировать? У меня же есть и домашний сервер, есть n8n, Openrouter – что-то из этого можно состряпать. А можно через API на регулярной основе готовить промпты в одной модели, передавать в другую и постоянно публиковать новый контент как по расписанию? А что, если сделать не одного аватара, а, скажем, семь?

Или придумать концепцию нейро-сериала, продолжение которого определятся по самым популярным комментариям под последней частью? Скажем, возможно стоит в поезде переместиться поближе к машинисту, а не плестись в его конце?
И вот это вот все неимоверное пугает. Все и сразу. С какой легкостью можно сделать аватар, придумать историю, сгенерировать контент из ничего. И, скорее всего, это и выглядеть будет как будто настоящее. Авторам для этого не нужно ничего уметь, даже камера не нужна нормальная или хотя бы айфон, знать как свет расставлять в локации. Всего 20 $ в месяц за подписку и вот вы блогер в режиме 24/7. И есть те, кто будет за такой контент платить, и кто будет его потреблять. И все произошло это за считанные годы, буквально вот на наших глазах. А судя по увеличившемуся спросу на память и улетевшим в стратосферу ценам на нее, мы только-только набираем скорость.
Спасибо, что дочитали мою статью! У меня есть небольшой телеграм канал, буду рад подписке и неформальному общению.
Комментарии (16)

davidaxxon
11.02.2026 21:02И вот уже сейчас бизнес предпочитает в своих помещениях включать нейро-треки, так никому не надо платить отчисления и тебя никто не накажет за авторские права.
Вы ещё дождётесь, что РАО протолкнёт введение сбора за музыку и видео с SynthID "в целях поддержки живых авторов и исполнителей" :)

mmMike
11.02.2026 21:02И, скорее всего, это и выглядеть будет как будто настоящее.
Пока не выглядит. Лично мне, мелкие очень характерные огрехи просто режут глаз и слух на первом десятке секунд просмотра.
С ходу понятно где 100% нагенерено. Ну, по крайней мере в том шлаке, что заполнил ютуб и прочее.Хотя, судя по количеству комментов под такими роликами (включая виртуальных блогеров), народ часто не видит и даже пытается комментировать, эмоционировать и задавать вопросы "калькулятору".
постоянно публиковать новый контент как по расписанию?
Да уже не нова идея. каждые 2/3 шотов на ютубе - это где то ворованный видео контекст, который нейронка озвучивает мерзким (что вижу на ролике то и говорю) голосом с характерными ошибками (в ударениях на словах, спел числительных и прочее).
так что давно рубят бабло массово на этом. Поставлено на поток
warzes
11.02.2026 21:02ну может оказаться что эти огрехи такими не являются и перед вами таки не нейронка.
Я как-то смотрел социальные ролики германии про беженцев (не знаю зачем). весь ролик была мысль что все нагенерировано... а потом глянул дату, когда выложили - 2012 год. угу. А ведь там весь комплект "огрехов" был. Но таки оказалось что живые актеры. Размылась уже грань между плохой дешевой съемкой или хорошей иишкой
mmMike
11.02.2026 21:02Ошибки в произношении и знакомый голос из стандартных вариантов "голос для озвучки" (русский - не основной язык для обучения сеток и ошибки не избежны)
Мелкие артифакты на видео (грубо говоря ручки/пальцы из задницы и т.п.). Повторы объектов и пр.
Просто потому, что для быстроты выбрали не много вариантов и особо их не просматривали. Тяп ляп и так сойдет.
Физика падений, пыли, волн.. как будто на другой планете с другим значением G.
Узнаваемые модели людей и объектов. Ибо свою сетку добучить даже не всю, а lora - это не дешево и по времени и ресурсам.Я понимаю, что тщательно сделанный ролик будет гораздо сложнее отличить.
Но большей частью, именно тяп-ляп. Потому что дешевле.Тут картинку генеришь (ComfyUI) и выбираешь результат более чем из сотни вариантов. А что бы добучить - нужно куча фоток. Их подготовка и т.п. и т.д.
А уж ролики генерить, что бы без огрехов получилось - дольше на порядок все это.Так что весь шлак на ютубе узнаешь практически сразу.

Vasjen Автор
11.02.2026 21:02Пока не выглядит.
Ключевое слово здесь – пока. Просто вспомните что генерировали нейронки 2-3 года назад, и что сейчас. С каждым новом релизом какой-то нейронки будет получаться все естественнее и естественнее.

woodiron
11.02.2026 21:02Эволюционное развитие Фотошопа и других программ изменения контента. Та же подчистка двойки в школьном дневнике - тоже изменение реальности. Или нанесение макияжа, например. То есть всё было, есть и будет, но на новом уровне.

Vasjen Автор
11.02.2026 21:02Все так. Из статьи исключил мысль о том, что мы, люди, зачастую сами тянемся к ненастоящему – ретушь на фото, пластические операции, переживаем драмам в кино, смотрим по ТВ ток-шоу. Вот получаем новый инструмент.
ia_alpatov
Ну пока трава осталась, её можно потрогать, только, предполагаю, рано или поздно это станет тоже прерогативой очень богатых людей.