Привет, Хабр! Накипело. В последние 3-4 месяца, при поиске интересных статей на Хабр, очень часто замечаю полностью скопированные, не отредактированные статьи, которые генерирует ИИ. Появился некий "новый класс контента", ценность которого равна нулю. Честно, терпел долго, ждал изменений, но с каждым месяцем подобного становится всё больше. Пиком стали подобные "блоги компаний", где выходят статьи с аналогичными паттернами...
В данной статье Вы не найдете ссылок, скриншотов с никами авторов или названиями компаний. Это осознанное решение. Я хочу говорить о системной проблеме, а не о частных случаях.
Вступление
Я не хочу сказать, что ИИ - это тотальное зло. Напрягает больше то, как его используют. Сам не безгрешен, периодически "ищу вдохновение" посредством различных запросов к языковой модели в стиле: "сгенерируй структуру для статьи на тему:" или "оцени статью, укажи на недочёты/дыры в теме". Делается это исключительно с целью избежать "замыленного глаза", сдвинуться с мертвой точки. Для меня это инструмент, а не готовое решение.
Но, суть проблемы как раз в том, что многие авторы поступают крайне странно и нелогично. Насколько я понимаю, их алгоритм выглядит примерно так:
Генерируется статья по наитипичнейшему промту: "сгенерируй статью на тему:"
Полное копирование без малейших правок
Генерация картинки в том же ИИ с последующей публикацией статьи
Этот контент абсолютно нечитаемый. Как можно получить удовольствие, зная на 100%, что текст полностью сгенерирован, не несёт никакой пользы, напрочь отсутствует минимальная экспертность со стороны автора. Фактически, любой человек, умеющий печатать на клавиатуре, может спокойно зайти на Хабр и получать высокие оценки.
Типичные паттерны сгенерированного текста
Думаю, стоит начать своё негодование с "азов", по каким критериям чаще всего распознаются подобные статьи.
1. Странная структура. Все языковые модели грешат одним и тем же. Используют конструкцию: "1. Жирный текст: Начинаем после двоеточия с большой буквы".
2. Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное "-" банально проще и быстрее.
3. Заголовки. Это особенно явный и забавный момент, который появился после обновления DeepSeek. Стиль примерно следующий: "Глава 1: Наша супер мега тема". Может возникнуть вопрос, что в этом плохого? Плохо, что подобные оглавления имеет статья на 5 минут...
В доказательство, подкрепляю свои слова (промт - описанное выше до заголовка):

Паттерны, сгенерированные LLM
Проведём небольшой эксперимент. Я задал ИИ промт "типичные паттерны сгенерированного текста", можете сравнить с рукописным:
Конечно. Вот основные черты, которые часто выдают текст, созданный нейросетью (в том числе и мной):
1. Шаблонная структура списков
Абзацы строятся по жёсткому шаблону: Жирный номер пункта, затем двоеточие и объяснение. Это создаёт эффект "армейского устава", а не живой речи. Настоящий автор чаще использует разные конструкции: может начать мысль с вопроса, вводного слова или просто с абзаца без нумерации.
2. Слишком правильная пунктуация
Речь в первую очередь о длинных тире (—). В реальной переписке люди обычно ставят обычный дефис (-), потому что это быстрее. Обилие идеально расставленных «—» — признак того, что текст отформатировала программа, а не человек.
3. Громоздкие заголовки для простого контента
Нейросеть любит давать разделам излишне официальные и сложные названия. Например, для текста на три абзаца может сделать заголовок "Глава 1. Всесторонний анализ ключевых предпосылок". Живой автор в такой ситуации выбрал бы что-то простое и конкретное.
4. Обилие вводных фраз и клише
Текст может быть пересылан штампами вроде:
"Важно отметить, что..."
"Стоит подчеркнуть следующий аспект..."
"Таким образом, мы можем наблюдать..." Эти фразы делают текст гладким, но немного безличным и "каучуковым".
5. Поверхностная глубина
Нейросеть хорошо систематизирует очевидные факты, но редко предлагает по-настоящему неожиданные связи, личные примеры или острую критику. Мысли идут по накатанной колее, без риска и настоящей глубины.
6. Излишняя вежливость и нейтральность
Даже в текстах, где уместна эмоциональность или резкость, ИИ часто сохраняет ровный, вежливый и дипломатичный тон. Не хватает живых эмоций, сарказма или допустимой резкости.
По сути, главный признак — это ощущение "идеальной стерильности". Текст грамотный, структурированный, но в нём нет хаоса, случайностей и личных интонаций, которые есть в живом письме.
И это лишь малая часть признаков, по которым определяются подобные статьи.
Как ИИ хоронит смысл
Давайте будем называть вещи своими именами. ИИ в нынешнем состоянии - это не искусственный интеллект. Это ультра-оптимизированный статистический анализатор. Функционала "думать" и "понимать" в нём не заложено. Фактически, он вычисляет, какое слово с наибольшей вероятностью должно стоять после предыдущего, основываясь на громаднейшей куче текстов, созданных людьми.
Вот именно поэтому подобные статьи обладают характерным набором качеств, которые мы, читатели, подсознательно считываем, как фальшь:
Иллюзия компетентности. Текст гладкий, как стекло. Никаких "шероховатостей" живого мышления: оговорок, уточнений, озарений. Это сухой монолит, "выточенный" под общий знаменатель. Грубо говоря - информационный фастфуд: насыщает, но так ли это полезно?
Отсутствие отправной точки. У живого автора есть цель, идея, боль, ради чего и затевается текст. Всё сводится к одному. У ИИ цели нет. Есть лишь задача - заполнить пространство между заголовком и заключением наиболее релевантными паттернами.
Смерть контекста и иронии. ИИ не понимает контекста нашей профессии. Его текст гладок и стерилен.
Самое пугающее происходит дальше... Такой контент, словно сорняк, начинает диктовать свои правила игры. Он набирает просмотры (потому что этот молодец грамотно использует ключевые слова), с просмотрами его двигают алгоритмы. Живые авторы, видя всё это, сдаются. Зачем неделю копать глубже/писать крупную статью, если поверхностный пересказ документации или рандомный "ТОП 10 ЧЕГО-ТО ТАМ" соберёт в 5 раз больше кармы (и, соответственно просмотров/комментариев).
Живой автор, вкладывающий душу и экспертизу, видит, как его глубокий разбор какой-либо темы - уступает в просмотрах и карме блестящему, но абсолютно бесполезному и сгенерированному за 15 минут. Включается простая, но железная логика: "зачем пахать неделю, если можно за пол часа получить тот же (или больший) эффект."
На мой взгляд, это не просто вопрос лени. Это вопрос экономики внимания. Платформа, захламленная сгенерированным контентом, перестаёт быть источником уникального экспертного знания. Превращается в некий клон агрегатора новостей. Читатель-эксперт уйдет, раздражаясь от подобного контента. На его место придёт пассивная аудитория, готовая лайкать и читать подобный "гладкий фастфуд". Это замкнутый круг: дешевый контент вытесняет дорогой (речь больше о временных трудозатратах), а с приходом дешевого контента уходят и серьезные авторы.
Предательство редактуры
Это вызывает настоящее недоумение и некий негатив. Можно же взять за ОСНОВУ сырой вывод ИИ и превратить во что-то путное. Но для этого нужна работа. Работа, которую никто не хочет делать.
Преобладает какая-то культура "и так сойдет". Мы живём в эпоху кликбейта и скроллинга. Упала ли планка качества настолько, что любой грамматически правильный текст считается пригодным для публикации? Похоже, что да. Нет запроса на "глубину" - нет и усилий по её созданию.
Что мне больше всего непонятно - ситуация с корпоративными блогами на Хабр. Не буду строить из себя эксперта и утверждать, что знаю процесс изнутри. Это не так. Но неужели в подобных блогах нет никакого контроля качества? Почему под заветной строчкой "Блог компании..." висит полностью сгенерированная за 3 минуты статья? Вероятнее всего, дело в "отделе маркетинга", где стоит чёткая задача - 10 любых статей в месяц...
Заключение
Так что же мы имеем в сухом остатке? Ситуация, честно говоря, напоминает апокалипсис. Платформа, которая строилась на экспертизе и живом опыте, постепенно заполняется информационным шумом.
Причём касается это далеко не только Хабра. Очень много информационных площадок спокойно пропускают полностью сгенерированные статьи, посты в социальных сетях в целом никак не контролируются. Что я искренне не понимаю, так это лояльность читателей, которые не минусуют подобный контент, ведут серьезные обсуждения сгенерированного текста, из 100 комментариев - в лучшем случае 1 будет негодовать и указывать на генерацию.
Меня, как автора, убивает простая математика: статья на 5 минут, написанная языковой моделью за 2 минуты, собирает в два раза больше плюсов, чем блок моих статей про rsync
, на который я потратил шесть вечеров. Как читателю, мне неприятно поглощать этот гладкий и безвкусный фастфуд - спросить у LLM я могу и сам.
А вы замечали эту проблему? Испытываете ли вы то же раздражение, или, может, я сгущаю краски? Буду рад услышать ваше мнение в комментариях...
P.S. В моей группе в Телеграмм разбираем практические кейсы: скрипты (Python/Bash/PowerShell), тонкости ОС и инструменты для эффективной работы.
Комментарии (14)
PereslavlFoto
30.09.2025 13:40Появился некий "новый класс контента", ценность которого равна нулю.
Потому что вы не хотите платить за контент.
Но для этого нужна работа.
Потому что вы не хотите платить за работу.
неужели в подобных блогах нет никакого контроля качества?
Качество — это число переходов по ссылке.
janvarev
30.09.2025 13:40Лайк.
Сам подписан платно на некоторых авторов, очень доволен.
Хабр пока относительно держится за счет комьюнити, которое минусует хотя бы полный неадекват, но приближение к vc и пикабу заметно, да.
ash_lm
30.09.2025 13:40Вы не поверите, какой результат я получил на промт: "Сгенерируй статью на тему "я устал читать сгенерированные статьи"". Концовка 5 баллов:
Заключение
Я устал читать сгенерированные статьи — не потому, что они плохие. А потому, что они слишком хорошие.
Architect_01
30.09.2025 13:40Давайте пойдем от противного. Не все умеют складно излагать свои мысли - тем более - формулировать их. Про орфографию и прочее - уже молчу - сам грешу этим. Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть? ИИ в этом случае - хороший помощник. Но в одном с вами соглашусь - если видно, что выкладывается просто генерация - она глаз режет. Чтобы ИИ сгенерировал хороший текст - тут тоже стоит попотеть. Получается - палка о двух концах - либо корявый, невнятный текст с ошибками - зато свой - либо явная генерация... Что лучше?
myswordishatred
30.09.2025 13:40Но есть люди, которые хотят донести свои мысли или идеи, но не умеют излагать - и как прикажете им быть?
Потратить больше времени на написание?
Вообще, письменная речь это тоже навык, который можно развивать. Орфографические ошибки текстовый редактор вам подсветит и предложит, как исправить. Стилистические, конечно, в этом смысле сложнее. Вот тут как раз можно к б-гмерзкой ЛЛМ прийти и попросить стилистической редактуры. Но, конечно, лучше книжки читать.
Что лучше?
Оба хуже.
michael_v89
30.09.2025 13:40В данной статье Вы не найдете ссылок, скриншотов с никами авторов или названиями компаний.
Я хочу говорить о системной проблеме, а не о частных случаях.Отлично, давайте поговорим. В общем случае, статистически, есть большая вероятность, что большинство статей, которые вам кажутся сгенерированными, на самом деле авторы писали са��и, вы видите то, что хотите видеть, и никакой проблемы нет. Что дальше?
svm
30.09.2025 13:40Что я искренне не понимаю, так это лояльность читателей, которые не минусуют подобный контент, ведут серьезные обсуждения сгенерированного текста, из 100 комментариев - в лучшем случае 1 будет негодовать и указывать на генерацию.
То же самое касается видероликов. Посмотрите как их потребляют. Куча лайков, куча комментов и только пару человек напишут, что это ИИ. Раньше больше об этом писали. Либо перестали замечать, либо забили об этом писать.
И это касается видео, где, помимо содержания, можно оценить ещё по голосу и соответствию видеоряда. Люди уже ИИ видео потребяют не замечая, а текст куда сложнее оценить, что это ИИ (тем более для неподготовленного).
Так что да, это апокалипсис. На ютубе в рекомендации постоянно попадают ИИ ролики, приходится нажимать Не рекомендовать канал для каждого такого и вроде как помогает, но они всё равно пролазят.Тем не менее, ценный авторский контент непременно будет замечен, особенно кому это нужно. Ваши статьи про rsync я прочитал с удовольствием и оценил по достоинству. По-моему, нигде в интернете так подробно о нём не написано.
Надеюсь, когда-нибудь с ИИ контентом начнется борьба более серьезная, чем есть сейчас.
Крупным сервисам уже пора бы внедрить какую-нибудь кнопку жалобы на генерированный контент.
Kamil_GR
30.09.2025 13:40А я вижу паттерны ИИ в вашем тексте. Например вовлекающий крючок (как его рекомендует ИИ) вопрос в заключении.
Метафоры типично иишные. И так далее...
Возможно текст хорошо отредактирован, но не более.
(Это я к тому, что отличить всё сложнее)
pda0
30.09.2025 13:40Насчёт длинных тире - а вы не думаете, что некоторые могут набирать большой текст в Ворде или либрерайтере, программах, которые умеют заменять минус на тире?
erogov
30.09.2025 13:40Больше скажу: неравнодушные к типографике не ленятся и — написать.
Diacut
30.09.2025 13:40Сколько себя помню, всегда длинные тире писал. Alt-0151 — уже на автомате. Соберусь писать статью на хабр, придётся менять на минусы перед публикацией. А то ж обвинят во всяком непотребстве...
Kudriavyi
Это такой же всадник апокалипсиса, как и статьи от генератора копипасты. А я, даже, поверил
novoselov
Это как раз решается очень просто, прописать в правилах что ссылки на сторонние ресурсы автора запрещены (кроме корпоратов). Первое нарушение - софтбан, второе - перевод в read-only. Хабр от этого только выиграет, меньше времени на чужие ресурсы, больше удержание аудитории.
С AI-высерами сложнее, они только распугивают аудиторию и убивают качество, а запрос на "человеческий" контент сейчас только растет. Можно попробовать проверять статью и при превышении 80% генерированного контента вешать плашку AI-контент, чтобы люди не тратили время, что автоматически уменьшит просмотры и рейтинг статьи. (главное таким образом не выйти на своих редакторов)
serega_sw
Хотя бы добавить галочку "статья сделана с использованием ИИ", "статья сгенерирована ИИ". Пользователю добавить функционал "Не смотреть статьи с ИИ", "Не смотреть статьи с частичным ИИ"