Тихий апокалипсис: я устал читать сгенерированные статьи / forpes.ru

Главная
Тихий апокалипсис: я устал читать сгенерированные статьи

Тихий апокалипсис: я устал читать сгенерированные статьи +169

30.09.2025 13:30

eternaladm 243 17000 Источник

Привет, Хабр! Накипело. В последние 3-4 месяца, при поиске интересных статей на Хабр, очень часто замечаю полностью скопированные, не отредактированные статьи, которые генерирует ИИ. Появился некий "новый класс контента", ценность которого равна нулю. Честно, терпел долго, ждал изменений, но с каждым месяцем подобного становится всё больше. Пиком стали подобные "блоги компаний", где выходят статьи с аналогичными паттернами...

В данной статье Вы не найдете ссылок, скриншотов с никами авторов или названиями компаний. Это осознанное решение. Я хочу говорить о системной проблеме, а не о частных случаях.

Вступление

Я не хочу сказать, что ИИ — это тотальное зло. Напрягает больше то, как его используют. Сам не безгрешен, периодически «ищу вдохновение» посредством различных запросов к языковой модели в стиле: "сгенерируй структуру для статьи на тему:" или "оцени статью, укажи на недочёты/дыры в теме". Делается это исключительно с целью избежать «замыленного глаза», сдвинуться с мертвой точки. Для меня это инструмент, а не готовое решение.

Но, суть проблемы как раз в том, что многие авторы поступают крайне странно и нелогично. Насколько я понимаю, их алгоритм выглядит примерно так:

Генерируется статья по наитипичнейшему промту: "сгенерируй статью на тему:"
Полное копирование без малейших правок
Генерация картинки в том же ИИ с последующей публикацией статьи

Этот контент абсолютно нечитаемый. Как можно получить удовольствие, зная на 100%, что текст полностью сгенерирован, не несёт никакой пользы, напрочь отсутствует минимальная экспертность со стороны автора. Фактически, любой человек, умеющий печатать на клавиатуре, может спокойно зайти на Хабр и получать высокие оценки.

Типичные паттерны сгенерированного текста

Думаю, стоит начать своё негодование с «азов», по каким критериям чаще всего распознаются подобные статьи.

1. Странная структура. Все языковые модели грешат одним и тем же. Используют конструкцию: "1. Жирный текст: Начинаем после двоеточия с большой буквы".

2. Длинные тире. Думаю, тут и комментарии излишне. Авторы крайне редко будут использовать данный символ, так как обычное "-" банально проще и быстрее.

3. Заголовки. Это особенно явный и забавный момент, который появился после обновления DeepSeek. Стиль примерно следующий: "Глава 1: Наша супер мега тема". Может возникнуть вопрос, что в этом плохого? Плохо, что подобные оглавления имеет статья на 5 минут...

В доказательство, подкрепляю свои слова (промт — описанное выше до заголовка):

Паттерны, сгенерированные LLM

Проведём небольшой эксперимент. Я задал ИИ промт «типичные паттерны сгенерированного текста», можете сравнить с рукописным:

Конечно. Вот основные черты, которые часто выдают текст, созданный нейросетью (в том числе и мной):

1. Шаблонная структура списков
Абзацы строятся по жёсткому шаблону: Жирный номер пункта, затем двоеточие и объяснение. Это создаёт эффект «армейского устава», а не живой речи. Настоящий автор чаще использует разные конструкции: может начать мысль с вопроса, вводного слова или просто с абзаца без нумерации.

2. Слишком правильная пунктуация
Речь в первую очередь о длинных тире (‑). В реальной переписке люди обычно ставят обычный дефис (‑), потому что это быстрее. Обилие идеально расставленных »‑» — признак того, что текст отформатировала программа, а не человек.

3. Громоздкие заголовки для простого контента
Нейросеть любит давать разделам излишне официальные и сложные названия. Например, для текста на три абзаца может сделать заголовок «Глава 1. Всесторонний анализ ключевых предпосылок». Живой автор в такой ситуации выбрал бы что‑то простое и конкретное.

4. Обилие вводных фраз и клише
Текст может быть пересылан штампами вроде:

«Важно отметить, что...»
«Стоит подчеркнуть следующий аспект...»
«Таким образом, мы можем наблюдать...» Эти фразы делают текст гладким, но немного безличным и «каучуковым».

5. Поверхностная глубина
Нейросеть хорошо систематизирует очевидные факты, но редко предлагает по‑настоящему неожиданные связи, личные примеры или острую критику. Мысли идут по накатанной колее, без риска и настоящей глубины.

6. Излишняя вежливость и нейтральность
Даже в текстах, где уместна эмоциональность или резкость, ИИ часто сохраняет ровный, вежливый и дипломатичный тон. Не хватает живых эмоций, сарказма или допустимой резкости.

По сути, главный признак — это ощущение «идеальной стерильности». Текст грамотный, структурированный, но в нём нет хаоса, случайностей и личных интонаций, которые есть в живом письме.

И это лишь малая часть признаков, по которым определяются подобные статьи.

Как ИИ хоронит смысл

Давайте будем называть вещи своими именами. ИИ в нынешнем состоянии — это не искусственный интеллект. Это ультра‑оптимизированный статистический анализатор. Функционала "думать" и "понимать" в нём не заложено. Фактически, он вычисляет, какое слово с наибольшей вероятностью должно стоять после предыдущего, основываясь на громаднейшей куче текстов, созданных людьми.

Вот именно поэтому подобные статьи обладают характерным набором качеств, которые мы, читатели, подсознательно считываем, как фальшь:

Иллюзия компетентности. Текст гладкий, как стекло. Никаких "шероховатостей" живого мышления: оговорок, уточнений, озарений. Это сухой монолит, "выточенный" под общий знаменатель. Грубо говоря — информационный "фастфуд": насыщает, но так ли это полезно?
Отсутствие отправной точки. У живого автора есть цель, идея, боль, ради чего и затевается текст. Всё сводится к одному. У ИИ цели нет. Есть лишь задача — заполнить пространство между заголовком и заключением наиболее релевантными паттернами.
Смерть контекста и иронии. ИИ не понимает контекста нашей профессии. Его текст гладок и стерилен.

Самое пугающее происходит дальше... Такой контент, словно сорняк, начинает диктовать свои правила игры. Он набирает просмотры (потому что этот молодец грамотно использует ключевые слова), с просмотрами его двигают алгоритмы. Живые авторы, видя всё это, сдаются. Зачем неделю копать глубже/писать крупную статью, если поверхностный пересказ документации или рандомный "ТОП 10 ЧЕГО‑ТО ТАМ" соберёт в 5 раз больше кармы (и, соответственно просмотров/комментариев).

Живой автор, вкладывающий душу и экспертизу, видит, как его глубокий разбор какой‑либо темы — уступает в просмотрах и карме блестящему, но абсолютно бесполезному и сгенерированному за 15 минут. Включается простая, но железная логика: "зачем пахать неделю, если можно за пол часа получить тот же (или больший) эффект".

На мой взгляд, это не просто вопрос лени. Это вопрос экономики внимания. Платформа, захламленная сгенерированным контентом, перестаёт быть источником уникального экспертного знания. Превращается в некий клон агрегатора новостей. Читатель‑эксперт уйдет, раздражаясь от подобного контента. На его место придёт пассивная аудитория, готовая лайкать и читать подобный "чистый фастфуд". Это замкнутый круг: дешевый контент вытесняет дорогой (речь больше о временных трудозатратах), а с приходом дешевого контента уходят и серьезные авторы.

Предательство редактуры

Это вызывает настоящее недоумение и некий негатив. Можно же взять за ОСНОВУ сырой вывод ИИ и превратить во что‑то путное. Но для этого нужна работа. Работа, которую никто не хочет делать.

Преобладает какая‑то культура «и так сойдет». Мы живём в эпоху кликбейта и скроллинга. Упала ли планка качества настолько, что любой грамматически правильный текст считается пригодным для публикации? Похоже, что да. Нет запроса на "глубину" — нет и усилий по её созданию.

Что мне больше всего непонятно — ситуация с корпоративными блогами на Хабр. Не буду строить из себя эксперта и утверждать, что знаю процесс изнутри. Это не так. Но неужели в подобных блогах нет никакого контроля качества? Почему под заветной строчкой «Блог компании...» висит полностью сгенерированная за 3 минуты статья? Вероятнее всего, дело в «отделе маркетинга», где стоит чёткая задача — 10 любых статей в месяц...

Заключение

Так что же мы имеем в сухом остатке? Ситуация, честно говоря, напоминает апокалипсис. Платформа, которая строилась на экспертизе и живом опыте, постепенно заполняется информационным шумом.

Причём касается это далеко не только Хабра. Очень много информационных площадок спокойно пропускают полностью сгенерированные статьи, посты в социальных сетях в целом никак не контролируются. Что я искренне не понимаю, так это лояльность читателей, которые не минусуют подобный контент, ведут серьезные обсуждения сгенерированного текста, из 100 комментариев — в лучшем случае 1 будет негодовать и указывать на генерацию.

Меня, как автора, убивает простая математика: статья на 5 минут, написанная языковой моделью за 2 минуты, собирает в два раза больше плюсов, чем блок моих статей про rsync, на который я потратил шесть вечеров. Как читателю, мне неприятно поглощать этот гладкий и безвкусный фастфуд — спросить у LLM я могу и сам.

А вы замечали эту проблему? Испытываете ли вы то же раздражение, или, может, я сгущаю краски? Буду рад услышать ваше мнение в комментариях...

P. S. В моей группе в Телеграмм разбираем практические кейсы: скрипты (Python/Bash/PowerShell), тонкости ОС и инструменты для эффективной работы.

Комментарии (243)

Kudriavyi
30.09.2025 13:40
#28901224
P.S. В моей группе в Телеграмм разбираем практические кейсы: скрипты (Python/Bash/PowerShell), тонкости ОС и инструменты для эффективной работы.

Это такой же всадник апокалипсиса, как и статьи от генератора копипасты. А я, даже, поверил
1. novoselov
  30.09.2025 13:40
  #28901918
  Это как раз решается очень просто, прописать в правилах что ссылки на сторонние ресурсы автора запрещены (кроме корпоратов). Первое нарушение - софтбан, второе - перевод в read-only. Хабр от этого только выиграет, меньше времени на чужие ресурсы, больше удержание аудитории.
  
  С AI-высерами сложнее, они только распугивают аудиторию и убивают качество, а запрос на "человеческий" контент сейчас только растет. Можно попробовать проверять статью и при превышении 80% генерированного контента вешать плашку AI-контент, чтобы люди не тратили время, что автоматически уменьшит просмотры и рейтинг статьи. (главное таким образом не выйти на своих редакторов)
  1. serega_sw
    30.09.2025 13:40
    #28902028
    Хотя бы добавить галочку "статья сделана с использованием ИИ", "статья сгенерирована ИИ". Пользователю добавить функционал "Не смотреть статьи с ИИ", "Не смотреть статьи с частичным ИИ"
    
    morijndael
    30.09.2025 13:40
    #28902552
    ....и как только появится возможность эти статьи фильтровать, галочку тут же перестанут ставить
    
    onets
    30.09.2025 13:40
    #28903204
    Надо не галочку, а процент и чтобы проставляться автоматически, типа «статья с вероятностью 72% сгенерирована llm” и фильтр добавить
    
    muxa_ru
    30.09.2025 13:40
    #28903428
    И кнопку "пожаловаться на ошибочное помечание вашего текста как созданного ИИ".
    
    alanin006
    30.09.2025 13:40
    #28904092
    Чем то напоминает Антиплагиат в ВУЗах. Имхо даже если статья и написана человеком анализатор ее будет на некий довольно большой процент считать генерированной ИИ.
    
    Calculater
    30.09.2025 13:40
    #28905408
    +
    
    Некоторые люди и сами пишут так, словно LLM постаралась. А теперь, на фоне активной переписки в нейро-чатах, соответствующие текстовые паттерны будут фиксироваться даже у тех, кто генерирует текст сам.
    
    Mishootk
    30.09.2025 13:40
    #28906842
    Норм. Начинающие поэты тоже через "любовь-кровь" проходили. Как бы все просто и по теме. И они отсеиваются. Точно так же и технописатели со временем осознают, что нужно не подражать тем кого читают (или у кого просмотров много), а излагать собственные мысли. Хотя, вопрос в цели. Если урвать из кормушки, пока сыплется - это одно, а делиться своим, помогать - это другое.
    
    Wesha
    30.09.2025 13:40
    #28906974
    Некоторые люди и сами пишут так, словно LLM постаралась.
    
    Это у них синдром SLM!
    
    AiR_WiZArD
    30.09.2025 13:40
    #28911742
    Хрень этот антиплагиат, диплом на 60% сгенеренный и оформленный chatgpt 96% оригинальности, у однокурсников так же, детект нейросети включен. Особенно учитывая, что сейчас с памятью сетки очень хорошо подстраиваются под твой стиль общения.
    
    Flokis_guy
    30.09.2025 13:40
    #28904612
    Мне кажется лучший момент это проверка модераторами, да, ошибка первого рода будет критичной, но все таки.
  1. Hlad
    30.09.2025 13:40
    #28904238
    Достаточно просто в список оснований для минусов поставить "статья сгенерирована ИИ". И для минусов в карму - тоже что-то типа "Выдаёт результат ИИ за свой". Это будет такой лёгкий намёк, что за ИИ-тексты стоит минусовать. Думаю, результат проявится сразу.