Здравствуйте. Позвольте отрекомендоваться: поруч... эээ, vvzvlad. И я ненавижу эйай-слоп.
У меня были некоторые обсуждения этой темы с авторами и главредами блогов на уровне "а ты кто такой вообще мальчик, мы за своих авторов ручаемся", и чтобы не возникало вопросов на эту тему (хоть мне немного и неудобно писать регалии прям так, прямым текстом, очень редко это делаю):
У меня примерно 15 лет опыта в копирайтинге, только на хабре порядка 200 статей (около 50 в черновиках, потому что там совсем старые обзоры с умершими картинками и мне за них стыдно), и еще примерно те же 50 — в блогах других компаний без моего имени. На других ресурсах тоже немало, некоторое время я жил исключительно на заработке даже не с копирайтинга, а именно с написания статей со смыслом. Я курировал несколько обучающих курсов.
За эти 15 лет я повидал хороших писателей, и плохих писателей, и ужасных писателей, и копирайтеров с фрилансру (они на отдельном этаже в этой пирамиде, как в анекдоте "вовочка."). Помогал куче компаний в ведении блогов на хабре, обучал их авторов, и делал так, чтобы рекламные статьи не выглядели как рекламные, и чтобы рекламные статьи выглядели как рекламные, но принимались читателем на ура, и топил за "маркетинг смыслов" еще до того как это так удачно назвал Фадееы, и ругался с Марией Рожковой, когда еще был жив АМР, и палил несколько ее проектов на хабре, и рассказывал ей как делать обзоры, и был банен на хабре за свои обзоры, и делал свой проект, и натаскивал там авторов на то, как писать интересно и полезно.. Ну, в общем много что было.
У меня есть две какие-то награды от хабра, прям на полочке стоят. Одна статья которая вышла на первое место в рейтинге. Статья, которая занимала довольно долго топ по рейтингу. 11 тысяч комментариев. Я не знаю, что еще предьявить, чтобы подтвердить то, что я знаю, о чем пишу.
Я аутист, мне просто в аналитику. Для меня это просто жизнь, я не учился, я никогда не работал чистым аналитиком, но мне как-то рассказали про декомпозицию, анализ и синтез, и я такой "о, так вот как называется то что я делаю все время". Периодически это по мне бьет, потому некоторые сферы жизни не формализируются никак ваще, и мне с ними традиционно сложно, потому что если что-то нельзя разобрать и положить в табличку — я не знаю как с этим взаимодействовать.
И вот я никогда не писал "просто так", я всегда понимал о чем я пишу. Если я пишу про программирование — я умею программировать как минимум на том же уровне. Если я пишу про железо — я умею в железо. Если про аналитику, цифровизацию или бизнес-процессы — я, блин, умею в аналитику, цифровизацию и бизнес-процессы! Нельзя без этого получить хорошую статью. В это должен уметь или автор (хотя бы на уровне понимания терминов) или его собеседник, чтобы он записал близко к тексту интервью с ним. И это для меня граница, по которой я ранжирую авторов.
И я читаю хабр на протяжении этих 15 лет практически ежедневно, с перерывами на отпуск и любовные страдания по А.
И я, блин, знаю, как пишут авторы хабра. В среднем, по больнице. У меня есть авторы-любимчики, у меня есть авторы, которых я не люблю.
Но сейчас я вижу то, что я не просто не люблю, я ненавижу — нейрослоп. Это статьи, которые полны логических ошибок, не отвечает на вопрос заданный в заголовке, с кучей воды. Это не просто дно копирайтинга, это "снизу постучали". Это не было бы проблемой, будь это плохие авторы. Плохие авторы конечны. LLM может генерировать гигабайты текста, только плати за токены, и весьма недорого — у меня есть несколько проектов, в которых LLM используется для NLP, и там ощутимые обьемы входа и генерации, и знаете сколько я потратил за все время существования этих проектов на работу и тесты? Долларов пять. Дешевый некачественный копирайтинг еще никогда не был ТАК дешев.
Возможно этот слоп замечательно индексируется, но я считаю что это путь в никуда для хабра как сообщества специалистов.
Потому что как только таких статей ст��нет большинство — из сообщества уйдут те самые специалисты, просто потому что ну зачем им читать воду. Я закрываю эти статьи ровно сразу же, как только опознаю ИИ. Если их станет слишком много — я просто уйду. И чем больше уходит активных авторов, тем меньше становится интересных статей, и тем больше в процентном соотношении такой воды, тем больше уходит ядерная аудитория. Замкнутый круг.
Причем я хорошо понимаю, почему блоги компаний-то не видят никакой проблемы — у них KPI по просмотрам и комментариям, и все хорошо, в комментариях обсуждение какие-то, люди обсуждают новости, комментарии оставляют, зарплата SMM капает. Качество самих обсуждений и то, КТО там обсуждает, ядерная аудитория или новореги, которым просто хочется высказаться — им не очень важно. Нет, я не считаю, что новореги — это обязательно плохо, просто ядерной аудиторией им только предстоит стать: все мы когда-то писали свои первые глупые комментарии и получали минусы, но те, кто решил "ну нафиг, сложно/обидно/етц, вернусь обратно на пикабу" эту статью не читают.
Так вот, для самих компаний все ок, но слоп-статья представляет собой просто полотно воды с набором ключевых слов, которую можно сократить до "а давайте пообсуждаем батареи в смартфонах". Но просто сокращение до заголовка не работает, люди привыкли к статьям, им кажется что прочитав что-то крупное, они получают информацию, у них мозг так работает, что его надо с определенной частотой и обьемом возбудить ключевыми словами, чтобы по этим ключевым словам триггернулось какое-то воспоминание, и они бы его написали в комментарии, и тогда мож��о было бы это пообсуждать.
Для понимания и обучения на статье нужен в ней смысл, а вот для обсуждения нужны просто ключевые слова в достаточном количестве и плотности. А вот темы.. Темы — они вечные. Старые девайсы, батарейки, телефоны, плохие корпорации, современные гаджеты..
И вот когда у SMM компании хотя бы сто таких тем, он просто может их по кругу пускать каждый год, как делает Лебедев у себя в блоге ("я пощу старые хорошие посты, потому что их не видела новая аудитория"), просто генерируя каждый раз новую статью с нулевой новизной, и все равно это будут обсуждать. И лить трафик на сайт компании, чего не лить-то, комментарии крутятся, просмотры мутятся.
Поэтому для SMM и в целом для компании это реально удобно — мало затрат на статью, а трафика хоть и меньше, ну так на рубль вложенный в SMM все еще выгоднее (сильно выгоднее, потому что LLM это практически бесплатные рабы, которые еще и настолько быстро работают, что одному главреду, если его не волнует качество, за день можно нагенерить статей эдак так на неделю-другую).
А вот хабр постепенно превратится такими темпами просто в трафико-помойку, где будут просто статьи от ИИ и такие же новости про очередной прорыв в аккумуляторах, который, как известно, происходит примерно пару раз в год.
И как я уже говорил, общение у меня не заладилось. Поэтому я вот решил вынести это немного в публичное пространство, да. Хотя основная цель не в этом: я хочу подсветить основные признаки LLM-статей, но не так, как делают ИИ-чекеры типа Гигачек.
Вообще, использовать LLM для детекции LLM не имеет смысла, потому что LLM очень легко обучать с отрицательным подкреплением. И как только вы выпускаете детектор LLM в открытое пространство, любую нейросеть можно обучить его обходить. Либо через фаин-тюнинг, либо просто подавая раз за разом на вход вердикт чекера и просить "переформулируй". Рано или поздно оно сгенерирует нечто, что опознается чекером как результат человеческой деятельности. Кажется, в этом смысла будет еще меньше, чем в первой версии, но зато галочка "написано человеком" будет.
Так вот, признаки слоп-статей. Я буду стараться подсвечивать то, что, я надеюсь, не получится исправить в ближайшем будущем, потому что если это будет исправлено, то результат генерации не будет особо отличаться от написания статей человеком (в том смысле, что будет иметь смысл), и мне, в целом, будет ок. Мне же вот норм от кода, сгенерированного LLM, так что я не очень привередлив.
Так вот, признаки слоп-статей. Хочу сразу предупредить, что прочитав это, вы (как я надеюсь) будете видеть их везде, потому что у вас сложится картинка в голове, набор характерных признаков. И избавиться от этого уже не выйдет. Я некоторое время читал эти статьи по диагонали и не видел особых проблем, а потом оп, взгляд зацепился за одну несостыковку, за другую, потом я увидел это в другой статье, в третьей, больше статей — больше признаков... И все, конец. Дорога в одну сторону. Так что если вам дорога свой рассудок и своя жизнь, в которой вам норм читать такие статьи — держитесь подальше от дальнейшего текста, ибо читая его, вы принесете в жертву свою невинность и свое детство, свободное от бездушного эйай-слопа.
Помните, да, "Не проси об этом счастье, отравляющем миры"? Вот это оно.
Так вот, признаки слоп-статей. Это будет длинная статья с кучей примеров. Не спешите пролистывать ее "да это тоже самое, что выше". Александр Ф. Скляр сказал бы "Так надо".
Так мозг работает. Хотите научиться опознавать слоп — посмотрите на кучу примеров. Мозг сам вытащит закономерности, не мешайте ему, просто прочитайте. Идеально два раза или в два приема, пусть уложится в голове, пусть там побултыхается и поварится. Но хватит и одного, надеюсь, тут тоже все аутисты и программисты, вам проще будет. А если вы не аутист-программист, что вы тут забыли?
Так вот.. Все-все, признаки.
Странные нечеловеческие обороты
Хорошо согласованные на уровне лексики, падежей, орфографии, пунктуации предложения, в которых даже вроде есть смысл (на уровне предложения), но которые либо просто странно выглядят, либо страдают несогласованностью конструкции: от "подьезжая к станции с нее слетела шляпа" до полной неспособности при чтении распарсить что же именно на что ссылается.
MiniDV обеспечивал значительно лучшую четкость изображения, ... Важной особенностью была возможность напрямую загружать видеозаписи в компьютер через интерфейс FireWire (IEEE 1394)
Речь идет о стандарте MiniDV, а потом вдруг начинается о возможности загрузки через интерфейс. Смысл вроде понятен — у MiniDV были рекордеры, и вот у этих рекордеров часто был FireWire, через который можно было загружать, потому что стандарт изначально цифровой... Но LLM проигнорировал эту сложность и сократил цепочку рассуждений, сделав ее несогласованной в смысловом плане.
Вишенка на торте — "FireWire (IEEE 1394)", потому что ну кому интересно что там за номер IEEE у стандарта. Его все знают как FireWire. И даже если кто-то хочет написать про номер IEEE, то он напишет скорее "IEEE 1394 (так же известный как FireWire)". Или "Интерфейсы FireWire, i-Link, Lynx (которые все суть IEEE 1394)". А уточнение что там за IEEE.. Ну, не имеет особого смысла. Но это не очень верный признак.
Там кстати очень прикольный диалог с нейронкой (ну, опосредованно), можете ознакомиться.
А стандарт Rec.601 преобразовывал видео в цветовое пространство YCbCr.
Тоже самое. Стандарт преобразовывал. И смысл в целом понятен — в стандарте кадры в YCbCr, но оно опять несогласованно в логическом смысла.
Я, кстати, в диалоге выше за это предложение предьявил. И на мое возмущение этим предложением мне ответили, что да, "Слово «преобразовывал» упростило смысл", и предложили в качестве исправления монструозную конструкцию "А стандарт Rec.601 описывал метод преобразования видео в цветовое пространство YCbCr, который реализуют устройства и программы".
Это же надо так не чувствовать язык!
По сути верно, но получилась адская хрень. Хотя нормальной правкой было бы простое "В стандарте Rec.601 видео преобразовывалось в цветовое пространство YCbCr".
Если мне такой мой текст показали бы, я бы чем угодно клялся бы, что это нейросеть и что я дурак не проверил, лишь бы не признавать что этот текст был написан мной осознанно. Потому ну, это же расписаться собственоручно в профнепригодности как писателя буквами.
Кабельные операторы, с другой стороны, ценили удобство DVR ... Многие ограничивали функции skip или отключали автоматическую запись, чтобы сохранить доходы.
Речь про DVR, но ограничивали кабельные операторы. Ну или DVR ограничивали, но тогда получается что доходы хотели сохранить тоже DVR. Какой-то ИИ получается, а не рекордер.
При воспроизведении магнитная лента проходит через воспроизводящую головку, где магнитные вариации конвертируются обратно в электрический сигнал.
Магнитные.. что? Это слово не применятся в таком контексте никогда. Человек, который знает, как работает проигрыватель ленты, никогда не напишет это слово, а тот, кто не знает, не напишет остальную чуть предложения.
Что позволит сохранить тысячи треков на встроенной флеш-памяти или жестком диске? Для этого понадобится несколько сотен CD-дисков. Спасли положение MP3-плееры.
Непонятно вообще что же сказать-то хотелось. Что позволит сохранить тысячи треков на флеш памяти? Для этого нужны сотни дисков. Но спасли положение MP3-плееры.
"Для хранения тысяч треков понадобились бы сотни CD-дисков. Спасло положение флеш-память и жесткие диски в MP3-плеерах", вот в чем смысл. Но оригинальный текст просто комбинирует ключевые слова без смысла в целом.
В основе работы iPod лежит простая, но эффективная схема: музыка загружается с помощью программы iTunes, хранится на диске в формате AAC или MP3 и выводится через встроенный аудиочип.
Простая схема — это загрузка через iTunes? Почему загрузка через iTunes это эффективная схема? Причем тут некий "аудиочип", который и так был в любых плеерах (если понимать под ним ЦАП). Я тут даже переформулировать не могу толком, потому что тут смысла-то нет, не было там никакой простой, но эффективной схемы, было удобное устройство с жестким диском, и это позволяло закинуть туда гораздо больше треков, чем в плеерах с флеш-память, которая тогда была дорогая.
Лента выглядела как длинный узкий пластиковый или бумажный кусок, покрытый магнитным материалом (обычно оксидом железа)
Длинный узкий кусок. Кажется у этого есть название.. Ах, да, лента! "Содержимое катушки — это лента из пластика или бумаги, покрытая магнитным материалом", что-то типа того. "длинный узкий кусок" это все равно что "очень длинный прямоугольник". Фактически верно, но какой человек назовет ленту "длинным куском"?
Одна магнитная лента способна хранить десятки терабайт информации, а благодаря современным системам управления и формату LTFS пользователи могут получать доступ к отдельным файлам, несмотря на последовательный физический характер хранения.
Все это переросло в жесткий диск. Набор металлических или стеклянных пластин, покрытых магнитным слоем, которые вращаются на высокой скорости (до нескольких десятков тысяч оборотов в минуту).
Сначала речь про магнитную ленту с терабайтами информации (явно современные стримеры), и LTFS — это гдет 2010 годы, а потом оп, и про то, как из ленты выросли жесткие диски. Нарушение последовательности повествования во времени.
Нормальная правка: "Магнитная лента хранит информацию, лента переросла в жесткие диски, но все еще составляет им конкуренцию, т.к. способна хранить терабайты, а благодаря LTFS можно получить доступ к отдельным файлам."
Более поздний этап — это переход от жестких дисков с вращающимися магнитными пластинами к флэш-памяти (Flash)
Примером является использование NAND-флэш, который позволил создавать компактные и надежные накопители, кардинально изменившие способы хранения в смартфонах, ноутбуках и дата-центрах.
"Флеш памяти (Flash)". Зачем тут скобки? Какой смысл в слове Flash? "(англ. flash memory)" звучало бы нормально, но в отдельном слове нет никакого смысла, и даже если бы был, его надо было ставить после "Флеш".
Затем наступил этап интегрированных зарядных устройств. В 90-х Nokia и другие компании начали выпускать телефоны с портативными зарядками в комплекте.
К-к-к-какие интегрированные зарядные устройства? Какие телефоны с портативными зарядками? О чем тут вообще речь? Если интегрированные зарядные устройства — то можно предположить, что речь о микросхемах контроля заряда? А причем тут тогда портативные зарядки, которые ну, в розетку втыкаются? А если речь про зарядки в розетку, где там интегрированные устройства? Вообще, какой смысл в "Этап интегрированных устройств, телефоны с зарядками в комплекте". Они в комплекте или интегрированные?
Когда вспоминают, что интернет был по карточкам, в голове сразу рисуется картинка: бумажные купоны, защитная полоса, номинал в «условных единицах» и томительное ожидание набора номеров модема.
Давались они также, при покупке сетевого адаптера для пк.
Бумажные купоны. Модем. Давались при покупке сетевого адаптера.
Могу предположить, что речь про карточки при покупке модема (ни разу о таком не слышал, но допустим). Но почему модем называется сетевым адаптером? Как карточки стали купонами?
Высокая плотность энергии несёт больше пространства, но и больше нагрева.
Речь тут про аккумуляторы. Какого пространства? Какого нагрева? Даже не понимаю, что хотел сказать автор.
Громкое заявление, да, но не менее громкий формат, который используется везде.
Речь про JPEG. "Громкий формат". "Тихий стандарт". Хз, плохая аналогия подобна котенку с дверцей.
Изображение сначала отображается в низком качестве и постепенно дорабатывается. В эпоху dial-up-модемов это было как-то так: вы видели, что фото точно загрузится, и могли подождать, пока прогрузится лицо собеседника из ICQ.
Опустим то, что в "В эпоху dial-up-модемов" progressive jpeg никем особо не поддерживался и не использовался. Какое лицо собеседника в ICQ? Почему мне надо было ждать, чтобы оно загрузилось? Что такое "точно загрузится"? Почему это атрибут progressive jpeg? Почему нельзя подождать обычно jpeg? Что мешает progressive jpeg не загрузиться на половине из-за обрыва связи? Вроде предложение выглядит как связный текст, но начинаешь его разбирать на кусочки и понимаешь, что там просто комбинированные ключевые слова: низкое качество, постепенно дорабатывается, dial-up, модем, фото, загрузка, ICQ, и все, смысла нет.
С каждым годом выпуск 3D-фильмов всё меньше и меньше. Формат официально признали фиаско.
Тут тупо пропущены слова-связки. "Выпуск меньше"? Я так на английском разговариваю, если дело не касается даташитов и переписки. "Дай красная коробка полка сколько стоит?"
"С каждым годом 3D-фильмов выпускалось всё меньше и меньше", вот в чем смысл.
Персонал перевели в структуры Ford и Volkswagen. Закрытие проекта повлекло значительные финансовые потери: Ford списал около $2,7 млрд в своём отчёте, при этом Volkswagen ушла из проекта с убытками.
Форд списал в отчете, но при этом Volkswagen ушла с убытками. А форд с убытками не ушел? LLM упорно не хочет использовать повторения (а их использовать придется, потому что данных по Volkswagen-у нет), и поэтому пишет части приложения по-разному, но криво.
"При закрытии проекта Ford и Volkswagen вышли из него с убытками, например у форда, судя по его отчетности, он составил аж $2,7 млрд."
Хорошим тоном в копирайтинге считается еще привязать эти 2,7 млрд к чему-нибудь вроде прибыли форда за год, или трат на R&D, чтобы понимать, а что стоил этот проект, 1% или 40% бюджета. Но это так, и обычные копирайтеры это не осиляют, это не показатель.
После инженер Джек Маллин увёз пару Magnetophon в США, показал запись Бинга Кросби и запустил волну создания студийных магнитофонов и компании Ampex. Что получил пользователь — радиостанции, студии звукозаписи и массовые бытовые кассетники.
Почему она выстрелила и живёт до сих пор — просто: высокая плотность записи при низкой себестоимости, простой механизм чтения/записи. Про минусы не будем, т. к. для архивов и бэкапов важнее цена за гигабайт, а лента переросла в современные LTO-ленты.В 1954 году компания IBM выпустила первый магнито-дисковый накопитель — устройство с вращающимися магнитными пластинами и механическими головками для чтения-записи.
Опять скачет туда-сюда. Сначала про изобретение магнитофонов (студии звукозаписи? а до магнитной ленты их не было?). Потом оп, почему магнитная лента выстрелила? Высокая плотность записи и низкая цена за гигабайт. А потом уже утверждение о том, что лента переросла в LTO. Получается, что сначала у нас были гигабайты на ленте (видимо сразу после созданий студийных магнитофонов), а потом оп, и LTO. Ну и дальше про HDD, без связки.
Еще придуманное слово "магнито-дисковый накопитель". Судя по гуглу, оно встречается ровно в одном месте — в этой статье. Живые копирайтеры обычно не придумывают слова, а если и придумывают — то делают это осознанно в формате "назовем этот эффект Х". Потому что придумывать — а нафига, они оперируют новостями и пресс-релизами обычно. Иногда статьями. Максимум копирайтера — это замена одного слова на другое, чтобы не было совсем уж откровенных повторений.
ЛЛМ-ка же комбинирует токены, у нее нет понимания что придумывать новое нехорошо, для нее придумывание предложений близко к придумыванию слов.
От техники перешли к культуре. Telegram style не возник случайно — сообщения оплачивались по слову, поэтому экономная, «телеграммная» речь родилась из расчёта затрат. Поскольку точка как символ считалась словом, её написание как STOP не увеличивало стоимость, зато сохраняло смысл и экономило споры о расценках (типа, считать ли символ). Это было не только про экономию, это был способ формализовать смысл, убрать шум и оставить только сигнал.
Опять ключевые слова без смысла. Точка считалась словом, поэтому ее можно было писать как STOP, поэтому это сохраняло смысл... Экономило споры.. Споры о том, считать ли смысл.. Формализовать смысл.. Убрать шум и оставить только сигнал.. ПРИЧЕМ ТУТ ТОЧКА И STOP??
Устройства Nokia отличались хорошей надежностью, однако частная стандартизация создала немало проблем с совместимостью. В результате смена телефона вынужденно приводила к необходимости менять и зарядное.
Сколько там у нокии было поколений зарядных, три? Что за частая стандартизация?
Речь о куче разных стандартов зарядок у разных компаний, но причем тут нокия..
Наряду с этим, биометрическая аутентификация и токенизация уменьшают вероятность обмана от «того самого банка».
Токенизация? "того самого"? Какого обмана? При чем тут биометрическая аутентификация?
Еще один признак:
Пустота в предложениях или банальность, произнесенная с умным видом
Это когда вроде предложение написано, но в нем нет смысла или почти нет смысла, просто вода.
Тонарм — это сбалансированная и отрегулированная деталь, обеспечивающая движение иглы по дорожке.
Благодаря компактности и удобному интерфейсу, iPod сделал музыку персональной, доступной всегда и везде, что сильно повлияло на культуру прослушивания и погружение пользователя в собственный музыкальный мир.
При этом емкие батареи квалифицированно управляются электроникой, чтобы оптимизировать нагрузку и продлить срок службы.
История прослушивания музыки — это ис��ория постоянного технического прогресса и совершенствования форматов и устройств. Крупные изменения в прослушивании музыки были неоднократно. Появление магнитной ленты, электронные носители и аудиокодеки сделали музыку более доступной. Интернет обеспечил глобализацию музыки и сам стал ее носителем.
В свою очередь, качество записи многократно усиливалось за счет профессионально подобранного эквалайзера RIAA и тщательно настроенных усилителей.
Это была одна из первых массовых систем автоматического хранения и обработки информации, применявшаяся в бухгалтерии, статистике и промышленных приложениях.
Системы вроде Ceph, GlusterFS, SeaweedFS и другие позволили перейти к следующему уровню — теперь хранение и доступ к данным стали гибкими, надежными и максимально масштабируемыми, подстраиваясь под реальные потребности современных IT-инфраструктур без традиционных узких мест.
Современный интернет сложно представить без стандартизированных пайплайнов, алгоритмов ранжирования и потоков гигабайтных данных, проходящих через облачные инфраструктуры.
Большие платформы диктуют свои правила — единые UI‑гайдлайны, пайплайны сборки и бесконечные потоки данных для «прокачки» рекомендаций и таргетинга.Но даже мощные ассистенты иногда слышат не то, что вы говорите. Это не провал технологий, а напоминание: голос — это не просто ввод. Это диалог.
P.S. Если ваш ассистент все еще не понимает, что вы имели в виду, не спешите его винить. Скорее всего, вы просто не учли, как он слышит мир — и как теряет контекст, когда вокруг шум.
А пока индустрия движется к более устойчивым, долговечным и экологичным решениям. Пока же улучшения достигаются через комплексное сочетание и какие-то пробы.
Этот сдвиг к единой системе — драйвер изменения образа жизни. Вскоре такая экосистема будет определять не только удобство, но и здоровье, эмоциональное состояние, эффективность и устойчивость нашей повседневности.
Если раньше автор отвечал за каждое своё слово, и за ваш комментарий на каком-то маленьком форуме из 2013-го вас могли спросить, то теперь контроль разделяется, влияя на формирование и хранение контента. Появляются вопросы с юридической и этической точки зрения. Получается, что платформа и читает, и удаляет, и правила придумывает — а порой кажется, что сама забывает, что удаляла вчера.
Помните, в ложной слепоте, да?
— Не у всех из нас есть родители или кузены. У некоторых не было никогда. Некоторые рождаются в чанах.
— Понимаю. Печально. «Чаны» звучит так бесчеловечно.
— Расскажите мне больше о своих кузенах, — затребовал «Роршах».
— Наши кузены находятся на генеалогическом дереве, — ответила Саша, — вместе с племянницами, и племянниками, и неандертальцами. Мы недолюбливаем навязчивую родню.
— Мы бы хотели побольше узнать об этом дереве.
— Не могло оно проанализировать эту реплику. Там три двусмысленности на две фразы. Оно их просто проигнорировало.
Там была ситуация как раз с аналогом LLM-ки, которая вела вроде осмысленный диалог, но на самом деле просто комбинировала слова. И вот тут, вроде слова-то есть, но они пустые. "теперь контроль разделяется, влияя на формирование и хранение контента", " Пока же улучшения достигаются через комплексное сочетание и какие-то пробы", "история постоянного технического прогресса и совершенствования форматов и устройств".
Следующий признак...
Ненужная точность и термины
Нейронка знает термин — нейронка вставляет термин. Нейронка знает точное число — нейронка вставляет точное число.
Ее основой служила магнитная лента шириной всего 3,81 мм, на которой записывался звук. Лента двигалась со скоростью около 4,76 см в секунду.
Мытьё тарелок и кастрюль отнимало от 10 до 30 минут после каждого приёма пищи, а при семейных застольях — и вовсе час и больше. Посудомойка может очистить от 12 до 16 комплектов посуды за один цикл, при температуре воды до 90 градусов, уничтожая до 99,9% бактерий. Расходует около 0.7 кВт·ч электроэнергии и менее 10 литров воды.
Везде всё по карте, и это превращается в экономику удобства. Рынок ждёт рост — к 2029 году его объём может вырасти до $140,55 млрд, а среднегодовой темп (CAGR) — порядка 19,2%.
Скажите, зачем "3,81 мм", а не "4". "Около 4.76 см в секунду"?? Около? Т.е. 4.76 см/с это еще и неточное значение, так, примерно, около?
Какой смысл в "от 12 до 16 комплектов посуды"? Зачем дробные доли в "$140,55 млрд" и "19,2%"? Нет никакого смысла. Ноль.
"шириной примерно 4мм", "со", "десяток комплектов посуды" и так далее.
Фактические ошибки
LLM не фактчекает. LLM некритична.
Есть два подхода. Первый — ступенчатое повышение напряжения: зарядник подает сначала 5 В, потом 9 В, 12 В и так далее, классика для многих алгоритмов Quick Charge и им подобных. Второй — «низкое напряжение + большой ток»: понизили В, повысили А. Энергия идет широким потоком (так работают схемы VOOC/SuperVOOC).
"«низкое напряжение + большой ток»: понизили В, повысили А. Энергия идет широким потоком". Каким потоком? Куда?
Речь про то, что можно заряжать две батареи последовательно без DC-DC, а просто 7 вольтами.
Помните, как собирались у кого-то дома, вокруг единственного компьютера, чтобы вместе скачать новый фильм или поиграть в игру?
Человеки! Вспомните, как вы собирались вокруг единственного компьютера, чтобы скачать новый фильм? Не помните? Я тоже не помню. Потому что когда интернет позволил скачивать фильмы пока вы сидите у компьютера, эти компьютеры уже были у всех, кто хотел. А когда они еще не были у всех, и вокруг него надо было собираться — ну, скачать фильм можно было там за ночь.
До эры смартфонов в карманах (или на штанах) у многих был маленький пейджер: устройство для мгновенных уведомлений по радиосигналу. Нужно было срочно с кем-то связаться — вы отправляли сигнал в эфир и ждали ответа.
Помните как вы отправляли сигнал в эфир? А как ждали ответа? От пейджера, напомню, ждали. Не помните? Я вот тоже не помню. Тетечке позвонить можно было, сказать "абоненту 7374, сообщение "я в городе, приезжай"", и все. Никакой обратной связи. ЛЛМ-ка не помнит. Ни скачивание фильмов, ни как работали пейджеры. Они вообще не любят, в принципе Она вообще не помнит, в принципе. Она комбинирует ключевые слова так, чтобы это было похоже на настоящие предложения. И в целом, это работает — угадайте, сколько человек в комментариях что-то сказали по этому поводу? Ноль.
Статья, кстати, исключительно про пейджеры. Там много такого:
"пейджер в «мини‑телевизионном» корпусе", "Bravo отличался простым, но надежным корпусом ", "часто упоминали Ericsson R310s: хотя, по сути, это был защищенный телефон", "шли цифровые пакеты со всемирно признанным протоколом POCSAG", "характерные для классических «би-прыжков»".
Это был первый PDA, где можно было не только вести заметки стилусом, но и ожидать, что устройство поймет ваш почерк
Речь про Palm. Никакого понимания почерка там конечно не было, там было graffiti, которое распознавало буквы, которые надо было писать определенным образом. Все. Нейронка не знает этого, повторяю, она не фактчекает и не ищет. Она вытаскикает у себя из памяти вектора и делает из них текст. Какой бы ни была она огромной, сжатие тренировочного датасета происходит с потерями, и там образуется связка pda-palm-стилус-написание букв. И она бы выдала вам эти вектора или токены, но людям чет не нравятся статьи из ключевых слов, поэтому она делает из них валидные с точки зрения грамматика языка предложения (ну, если повезет, как видно выше, не всегда валидные). Но смысла в предложениях не добавляется.
Sharp Zaurus SL-C1000 вышел в 2005 и стал настоящим карманным мини-ПК на Linux для тех, кто любит ковыряться «под капотом»
...
Но энтузиастам, привыкшим к готовому решению, пришлось несладко: настройка требовала погружения в Linux-туннели, а локализованной прошивки не было
Для тех, кто любит поковыряться под капотом, но привык к готовым решениям, но локализованной прошивки не было, а надо было погружаться в линукс-туннели. Определитесь уже, энтузиасты любили поковырять под капотом или привыкли к готовым решениям? Что за линукс-туннели и зачем они для локализации?
А задорные «эффекты замедления» стали прообразом тех функций, что мы сегодня видим в каждом подкаст-редакторе и фильтрах на смартфоне.
Что там, как поживают фильтры для аудио на смартфоне, с эффектом замедления? Я лет 10 назад с ними сталкивался в диктофонах, которые позволяли замедлить/ускорить запись и одновременно поднять или уменьшить частоту, чтобы голос звучал не пискляво. Больше я такого не видел. Ну на ютубе можно вот скорость видео поднять, чтобы побыстрее смотреть.
Это оказалось настолько удачным изобретением, что на протяжении нескольких тысяч лет человечество, по сути, не придумало ничего лучше. Даже появившиеся позже книги и само книгопечатание — это тот же пергамент на максималках и в промышленных масштабах. Качественное изменение произошло лишь относительно недавно, когда человечество стояло на пороге индустриализации.
Пергамент. На максималках. А машина это велосипед на максималках. Или нет, колесо на максималках, волокуша такая. Офсетная печать такая: я для вас шутка, да? Машины для производства бумаги, я был на такой: целый цех, через который со скоростью метров 10 в секунду фигачит большой-большой лист бумаги. Пергамент на максималках, ага.
Если уж говорить о том, что именно на максималках, то это скорее как раз папирус. А пергамент, напоминаю, это тонкая выделанная кожа.
У батареи нет особых правил во время зарядки и нет калибровки. Дешевле производить, поэтому они незначительно повышают общую стоимость мобильных устройств. Из минусов литий-полимерных батарей стоит выделить их повышенную стоимость. Однако где минус, там и плюс: такие аккумуляторы крайне редко подделывают, поэтому нарваться на смартфон с некачественной Li-Pol-батареей маловероятно.
Тут вообще раздвоение личности. Аккумуляторы дешевле производить, и они незначительно повышают стоимость устройства(!), но стоимость их повышенная, из-за чего их редко подделывают (!).
У батареи нет особых правил во время заряда. CC/CV это не особые правила? Особенно по сравнению с никелем и свинцом.
Может тогда натрий-ионные аккумуляторы (Na-ion) — новая альтернатива литий-ионным технологиям? Тут всё не так просто — рост стоимости и экологические проблемы добычи лития могут дать о себе знать.
Натрий-ионный — новая альтернатива литию. Но не все так просто, ведь есть проблемы добычи лития! А что, разве натрий-ионнные как раз не альтернатива литию?
Вывод простой: WebP остаётся хорошим вариантом, если важна совместимость и быстрое декодирование.
Совместимость? WebP? Чо-то тут не так. В какой оси вы видели совместимость? Какие сайты его поддерживают для загрузки? Кажется, он только в гугла в поиске по картинкам есть, и все.
Основная сфера применения HDD — холодное хранение данных (cold storage) и резервное копирование на магнитные ленты (LTO).
HDD для холодного хранения.. Ну, пусть. Но основная сфера применения HDD — резервное копирование на магнитные ленты... Шта?
RCS (Rich Communication Services) со своими аудиостикерами и т. п. — наследник SMS с расширенным функционалом, но без обязательного сквозного шифрования. Важно, что для RCS не нужно ничего скачивать или регистрироваться — всё в рамках «родного» приложения сообщений. Однако для её полных преимуществ требуется, чтобы ваш оператор мобильной связи и устройство поддерживали RCS. Говорят, есть даже возможность совершать голосовые и видеозвонки.
С другой стороны, есть Matrix — открытый, децентрализованный протокол с федерацией и e2e, где пользователи реально могут выбирать, кому доверять и где хранить данные.
В чаты внедряют ИИ, генерацию текстов, адаптивные ответы, фильтры. С появлением ephemeral messaging с удалением сообщений добавляется контроль над собственным цифровым следом.
Чо там, кто-нибудь видел вживую RCS? Делали голосовые или видеозвонки?
Ладно, допустим. Что там дальше? Оп, Matrix. С другой стороны от RCS. Типа, вот у нас есть RCS, а есть Matrix. Все, других вариантов нет. ICQ? Jabber? Вотсап? Телеграм? Дискорд? Слак? iMessage? SMS, наконец? Кто-нибудь использовал термин ephemeral messaging для сообщений, которые можно удалить или которыми вам присылают нюдсы?
Что такое адаптивные ответы? А фильтры? Какие ИИ внедряют в чаты? Почему не упомянуты боты, которые сейчас есть в любом мессенжере? Много вопросов, мало ответов. Почему? Потому что связность текста не волнует ллм-ку, ее волнуют ключевики.
Ну, короче, примеры не то, чтобы закончились, я могу из статей надергать еще два-три раза по столько же, но я устал. Давайте кратенько пройдемся по авторам и статья, вдруг там будут какие-то закономерности. Ну и заодно примеры статей покажу.
Примеры
Возьмем, например, блог компании RUVDS.
RUVDS
Вот прикольный цикл статей про пасту:
>>1/0 https://habr.com/en/companies/ruvds/articles/957638/
Явно не слоп, автор старался, ковырял источники, текст связный.
>>2/0 Что такое SLA, и сколько стоит девятка в аптайме (тоже не слоп, человек писал)
>>3/0 Почему случается оверинжиниринг
>>4/0 Кардинально меняем звучание гитарного звукоснимателя (ну тут вообще чувак увлеченный, там опять серия статей)
>>5/0 HTML и CSS ошибки, влияющие на доступность. Мой опыт и моего незрячего знакомого Ильи. Часть 13 (тоже серия от первого лица)
>>6/0 Psion Siena: карманный компьютер, который умел больше, чем кажется (ну как бы автор говорит сам за себя).
>>6/1 Почему файлы стали меньше: форматы фото и видео (JPEG, HEIC, AV1)
Оп! Чистейший слоп. Вставлены мемасики, это скорее всего человек. А текст нечеловеческий. Автор About_it
Дальше опять:
>>7/1 Тревожные расстройства, панические атаки и положительная обратная связь в организме
>>8/1 Водородные печи в электровакуумном производстве. Что, зачем, какие
>>9/1 Ветрогенераторы без лопастей?
>>10/1 Какой была бы Всемирная паутина, если бы вместо WWW был Gopher
>>11/1 Как мы нашли баг в компиляторе Go
Тут вроде все ок..
>>11/2 Почему батареи в некоторых телефонах живут так мало
Опа, слоп. Причем того же автора, что и выше, About_it (Техногик, пишу: об айти, об этом и обо всем).
Заходим к нему в профиль... Уууу. Чистейший слоп, прям квинтэссенция, каждая статья как пример.
Но в целом, ruvds держится хорошо. Я показываю этот список в порядке публикаций, так что можно оценить слоп-фактор: 13 статей, из которых 2 генерации, слоп-фактор 0.15. С таким количеством хороших авторов несложно свести его к нулю, но угу.
Сходим в блог другой компании...
Selectel
Потыкайте во все жирные статьи — там точно генерация, и в парочку штук, где генерации нет, посмотрите отличия.
>>1/0 Запускаем сервер в Minecraft: исследование конкурентов (не слоп)
>>1/1 Как цифровые видеорекордеры меняли ТВ и почему не выжили (слоп, отсюда куча примеров в этой статье, автор techno_mot)
>>2/1 Сокращаем расходы на Kubernetes (тоже не слоп, виден живой человек)
>>3/1 Придумал расширение для Chrome и устранил шахматных читеров (ух ты, чувак сделал расшире.. А, это перевод. Но не слоп, реальный человек и реальное расширение. Слоп переводить невозможно, потому что смысл теряется окончательно. Поэтому если видите перевод, то это на 99% не слоп)
>>3/2 Toshiba разработала HDD с 12 пластинами (слоп. Автор TrexSelectel)
>>3/3 Zorin OS: мостик в мир Linux слоп, автор Seleditor. Причем, очень смешно: цитата из статьи "Помимо прочего, обновился Wine — теперь в сборке используется версия 9.x (в тексте указано «10», но такой версии на октябрь 2025 года нет).", идем на сайт вайна, и оп, "Wine 10.0 Released January 21, 2025". Уж лучше пересказ пресс-рели��а, чем ТАКОЙ фактчекинг от ЛЛМ-ки.
>>4/3 Новые AMD EPYC 4005 и Ryzen Pro 9000 (Много всякой пресс-релизной воды "гибкой и высокопроизводительной", "благодаря богатому I/O, современной памяти", но вроде видна экспертиза, человек живой, просто разговаривает языком пресс-релизов, бывает, так что не слоп)
>>5/3 Триллион параметров против здравого смысла (стиль где-то похож, но точно не слоп, реальные задачи, реальное исследование)
>>6/3 Как избежать перезаписи в S3 с помощью условных заголовков (живой человек, не слоп)
>>7/3 Kubernetes на пальцах (Странно, TrexSelectel, но не слоп, картиночки, рассказ живого человека)
>>7/4 Ubuntu 25.10 «Questing Quokka» (TrexSelectel, слоп. Пересказ пресс-релиза и чейджлога, но видны обороты ллмки, потому что текста чейджлога не хватило на статью, пришлось налить воды)
>>8/4 Автоматизация без риска (норм, скучновато, но писал человек)
>>9/4 Как мы запустили GPU NVIDIA H200 в Selectel (тож человек писал)
>>9/5 Open Printer с открытым софтом и железом (Слоп, и опять TrexSelectel, да чтож ты будешь делать!)
>>10/5 Как алгоритм Google DeepMind в 100 раз снизил шум (не слоп, но перевод)
Кстати, характерный признак слопа — когда автор пишет на ооооочень разные темы, рассказывая что-то сложное, но это не перевод. Если человек разбирается во всем на уровне специалиста, то он в жизни не будет рабоать копирайтером, он будет качать свой бренд. Но тут перевод.
>>11/5 Как я сделал робота (Не слоп, у чувака две статьи и обе на тему робота)
>>12/5 Воскресная барахолка под Валенсией (чувак ходит по барахолкам и фоткает все подряд. Первые статьи были прикольные, щас скатился просто в фотки, но это абсолютно точно не слоп)
>>13/5 Пять нестандартных мини-ПК (ну вроде нооорм, но автор TrexSelectel.. Но наверное, не слоп, считаем что у нас презумпция невиновности)
>>13/6 Linux 6.17: свежие драйверы (как про Ubuntu выше: статья из чейнджлога, слоп, TrexSelectel)
>>14/6 Учимся дружить Mikrotik с Nginx (не слоп, чувак реально ковыряет тему)
>> 15/6 Графика победила физику (оооочень странная статья. TrexSelectel, но написана хорошо, но это не перевод, оригинала не находися, в комментариях говорят, что это пересказ видео, но чтобы на таком уровне пересказать видео, надо шарить в теме... ЛЛМка не сможет, на 98% что не слоп)
>> 16/6 QR-код по запросу: знакомство с QRious (тоже странно. Статья абсолютно точно не генерация, но почему от TrexSelectel? Я сомневаюсь что у него есть какой-то проект, значит это кто-то писал, а от него просто выложили? Как и предыдущую. Сойдемся на этом)
Ну, в целом понятно. Слоп-фактор 0.38.
Еще интересные находки (вне рейтинга):
Гайд по полному разочарованию в 3D-печати (автор не разбирается в печати и с высокой вероятностью у него не было принетра вообще, но характерных слоп-оборотов нет)
Эволюция музыкальных гаджетов (Точно слоп, примеры оттуда есть в статье, автор techno_mot)
Что мы в итоге вынесли из этого мини-расследования? На примере двух компаний выяснили, что слоп-фактор не ноль, но пока даже не половина, хотя иногда подбирается к ней. Что есть отдельные авторы, которые часто (или даже всегда) публикуют слоп: techno_mot, TrexSelectel, About_it.
Заключение
Ну, и короче, вся надежда на вас, дорогие читатели. Руководителям корпблогов, как я уже говорил, смысла что-то менять мало, у них все хорошо, статьи пишутся дешево. Вопрос, до какого уровня ими можно разбавлять нормальные статьи — дискуссионный. Для меня это граница ровно ноль, а вот для кого-то из них, возможно и 90%. И мне бы очень не хотелось бы, чтобы это так было.
У руководства хабра, насколько я понимаю, подход скорее реактивый — есть стимул, есть реакция. Может если посещаемость упадет, они начнут беспокоиться. Или еще какие-то метрики, дочитываемость там. Но тут же какая проблема, помните принцип Гудхарта? "Когда мера становится целью, она перестает быть хорошей мерой".
Ну вот вынесли эти метрики в статистику по статьям. Дочитываемость там, комментарии, уровень вовлечения. Ну так вот их и начнут оптимизировать. И они будут ок, не было еще такого KPI который мотивированные люди не смогли бы похакать.
И вот с точки зрения метрик все будет ок еще долгое-долгое время. А потом оп, и провал.
Это как с рождаемостью: когда она падает, то у вас довольно долгое время все хорошо, потому что люди живут долго, система меняется медленно. А зато потом, когда старшее население начинает умирать, все, страна буквально в пике входит, потому что если у вас уже 30 лет низкая рождаемость, то нового поколения мало, а если его мало, то оно и рожает мало, даже если ему создать все условия, и вот эта вот положительная обратная связь делает очень-очень плохо. Мы это еще на своем веку увидим в какой-нибудь японии и корее. Конец лирического отступления.
Так вот с точки зрения метрик все будет ок, но корневая аудитория начнет разбегаться. Я оцениваю этот уровень где-то на уровне слоп-фактора 0.5 (для всего хабра). И вот после этого потребуются уже очень большие усилия чтобы комьюнити восстановить.
Я очень не люблю реактивный подход, я топлю за проактивный. Вот щас хорошее время, чтобы что-то сделать очень небольшими усилиями.
Определяйте эти статьи, минусуйте их, минусуйте авторов, пишите в комментариях "Опять слоп! Сколько можно!", нажимайте на "пожаловаться" под статьей. Мне еще обещали "Сгенерировано ИИ" в причинах минусов, тоже тыкайте, когда он будет.
Сим победиши!
Комментарии (18)

Goron_Dekar
18.11.2025 08:01Люди, пожалуйста, следите за тем, чтобы на каждый плюс ставить хотя бы два минуса. На ресурсе стало очень удобно и легко писать. Нет ощущения, что статья - это прорыв через критику, через рецензию.

zenhower
18.11.2025 08:01Спасибо за статью, полностью на вашей стороне! Сильно утомляет недостаток смысла в тексте, но всё чаще звоночек уже на уровне заголовков вида: "выпустили устройство с wi-fi красного цвета" или "Майкрософт работает над проблемой с исправлением".

YMA
18.11.2025 08:01Надо просить админов сделать причину постановки негативной оценки - "Нейрослоп", и если десяток пользователей ее нажимают - статье автоматом проставляется соответствующий тэг, по которому такие статьи можно зобанить.
Ну реально бесячит - вроде тема интересная, открываешь, читаешь, и понимаешь, что это вода с мусором. Зря потраченное время...

inkelyad
18.11.2025 08:01Надо просить админов сделать причину постановки негативной оценки - "Нейрослоп"
Это спецеизм. Надо именно отметку "вода с мусором" и делать. А уже кто это писал - не важно. Хотя минуточку - тут где-то в настройках ленты "порог рейтинга" есть. Вроде бы для этого и служит. Осталось только понять, почему не работает.

zenhower
18.11.2025 08:01Все годы ставил с указанием "низкий технический уровень материала". Чем не подходит?

positroid
18.11.2025 08:01Странные нечеловеческие обороты
На мой взгляд, здесь многое больше похоже на кривой машинный перевод, чем на результат деятельности ИИ, сейчас AI-слоп выглядит вполне связно, но либо смысл теряется, либо факты не те. Ну и форматирование (списки, выделения, тире не к месту).
Про минусы - ставлю, если заголовок цепляет чтобы зайти внутрь, а статья оказывается полным ии-шлаком. А если плохую статью видно сразу по заголовку/анонсу (читаю через rss) - то как-то и открывать её совсем не хочется уже.
P.S. Больше всего бесят ИИ-комментарии - ну ладно ты статью не можешь сам написать, но в комменты то зачем копипастить ответ из чата...

Gizensha
18.11.2025 08:01Это компенсируется тем, что нейросети нагибают сеошников, выдавая нужный ответ при запросе в поисковик сразу, в то время как это отродье специально пишет воду в цитируемый гуглом отрывок описания сайта, чтобы заставить к ним зайти. Так что не слоп, а slope, но луддитам не понять.

ru1z
18.11.2025 08:01Спасибо, злободневно! Вчера на хабре читал новость, что
чёртовудюжину "ии" должны внедрить в медицину. Почувствовал себя как в шутке про женщину приходящую в офисы с пчелами.

iiwabor
18.11.2025 08:01У многих людей, под влиянием тиктоков и шортсов, сейчас развилось клиповое мышление - прочитали заголовок, лайк поставили, ну, иногда картинки еще посмотрели - всё! Статьи, особенно длинные и со сложным контекстом, никто не читает, и что там Чат ЖПТ нагенерил - уже не особо важно.
Я много раз замечал, что "авторы" постят сгенереную рекламную муть, даже не вычитывая и не исправляя ошибки - а зачем? И так сойдет...

hex_coder
18.11.2025 08:01Не осилил прочитать прямо всю статью особенно на оборотах, после трети текста читал по диагонали. Где мне тема незнакома, то я не отличу LLM от неграмотного человека. И от грамотного тоже. Но в целом, можно понять так, что нейронки обучались на текстах неграмотных/ленивых людей, которых ... (не буду писать большинство, потому что не проверял :) ). Странные обороты можно встретить и у живых людей. Но как Вы сказали, наверное, это плохие писатели.
А по поводу того, что текст выглядит как будто переведён с английского - ну, так и гугл-переводчик до сих пор иногда очень смешно переводит. А когда-то смысл вообще меняется на противоположный. Можно зайти на сайт бронирования отелей, выбрать азиатскую страну и читать отзывы вместо анекдотов. Хотя у меня есть подозрение, что на всяких сайтах, где он используется, там какая-то устаревшая или облегчённая модель, потому что если вставить оригинал текста на сайте гугла, то уже выглядит получше. Но иногда и там смешно читать.
Так что скорее всего, нейронки просто надо заточить под русский язык. Вот только кто это будет делать на информации всего интернета?
По поводу точности - вот в этом действительно нет человечности. Человеку будет лень писать лишние запятые и цифры, поэтому он действительно округлит.

wsf
18.11.2025 08:01Читаю хабр с основания. Открывал главную, пробегал по заголовкам, и, если уж открыл статью, то в основном дочитывал до конца. Последние пару лет заметил как изменился подход к чтению, открываю сразу комментарии, если есть упоминание генеренки - вкладка сразу закрывается. Упоминание вида ии сделал что-то чатгпт придумал что-то и прочего в заголовке - включает режим баннерной слепоты.

Dkstr
18.11.2025 08:01Возможно, озвучиваемый порог слоп-фактора 0.5 может и не наступить...
Скрытый текст


ivanstor
18.11.2025 08:01К сожалению, часть описанных признаков обнаруживается при живом общении. С представителями нового поколения. И письменном, и устном. Особенно вот эти перескакивания с мысли на мысль, термины невпопад. И странное общее впечатление — рваной, но гладкой речи, с трудно уловимым смыслом.

varabyo
18.11.2025 08:01любовные страдания по А.
Будем надеяться, что А. это прочитает... Удачи вам! ❤️

vilgeforce
18.11.2025 08:01Вы говорите что никто про эти косяки не написал. А как много про них прочитали? Я вот вижу что-то шлакообразное - прохожу мимо. Даже минус нажать лень (тем более нет смысла в корпблоге)
YMA
Спасибо автору за статью, в которой рассуждается о различиях между текстами, написанными людьми и большими языковыми моделями (LLM). Автор справедливо отмечает, что люди-копирайтеры обычно не придумывают слова, а если и делают это, то осознанно. Максимум, на что они способны, — заменить одно слово на другое, чтобы не было откровенных повторений. LLM же комбинирует токены, для неё придумывание предложений близко к придумыванию слов.
Также автор обоснованно подчёркивает, что LLM не обладают сознанием или истинным пониманием, их «знания» — это статистические шаблоны. Модель воспринимает язык как сложный набор вероятностей и связей, извлечённых из обучающих данных.
Статья грамотно освещает особенности работы LLM и различия между текстами, созданными людьми и нейросетями, и заслуживает постановки плюса путем нажатия зеленой стрелочки, направленной вверх. :)))
janvarev
Вы хоть /s в конце ставьте, а то и перепутать недолго.... :)
(Мне пришлось вручную зайти в ваш профиль и посмотреть остальные комментарии, чтобы убедиться)
Femistoklov
Шутка слишком хорошо сделана, нейронки так не умеют.