Приветствую тебя, дорогой читатель!
Данный очерк будет посвящен тому, насколько скользкой может оказаться дорожка использования LLM-инструментов при написании повествовательной статьи.
Начнем с того, что меня подвигло к ее написанию и тематики статьи: изложение персонального опыта путешествия в IT-индустрию в качестве работы. Я давно планировал это сделать и все откладывал, при этом я понимал, что мой опыт может быть интересен паре-тройке человек, и, может, для кого-то он послужит одним из камешков в фундаменте накопления уверенности, чтобы ступить и сделать существенный шаг в сторону обучения одной из IT-профессий. Моя история связана с накоплением знаний, навыков и опыта собственными усилиями в новой для себя сфере, в моем случае — бизнес- и системном анализе. Если коротко, не имел навыков и технического бэкграунда, изучил относительно небольшой объем "базы" — и ринулся набирать практику — и в относительно небольшие сроки имел работу, которая позволяла быть "свободным", т.е. непривязанным к месту, с доходом, который позволял активно пользоваться этой самой свободой, периодически организовывая поездки и путешествия в разные места нашей и не только родины и при этом совмещать это с работой, иными словами — не брать отпуск.
"Так себе затея — вещать о нечто подобном на технически-ориентированной платформе в виде habr.com", — могут подумать многие из вас, и, возможно, будут правы. Легко могу это парировать тем, что все, что происходит в нашей с вами общей "ноосфере" в мире IT, даже уже — в мире IT-найма — является частью общей картины, и данная информация может иметь прикладной характер также для апологетов сферы, чей уже весьма токенизированный ум невозможно взбудоражить простыми человеческими разговорами, если они не содержат явно выраженной прикладной ценности, желательно в цифрах.
Круто. Как это все связано с использованием LLM-модели при написании текста? Примерно таким же образом, как Марс связан с Юпитером: обе — планеты, но не более.
Как итог, прошлая моя статья была написана при помощи LLM-модели, а именно — Claude 3.5 Sonnet. Отличная модель, кстати, единственная явно наступающая на пятки GPT-4. Я начал писать ее также, как и эту, но на полпути к завершению решил скормить ее модели и посмотреть, что получится, заодно попросив обогатить аллегориями и добавить чуть больше легкости к прочтению. Как итог — пронумерованные списки, буллиты и стиль изложения как в назойливой рекламе. "То, что надо!" — подумал я и продолжил скармливать попутно написанные оставшиеся части текста в эту Черную дыру Обработки естественного языка. Как результат — пост статьи на habr.com и, мягко говоря, смешанное восприятие статьи.
Комментарии от явных неновичков дали понять, что пост был расценен как полностью сгенерированный ChatGPT или схожей моделью. И сложно с кем-то спорить, что как только ты столкнешься пару-тройку раз с материалом, написанным в схожей стилистике, начиная от формата (пресловутые буллеты и списки) и заканчивая задорными вопросами читателю, то твой когнитивный аппарат распознает подобный текст на раз-два, хоть с 0-shot :)
В целом, чем осведомлённее мы становимся в разрезе LLM-моделей, тем больше возникает настороженность насчет контента, который потребляем. Ведь с каждым днем количество сгенерированного контента становится всё больше, вероятно, даже кратно, и процент человеческого вклада в пост-обработку данного контента также пропорционально сокращается. Вопрос, когда эта настороженность начнет перерастать в легкую тревожность, а далее... даже загадывать не берусь. В любом случае, всё это связано с негативной эмоцией при восприятии контента, а этого мало какой создатель контента бы захотел. И пусть сейчас это относительно небольшое количество людей, наиболее продвинутых, так скажем, гиков в своих сферах. Но количество людей, легко распознающих сгенерированный текст даже на подсознательном уровне, вероятно, будет увеличиваться все больше с каждым днём. Тем более на такой платформе как Хабр, где, по сути, концентрация людей, которые "чуть больше" в некотором плане, когда речь заходит про использование технологий.
Заключение
Здесь коротко — пишите текст сами, а то засыпят минусами :)
P.S. Данная статья была написано при помощи Claude 3.5....для проверки грамматики
Комментарии (16)
vindy
03.11.2024 04:21У меня нет никакой обширной статистики, но лично для меня ллм статья - это сразу блэклист автора. Если человек не готов вложить в продукт больше усилий, чем несколько промптов, почему я должен тратить свое время на чтение этой жижи? Кроме того, на моральном уровне это глубоко нечестно, что-то вроде скачанного из интернета реферата в школе. Извините, если это как-то пафосно звучит, но лично у меня к авторам таких статей отношение как к цыганам, заворачивающим кусочки кала в фантики, и пытающимся их продать (да, внимание читателя - это деньги).
4wards1
03.11.2024 04:21Данная статья была написано при помощи Claude 3.5....для проверки грамматики
Просто великолепно. Грамматика проверена на 5+. И пунктуация тоже.
gun_dose
03.11.2024 04:21Я не могу понять, в чём смысл писать статьи с помощью ИИ? Я так понимаю, люди пишут статьи, когда у них есть какие-то мысли, которыми они хотят поделиться. А если человек не в состоянии сам выразить свои мысли, то кому это в принципе может быть интересно? В общем, моё мнение, что статьи, написанные с помощью ИИ - это мусор, а те, кто их публикуют - мошенники.
Informatik
03.11.2024 04:21Если статья годная, то абсолютно неважно как она написана с ИИ или без. И наоборот, если статья отстойная, то ее не оправдывает то что она написана натуральным кожаным мешком. ИИ всего лишь инструмент для письма, также как и калькулятор для счета.
David_Osipov
Ааа, благо я в это почти попал. Для себя я хотел разобраться в способах реминерализации зубов, поэтому нашёл всеми правдами и неправдами 51 научную работа по этой теме и скормил AI. После многих-многих циклов фактчекинга и полировки, думал заделиться этим и с Хабром. Однако, благо, администрация Хабра предупредила, что скорее всего, даже если материал годен, то сам факт использования AI может разгневать людей. От публикации я отказался, может опубликую в vas3k в ближайшее время.
rsashka
Так рассматривайте этот текст только как заготовку и сделайте рерайтинг полученного материала, в чем дело?
David_Osipov
Если сделать качественно, то придётся прочитать 50 научных статей и сделать рерайт. А если менее трудозатратно, то просто подбить текст под свой стиль без перепроверки по 50 статьям. Первый вариант крайне трудозатратен с неясным выхлопом, а второй вариант будет ли нормален для Хабра?
rsashka
Но вы же уже это сделали, разве не так?
David_Osipov
Да, но фактчекал с помощью ИИ на низкой температуре много раз.
Hardcoin
Скорее имитация, чем фактчекинг. Вы сами-то для себя доверяете полученным выводам?
David_Osipov
Вполне. Каждую секцию текста я прогонял циклы фактчекинга, пока при высокой и низкой температуре ИИ больше не мог предложить резонные исправления. Я не совсем уверен в верности референсов, но в верности фактов - вполне.
GennPen
Низкая температура уменьшает рандомизацию в ответах. Но это не означает что ИИ выдаст верный ответ.
Balling
Да что там писать. Nano-MHAP лучше и всё?
David_Osipov
Скорее это статья про обзор всех новых методов реминерализации с объяснением принципов работы, плюсами и минусами, рисками. Включая, конечно же, Nano-MHAP