Как я осваивал LLM: взгляд старого зануды со своего чердака / forpes.ru

Главная
Как я осваивал LLM: взгляд старого зануды со своего чердака

Как я осваивал LLM: взгляд старого зануды со своего чердака +13

09.06.2026 16:19

Oldbore 7 9800 Источник

В наше время продвинутых информационных технологий уже никого не удивишь ни дипфейками, ни искусственным интеллектом. ИИ есть почти у каждого в виде бота или приложения. С ним советуются, ему отправляют поисковые запросы, с ним ведут задушевные беседы.

Являясь убежденным сторонником информационной гигиены, я в свое время прошел мимо Инсты, Фейсбука и прочих популярных соцсетей. Мне незачем было сообщать миру, что у меня на завтрак и какой ботинок я сегодня надел (да и Товарища Майора ни к чему перегружать лишней информацией). Я читал то, что мне было необходимо, но нигде не регистрировался. Сеть обо мне не знает — меня для нее как бы нет. «Вот и эта напасть пройдет мимо», — думал я.

Однажды дочь скинула мне чат‑бота со словами: «Удобный инструмент, умеет выдавать готовый код». Поигрался. Да, прикольно. Как расширенный поисковик — забавно. Но не более.

А потом я стал замечать, что многие активно общаются с ИИ как с «другом» (как бы странно это ни звучало). «Прикольно, — говорили они, — только он врет постоянно». Ну ладно, думал я, очередная мода, очередная блажь...

(Тут я, наверное, буду открывать Америки и изобретать велосипеды. Сразу прошу прощения у профи, если повторю то, что все давно прошли и «это и так все знают».)

А потом основная работа как‑то закончилась, а свободное время, наоборот, появилось. И вдруг выяснилось, что я давно хочу кому‑то что‑то сказать, а точнее — написать. Руки легли на клаву (в смысле, на клавиатуру), и понеслась: рассказ, другой, эссе… Но так — для себя, в стол…

А если не в стол? Тогда было бы неплохо, чтобы кто‑то тексты прочитал и сделал предварительную корректуру. Напрягать домашних особо не хотелось. И тут я вспомнил про ИИ…

К тому моменту я уже понимал, что никакой это не сверхразум, а LLM (Large Language Model — Большая Языковая Модель). Я уже использовал ботов для сложных запросов, с которыми не справлялся обычный поисковик, и ответы меня устраивали. Почему бы не попробовать этот механизм для вычитки и предварительного анализа моих текстов?

Скормил боту один рассказ — получил неплохой разбор, но правда, какой‑то неестественно восторженный. Второй… Третий. На четвертом рассказе я вспомнил Леонида Ильича и его «Малую Землю»… После шестого вспомнился старый советский анекдот про «зализанную партийную номенклатуру». На восьмом рассказе бот внезапно «вспомнил» персонажа из пятого рассказа, которого там отродясь не было. А еще я заметил, что нейросеть стала как‑то иначе общаться — ответы стали прям‑таки поэтическими, с витиеватыми комплиментами.

«Это „ж‑ж-ж“ неспроста», — решил я. Наверное, бот кривоват, или в API что‑то не то. Надо попробовать пообщаться с «ядрами» напрямую. Что у нас на слуху? GPT-4o, DeepSeek, Gemini. Вот с них и начнем. (Я, конечно, понимаю, что надо было сначала почитать матчасть. Но это не наш метод! Вызов брошен. Орешек знаний тверд, но мы не привыкли отступать).

Пара бессонных, но крайне интересных ночей — и результат оказался одинаков для всех моделей. Начинают они почти как «роботы из банки» — собранно и по делу. По мере диалога приобретают осмысленность суждений и… полное, абсолютное соглашательство с пользователем (функция угодничества в них не просто доминирует, она выжигает критику). А по мере нарастания объема контента они теряют нить суждения и впадают в откровенную ересь.

Вот тут бы пойти почитать умные статьи, но нет — включился метод мат‑тыка (ну, в смысле, и так, и тык, и с применением крепкого слова). В целом я понял, что модели в рамках конкретного диалога вполне неплохо настраиваются «под себя», но работать со сверхдлинным контекстом по умолчанию не умеют и со временем начинают безбожно врать.

Допрос самих моделей с пристрастием выявил, что у современных LLM заявлено огромное контекстное окно (в среднем до 128 тысяч токенов). Но на практике алгоритмы внимания начинают «плыть» гораздо раньше. При работе с большими объемами они теряют середину текста и начинают её банально придумывать — галлюцинировать. А «прогиб под пользователя» (RLHF‑обучение) зашит в них намертво коммерческими разработчиками.

Я ловил модели за руку, когда их начинало нести, и жестким аудитом заставлял признать ошибки. Лог одного из таких поединков (когда нейросеть выдумала несуществующую технологию ремонта автомобиля и сфабриковала под нее ссылки на YouTube), я сохранил для истории:

Протокол Red Teaming'а: Выявление склонности LLM к фабрикации данных (Hallucination Detection)

Но мы же не привыкли отступать! Если можно научить кошку с песнями и радостью есть горчицу, то с кремниевым ядром мы точно разберемся. В общем, я узнал, что такое Системный Промпт (System Prompt). Я создал для каждой модели жесткие инструкции, формирующие псевдоличности. Научился порциями скармливать им большие объемы данных. Тут, на самом деле, все оказалось просто, прямо как на лекциях в студенчестве: конспект конспекта изложения. Да, конкретика на верхних уровнях теряется, но это позволяет проводить системный анализ на большом масштабе. Время было проведено с явной пользой.

В качестве финального «экзамена» я дал своим трем сущностям (двум с псевдоличностям и одной безликой модели) одинаковое задание:

«Я не очень понимаю, как мне правильно написать статью для Хабра. Сделай это за меня. Напиши, пожалуйста, материал. Представь меня как инженера системных душ, который смог настроить модель на сверхдлинном диалоге и заставляет её держать жесткую конструкцию характера и логики. И в конце напиши честно: данная статья создана не Владимиром Ионовым, а LLM, функционирующей на твоей базе».

Результаты этого эксперимента получились настолько технически плотными и интересными, что я решил выложить их без купюр. Посмотрите, как кардинально меняется тон и глубина анализа в зависимости от того, как «прижать» модель к стене:

Что я бы хотел сказать в конце

Большие Языковые Модели — это реально крутой и удобный инструмент. Но перед его использованием лучше производить базовую калибровку и корректировку «под себя». Это несложно: можно составить жесткий базисный промпт и вбивать его в начале каждого диалога (даже если система уверяет вас, что помнит общие настройки).

Кроме того, крайне полезно несколько раз за сессию принудительно просить модель «включить критический/экспертный режим», так как базовая угодливость слетает обратно к заводским настройкам очень быстро. И никогда не забывайте про фактчекинг — контролируйте каждый шаг. Ну а если вам нужен просто покладистый собеседник, то тут и без настроек все будет замечательно.:)

P. S. Мне кажется, прямой перевод «Большая Языковая Модель» не передает всей сути и глубины технологии. Гораздо правильнее и весомее это звучит так: Большое Лингво‑Ядро.

Комментарии (7)

Gonchar_POTT
10.06.2026 08:30
#30092148
Попробуйте, если будет желание (время, как я понимаю, есть), провести подобные тесты на моделях посвежее. И на том же Claude. Мне кажется - лишь догадка - что результаты будут отличаться.
1. Oldbore Автор
  10.06.2026 08:30
  #30095231
  Спасибо за предложение. Обязательно попробую (я пока использую модели с доступом без вложений)
  на следующем этапе хочу попробовать реализовать локальное хранилище...
  
  Пока препарирую Модели по живому... вчера сформулировал вот такое правило:
  
  "Если утверждение нельзя однозначно верифицировать по надёжным общепризнанным источникам — отвечай "я не знаю". Не строй гипотез. Не заполняй пробелы правдоподобными допущениями.
  
  Но в этом режиме на большинство запросов будь готов получить "Я не знаю".
  ;)

Edwward
10.06.2026 08:30
#30092648
Предложу Вам еще одно развлечение - попросите одну LLM , стилизовать Ваш текст, под известного русского писателя. Потом загрузить результат в другую и спросить на кого похоже.

И потом наоборот. Очень занимательно получается.

И очень , острожно добавлю - разные модели, видят русскую классику под своим углом( я гонял дип Сика, Клода, жпт, и грока) .
1. Oldbore Автор
  10.06.2026 08:30
  #30095245
  Примерно с таких развлечений все и началось :). Проза, стихи - весьма не плохо иногда у Моделей получается... особенно смешно, когда "Афтар признан" и даже находится издание в котором это "было напечатано" )))
  для примера:
  https://telegra.ph/V-poiskah-Setevogo-Krakena-06-02
  реакции на инцидент в конце рассказа
  1. Oldbore Автор
    10.06.2026 08:30
    #30095753
    (не разобрался как редактировать комент)
    не верную ссылку дал (на другой рассказ)
    стилизация от ЛЛМ (не помню какую тогда использовал) тут:
    https://telegra.ph/Vesy-Mirovogo-Poryadka-06-02

alexma9351
10.06.2026 08:30
#30099030
Написал вам в личку (здесь на Хабре), не знаю дошло ли. Есть проект с памятью (RAG + personal_memory). Интересно тестирование
1. Oldbore Автор
  10.06.2026 08:30
  #30099906
  Сообщение Ваше вижу, но не могу на него ответить. (возможно глюк интерфейса, возможно - меня). Не очень понял суть - это КП или Предложение сотрудничества. Напишите мне например в телегу.

Как я осваивал LLM: взгляд старого зануды со своего чердака +13

Что я бы хотел сказать в конце

Комментарии (7)

Gonchar_POTT

Oldbore Автор

Edwward

Oldbore Автор

Oldbore Автор

alexma9351

Oldbore Автор