Прочитал с утра очередной пост на Хабре, как можно неправильно использовать LLM. Я отношусь к Моделям достаточно утилитарно - как к инструменту. Я не пытаюсь найти в них сознание, так как довольно хорошо представляю устройство вычислительной техники и то, как она выполняет программы. Поэтому каждая публикация с посылом "смотрите, Модель делает чушь" для меня сродни откровениям человека, попытавшегося вырезать ровный круг из оконного стекла при помощи молотка и получившего груду осколков в результате.

Это очень короткая статья про то, чем отличаются молотки от LLM.

Прямое управление

Молотки, отвёртки, топоры, бензопилы и автомобили с самолётами - это всё инструменты с прямым управлением. Вне зависимости от своей сложности они управляются человеком через воздействие на сам инструмент (молоток) либо на органы управления (руль, педали, штурвал, рычаги, кнопки, ...).

Ловкость пользования такими инструментами зависит, как правило, от навыков конкретного человека, улучшаемых через практику обращения с конкретным инструментом. Сложные инструменты, типа автомобиля или самолёта, требуют постепенного и продолжительного освоения и покоряются не всем представителям рода человеческого. Некоторые даже управление автомобилем считают чем-то непостижимым, сродни лёгкому шаманству.

Непрямое управление

LLM устроена так, что она даёт разные ответы на один и тот же вопрос. Могла бы давать один и тот же ответ, но даёт разные, потому что так захотели создатели этого инструмента.

Тем не менее, мы можем примерно, а при необходимости и довольно точно, добиваться от моделей желаемого для нас поведения. Например, такой промпт:

Замени во фразе "мама мыла раму" слова "Мама" на "Маша", а "раму" на "Рому". Результат выведи одной строкой без кавычек.

даёт однозначный результат (проверено в ChatGPT, DeepSeek, Gemini, Grok):

Маша мыла Рому

Непрямое управление отличается от прямого тем, что вам нужно создавать такие условия для объекта управления, чтобы он сам принимал решение о достижении нужных вам целей.

Если сравнивать с компьютерными играми, то это как StarCraft (прямое управление) и SimCity (непрямое управление). В первом случае вы сами создаёте юниты и задаёте им цели, во втором - создаёте условия через развитие городской инфраструктуры для появления в игре "юнитов".

Суть непрямого управления моделями - в создании такого контекста, который приведёт модель к нужному вам результату. Вы не можете "рулить" моделью, но вы можете создать такой "рельеф", что модель докатится в нужную вам точку назначения сама.

Модель - это инструмент

Чтобы использовать инструмент нужно выполнить два условия:

  1. иметь цель, соответствующую возможностям инструмента;

  2. иметь начальные навыки использования инструмента;

LLM (большие языковые модели) - это текстовые процессоры. Есть модели, которые работают с изображениями - это другое. Не нужно ожидать от текстовых процессоров, что они создадут незабываемую мелодию. Это настолько же непрактично, как стричь газон отвёрткой. Возможности LLM - обработка текста. Всё. Не надо говорить с Моделью "по-душам" или пытаться влюбиться в неё или влюбить Модель в себя. Дайте Модели текст и попросите её вернуть текст - она справится с этим.

Теперь про навыки. Самое главное в любой модели - это размер выходного контекста. Это максимальный объём текста, который вы сможете получить в качестве результата для одного запроса. Если вам непонятно, почему этот параметр - самое главное, - идите разбирайтесь с устройством моделей. Второй по важности параметр - общий объём контекста.

Вот эти два параметра и определяют возможности модели, как инструмента.

  1. Общий размер контекста ограничивает ваши возможности, как пользователя инструмента, в части (непрямого) воздействия на инструмент.

  2. Размер выходного контекста ограничивает возможности инструмента (и ваши ожидания) в части формирования (текстового) результата.

Если вы понимаете эти два момента, то вы сможете сформировать свой запрос к Модели гораздо лучше, чем его сформировал герой этого поста про CUDA на Linux Ubuntu и GPT-5 Pro.

Заключение

Модели - это обычные инструменты с несколько необычным режимом использования. Вместо того, чтобы давать "прямые инструкции" для достижения нужных пользователю целей, оператор Модели задаёт контекст (создаёт условия), в котором Модель сама стремится достигнуть этих целей.

В этом отношении особенности пользования инструментами-моделями ничем не отличаются от особенностей пользования инструментами-людьми. Чтобы добиться от людей достижения нужных вам целей, также нужно создавать условия, чтобы люди сами шли к вашим целям. Например, выдавая им зарплату за достижение целей и премию за скорость их достижения.

Если у вас есть навыки управления людьми, вам будет довольно просто использовать модели. Принципы управления людьми и моделями очень похожи.

Комментарии (0)