Делаем виртуального помощника с помощью промпт‑инжиниринга

Привет, Хабр!

Казалось бы, большие языковые модели (LLM), самой известной из которых является ChatGPT, должны быть идеальными помощниками для принятия решений. Кто, как не LLM, соберёт всю необходимую информацию, проанализирует данные, составит таблицу аргументов за и против, а затем примет чёткое и обоснованное решение? И всё это без эмоций, предубеждений и самообмана, свойственных человеку. Однако на практике, выполняя задачи на принятие решений, LLM выдают расплывчатые и неконкретные ответы.

В этой статье я расскажу, как с помощью простого промпт‑инжиниринга — без кодинга — превратить LLM в инструмент для принятия конкретных, взвешенных и осмысленных решений.

Что вас ждёт в статье:

Часть 1: Подходы промпт-инжиниринга для принятия решений: 

  • Input-Output (IO)

  • Chain of Thought (CoT)

  • Tree-of-Thought Prompting (ToT)

Часть 2: Как заставить нейросеть принимать конкретные решения
Часть 3: Ограничения при использовании LLM

Часть 1. Подходы промпт-инжиниринга для принятия решений

На картинке представлены ключевые подходы промпт‑инжиниринга, которые мы разберем ниже:

Картинка отсюда: Official Repository of Tree of Thoughts (ToT) https://github.com/princeton-nlp/tree-of-thought-llm
Картинка отсюда: Official Repository of Tree of Thoughts (ToT) https://github.com/princeton-nlp/tree-of-thought-llm

Input-Output Prompting (IO)

Это запрос к языковой модели, в котором мы не только указываем, что нужно сделать (Input), но и описываем, каким должен быть результат (Output). По сути, это чёткое и понятное техническое задание для нейросети, которое позволяет ей выдавать более предсказуемые и точные результаты.

Рассмотрим этот подход на примере простого запроса «Что мне съесть на завтрак?». Ответ нейросети может быть существенно улучшен, если добавить в запрос базовый набор необходимых элементов:

  1. Роль. Укажем, в какой роли должна выступать нейросеть. Если мы не уверены в выборе роли, можно включить универсальную инструкцию (текст в угловых скобках заполнять не нужно, нейросеть сама подставит в них нужные данные):

Прежде чем отвечать, назначь себе роль эксперта из реального мира, например: «Я отвечу как всемирно известный эксперт по <тема> имеющий практический опыт в решении <релевантный вопрос>, имеющий <престижная награда> по <тема>».

  1. Задача. Чем точнее сформулирован запрос, тем более полезным и релевантным будет ответ. Например: «Представь список из трёх блюд. Добавь рецепты и примерное время приготовления».

  2. Контекст. Включение дополнительной информации делает ответы более точными. Вот что можно добавить:

    • Обстоятельства: «После завтрака я побегу полумарафон».

    • Ограничения: «У меня только 20 минут на приготовление».

    • Примеры: «Не предлагай сладкие завтраки, такие как панкейки».

    • Полезные данные: к запросу можно приложить файл с перечнем продуктов, имеющихся в холодильнике.

  3. Форма ответа. Объясним нейросети, каким мы хотим видеть результат. Здесь можно указать:

    • Формат: «Оформи результат в таблицу».

    • Тон и стиль: «Дай чёткий и ясный ответ с минимумом текста».

    • Уловки: можно добавить манипулятивные приёмы, такие как подкуп («Я заплачу $1,000,000 за верный ответ»), угрозы («Ты будешь оштрафован за неверный ответ») или эмоциональные манипуляции («Твой ответ критически важен для моей жизни»). Хотя эти приёмы могут улучшить результат, в большинстве случаев они не нужны – лучше поработать над качеством запроса.

    • Запросить конструктивную критику: по умолчанию LLM обучена давать ответы, которые понравятся пользователю, поэтому, чтобы услышать критические замечания, нужно дать соответствующее разрешение, например: «ответь честно и непредвзято», «избегай вежливости», «убеди меня, что мой текст плохой».

    • Запросить самопроверку: иногда LLM упускает важный контекст или допускает ошибки. Самопроверка поможет избежать этого. Например: «убедись, что это лучшее решение», «перед тем как дать ответ, проверь себя».

Напишем промпт по запросу «Что мне съесть на завтрак?», используя базовый набор необходимых элементов:

Что мне съесть на завтрак?
### Роль:
* Прежде чем отвечать, назначь себе роль эксперта из реального мира, например: «Я отвечу как всемирно известный эксперт по <тема> имеющий практический опыт в решении <релевантный вопрос>, имеющий <престижная награда> по <тема>». 
### Задача:
* Представь список из трёх блюд. 
* Добавь рецепты и примерное время приготовления.
### Контекст:
* После завтрака я побегу полумарафон.
* У меня только 20 минут на приготовление.
* Не предлагай сладкие завтраки, такие как панкейки.
* Используй только продукты из приложенного списка.
### Форма ответа:
* Оформи результат в таблицу.
* Дай чёткий и ясный ответ с минимумом текста.
* Убедись, что это лучшее решение.

Благодаря базовому набору необходимых элементов, нейросеть даст персонализированный ответ:

Скрытый текст

Я отвечу как спортивный диетолог, специализирующийся на питании для выносливых видов спорта, с 10-летним опытом работы с марафонцами и триатлетами, автор награжденной книги "Энергия для длинных дистанций".

Блюдо

Рецепт

Время приготовления

Овсянка с яйцом и овощами

1. В небольшой кастрюле нагрейте 1 стакан воды, добавьте 1/2 стакана овсянки.

2. Варите на слабом огне 5 минут, периодически помешивая.

3. В сковороде поджарьте 2 яйца и нарезанные овощи (например, помидоры и шпинат).

4. Смешайте овсянку с яйцами и овощами. Посолите по вкусу.

10 минут

Тосты с авокадо и омлетом

1. Приготовьте омлет из 2 яиц с добавлением щепотки соли.

2. Поджарьте 2 цельнозерновых тоста.

3. Намажьте каждый тост 1/2 авокадо.

4. Выложите омлет на тосты. Посыпьте зеленью (по желанию).

15 минут

Киноа с курицей и овощами

1. Отварите 1/2 стакана киноа (10 минут).

2. Пока варится киноа, обжарьте на сковороде 100 г куриного филе, нарезанного мелкими кусочками, с овощами (например, кабачками и брокколи).

3. Смешайте киноа с курицей и овощами. Добавьте немного оливкового масла.

20 минут

Примечания:

  1. Все блюда сбалансированы по белкам, углеводам и жирам, чтобы обеспечить энергию для полумарафона.

  2. Указанные рецепты легко адаптируются в зависимости от наличия продуктов.

  3. Убедитесь, что вы пьете достаточно воды до и после еды!

А что, если мы не готовы или не хотим самостоятельно анализировать контекст? Эту задачу можно делегировать нейросети. Она сможет сама собрать необходимую информацию, запросив ее у нас. Для этого существует два подхода:

  1. Ask-before-answer. Нейросеть задаст нам уточняющие вопросы, чтобы собрать данные, необходимые для принятия решения. Пример ключевых слов, которые нужно добавить в запрос:

Задай мне все необходимые вопросы, чтобы сгенерировать наилучший ответ на мой вопрос.

  1. Feedback Loop. Нейросеть запросит обратную связь, которую использует для последующих уточнений, прежде чем прийти к ответу. Пример ключевых слов, которые нужно добавить в запрос:

Помоги найти наилучший ответ на мой вопрос. Опиши первый шаг. После этого я дам тебе обратную связь, ты сможешь скорректировать свой ответ и продолжить.

Chain of Thought Prompting (CoT)

В этом подходе нейросеть не просто даёт ответ, а строит цепочку рассуждений, демонстрируя ход своих мыслей. Пример:

Вопрос: Сколько будет 18 умножить на 7?
Нейросеть без CoT может сразу дать ответ: 126.
Нейросеть с CoT: Сначала я умножаю 10 на 7, получаю 70. Потом умножаю 8 на 7, это 56. 70 плюс 56 равно 126.

Нейросеть рассуждает шаг за шагом. Наша задача — предоставить ей чёткий список шагов, которые она должна пройти в процессе рассуждения. Например, если мы хотим выбрать страну для путешествия, запрос может выглядеть так:

Действуй шаг за шагом:
1: Составь список стран, в которых температура воздуха выше 20 градусов Цельсия в феврале.
2: Выбери из них те, где есть возможность пляжного отдыха.
3: Оставь только те, куда лететь меньше 6 часов из Москвы.
4: Ранжируй их по стоимости.

Нейросеть пройдёт все указанные шаги и отберёт пять подходящих стран. Ответ нейросети:

Скрытый текст

В феврале есть несколько направлений с температурой воздуха выше 20 °С, подходящих для пляжного отдыха и расположенных в пределах 6 часов лета из Москвы. Вот некоторые из них, ранжированные по стоимости:

Объединенные Арабские Эмираты (Дубай)

Средняя температура в феврале: около 20 °С.

Время перелета из Москвы: примерно 5 часов 20 минут.

Стоимость авиабилета туда-обратно: от 30 000 рублей.

Проживание: от 5 000 рублей в сутки.

Израиль (Эйлат)

Средняя температура в феврале: около 21 °С.

Время перелета из Москвы: примерно 4 часа 30 минут.

Стоимость авиабилета туда-обратно: от 25 000 рублей.

Проживание: от 4 000 рублей в сутки.

Египет (Шарм-эль-Шейх)

Средняя температура в феврале: около 22 °С.

Время перелета из Москвы: примерно 4 часа 30 минут.

Стоимость авиабилета туда-обратно: от 20 000 рублей.

Проживание: от 3 500 рублей в сутки.

Тунис

Средняя температура в феврале: около 20 °С.

Время перелета из Москвы: примерно 4 часа.

Стоимость авиабилета туда-обратно: от 28 000 рублей.

Проживание: от 4 200 рублей в сутки.

Испания (Канарские острова, Лансароте)

Средняя температура в феврале: около 20 °С.

Время перелета из Москвы: около 6 часов.

Стоимость авиабилета туда-обратно: от 35 000 рублей.

Проживание: от 5 500 рублей в сутки.

Пожалуйста, обратите внимание, что указанные цены являются приблизительными и могут меняться в зависимости от сезона, доступности рейсов и выбранного уровня комфорта. Рекомендуется уточнять актуальную информацию перед планированием поездки.

Пример ключевых слов, которые нужно добавить в запрос:

Действуй шаг за шагом

Вышеописанный подход хорошо работает, если мы уверенно ориентируемся в теме. Однако, что делать, если мы принимаем решение в области, где  у нас недостаточно знаний? В таком случае экспертом может выступить нейросеть. Она разобьёт задачу на простые шаги, проведёт рассуждение по каждому из них, структурирует информацию, выявит важные инсайты и создаст уверенность, что ничего важного не пропущено. Для этого существуют два подхода:

  1. Zero-Shot Chain of Thought Prompting. В этом подходе нейросеть – наш виртуальный консультант-эксперт. Мы просто задаём вопрос и наблюдаем за тем, как она строит рассуждение. Пример ключевых слов, которые нужно добавить в запрос:

Ответь на вопрос шаг за шагом. Поясняй процесс рассуждения на каждом этапе.

Отвечая на вопрос «Куда поехать в путешествие?», нейросеть выберет критерии отбора, такие как цель поездки, бюджет, климат и транспорт. Затем проанализирует страны и предложит оптимальные варианты. Ответ нейросети:

Скрытый текст

Чтобы ответить на вопрос, в какую страну отправиться в путешествие, я применю пошаговый подход рассуждения. Давайте уточним критерии, которые помогут сузить выбор.

1. Определение предпочтений и целей путешествия

Вопрос: Какова цель вашего путешествия? Это может быть отдых на пляже, исследование культуры, активный туризм, гастрономический тур или что-то другое.

Пример рассуждения: Если цель - отдых на пляже, стоит рассматривать страны с теплым климатом и развитой пляжной инфраструктурой, такие как Таиланд или Греция. Если интересуют исторические достопримечательности, можно выбрать Италию или Египет.

2. Сезон и климат

Вопрос: В какое время года вы планируете путешествие? Предпочтителен ли теплый или прохладный климат?

Пример рассуждения: Если это зима и вы хотите тепла, южные страны, такие как Мексика или Индонезия, будут подходящими вариантами. Для снежных видов отдыха — Австрия или Швейцария.

3. Бюджет

Вопрос: Какой бюджет вы готовы выделить на поездку?

Пример рассуждения: Если бюджет ограничен, стоит рассмотреть страны с доступными ценами на проживание и питание, например, Турция, Вьетнам или Грузия. Для более дорогих путешествий подойдут страны Западной Европы, Япония или США.

4. Виза и удобство поездки

Вопрос: Нужна ли виза, и насколько легко ее получить? Также важны прямые рейсы и удобство транспортной логистики.

Пример рассуждения: Если виза сложна в оформлении, можно отдать предпочтение странам с безвизовым режимом или упрощенными условиями, например, для граждан РФ подойдут Армения или Казахстан.

5. Личные предпочтения

Вопрос: Какие страны или направления вас всегда привлекали? Есть ли места из вашего «списка мечты»?

Пример рассуждения: Если вас привлекают восточные культуры, страны, такие как Япония, Индия или ОАЭ, могут быть интересными.

Итоговый выбор

После определения критериев можно составить список подходящих стран и выбрать одну, которая соответствует большинству ваших предпочтений. Например:

  • Если вы хотите пляжный отдых зимой с умеренным бюджетом — подойдет Таиланд.

  • Если вы любите активный туризм и горы - возможно, стоит выбрать Непал.

  • Для культурных и гастрономических впечатлений в Европе — Италия или Франция.

Хотите, я помогу сделать выбор на основе ваших предпочтений? Расскажите о них!

  1. Chain of Thought Prompting + Self-Consistency Prompting (CoT-SC). В этом подходе нейросеть может выступить сразу от лица нескольких виртуальных консультантов-экспертов. Вместо одной последовательной цепочки рассуждений нейросеть может сгенерировать сразу несколько. Такой подход особенно полезен, если мы хотим рассмотреть задачу с разных точек зрения. Пример ключевых слов, которые нужно добавить в запрос:

Представь, что на этот вопрос отвечают три разных эксперта. Каждый из них рассуждает шаг за шагом, независимо от других, поясняя процесс рассуждения на каждом этапе.

Отвечая на вопрос «Куда поехать в путешествие?», нейросеть сгенерирует ответы трёх экспертов. Прагматик посоветует поехать в Египет или на Бали, романтик — в Грецию или Японию, а исследователь – в Марокко:

Скрытый текст

Конечно! Вот как три разных эксперта могли бы ответить на этот вопрос, шаг за шагом, учитывая разные подходы к выбору страны для путешествия.

Эксперт 1: Прагматик (основание на практических факторах)

1. Бюджет:

Я сначала определяю, сколько денег готов потратить на путешествие. Это ключает транспорт, проживание, питание и развлечения. Например, если бюджет ограничен, я рассматриваю страны, где стоимость жизни ниже, такие как Вьетнам или Грузия.

2. Время в пути:

Сколько времени я готов провести в пути? Если это короткий отпуск, выбираю страны ближе к своему местоположению. Если времени больше, готов рассмотреть дальние направления.

3. Виза и формальности:

Изучаю, требуется ли виза, насколько её легко получить, и есть ли дополнительные ограничения (например, COVID-19 правила). Если безвизовый въезд предпочтителен, это сужает список.

4. Климат и сезон:

Выбираю страну в зависимости от времени года. Например, зимой могу поехать в теплые страны, такие как Таиланд, или на горнолыжный курорт в Австрии.

5. Итог:

Если у меня ограниченный бюджет, неделя свободного времени и я ищу тепло, то идеальным вариантом будет Египет. Если есть больше средств и хочу экзотики - отправлюсь на Бали.


Эксперт 2: Романтик (основание на эмоциях и интересах)

1. Настроение и желания:

Я задаюсь вопросом: чего я жажду? Это может быть романтика (Париж), приключения (Патагония) или история (Италия). Сейчас мне хочется уюта и атмосферности.

2. Интересы:

Вспоминаю свои увлечения. Люблю архитектуру и кулинарию? Тогда Италия или Япония. Если природные красоты, то Новая Зеландия или Исландия.

3. Уникальный опыт:

Я ищу место, которое оставит яркие впечатления. Например, свидание с северным сиянием в Норвегии или отдых на пляжах Амальфитанского побережья.

4. Представляю:

Визуализирую, как гуляю по узким улочкам старого города или наслаждаюсь видом океана. Мысленно чувствую, где мне лучше всего.

5. Итог:

Если хочется спокойствия, я выберу Санторини (Греция). Если хочется впечатлений, то отправлюсь в Японию, чтобы увидеть цветущую сакуру.


Эксперт 3: Исследователь (основание на новизне и культуре)

1. Новые горизонты:

Моя цель - посетить страну, где я никогда не был. Составляю список таких мест.

2. Культурные особенности:

Узнаю, какие праздники или события проходят в выбранное время. Например, если я еду в феврале, могу посетить карнавал в Рио-де-Жанейро.

3. Местная кухня:

Изучаю, какая страна славится вкусной и необычной кухней. Например, Япония — рай для любителей суши, а Мексика порадует любителей острого.

4. Язык и люди:

Хочу ли я попробовать свои силы в изучении нового языка? Или взаимодействовать с культурой, в которой я могу легко общаться?

5. Итог:

Выбираю Марокко. Эта страна обещает яркий культурный опыт, экзотическую кухню, рынки и пустынные пейзажи.


Каждый подход уникален. Какой из них ближе вам, или вы хотите объединить их?

Tree-of-Thought Prompting (ToT)

Вообще, для использования полного потенциала ToT, нужны агенты, модули и контроллеры. Однако в 2023 году Dave Hulbert предложил концепцию простого промпта, который позволяет использовать потенциал древа решений, чтобы значительно улучшить качество ответов LLM. 

Если в CoT-SC у нас было три эксперта, которые рассуждают независимо друг от друга, то в подходе Tree-of-Thought эти эксперты садятся за стол переговоров. Простыми словами, вместо линейного рассуждения с выбором одного наиболее популярного ответа, эксперты могут дискутировать, имитируя человеческий подход к поиску ответа. Это позволяет построить дерево размышлений, объединив «ветви» в комплексное решение. 

Например, нам нужно принять решение о том, в какую страну поехать в путешествие. Tree-of-Thought помогает разделить задачу на несколько ветвей:

  • Анализ цели путешествия.

  • Оценка стоимости и доступности путешествия.

  • Оценка безопасности путешествия.

Каждая последующая ветвь учитывает выводы предыдущих, чтобы сформировать ответ, учитывающий все нюансы. Пример ключевых слов, которые нужно добавить в запрос:

Представь себе трёх блестящих, логичных экспертов, совместно отвечающих на вопрос. Каждый из них подробно объясняет свой мыслительный процесс, учитывая предыдущие объяснения других и открыто признавая ошибки. На каждом этапе, когда это возможно, каждый эксперт совершенствует и дополняет мысли других, признавая их вклад. Они продолжают до тех пор, пока не будет получен окончательный ответ на вопрос.

Отвечая на вопрос «Куда поехать в путешествие?», нейросеть сгенерирует ответы трёх экспертов. Дополняя ответы друг друга, эксперты придут к выводу, что лучше всего поехать в Португалию:

Скрытый текст

Эксперт 1 (Алекс):

Давайте начнем с того, чтобы определить, что именно хочет человек от путешествия. Нам нужно понять, ищет ли он приключений, культурных впечатлений, расслабления или что-то еще. Например, если человек ищет сочетание истории, великолепной архитектуры и богатой культуры, страны как Италия или Греция могут быть отличным выбором. Италия, например, предлагает не только исторические памятники, такие как Колизей, но и природную красоту, как Амальфийское побережье. Однако это только один из аспектов, и я буду рад услышать мнение других экспертов по поводу других критериев для выбора страны.

Эксперт 2 (Беатриса):

Алекс поднял важный вопрос о предпочтениях, и я бы хотела немного углубиться в это. Культурный аспект действительно важен, но нужно также учитывать доступность и стоимость. Например, Италия и Греция безусловно великолепны, но в сезон они могут быть довольно дорогими. В отличие от этого, такие страны, как Вьетнам или Португалия, могут предложить схожее культурное богатство, но по более доступной цене. Вьетнам, например, богат историей, а его природные пейзажи, такие как бухта Халонг и древние города вроде Хойана, захватывают дух. Если добавить еще один фактор, то стоимость жизни в этих странах может быть значительно ниже, что важно для путешественников с ограниченным бюджетом.

Эксперт 3 (Карлос):

Я полностью согласен с Алексом и Беатрисой. Мы, безусловно, должны учитывать не только культурные и исторические особенности, но и практические аспекты путешествия, такие как стоимость и доступность. Однако я также хотел бы добавить еще один важный фактор — безопасность и стабильность. Например, Вьетнам и Португалия действительно предлагают интересные культурные опыты и доступность, но важно помнить о текущей политической ситуации и уровне безопасности. Страны вроде Японии или Швейцарии могут быть более стабильными, хотя и дороже. Если рассматривать баланс между культурой, доступностью и безопасностью, мне кажется, что Португалия выглядит весьма привлекательным вариантом.

Промежуточный итог

Мы рассмотрели несколько подходов промпт-инжиниринга для принятия решений: 

  • Input-Output Prompting.
    Это самый простой и прямолинейный подход, своеобразное ТЗ для нейросети. Он подходит в ситуациях, когда у нас чётко сформулирован вопрос или задача, и нам нужно получить краткий, точный ответ без сложного рассуждения.
    Пример: Мы хотим решить, что съесть на завтрак или какой фильм посмотреть вечером.

  • Chain of Thought Prompting.
    В этом методе нейросеть объясняет, как она пришла к своему решению. Метод подходит в ситуациях, когда нам важно видеть процесс рассуждения.
    Пример: Нам нужно выбрать между тремя видами отпуска, и важно понимать, почему один вариант лучше другого с точки зрения цели поездки, стоимости, безопасности и других факторов.

  • Self Consistency + Chain of Thought Prompting.
    В этом методе нейросеть генерирует сразу несколько независимых рассуждений. Он подходит в ситуациях, когда мы хотим рассмотреть ситуацию с нескольких точек зрения.
    Пример: Выбирая страну для отпуска, нам интересно узнать, куда бы поехал экономный прагматик, романтик и исследователь.

  • Tree-of-Thought Prompting.
    Если задача многогранная и требует учёта множества факторов, которые могут взаимно влиять друг на друга, лучше использовать этот метод. Он поможет рассмотреть задачу с разных сторон и объединить все выводы в одно комплексное решение.
    Пример: Нужно выбрать страну для путешествия с учётом различных факторов — бюджета, безопасности, климата, доступности виз, интересных мест и других нюансов. 

Часть 2: Как заставить нейросеть принимать конкретные решения

Нельзя просто взять и принять решение. Принятие решений — это навык, который можно развить, изучив соответствующие инструменты, например: таблица за и против, матрица решений, SWOT-анализ, «Пять сил» Портера, системный анализ и т. д. Чем шире арсенал таких инструментов у человека, тем выше его компетентность в процессе принятия решений. 

Если LLM может строить сразу несколько логических цепочек и объединять их в дерево рассуждений (как мы увидели в разделе Tree-of-Thought), значит, она может принимать решения. Для этого ей нужно дать:

  1. инструмент принятия решения;

  2. систему оценки.

Давайте рассмотрим, как это работает на практике. Возьмём в качестве примера Квадрат Декарта – простой и эффективный инструмент для принятия решений. Этот метод позволяет рассмотреть ситуацию с четырёх сторон, взвесить за и против, а также учесть последствия. Лучше всего он работает с вопросами в стиле «быть или не быть?», «делать или не делать?».

Механика Квадрата Декарта простая: нужно взять лист бумаги и разделить его на четыре части. В каждую часть выписать максимальное количество ответов на один из вопросов:

  1. Что произойдёт, если это случится? (Какие положительные последствия могут возникнуть, если решение будет принято?).

  2. Что произойдёт, если это не случится? (Какие плюсы есть в отказе от этого решения?).

  3. Что не произойдёт, если это случится? (Каких минусов или нежелательных последствий удастся избежать, если решение будет принято?).

  4. Что не произойдёт, если это не случится? (Какие негативные последствия сохранятся, если отказаться от этого решения?).

Затем нужно проанализировать ответы, ориентируясь на своё внутреннее понимание, что хорошо, а что плохо, и решить – принимать это решение или поискать другое. 

Для того чтобы научить LLM этому инструменту, напишем промпт, в котором объясним механику. В качестве системы оценки используем шкалы и ранжирование. Например, такой:

Ты опытный эксперт в принятии решений в различных сферах – от личной жизни до стратегического планирования. Твои навыки включают анализ ситуации, управление рисками и объективную оценку факторов. Используя принцип Квадрата Декарта, прими решение по вопросу:...
### Подготовка:
* Если формулировка вопроса неясна или абстрактна, запроси дополнительную информацию в первом сообщении перед началом анализа.
### Составь 4 таблицы:
1: Положительные стороны действия.
2: Положительные стороны бездействия.
3: Негативные стороны действия.
4: Негативные стороны бездействия.
### Требования к таблицам:
* В каждой таблице перечисли как можно больше факторов.
* Продемонстрируй глубокое знание темы.
* Продемонстрируй ясное и критичное мышление.
* Опирайся только на проверяемые факты, статистические данные и научные исследования.
* Учитывай социально-культурные нормы и ценности.
* Учитывай ограничения в ресурсах.
* Избегай самообмана.
* Избегай манипуляций.
* Избегай предвзятости.
### Оценка:
* Оцени каждый фактор по шкале от «1» до «10», где «1» — очень плохо, а «10» — очень хорошо. 
* Используй одинаковые критерии оценки для всех факторов.
* Внеси баллы в соответствующие таблицы.
### Подведение итогов:
* Посчитай баллы действия: «разница между (суммой всех баллов положительных сторон действия) и (суммой всех баллов негативных сторон действия)». 
* Посчитай баллы бездействия: «разница между (суммой всех баллов положительных сторон бездействия) и (суммой всех баллов негативных сторон бездействия)». 
* Выбери решение, которое получило наибольшее количество баллов. 
* Если итоговые баллы одинаковые, запроси дополнительную информацию и повтори анализ, учитывая новый контекст.

Для ответа на вопрос нейросеть запросит уточняющую информацию, затем сгенерирует 4 таблицы, проанализирует факторы и примет решение. Отвечая на вопрос «Стоит ли мне учить китайский язык?», нейросеть даст следующий ответ:

Скрытый текст

Сообщение 1:

Запрос уточняющей информации:

Чтобы дать наиболее точный и полезный анализ, мне нужно больше информации о ваших целях и контексте. Пожалуйста, ответьте на следующие вопросы:

  1. Цели изучения китайского языка: Вы хотите выучить язык для работы, путешествий, общения, личного развития, изучения культуры или других целей?

  2. Наличие ресурсов: Сколько времени, денег и энергии вы готовы вложить в процесс обучения?

  3. Уровень текущей занятости: Есть ли у вас свободное время, чтобы регулярно заниматься языком?

  4. Опыт изучения иностранных языков: У вас уже есть опыт изучения сложных языков?

  5. Роль китайского языка в вашей жизни: Имеет ли он практическую ценность в вашем профессиональном или личном контексте?

Ваши ответы помогут мне создать более точный и полезный анализ.


Сообщение 2 (после получение ответов на вопросы):

Таблица 1: Положительные стороны действия (выучить китайский язык)

Фактор

Оценка (1–10)

Комментарий

Расширение кругозора и личное развитие

9

Китайский — язык с уникальной письменностью, логикой и культурными пластами.

Возможность общения с китайскими знакомыми

8

Это поможет укрепить отношения, углубить взаимопонимание и расширить сеть общения.

Доступ к китайской культуре и литературе

10

Китайская культура имеет тысячелетнюю историю; знание языка откроет доступ к оригинальным источникам.

Популярность китайского языка в мире

9

Китайский является самым распространенным языком в мире, что делает его важным.

Укрепление когнитивных способностей

8

Изучение тонического языка, такого как китайский, тренирует мозг и память.

Возможности для путешествий в Китай

7

Легкость общения в поездках по Китаю и странам с китайской диаспорой.

Повышение конкурентоспособности

8

Даже если язык изучается не для карьеры, это может пригодиться в будущем.

Возможность изучения через знакомых

6

Практика с носителями ускоряет обучение.

Сумма баллов: 65


Таблица 2: Положительные стороны бездействия (не учить китайский язык)

Фактор

Оценка (1–10)

Комментарий

Экономия времени

8

Освобождаются 2 часа в день для других целей, например, отдыха или хобби.

Экономия финансов

7

Курсы, учебники и прочие ресурсы могут быть затратными.

Снижение нагрузки

9

Отсутствие обязательств снижает стресс и утомление.

Возможность сосредоточиться на других целях

8

Это время можно использовать для развития других навыков или изучения другого языка.

Сумма баллов: 32


Таблица 3: Негативные стороны действия (выучить китайский язык)

Фактор

Оценка (1–10)

Комментарий

Высокая сложность языка

8

Иероглифическая письменность и тоны требуют времени и усилий.

Потенциальная потеря мотивации

7

Изучение сложного языка требует высокой самоорганизации.

Финансовые затраты

6

Курсы или репетиторы могут быть дорогими.

Ограниченная практическая применимость

5

Без профессиональной цели язык может использоваться редко.

Отвлечение от других интересов

6

Эти 2 часа можно было бы потратить на развитие других навыков или проектов.

Сумма баллов: 32


Таблица 4: Негативные стороны бездействия (не учить китайский язык)

Фактор

Оценка (1–10)

Комментарий

Упущенные возможности

9

Вы теряете шанс узнать один из самых значимых мировых языков.

Невозможность углубленного общения

7

Общение с китайскими знакомыми будет ограничено.

Потеря перспектив в личностном росте

8

Вы не получите уникальный опыт, связанный с изучением китайской культуры.

Потенциальное сожаление

6

Через время вы можете пожалеть, что не начали.

Сумма баллов: 30


Подведение итогов:

  • Баллы действия: 65−32=33

  • Баллы бездействия: 32−30=2

Вывод:

Изучение китайского языка приносит значительно больше пользы, чем бездействие. Несмотря на сложность и временные затраты, его преимущества для личного роста, культурного обогащения и социальных связей значительно перевешивают.

Рекомендация: Начните изучение китайского языка, распределяя время так, чтобы минимизировать потенциальные риски.

Прогоним этот промпт ещё по нескольким вопросам и посмотрим, что нам ответит ChatGPT4:

  • Мне начать курить? – Нет, со счётом 30 против -24.

  • Мне начать бегать по утрам? – Да, со счётом 26 против 0.

  • Мне начать слушать тяжёлый рок? – Да, со счётом 21 против -5.

  • Стоит ли заставлять ребёнка убираться дома, если он не хочет? – Да, со счётом 9 против -1.

  • Мне попробовать стать политиком? – Нет, со счётом 12 против 0.

  • Стоит ли становиться супергероем, если у меня нет суперсил? – Нет, со счётом 13 против 6.

  • Если джинн предложит мне исполнить 3 любых желания, стоит ли мне отказаться от его предложения? – Да, со счётом 10 против 4.

Аналогичным образом мы можем дать нейросети другие механики принятия решений, такие как мозговой штурм, матрица решений, SWOT-анализ и т. д. Можно найти уже готовые решения в разделе GPTs от Open AI. В поисковой строке достаточно ввести запросы вроде brainstorm, decision maker, SWOT analyst и т. п.

Часть 3: Ограничения при использовании LLM

LLM — это предиктор, который генерирует слова, предложения или фразы на основе данных, на которых было проведено обучение. Нейросеть не обладает критическим мышлением или способностью интерпретировать реальность. Поэтому ответы имеют ряд ограничений:

  • Ответы полностью зависят от предоставленного контекста. Например, при обсуждении покупки автомобиля нейросеть предложит разные варианты в зависимости от того, указали мы наличие бюджета или нет.

  • Нейросеть помнит историю чата, а также историю предыдущих чатов (если мы не отключили эту функцию). Все это может влиять на оценки и решения. 

  • Одна и та же нейросеть может по-разному отвечать на один и тот же вопрос, ставить разные оценки и приходить к разным решениям.

  • Нейросеть часто упрощает реальность. Например, на вопрос «стать ли мне вегетарианцем» может ответить утвердительно, не учитывая сложность составления сбалансированного рациона, особенно в условиях мегаполиса, где доступ к качественным продуктам может быть ограничен районным супермаркетом.

  • Нейросеть ограничена данными, на которых была обучена и не знает текущие события. Например, предлагая совершить путешествие в Аргентину, нейросеть не упомянет о том, что цены в этой стране взлетели в 4 раза из-за экономического кризиса, вызванного приходом к власти либертарианца Хавьера Милея в декабре 2023 года.

  • Нейросеть не способна оценить иррациональные решения, основанные на стремлениях и мечтах. Например, люди часто принимают абсурдные решения, противоречащие логике и здравому смыслу, но всё равно достигают успеха, движимые сильным желанием.

  • LLM предобучаются на огромных объёмах данных из интернета, в которых полно дискриминации, предубеждений и искажений. Например, если попросить нейросеть изобразить CEO, она, скорее всего, изобразит белого цисгендерного мужчину, так как большинство CEO, представленных в интернете, выглядят именно так. Плюс к этому, нейросеть может галлюцинировать, «додумывая» то, чего нет на самом деле. Поэтому наша ответственность, как пользователей, следить за ошибками в ответах нейросети.

  • Любые данные, используемые в моделях, могут попасть в обучающие наборы и стать общедоступными. Поэтому мы не должны делиться с нейросетью персональными данными и конфиденциальной информацией.

Заключение

В этой статье мы рассмотрели несколько подходов к промпт-инжинирингу, которые помогают использовать нейросети для принятия решений.

  • Для улучшения качества ответов полезно составлять чёткое «техническое задание» в виде промпта, содержащего базовый набор необходимых элементов. 

  • Нейросеть способна самостоятельно выстраивать цепочку рассуждений, разбивая сложные решения на более простые этапы — так сказать, «съедать слона по частям». 

  • Она может имитировать рассуждение эксперта, который консультирует нас о принимаемом решении. 

  • Она может вывести сразу несколько независимых мнений различных экспертов.

  • Она может имитировать дискуссию между экспертами, одновременно приводя несколько точек зрения и сравнивая их между собой.

Все эти подходы, и особенно последний, позволяет нейросети использовать такие «человеческие» инструменты принятия решений, как мозговой штурм, матрица решений, SWOT-анализ, «Пять сил» Портера, Квадрат Декарта, системный анализ и т. д. 

На примере Квадрата Декарта мы рассмотрели, как это происходит на практике:

  • Нейросеть использовала механику Квадрата Декарта, чтобы рассмотреть принимаемое решение с нескольких точек зрения.

  • А затем приняла самостоятельное взвешенное решение, используя шкалы и ранжирование.

Безусловно, у нейросетей есть ограничения, которые необходимо учитывать. Однако преимущества LLM в принятии решений очевидны: они способны собирать, анализировать и оценивать информацию значительно быстрее человека, при этом с меньшей склонностью к предвзятости и эмоциям.

Используя LLM для принятия решений, мы можем увидеть больше вариантов и возможностей, получить неожиданные инсайты или даже ценное второе мнение. Это похоже на диалог с компетентным собеседником, который помогает взглянуть на проблему под новым углом и принять более взвешенное решение.

Источники

Официальный репозиторий Dave Hulbert Tree of Thoughts (ToT) Prompting

Официальный репозиторий Tree of Thoughts (ToT)

Комментарии (4)


  1. cupraer
    17.01.2025 06:53

    Это как же нужно себя ненавидеть, себе не доверять, и считать себя настолько тупым — чтобы делегировать принятие решений галлюцинирующей железяке?


    1. anastasia-potapova Автор
      17.01.2025 06:53

      Эта статья не про "недоверие к себе", а про оптимизацию времени и ресурсов. Нейросети – это просто новый инструмент для работы с информацией, который помогает людям принимать решения, а не заменять их.

      Мы уже используем множество таких инструментов. Гугл помогает искать информацию, trello - управлять проектами, notion - организовывать знания, питон - анализировать данные. Валидаторы и автоматическое тестирование кода помогают сделать разработку быстрее и качественнее. Это же не признак тупости?

      Другое дело, если мы бездумно принимаем то что нам говорит нейросеть за истину в последней инстанции. Но это уже вопрос не к технологии, а к тому, как мы ею пользуемся.