Привет, Хабр!
Думаю, уже многие из вас используют (или использовали) ChatGPT в своей работе. И все, кто использовал её в производственных целях, мог заметить, насколько много ошибок может допускать нейросеть.
ChatGPT: Как и зачем
ChatGPT нередко может помочь в решении рутинных задач. Например, нейросеть можно использовать для написания текстов, генерации кода, анализа документов, анализа данных, оказания "консультационных услуг". Делается это просто: мы пишем текстовый запрос, при необходимости прикрепляем файл, отправляем запрос и ждём ответ.
Схематично взаимодействие с ChatGPT (или другой генеративной моделью) выглядит так:
Но ответ не всегда может нас устраивать. Тогда мы пишем уточняющий запрос, чтобы получить ответ, который нас удовлетворит:
И вот, отправив ряд уточняющих запросов, мы получаем результат, который нас удовлетворяет!
В данной статье будут рассмотрены некоторые ошибки, с которыми мне довелось столкнуться, и способы их избежать, используя как можно меньше уточняющих запросов. При этом описанные рекомендации применимы не только для перечисленных кейсов. Придерживаться их стоит всегда.
Странные сообщения, оторванные от реальности
Когда приходится использовать ChatGPT, чтобы сгенерировать длинный и политкорректный текст, можно увидеть результаты, которые не совсем сходятся с реальностью.
Например, нам нужно пригласить коллег на встречу для обсуждения рабочих задач.
Конечно, хочется отправить очень простой запрос для получения ответа, который можно будет скопировать, используя сочетание клавиш Ctrl+C, а после вставить в приглашение, перейдя к волшебным Ctrl+V.
Что может быть проще в данной ситуации, чем:
И мы получим вполне ожидаемый, но не совсем удовлетворяющий нас ответ:
Прочитав ответ нейросети, можно понять, что его практически невозможно использовать для копипаста. Он очень холодный и оторванный от реальности. Непонятно, какие материалы должны подготовить коллеги, зачем их готовить, и нужно ли вообще это активное обсуждение, о котором говорится в ответе? Конечно, можно написать ещё один запрос, в котором мы подробнее опишем ситуацию. И получим на него более располагающий к себе ответ. Но нам, конечно же, хочется использовать как можно меньше запросов. В чём же причина такого поведения нейросети?
Причина получения такого ответа заключается в том, что в запросе не был задан контекст. Если бы мы написали более подробный промт, то обязательно получили бы результат, который нас устроил. Но что же писать в этом самом "подробном промте"?
Для того, чтобы понять это, необходимо самому ответить на следующие вопросы:
Что необходимо сделать нейросети?
Что я хочу получить в результате?
Каким я хочу видеть результат?
Какие есть факторы, которые нужно учесть при выполнении поставленной задачи?
Ответив на эти вопросы, мы сможем задать контекст, опираясь на который, нейросеть сможет сгенерировать нужный нам ответ.
Если бы мы иначе написали изначальный запрос:
То получили бы куда более подходящий для нашей ситуации ответ:
Чтобы получать удовлетворяющие нас ответы, необходимо как можно подробнее описывать контекст и точно обозначать, что мы хотим видеть в качестве результата.
Несуществующие документы
Когда приходится сталкиваться с документами государственного образца - нередко можно начать замечать, что аналитик превращается в юриста. Какие-то стандарты отменили, какие-то претерпели изменения, а какие-то вовсе были заменены. Когда консультант плюс не может дать быстрый и понятный ответ, очень хочется обратиться к ChatGPT.
Один из таких документов - «Инструкция по проектированию зданий и помещений для электронно-вычислительных машин» (СН 512-78). Он был отменён и нужно узнать, каким документом (или документами) он был заменён, чтобы указать в документации ссылки на актуальные государственные документы.
И вот мы пишем заветный запрос:
Получаем, казалось бы, отличный ответ:
Хоть бери и вставляй ссылку в документацию! Но есть нюанс:
ГОСТ Р 56939-2016 - вовсе не "Здания и помещения для электронно-вычислительных машин. Общие технические требования". Потому что ГОСТ с этим номером - "Защита информации. Разработка безопасного программного обеспечения. Общие требования". Хотя бы что-то связанное с разработкой ПО, и на том спасибо...
Вывод: ChatGPT очень плохо умеет работать с государственными документами, если вы их не отправляете файлами для анализа. Если вы используете ChatGPT, всегда проверяйте результаты! Особенно если речь идёт о работе с документами.
Итого
ChatGPT, как и многие генеративные нейронные сети, можно сравнить с Джинни из мультфильма про Аладдина.
Они выполнят те задачи, которые вы поставили. Но выполнит так, как они их интерпретировали. И так, как они умеют :)
Поэтому:
Описывайте задачу как можно подробнее, задавая контекст для нейросети. Чем подробнее контекст, тем выше качество интерпретации запроса нейросетью.
Всегда проверяйте результаты. Они могут казаться правильными, но это далеко не всегда так.
Комментарии (5)
beskov
25.05.2024 07:34+1по поводу документов
ваша статья стремительно устаревает, прямо сейчас ChatGPT 4o выдаёт ответДокумент «Инструкция по проектированию зданий и помещений для электронно-вычислительных машин» (СН 512-78) был заменен СП 118.13330.2012 «Свод правил. Общественные здания и сооружения. Правила проектирования». Этот свод правил содержит актуализированные нормы и требования к проектированию зданий и помещений, в том числе для размещения электронно-вычислительных машин.
так что вы опять потеряли контекст — к какой версии относится ваш текст
beskov
25.05.2024 07:34по поводу вывода «Вывод: ChatGPT очень плохо умеет работать с государственными документами»
вы привели один пример, для того, чтобы делать выводы о статистических явлениях, нужно делать статистические наблюдения
независимо от того, какой вы аналитик, это бытовые, минимальные знания о природе вещей, построении выводов и статистической оценке, которые не требуют ни высшего образования ни спецкурсов
beskov
25.05.2024 07:34+1Когда приходится сталкиваться с документами государственного образца
Документы гособразца — это документы, шаблоны которых нормированы государственными НПА. А тут у вас речь про сами НПА.
beskov
По поводу контекста
В заголовке не указано, какому аналитику — маркетинговому аналитику, финансовому аналитику, аналитику данных. Так что это устойчивая проблема и дело не в ИИ, а в привычках человека.
beskov
но не зря ИИ OpenAI — это именно диалоговая система, поэтому нормально и правильно, что вы уточняете не только контекст, но вообще что угодно.