Генерация тестовой документации с ИИ / forpes.ru

Главная
Генерация тестовой документации с ИИ

Генерация тестовой документации с ИИ +5

17.06.2026 10:46

alenameteneva 6 7400 Источник

Всем привет! Продолжаю цикл статей про применение ИИ в тестировании. В первой я рассказывала о том, зачем мы пошли в пилот по применению ИИ в тестировании. Во второй — как собирать контекст. В третьей — как тестировать требования, когда контекст уже готов.

Сегодня поговорим про следующий этап — генерацию тестовой документации: тест-кейсы, чек-листы, матрица покрытия и т.д. Небольшой спойлер: в конце статьи вас ждет ссылка на репозиторий с инструкциями и промтами.

Зачем вообще отдавать тест-дизайн нейросети?

Причины все те же:

Скорость — она реально чувствуется на объёмных требованиях. На маленькой фиче из двух абзацев вы потратите больше времени на промпт и контекст, чем сэкономите.

Детализация — модель учитывает в сценарии все мелочи из ТЗ и расписывает все подробнее. У тестировщиков часто не хватает времени на детализацию шагов и ожидаемых результатов. Опытные инженеры многое держат в голове, но это потом больно аукается, когда "носитель знаний" уходит из команды или когда нужно онбордить нового человека. Времени на онбординг всегда мало, и детальные тест-кейсы могут снять часть нагрузки с ментора.

Формат под TMS — если прописать четкие правила по итоговому формату, на выходе можно получить не простыню текста в чате с ИИ, а файлы, которые реально импортировать в вашу TMS.

Какая информация нужна для старта?

Если вы воспользовались советами из моих предыдущих статей, то к этому моменту у вас уже есть контекст продукта и требования по фиче , протестированные и исправленные аналитиками в случае необходимости. К этому нужно добавить следующие документы:

Правила написания тест-кейсов, основанные на стандартах, принятых в вашей компании или команде:

где хранятся кейсы (у нас это Zephyr);
как формулировать шаги и ожидаемые результаты;
насколько детальными должны быть тестовые данные;
нужно ли указывать окружение или предусловия и для каких кейсов;
особые условия (например, точный текст ошибки в негативных кейсах);
какие есть ограничения и антипаттерны (не делать отсылки к другим кейсам, не использовать условную логику в шагах и т.д.).

Эталонный тест-кейс — один «идеальный» пример. Я выгружала его из Zephyr в CSV формате: модель легко читает csv и сразу видит реальные поля и стиль описания шагов, а не выдумывает свой шаблон.

Базовый сценарий. Не обязательно, но желательно для тех задач, если фича продолжает уже знакомый путь. Например, в калькуляторе страховой премии пользователь идет по экранам постепенно. И разработка тоже ведется постепенно от первого экрана к последнему. Когда у меня есть готовые тест-кейсы для первого экрана, я даю их нейросети для генерации тестов на последующие экраны. Если у меня уже есть идеально описанные шаги, то зачем просить нейросеть сделать ту же работу дважды? Если подумать, то мы тоже при написании новых кейсов часто клонируем старые и корректируем их или дополняем новыми условиями. С ИИ этот принцип тоже работает. К тому же, такой подход унифицирует документацию и уменьшает вероятность ошибок.

Пошаговая инструкция

Шаг 1. Собрать входные файлы в одну папку

Контекст, требования по задаче, правила, эталонный тест-кейс и, при необходимости, базовый сценарий. Чем меньше модели приходится догадываться, тем меньше «творчества» будет в ее ответе.

Шаг 2. Подготовить промпт

Беру готовый шаблон и подкручиваю под продукт или прошу ИИ собрать промпт под конкретную задачу. Второй вариант обычно быстрее и удачнее. В промпте фиксирую: какие файлы на входе, какие артефакты на выходе, ограничения (не выходить за рамки ТЗ, не придумывать данные, не ссылаться на другие кейсы).

Промпт у меня не статичный. После каждой итерации, где что-то пошло не так, я прошу поправить сначала документацию, потом сам промпт, чтобы на следующей задаче уже не наступать на те же грабли.

Шаг 3. Запустить генерацию

Загружаю файлы, даю задачу вроде «выполни задание из файла …» и жду.

С тем промтом, который я использую сейчас, у меня получается такой набор документации:

Use cases в формате .md — этот документ я проверяю первым. По нему сразу видно, как модель поняла требования и какие сценарии выделила. Если use cases написаны неправильно, то дальше проверять бессмысленно, и я возвращаюсь к контексту или промпту. Пример use cases:

End-to-end тесты в формате .md — подробные е2е тесты для вдумчивого ревью: все шаги, все тестовые данные, детальные ожидаемые результаты.

Пример тест-кейсов, сгенерированных ИИ по заданным правилам и шаблону:

Чек-лист в формате .md — позитивные и негативные проверки по элементам или компонентам. Также подлежат тщательной проверке тестировщиком.

Матрица покрытия в формате .csv — исключительно для проверки того, что все требования покрыты тестами.

У вас может быть свой набор выходной документации.

Шаг 4. Ревью

Про ревью уже немного написала в предыдущем пункте. Что важно: ревью должен делать опытный специалист, который мог бы написать то же самое самостоятельно, просто потратил бы на это больше времени. Если с ИИ работают джуны — финальное ревью должны выполнять миддлы и сеньоры. Иначе ошибки модели быстро станут «официальной документацией».

Ну и в целом принцип ревью один и тот же: если вы нашли у ИИ ошибку из-за недостатка информации, нужно дополнить требования или контекст. Если вы понимаете, что ошибка из-за неточного промта, то правите промт. Если же во время ревью вы понимаете, что модель делает что-то наперекор инструкциям, просто спросите у нее, почему она так делает. Чаще всего вы получите внятный ответ и сможете скорректировать задачу. У меня однажды было такое, что ИИ долго выдавал мне тест-кейсы, написанные не в соответствии с моими требованиями. После каждой итерации я добавляла в промт новый запрет, но это не помогало. В конце концов, я задала вопрос агенту "Ты что, вообще не читаешь мои инструкции?". На что он мне ответил: "Читаю, но там уже так много запретов и указаний, как НЕ надо делать, что я не понимаю, как НАДО делать". В общем, оказалось, что ИИ лучше работает с позитивными установками, чем с негативными, и я теперь стараюсь не забывать об этом.

Шаг 5. Итерации

Сколько итераций надо сделать, прежде чем остановиться и сдаться? У меня правило такое: если я уже потратила больше времени на задачу с ИИ, чем у меня ушло бы вручную, и при этом я не получила ни одного приемлемого результата, я делаю вывод, что эту задачу лучше оставить человеку. Если же я получала хорошие ответы, но они были нестабильны, то я делаю паузу и возвращаюсь к задаче позже.

Ну, а еще бывает, что контекстное окно чата забито под завязку. Новый чат или короткое саммари часто помогают в этой ситуации.

Шаг 6. CSV и импорт в Zephyr

Когда мое ревью и правки окончены и качество артефактов меня устраивают, я прошу ИИ перевести кейсы и чек-листы в формат CSV под наш Zephyr.

Тут ничего сложного нет - достаточно один раз выгрузить тест-кейс из Zephyr, проанализировать соответствие полей и прописать все в промте. Вот небольшой пример:

Precondition: заполняется только в первой строке тест-кейса, если предусловия указаны в тест-кейсе. Для остальных шагов поле Precondition остаётся пустым.
Steps: один шаг — одна строка. Нумерация шагов внутри каждого тест-кейса должна начинаться с 1 для каждого нового тест-кейса.
Test Data: заполняется, если есть тестовые данные для шага.
Test Type: всегда "E2E".
Automation: всегда "To be automated".

После того как формат подобрали, ИИ быстро превращает текстовые тесты в csv, а импорт в Zephyr у меня занимает меньше минуты. Пару раз при импорте у меня получалась ерунда, например, каждый шаг e2e-теста становился отдельным тест-кейсом. Причина оказалась банальной: в CSV название кейса (поле Name) должно быть указано только в строке первого шага. Если продублировать поле Name в каждой строке — Zephyr плодит отдельные кейсы.

Что в итоге

На этапе написания тестовой документации ИИ может дать едва не лучший буст по скорости, особенно если у вас большой объем документации, сложный тест-дизайн или много однотипных кейсов. Но залогом хорошего результата всегда остаются два компонента: качественные входные данные и обязательное ревью.

В следующей статье цикла я начну рассказывать о генерации автотестов с помощью ИИ, и о том, почему получилось не сразу.

И обещанный бонус: в этом репозитории лежат более подробные инструкции и примеры промптов для использования ИИ в тестировании.

Комментарии (6)

anonymous
18.06.2026 01:50
#30123686

AlexeyChijov
18.06.2026 01:50
#30124492
Понравился репозитории (ссылка на который в конце статьи), где лежат инструкции и примеры промптов для использования ИИ в тестировании.

An_Streine
18.06.2026 01:50
#30125344
Статья довольно интересная, правда есть несколько вопросов:
- Есть ли замер времени написания тест-кейса с помощью ИИ и middle QA?(допустим у вас 2-3 итерации правки тест-кейса)
- А не страдает ли уровень знания продукта QA специалистами, при таком подходе?(потому что чаще щупается ИИ чем продукт/документация)
- Как происходит поддержка тест-кейсов при таком подходе?
1. alenameteneva Автор
  18.06.2026 01:50
  #30126062
  На одном тест-кейсе замера не было, потому что по одному кейсу мы не пишем, да и в целом понятно, что подготовка промта и документации займет больше времени) Я брала для сравнения однотипные UI компоненты с примерно одинаковой логикой и количеством полей (например, компоненты “Страхователь” и “Застрахованный” в онлайн калькуляторе страховки). По одному компоненту писала тест-кейсы и чек-листы сама, по другому с ИИ. При ручном подходе вычитывание требований, тест-дизайн, написание кейсов и чек-листов в Zephyr (не самый удобный, на мой взгляд, инструмент) заняло 6 часов. При подходе с ИИ я потратила 1.5 часа на генерацию тест-кейсов, ревью, правки и импорт в зефир. При этом, я получила на выходе более подробную документацию, готовую для автоматизации также с помощью ИИ. Последний пункт важен, потому что когда мы пробовали ИИ для написания автотестов, то быстро поняли, что все упирается в подробные тест-кейсы - если они написаны для ручников и в них не хватает каких-то шагов (очевидных для погруженного QA-инженера, но неизвестных для ИИ), то и нейронка напишет нерабочие автотесты. А если кейсы изначально максимально детальные, то автоматизация с помощью ИИ тоже будет легкой и быстрой. Ну, а детальность не в ущерб времени можно как раз получить при генерации с ИИ.
  
  Как я уже писала выше, во-первых, использовать ИИ в полной мере стоит только тем специалистам, которые погружены в продукт. И, будем честны, мало у кого есть максимально подробная документация на проекте. То есть человеку все равно всегда приходится быть в теме, чтобы “докармливать” ИИ контекстом. Если у вас грамотно выстроен shift-left, есть такие активности, как 3 амиго или PBR, на которых детально обсуждаются все постановки, то уровень знаний QA специалиста не должен пострадать из-за того, что он использует ИИ для генерации тест-кейсов.
  
  Поддержка - в смысле актуализация? Можно по-разному к этому подойти, но я бы советовала время от времени также привлекать ИИ к оптимизации тестовой модели. Например, можно выгрузить все тест-кейсы из вашей ТМС, положить к ним все актуальные требования и попросить ИИ сформировать отчет о том, какие кейсы устарели, какие противоречат друг другу, в каких не хватает деталей и т.п. Именно сформировать отчет ,а не переписывать сразу все кейсы) А потом уже постепенно проверять, все ли корректно подсветила нейронка и понемногу заниматься актуализацией. Я постараюсь на эту тему отдельную статью написать, где уже более детально все распишу. Но верхнеуровнено подход именно такой. А будет это все осуществляться полностью автоматизированно,с частичной автоматизацией или вообще вручную, зависит от того, какие вам доступны инструменты.

fedyapetukhov09
18.06.2026 01:50
#30129804
Вместо ускорения тут легко получить обратное, много времени уходит на сбор контекста, правила, промпты и бесконечные правки. По факту ты просто переносишь работу тестировщика в формат настрой ИИ и контролируй его, а не реально сокращаешь объём.
1. alenameteneva Автор
  18.06.2026 01:50
  #30130506
  Если изначально с документацией все плохо, то это тормозит любого тестировщика, хоть с ИИ, хоть без. Что делает QA, когда требования от аналитиков - это три строчки в задаче? Идет разговаривать с этим аналитиком, чтобы узнать больше деталей. Идет разговаривать с разработчиком, чтобы узнать, правильно ли он понял аналитика и что он вообще реализовал. То есть точно также собирает контекст. А если тестировщику не все равно, то он потом сам же еще и пишет эту документацию вместо аналитиков, чтобы было хоть что-то, на что можно будет опереться в будущем. Учитывая то, что тестировщик уже потратил кучу времени на то, чтобы собрать всю информацию, не вижу ни единой причины, почему ему не стоит попробовать сэкономить себе время за счет ИИ хотя бы на тест-дизайне или написании тест-кейсов.
  
  Если же документация есть, то собрать ее в кучу - это лишь вопрос техники. Я в своих статьях рассматриваю самый топорный метод - когда документация выгружается ручками. Это может занимать разное количество времени в зависимости от того, как она у вас вообще огранизована и в каком объеме. Но это не требует каких-то особенных знаний и навыков и доступно вообще любому пользователю.
  Для более продвинутых юзеров всегда можно предложить вариант с mcp, через который можно будет получать доку из Confluence по одному запросу, с каким-нибудь RAG и прочими крутыми штуками. Но это требует других ресурсов, согласований внутри компании, договоренностей с ИБ и т.п.
  
  Безусловно, всегда можно получить обратный эффект. В моей практике были задачи, с которыми ИИ так и не справился нормально, и я просто вычеркнула их из списка) Но все, что касается анализа и обработки текста, у меня при правильном подходе с ИИ получается намного быстрее, чем вручную.
  
  Я хочу показать, что любой тестировщик может облегчить себе работу, если поймет, в чем его боль и подумает, как можно с ней справиться с помощью какого-нибудь ИИ-инструмента.
  
  P.S. Изначально, моя самая большая боль была даже не в сфере тестирования - а в сфере создания презентаций) ну ненавижу я PowerPoint и все подобные штуки. А время от времени все равно приходится делать презентации для демо или просто для руководства. Если раньше я руками презентацию делала по 4-5 часов, то потом появилась Gamma и сейчас это занимает 5-15 минут. И вот с помощью одного инструмента я освободила большой кусок времени. А если найти в своей рабочей рутине штук 5 таких дел, которые можно покрыть нейронками, то можно наконец найти время для чего-то более интересного для вас лично)