Аннотация

В первой части серии статей я рассуждала о том, от чего зависит выбор тестов. Имея в голове понимание того, что вы хотите добиться тестированием, можно делать следующий шаг — выбирать тесты. Для этого надо понимать, какие тесты бывают вообще.

Почти все статьи, посвященные видам тестирования, имеют группировку тестов по каким-нибудь категориям. Только это деление не везде совпадает. Вчитываясь в такие статьи, нередко обнаруживаешь расхождение терминологии у разных авторов.

Я ставлю перед собой цель разложить по полочкам, визуализировать многообразие тестов, чтобы помочь тем, кто выбирает, какие тесты им нужны, и тем, кто изучает само тестирование.

Я не берусь давать четкие определения видам тестирования в этой статье. Об интерпретации терминов, используемых для названия видов, речь пойдет в третьей части. Связано это разделение с объемом информации.

Классификация видов тестирования


На виды тестов можно посмотреть с разных сторон. И классифицировать их также сложно, как, например, кулинарные блюда. Можно группировать блюда по принадлежности к национальной кухне, можно по времени приема (на завтрак, на обед, на ужин), можно по используемым ингредиентам, можно по калорийности и так далее. Сами продукты — тоже можно разделять на группы по различным критериям. При этом все понимают, что стейк может быть ужином, при этом он не перестает быть мясным блюдом и вызывать споры о принадлежности к национальной кухне. Так и тесты — регрессионный тест может быть интеграционным.
Принадлежность к одной категории не исключает принадлежность к другой.

Другой пример — жирной пищей можно назвать и блюдо, и продукт — чебурек и растительное масло. Тестом на уязвимость может быть набор автоматизированных сценариев и один тест кейс в наборе функциональных приёмочных тестов формы ввода.
Вид теста — это характеристика, которой может обладать как отдельный тестовый сценарий, так и целая коллекция тестов.

Смотрите какой милый майнд мап с видами вина:
вина
Казалось бы, он полностью охватывает все виды вин. А теперь посмотрите на него еще раз и перечислите вина по странам производства, как они расставлены в супермаркете или в меню ресторана. Не получается? А как же тогда выбирать? Эта карта не подходит для выбора по производителям. Если присмотреться внимательнее — там есть приписка «по стилю и вкусу».

Вот так же и с видами тестов.
Ограничиваясь 1 критерием группировки, мы упускаем из виду все разнообразие тестов.

А критерий группировки может является ключевым критерием выбора.

Карта видов тестирования


Мне нравится подход, что использовался в статье про тестирование ПО на Википедии, поскольку рассмотрено большое множество разрезов.

Я взяла этот список за основу и дополнила информацией, почерпнутой из других источников и личного опыта и составила майнд мап (карту знаний). Мне эта карта бывает полезна в процессе планирования тестов — я проверяю, не забыла ли я чего. Делюсь схемкой с вами:

image

Посмотреть в полном размере.
Скачать исходник в формате xmind можно тут.

Названия тестов приведены на английском, чтобы избежать неточности перевода.

Цветокоды

  • Голубым выделены характеристики, применимые к тестовым наборам
  • Желтым выделены характеристики, применимые только к тест кейсам
  • Зелёным выделены универсальные характеристики

Это разделение условно, могут быть исключения.

Про желтые блоки в карте знаний

Глядя на мою карту, можно подумать, что разделение тестов по видам сценариев — не так уж важно. На деле конкретных тест кейсов в разы больше, чем наборов, и
упустив какой-то вид, вы теряете кучу ценных проверок, а, значит, и дефекты.


Виды тестов, которые перечислены в узле «Сценарии» — это на самом деле названия методик подготовки сценариев. Соблюдение этих методик дает на выходе конкретные тесты. Поэтому, на мой взгляд, уместно приводить их как виды тестов.

Упомянутые методики принято считать видами тестов Черного ящика. Почему эти тесты на моей схеме не относятся к Black Box? Потому что даже тестируя спецификацию надо думать о том, что будет, если ввести значение больше допустимого, и как должна система реагировать на ошибки вообще. Об этом надо думать и при написании unit-тестов, которые к Black Box никак не относятся.

Про зелёные блоки в карте знаний

На самом деле эти названия — это виды требований. Тесты, покрывающие конкретный вид требования, логично называть тестами этого требования. Большинство названий тестов, помещенных в голубые блоки — тоже вылезло из названий требований. Например, «приложение должно быть отказоустойчивым» порождает тесты отказоустойчивости.

Зеленые блоки отличаются от голубых тем, что редко вообще упоминаются в русскоязычных обзорах видов тестирования. Однако если вы, к примеру, поищите словосочетание «suitability testing» вы найдете много полезного.

Как пользоваться картой


Мой майнд мап видов тестирования, по сути, является графом, конкретно — деревом. Моё любимое приложение XMind позволяет очень просто поменять структуру карты знаний на дерево и другие представления. Но в тексте много букв, поэтому дерево становится широким и не удобным для восприятия.

У этого дерева есть 10 больших веток — первый уровень графа — это критерии классификации. Очевидно, что они не являются сами по себе видами тестов.

Я надеюсь, что вам известно, чем отличается поиск в ширину от поиска в глубину. По моему глубокому убеждению ошибки в понимании и выборе тестов происходят из-за стремления найти удовлетворительно решение по-быстрее, что подталкивает на поиск в глубину. 2-уровневые (заголовок — перечень) списки видов тестирования этому весьма способствуют.

Искать надо в ширину. Потому что на каждой ветке приведенного графа есть тесты, которые вам нужны. Тоже следует делать при попытке охарактеризовать уже имеющиеся тестовые наборы. Один и тот же тест будет иметь несколько разных характеристик.
Спойлер: когда вы изучите все виды тестов, то обнаружите, что в каждой категории есть нужные вам виды тестов


Критерии классификации


Приступим, пробежимся в ширину по верхнему уровню дерева.

1. Вид требований

Все тесты зависят от того, что требуется от разрабатываемого ПО.

Если нам есть что разрабатывать, значит есть что тестировать. Наличие формально описанных требований — вещь очень важная, но не является обязательной. Не важно, есть ли у вас бумажка, называемая «ТЗ»/«SRS» или нет — требования, на основе которых вы проводите проверку, всегда есть.

Мы можем уточнить, конечно, какие именно нужны операции или понять и сделать согласно своему видению, но так или иначе минимальные требование у нас уже есть.
Нет требований — нет разработки. Справедливо и обратное — есть разработка -> есть требования.

Можно считать, что требований нет, если разработчики не поняли, что от них ждут, и не смогли приступить к работе. Я знаю хороших разработчиков, которые не приступают к разработке, пока не получат ответ на вопрос: «а для чего этот софт должен делать то-то и то-то? Какая конечная цель использования?»

Если же разработчики работают — значит требования есть, другим вопросом остается точность их понимания.

Например, «задача сделайте калькулятор, у которого будут кнопочки, и который будет выполнять все математические операции» содержит в себе кучу требований сама по себе.

Разберите имеющееся у вас представление о том, что ожидается от разрабатываемого ПО, по видам требований, которые вы видите в моем майнд мапе. Если вы стремитесь к полноценному тестовому покрытию, то
Вам нужны все виды тестов из первой группы

Если вам нужны только «минимально необходимые», а не «необходимые и достаточные» — используйте функциональные suitability и accuracy тесты.

Подробно о функциональных тестах речь пойдет в третьей части.

На этом шаге многие останавливаются. "Нам нужны функциональные тесты". Но надо идти дальше.

2. Объект тестирования

Самый плодородный подход к классификации тестов — это категоризация по объектам тестирования. Велико разнообразие технологий, интерфейсов, архитектур, функциональных предназначений и характеристик системы. Все требует своего подхода к тестированию. Отличаются методы и инструменты.

Приложу эту группу отдельно:


Справа я написала три группировки, они условны, поэтому не являются родительскими узлами. Потому что эти требования могут быть и функциональными, и не функциональными, в зависимости от того, что разрабатываем. В общем случае инфраструктурные мы будем проводить до и для передачи в production. А эксплуатационные мы будем проводить на prod-like среде, когда уже будет определено, на каком железе будет жить наша система.

Полное тестирование безопасности, например для сертификации в ФСБ, могут быть частью инфраструктурных тестов, если используются аппаратные способы защиты или внешние системные модули, которые мы не разрабатываем сами. А некоторые средства защиты будут «вшиты» в наш софт и тестироваться как часть функциональных требований.

Например, в рамках тестирования функции передачи сообщения о транзакции от банкомата к банку-эмитенту, мы проверим шифрование пин-кода.

Очень важно понимать, что
виды тестов по объектам тестирования — это не виды функциональных тестов

Как и тесты производительности, отказоустойчивости и т.п. — не всегда виды NFR.

Рассмотрим примеры.

Пример 1. Есть не функциональное требование «при сбое компонента его функции должны выполняться другим, параллельным компонентом». Соответственно, покрываться требование будет не функциональными тестами — стресс тестами, тестами надежности и стабильности.

Пример 2. Рассмотрим случай, когда отказоустойчивость является функциональным требованием. Например, разрабатывается и тестируется отказоустойчивый кластер, а не система, в которой он используется. Целью разработки является создание продукта, который будет обеспечивать отказоустойчивость. В этом случае мы имеем дело с функциональными тестами отказоустойчивости.

Пример 3. Разработка приложения Jmeter. Это — популярный инструмент для проведения нагрузочного тестирования. Его функционалом является нагрузочное тестирование. Это — случай, когда субъект тестирования стал объектом тестирования. Рекурсивненько, да? Тесты нагрузочного тестирования JMeter являются функциональными.

Еще возможные примеры: разработка криптомодуля (функциональные тесты ИБ), разработка интерфейса взаимодействия между системами (функциональные интеграционные тесты), разработка веб-интерфейса фронт-офиса как тонкого клиента при соблюдении разделения бизнес логики от представления данных (функциональные UI-тесты). И так далее.

Вот из-за таких случаев не уместно разделять функциональные тесты по видам функционала (только по видам требований). И не уместно относить сами функциональные тесты к объектам при категоризации «по объекту тестирования».

3. Знание системы

В зависимости от знания системы тесты бывают тестами черного, серого и белого ящика. Эти термины идут из Теории Управления, и я надеюсь, что они вам знакомы в более широком смысле, чем как виды тестов.

Рассматривать как монохромный ящик можно как всю систему целиком, так и ее отдельную часть.

Наиболее распространенным подходом к тестированию является проведение функциональных suitability тестов черного ящика. Еще их заодно называют acceptance тестами, но до приёмочных тестов мы еще не дошли, подождите. Именно на такое тестирование натаскивают большинство начинающих тестировщиков.
Распространено заблуждение, что проведение таких тестов необходимо и достаточно, а если не приводит к повышению качества продукта — то тестировщики плохо поработали.


Весь мой цикл статей по выбору тестов нацелен на то, чтобы избавить читателей от этого заблуждения.

Подробно о влиянии знания системы на проведение тестирования я напишу отдельно.

4. Степень автоматизации

Про автоматизацию пишут везде и много. Я сама очень люблю эту тему.

Что мне не нравится, так это то, что автоматизацию чаще всего рассматривают в таком контексте: «вот у нас накопились регрессионные функциональные тесты, прогонять их некому, надо как-то чтобы оно само». Поэтому многие посмотрят на эту ветку дерева и скажут «ну, это потом».
Автоматизация — это не только эволюционное развитие тестов. Некоторые необходимые виды тестов просто не могут быть ручными.


Об автоматизации надо задуматься, отвечая на вопрос:
«как мы это проверим?»

Некоторые ситуации просто невозможно воспроизвести вручную. Иногда нам нужны симуляторы внешних систем. Иногда — вспомогательные инструменты для подготовки тестовых данных. Почти всегда — инструменты для проведения нагрузочного тестирования.
Какие-то инструменты вы возьмете готовые, какие-то напишите сами. На это надо заложить ресурсы, поэтому
думайте об автоматизации заранее.


5. Степень изолированности компонентов

Протестировать систему «от-и-до» можно на безопасность, можно на соответствие стандартам, можно на удобство эксплуатации. Речь идет о масштабе — когда вы берёте все целиком.
Можно проверять отдельные части, на разном уровне агрегации. Можно проверять не сами компоненты, а то, как они взаимодействуют — теряются ли, искажаются ли данные.

Выбор масштаба, на котором будет проводиться тот или иной тест, зависит от цели — какие ошибки вы ищете, какие требования хотите проверить. И еще от знания и доступности системы.

End-To-End тестирование может быть black box, например, на приёмочных испытаниях при первичной сдаче в эксплуатацию. А до передачи — grey box, когда тестировщики знают, как устроена система и где у нее узкие места. Заливают данные на самый передний вход и ждут течь из всех щелей и ожидаемый результат из самого заднего выхода. От знания системы зависит подготовка тестовых данных. Зная, где может прорвать, можно подсунуть то, что в нужную щель пролезет. При этом может быть так, что потенциально дефектный компонент не доступен сам по себе — поэтому речь не идет о тестировании компонента. Заводится вся машина, и дефекты могут быть обнаружены не только там, где ожидаются.

Если компонент изолировать и подавать данные на вход только в него и проверять результат только на его выходе — это будет тестирование компонента.

В зависимости от того, на сколько мелко крошить систему возникают расхождения в терминологии относительно видов тестирования. Об этом будет речь в другой части.

6. Время проведения тестирования

При определении необходимых видов тестов надо ответить на вопрос
когда мы будем тестировать?

Мой любимый армейский анекдот: «Копайте от забора и до заката». В переложении на нашу работу:
«Тестируйте от критичного дефекта и до релиза».

Я считаю, что такой подход приводит к тому, что достигнуть эффективного тестового покрытия невозможно.

Вопрос о времени проведения того или иного тестирования во многом зависит от методологии ведения проекта. По SCRUM вы будете брать только те тесты, которые можете успеть за итерацию. У вас будет зафиксирована дата релиза, и вы сможете предположить, когда уже пора сделать смоук, когда имеет смысл начать регресс, а все остальное время будете разгребать баг-фикс и проводить полноценные тесты новых фич. Билд может собираться каждый день, а на нем можно гонять смоук и/или регрессионные тесты. Кто-то собирает билд только перед релизом и сидит ночами, чтобы допроверить или перепроверить все, что можно успеть.

В моем понимании, черта, которая разделяет тесты по времени — это релиз. Часть тестов делается до релиза, внутри команды — это альфа тесты, часть — после передачи в эксплуатацию — это бэта, гамма, дельта… омега тесты.

Всем известен закон зависимости стоимости дефекта от времени его обнаружения. Поэтому максимум тестов должно выполняться на альфа стадии.

Под бэта тестами обычно понимают «пререлиз». Когда продукт вроде как готов, и его уже используют, но он все еще не является законченным. Практика полноценного бэта тестирования распространена в gamedev-индустрии и в open source-проектах.

7. Степень подготовленности тестов

Вам надо определиться:
  • Вы либо закладываете время на подготовку тестов, либо — нет.
  • У вас либо есть общий стандарт тест планов и отчетов о тестировании — либо нет.
  • Вы используете или собираетесь использовать систему управления тестами, или нет.

Со временем эти тезисы для вас могут измениться.

Как бы то ни было, даже если по началу по всем пунктам вы ответили «нет», это не значит, что на вашем проекте будет проводиться только исследовательское тестирование. Можно взять ТЗ и проверить, выполнено ли то, что в нем написано — это будет вполне подготовленное тестирование. Когда ты знаешь, что искать.
Отсутствие оформления тестов не означает их неподготовленность.


Подробнее — в другой части.

8. Глубина тестирования

О «Test-to-pass и Test-to-fail» я вычитала в книге Software Testing By Ron Patton. Вот цитата:
There are two fundamental approaches to testing software: test-to-pass and test-to-fail. When you test-to-pass, you really assure only that the software minimally works. You don't push its capabilities. You don't see what you can do to break it. You treat it with kid gloves, applying the simplest and most straightforward test cases.

Паттон пишет, что тесты, которые должны пройти успешно (Test-to-pass), должны проверяться в первую очередь. Если они не прошли, то остальные можно не проверять.

Меня не удивляет то, что это разбиение тестов почти нигде больше не упоминается. Причина — эта характеристика почти эквивалента разделению тестовых сценариев на позитивные и негативные. По сути, так оно и есть, кроме одного момента:
Позитивные и негативные бывают тест кейсы. Метками «test-to-pass» и «test-to-fail» можно сгруппировать тестовые наборы для smoke, acceptance и regression тестов, которые могут содержать в себе как негативные, так и позитивные сценарии.


Tets-to-pass — это тесты в нормальном, наиболее часто используемом режим эксплуатации.

Test-to-fail — это тесты на неизведанной территории, которая может оказаться минными полем. Эти тесты вы не будете проводить после каждой сборки. Они нужны только для поиска особых состояний системы, в которых возможно возникновение ранее не обнаруженного дефекта или вообще сбой всей системы. Такие тесты могут быть ad hock, а негативные тесты — это могут быть случаи, которые проверяются при принятии баг фикса, и они должны пройти успешно.

Цель негативного теста — убедиться, что система правильно реагирует на неправильное действие. Цель test-to-fail наверняка сломать систему.

Помним, что чем раньше обнаружатся дефекты — тем лучше. И что к концу итерации система должна быть максимально проверена, а базовые сценарии должны наверняка проходить успешно. Таким образом, мы получаем чередование тестов по глубине.

Первая порция тестов должна позволить обнаружить некоторое количество show-stopper дефектов. Когда первая порция Test-To-Pass пройдет успешно, переходим ко второй — Test-To-Fail, которая должна выявить как можно большее количество дефектов всех степеней критичности. А после проведения последней порции тестов дефекты не должны возникнуть вообще — они должны быть снова Test-To-Pass.

9. Сценарии

Об уместности приведения в схеме видов сценариев уже написано выше.
Продумывание сценариев — это не стратегическая задача. При планировании стратегии тестирования можно сказать с уверенностью только одно
сценарии нужны все возможные.

Иначе вы упустите дефекты.

10. Динамичность

Если при тестировании происходят манипуляции с приложением — оно динамическое. Если состояние системы не меняется — это статическое тестирование.
Статические тестирование часто упускается. Как можно тестировать, ничего не меняя?
Ответ — на схеме. Code review и тестирование документации помогают выявить солидную долю ошибок, не тратя время на приведение системы в движение.

На этом просмотр в ширину закончен. Просмотр в глубину оставим на следующий раз.

Составление матрицы тестов



Итак, каждый набор тестов можно описать перечислив 9 характеристик:
  • Вид требований
  • Объект тестирования
  • Знание системы
  • Степень автоматизации
  • Степень подготовленности тестов
  • Глубина тестирования
  • Время проведения тестирования
  • Степень изолированности компонентов
  • Динамичность


Говоря о конкретном проекте, можно будет разбить все объекты тестирования на функциональные и не функциональные группы, то есть по виду требований. — 1 измерение.

Браться за тот или иной набор тестов вы будете в зависимости от этапа разработки, поэтому тесты можно сгруппировать по времени проведения. Их можно пометить как тесты, которые должны пройти успешно, и как тесты, с помощью которых должны быть обнаружены дефекты. — 2 измерения

Проведения статических тестов можно заложить как стандартную практику на организационном уровне. Code review проводить после каждого commit с закрытием тикета, а тестировать спецификацию при получении новых требований или на стадии тест дизайна. — 1 измерение.

Ad hock / исследовательское тестирование проводить во время простоев в работе или в первые дни жизни проекта/нового функционала. Все остальные тесты считать подготовленными.

Остается 4 характеристики тестов:
  • Вид требований * Объект тестирования = Функциональный компонент системы
  • Знание системы
  • Степень автоматизации
  • Степень изолированности компонентов


Теперь по ним можно составить матрицу возможных сочетаний видов тестирования.



image

Я тут посчитала, что даже по 4 характеристикам видов тестов получается так много, что нет смысла их генерировать.

Матрица, матрица… я считаю матрицей тестов этот самый майнд мап с видами тестов. Глядя на него просто надо держать в голове факт, что каждый отдельно взятый тест одновременно является разновидностью тестов всех перечисленных категорий верхнего уровня.

Заключение



Итак, множество тестов — огромно. Имея понимание цели проведения тестирования и систематизированное представление о видах тестов уже вполне можно ответить на вопрос — какие виды тестов вам нужны.

Напоследок вот чеклист — вопросы, на которые надо ответить, определяя нужные виды тестов:
  1. Какие функциональные и нефункциональные требования предъявлены к системе?
  2. Из чего будет состоять система?
  3. На сколько хорошо тестирующие знают строение системы?
  4. Как и чем воспроизводить тестовые ситуации?
  5. На каких участках и в каких масштабах будет тестироваться система?
  6. На каком этапе разработки будут проводиться тесты?
  7. Как вы будете описывать и хранить тесты?
  8. Хорошо ли знают ваши тестировщики методы составления тестовых сценариев?
  9. Будут ли разработчики проверять сами себя и друг друга?
  10. Совершенна ли спецификация?

(Эти вопросы поднимались при обзоре видов тестов в ширину.)

Надеюсь, я не запутала читателей еще сильнее, и вам моя матрица пригодится.

Комментарии (3)


  1. musuk
    04.05.2015 11:53
    +2

    Ещё есть A/B-тестирование: иногда показываем новую версию клиенту, а он там натыкается на баги, а мы потом читаем логи.


  1. 0xFE
    05.05.2015 00:01
    +1

    сценарии нужны все возможные.

    Как разработчик — согласен на 100%
    Но, как правило, это очень дорого. Если предварительно не ограничить скоуп тестирования метриками покрытия кода/требований, то тестирование не закончится никогда.


    1. Funnear Автор
      05.05.2015 11:19

      Спасибо, очень важное замечание.

      Под «нужны все» я имела в виду «все применимы». Надо воспользоваться Бритвой Оккама и оставить только те из них, что реалистично использовать. А то, что отсекли — оценить на риски. Потом, когда будет анализироваться эффективность работы пересмотреть то, что отсечено, возможно стоит все-таки добавить эти тесты, если результат не устраивает. Если Цель не достигнута.