Эффективен ли TDD? / forpes.ru

Главная
Эффективен ли TDD?

Эффективен ли TDD? +13

14.05.2020 08:05

senpay 57 3500 Источник

Во время интересной дискуссии, один очень уважаемый человек «козырнул» «неубиваемым» аргументом:

Есть полно исследований, демонстрирующих эффективность TDD

Действительно. Если зайти на Google Scholar, забить ключевые слова «TDD» и «Эффективность» — будет много научных статей, но так ли все просто? Хоть я сам и являюсь большим фанатом TDD, но я так же считаю себя скептиком, и решил проверить, доказано ли научно, что TDD так крут.

I find your lack of scepticism disturbing

I find your lack of scepticism disturbing

Test-driven development (TDD) с нами уже долгое время, и все это время он был предметом горячих споров. Суть TDD в том, что начинать разработку надо с написания падающего Unit test, после чего пишется код, который сделает этот тест «зеленым», и так по циклу. Для тех, кто не в курсе, можно посмотреть руководство по TDD в IDE Idea.

Часть разработчиков уверены, что TDD улучшает эффективность и качество не менее чем до 146%. Часть разработчиков точно знает, что TDD — это полный бред, и писать тесты до написания кода — это как кататься лыжами по асфальту. Компромисса между этими группами разработчиков ждать не стоит.

Но вернемся к науке. По счастливой случайности, так совпало, что я учусь в магистратуре Wrexham Glyndwr University по программе Computer Science with Big Data Analytics (кстати — всем рекомендую, и распишу про нее отдельно) и прямо сейчас прохожу модуль «Critical Research», где учат читать научные статьи и анализировать их достоверность.

Какие наши доказательства?

Исследований на тему эффективности и полезности TDD, действительно, много. Однако, если почитать сами исследования, можно заметить, что они приходят к противоречивым выводам.

К примеру, в докладе “An Experimental Evaluation of the Effectiveness and Efficiency of the Test Driven Development”, опубликованном в 2007 был сделан вывод, что TDD улучшает продуктивность разработчиков, при этом не оказывая влияния на качество [1].

В другом докладе, в котором были рассмотрены выводы нескольких других исследований и проведено собственное исследование, “Evaluating the Effectiveness of Test Driven Development: Advantages and Pitfalls”, 2017 пришли к выводу, что TDD может улучшить качество продукта, но приводит с снижению продуктивности. Дополнительно, было замечено, что большинство разработчиков находят TDD неестественным [2].

По результатам еще одного исследования, “A Replicated Experiment on the Effectiveness of Test-First Development”, 2013 исследователи не смогли обнаружить убедительного и значимого влияния Test-First или Test-Last подходов на продуктивность разработчика или качество продукта [3].

Чтобы забить гвоздь в гроб «доказанности» эффективности и полезности TDD, можно почитать обзорный отчет “Overview of the Test Driven Development Research Projects and Experiments”, 2012 [4], в котором, на основе большого количества доступных исследований пытались придти к выводу о доказанности эффективности и положительном эффекте TDD. Авторы заключили, что не существует убедительных доказательств о положительном эффекте TDD. Различия в результатах предыдущих исследований авторы обосновали Confirmation bias — исследования, которые показали эффективность TDD изначально исходили из гипотезы, что TDD — эффективен.

Так почему же люди (включая меня), считают TDD отличной практикой?

После прочтения исследований, у меня есть только один логичный ответ — эффективность и применимость TDD зависит, прежде всего, от конкретного разработчика. Исследования эффективности TDD, видимо, недостаточно учли, что разработчики — не роботы, а TDD — не программа. Для части разработчиков, TDD принесет хорошие результаты, для части — не будет значимой разницы между TDD и простым написанием Unit tests, для части — TDD приведет к падению качества, продуктивности и мотивации.

Программирование — это социальная активность. Проблема с социальным взаимодействиями — это то, что это не точная наука. Осталось придумать как провести более-менее научный эксперимент чтобы подтвердить\опровергнуть эту гипотезу. Для начала предлагаю опрос.

Если вдруг вы захотите поделиться этой публикацией с англоязычными коллегами — есть чуть более формальная английская версия: medium.com/@alexspush/is-tdd-effective-2474c0471ac4

Список источников

[1] A. Gupta, P. Jalote “An Experimental Evaluation of the Effectiveness and Efficiency of the Test Driven Development” presented at First International Symposium on Empirical Software Engineering and Measurement, Madrid, Spain, 2007
[2] Z. Khanam, M. Ahsan, “Evaluating the Effectiveness of Test Driven Development: Advantages and Pitfalls” International Journal of Applied Engineering Research vol. 12, no 18, p. 7705, 2017. Available: www.ripublication.com/ijaer17/ijaerv12n18_81.pdf. [Accessed May 13, 2020].
[3] D. Fucci, B. Turhan, “A Replicated Experiment on the Effectiveness of Test-first Development” presented at ACM / IEEE International Symposium on Empirical Software Engineering and Measurement, Baltimore, MD, USA, 2013
[4] A. Bulajic, S. Sambasivam and R. Stojic “Overview of the Test Driven Development Research Projects and Experiments” presented at Proceedings of Informing Science & IT Education Conference (InSITE), 2012. Available: pdfs.semanticscholar.org/3278/971bb53a25822171df127d47a57243dd3bbd.pdf. [Accessed May 13, 2020].

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Ваше субъективное мнение о TDD

19,1%TDD повышает продуктивность и качество работы разработчика26
47,1%TDD повышает качество работы разработчика, но ухудшает\не влияет на продуктивность64
1,5%TDD повышает продуктивность разработчика, но ухудшает\не влияет на качество2
17,6%TDD не влияет на продуктивность или качество24
14,7%TDD ухудшает продуктивность и качество20

Комментарии (57)

amarao
14.05.2020 11:32
#21614532
+1
TDD хорош, когда тесты можно написать до программы. Очень часто программирование exploratory, т.е. "что получится никто не знает". В этой ситуации игра в TDD это глупость.

А бывает так, что есть совершенно точное ТЗ к которому можно написать тест до кода, и даже можно написать проходящий тест мок (на одном наборе данных), а потом можно писать код.

Это совершенно разные задачи — одно (exploratory) это элемент НИОКР, а второе — просто кодинг. Вот для задач кодинга TDD кратно повышает качество кода. Для НИОКР качество кода вторично по сравнению с нахождением решения, так что TDD лишь мешает искать решение.

Вот и всё.
1. vdem
  14.05.2020 11:37
  #21614550
  Вот и я сначала пишу какую-то небольшую часть кода, прикидываю, что получается, и когда картина более-менее ясна, дальше уже продолжаю кодить одновременно с написанием тестов. Здесь тесты очень помогают не сломать что-то очередными изменениями.
  1. amarao
    14.05.2020 11:43
    #21614586
    +1
    Это вы описываете как вы решаете простые задачи простыми методами. Бывает так, что результат exploratory programming не ясен до самого конца, потому что есть хаотические факторы (нагрузка, конкурентность, маштаб, невидимые обстоятельства-состояния). Бывает так, что даже задача не ясна "я хочу примерно вот так… или лучше вот так". Отказываться от такого — лишать продукт права на развитие. (Да, мы все умеем писать TDD для CRUD. Слабо написать тесты для ещё ненаписанной программы, которая делает удобно при редактировании текста?)
    
    Повторю тезис: TDD хорош для задач кодинга, когда не нужно исследовать.
    
    senpay Автор
    14.05.2020 12:23
    #21614890
    Формализуйте, пожалуйста, понятие exploratory programming? Можно конкретный пример? Я тогда бы учел это в исследовании, у меня, по ходу дела, отличная идея диссертации намечается.
    
    amarao
    14.05.2020 12:36
    #21615004
    -1
    Прямо из бэклога:
    Нужно переносить сервера (инстанса приложения) между разными кластерами в разных стойках (т.е. с разными Top-of-Rack свитчами) с минимальным даунтаймом.
    Это, кстати, почти контр-пример для моего тезиса, потому что тест для определения даунтайма я могу с лёгкостью написать даже не зная как я буду реализовывать её.
    
    … Давайте более exploratory.
    
    Я хочу в терминале возможность прыгать между вызовами команд. Т.е. отдельный комплект хоткеев, который позволяет переходить между строчками, где начинается вывод от новой команды с шелла.
    
    Ну какие тут TDD?
    
    senpay Автор
    14.05.2020 12:47
    #21615098
    +1
    Немного не понял задачу с терминалом. В случае, если известен формат строчек и набор хоткеев, написать тест не составит труда.
    
    Можете пояснить чуть более подробно?
    
    amarao
    14.05.2020 13:26
    #21615430
    +1
    Формат строчек не известен.
    
    Вот у меня шелл на удалённый сервер:
    $ dch -v 5.8.7-2
    $ git diff
    $ git add debian/changelog
    $ git commit --amend
    $ git push
    
    Между ними вывод. Я хочу между ним прыгать. Вывод зависит от настроек шелла на удалённом сервере и заранее его угадать нельзя. Вывод программ может включать себя команды (например, cat ~/.bashrc).
    
    Хз как делать. Но было бы чертовски удобно.
    
    Наверное, я бы придумал сделать esc код для терминала (который мой терминал понимает) и передавать его в PS'е. Или придумать новый тип для TERM. Или нужно написать свой хук в башовый PS для каждого сервера.
    
    Короче, как делать не понятно, но очень хочется попробовать. Если с подсказками не получится, возможно, можно использовать тайминги. Пользователь печатает в шелле — значит, ввод.
    
    Или прям нейронную сеть учить.
    
    Вот это пример exploratory programming. Пойти туда, не знаю куда, принеси мне Фичу.
    
    senpay Автор
    14.05.2020 13:29
    #21615462
    Так понятнее, спасибо. Действительно в данном примере я не вижу даже целесообразности TDD.
    
    chapuza
    15.05.2020 07:14
    #21619212
    А я в данном примере вообще не вижу целесообразности тестов. Потому что простые случаи легко покрыть прямо запусками из терминала, а для внезапных граблей никакой мегамозг тест не напишет, — до того, как на грабли эти наткнется.
    
    Если можно менять PS1 — задача вырожденно-тривиальная. Если нельзя — в общем случае не решаемая, потому что удаленный шелл не нанимался помнить историю вывода и туннели через 2+ ssh все выкрутасы с радостью похерят.
    
    Если я хочу это в своем уютненьком терминале на лаптопе — тут вообще делать нечего, Enter перехватить и ага.
    
    Но правильное решение такой задачи внезапно тривиально: хоткей, который маппится на «поиск назад строки, содержащий текущий промпт». Будут ложные срабатывания? — Да, возможно. Критично? — Вот вообще нет. Хоткеями пользуются люди, нажмут еще раз, если вдруг что.
    
    Писать на такую задачу тесты — это вообще себя не уважать.
    
    senpay Автор
    15.05.2020 10:50
    #21619736
    Я думаю, если речь идет о платном приложении, нестабильность горячих клавиш может легко стать причиной неуспеха.
    
    Я вот очень сильно переживаю, если у меня хоткеи не работают надежно.
    
    И не тестировать такой функционал — это не уважать пользователя, а писать ненадежный софт — не уважать себя. Разве нет?
    
    Есть отличная глава "QA should find nothing" из книги Clean Coder.
    
    chapuza
    15.05.2020 12:58
    #21620284
    Больше всего в современном состоянии CS меня напрягает бесконечное обилие никому не нужных методологических книг на фоне абсолютного отсутствия руководств по таким насущным вопросам, как умение понимать поставленную задачу.
    
    Платное приложение? С гарантией работы горячих клавиш? Ну, допустим. Это совершенно не та задача, которую мы тут обсуждаем, но допустим.
    
    Начните с написания терминального клиента. При установке соединения с удаленным хостом, загрузите туда свой код, который перехватит запуск из шелла и будет по определенному вами бинарному протоколу в отдельном канале присылать вам метаинформацию. Обмажьте это тестами (а если ваша команда упоролась по хайпу — то и типами) со всех сторон.
    
    Настройте стенд с матрицей всех шеллов всех версий, популярность которых выше 0.1%. Прогоните все тесты там.
    
    Можно запускаться.
    
    Есть отличный способ изюежать необходимости читать много водянистой беллетристики: думать своей головой.
    
    JediPhilosopher
    14.05.2020 13:21
    #21615382
    Ну вот у меня например задача была — закодить систему генерации городской застройки. Т.е. даешь ей полигон участка, она сама раскидывает там домики и дороги, с учетом градостроительных норм и всяких принципов хипстоурбанизма.
    
    Ну и я вот месяц сидел и фигачил туда-сюда всякие алгоритмы расстановки дорог и домиков.
    
    Тут во-первых непонятен результат (ну то есть хочется получить красивую застройку, но непонятно даже как именно она должна выглядеть, это плохо формализуется, а самих норм недостаточно). Во-вторых надо очень быстро и много чего пробовать и менять — от тестов тут толку особо нет, так как их придется постоянно переписывать, по мере смены концепций и алгоритмов.
    
    Вот когда уже получен хороший результат, и теперь надо на его основе сделать устойчивый продукт — там уже можно написать тесты, а потом начать разгребать всю ту кучу говнокода, которая родилась в процессе исследований и прототипирования.
    
    senpay Автор
    14.05.2020 13:28
    #21615450
    Ваш аргумент отлично работает против ATDD (Acceptance Test-driven development), но не TDD.
    
    В классическом TDD тест — это Unit-test, а тестируемый объект это метод, или даже отдельная ветка исполнения в методе. Готов поспорить, что на этом уровне в любом приложении будут детерминированные результаты.
    
    sshikov
    14.05.2020 14:08
    #21615758
    +1
    Детерминированные — да. Но это не всегда значит, что будет просто или быстро написать для них assert. Ну скажем, в моем случае, программа это spark (примерно тоже самое будет верно и для пандас, я думаю). Уже на самом верхнем уровне (собственно, там и кода может быть совсем мало) мы сталкиваемся с тем, что тестируемые объекты — это что-то, совершенно непригодное для юнит тестирования. Т.е. это датафреймы или датасеты, и чтобы они работали, нужно запустить собственно некий здоровый фреймворк.
    
    И тесты сразу становятся интеграционными, и перестают работать приемлемо быстро. Это полностью лишает смысла применять такие тесты в методологии типа TDD, когда быстрый ответ важен.
    
    senpay Автор
    14.05.2020 14:12
    #21615788
    Согласен, для таких задач Unit-Test слабо применимы. Хотя, есть примеры, когда в таких задача прекрасно работал Test-First подход с BDD фреймворками, например — www.youtube.com/watch?v=bny86gxbUcg
    
    DistortNeo
    14.05.2020 14:12
    #21615782
    +1
    Отличие TDD от code-first заключается в том, что TDD принуждает к максимальному покрытию кода тестами и к написанию качественного кода. При использовании code-first велик соблазн оставить кусок кода непротестированным, ведь и так всё работает. При TDD такого не будет.
    
    Но аргументы, написанные выше, не столько против TDD, сколько против тестов вообще в определённых случаях.
    
    Дело в том, что основной смысл в тестах — это фиксация поведения программы при определённых сценариях, чтобы не допустить регрессий при доработке программы. Также тесты играют роль документации. При это тесты не гарантируют корректность работы программы. Тесты, как и код, могут содержать ошибки. Тесты могут быть неполными даже при TDD.
    
    Нужно ли писать тесты, если задача поисковая? Моё мнение — нет, потому что поведение программы постоянно меняется, а тесты, наоборот, его фиксируют. То есть придётся делать двойную работу: переписывать и код, и тесты. А если это обработка изображений, так затраты на тесты там вообще на порядки выше, чем на написание кода. Работоспособность алгоритмов намного проще проверить глазами.
    
    Ну то есть тут уже всё становится индивидуально. Есть люди, кому проще писать код сразу с тестами — ок, пусть пишут. А если люди, кому это в тягость — пусть не пишут.
    
    senpay Автор
    14.05.2020 15:23
    #21616350
    Вот и мой основной тезис в том, что все очень индивидуально, и то, что работает для одного разработчика, может прекрасно не работать для другого
    
    mad_nazgul
    15.05.2020 07:22
    #21619228
    Прошу прощения, но ИМХО как раз тесты могут быть инструментом исследования!
    Т.е. мы хотим получить какой-то результат (как его получить мы не знаем).
    В тестах мы фиксируем результат.
    А потом последовательными итерациями к нему приближаемся.
    Или мы «тестируем гипотезу».
    Опять же в тестах мы формулируем гипотезу и смотрим, что получается/не получается.
    
    senpay Автор
    15.05.2020 10:53
    #21619750
    Мне нравится такой подход — "тест как гипотеза".
    Ведь, в противном случае, как мы поймем, что мы наиследовали своим кодом? Разве что читать логи, что не всегда реально (если их тыщи)
    
    sshikov
    14.05.2020 14:03
    #21615726
    +2
    Я думаю, что тезис «эффективность зависит от… разработчика» нужно просто расширить, например на инструмент (язык, фреймворк и т.п). Так же, как его выше предложили расширить на тип задачи. Достаточно хорошо известно, что в языках с сильной системой типов необходимость юнит тестов несколько ниже, так как часть гарантий дает компилятор. То есть, часть функций тестов просто перекладывается на описание типов в коде. Ну и напрашивается вывод — разве эффективность TDD от этого же не должна зависеть?
    
    senpay Автор
    14.05.2020 14:08
    #21615754
    Это отличное замечание! Если честно, я (интуитивно) предполагал, что в языках с сильной и статической типизацией TDD принесет улучшения производительности за счет автоматической генерации кода на основе тестов (как минимум определения классов и методов)
    
    Это отдельная грань проблемы, которую нужно исследовать.
    
    sshikov
    14.05.2020 14:11
    #21615778
    +1
    Ну да. При этом я не хочу сказать, что она станет ниже. Но что она станет другой — это почти наверняка. Фактически, мы описали какие-то типы, скомпилировали — это де-факто нам проверяет, что наши типы будут работать правильно (до какой-то степени). Т.е. это тест — но как бы уже и не тест.
    
    0xd34df00d
    14.05.2020 20:15
    #21617810
    Мой пример: тайпчекер и транспилятор для игрушечного proof-of-concept-языка, грамматику и некоторые элементы семантики которого я продумываю по ходу дела. Единственные тесты, которые у меня есть — что такое-то выражение парсится корректно (когда писал парсер), что такое-то выражение принимается или отвергается тайпчекером (когда писал тайпчекер), что такое-то выражение после транспиляции на таком-то входе даёт такой-то результат.
    
    Тестировать отдельные функции тут как-то бессмысленно, есть только интеграционные тесты.
    
    senpay Автор
    14.05.2020 20:34
    #21617906
    Почему бессмысленно тестировать отдельные функции?
    
    некоторые элементы семантики которого я продумываю по ходу дела
    -> почему не заранее?
    
    0xd34df00d
    14.05.2020 21:45
    #21618168
    +1
    Почему бессмысленно тестировать отдельные функции?
    А зачем? Что именно здесь (и в соседних файлах) тестировать по отдельности и, опять же, зачем?
    
    почему не заранее?
    Заранее всё продумать тяжело. Какие-то идеи возникают по ходу дела, например. Вот, недавно оказалось, что паттерн-матчинг таки неплохо добавить и проверить.
1. lair
  14.05.2020 11:38
  #21614556
  TDD хорош, когда тесты можно написать до программы.
  Кстати, да. У меня были случаи, когда еще на этапе написания тестов по ТЗ становилось понятно, что в ТЗ ошибка.
1. HackerDelphi
  14.05.2020 12:05
  #21614736
  Я бы добавил ещё один случай — при написании кода, главное в котором:
  
  Скорость выполнения
  
  Работа с файловой системой/сетью/другим железом
  
  Юнит тесты — не особо подходящий инструмент.
  Делать методы открытыми, а тем более — заводить интерфейсы ТОЛЬКО для юнит тестов — такое решение может привести к кардинальной деградации производительности.
  Если тестировать интеграционниками с использованием не моков, а тестового окружения — то такой «не совсем TDD» может оказаться неплох.
  Но если добавить в винегрет ещё и исследования (а при написании тайм-критикал кода они всегда есть), то всё-таки лучше писать тесты после кода.
  1. amarao
    14.05.2020 12:11
    #21614796
    +2
    Я вам вполне могу написать TDD для интеграционных тестов, это не проблема. Даже с учётом скоростей. Вы путаете деление юнит-тесты/интеграционные тесты (что на самом деле вопрос про размер сайд-эффектов) и вопрос "код вперёд или тесты вперёд".
    
    Тут вопрос "а знаем ли мы заранее что мы пишем?" или нет.
    
    EvgeniiR
    14.05.2020 13:07
    #21615250
    Вы путаете деление юнит-тесты/интеграционные тесты (что на самом деле вопрос про размер сайд-эффектов) и вопрос «код вперёд или тесты вперёд».
    
    «Тесты вперёд»(test first) и TDD это разные вещи, и TDD про написание конкретно юнит-тестов.
    
    amarao
    14.05.2020 13:28
    #21615444
    Ой ли? TDD ровно так же применим для интеграционных тестов, как и для юнит-тестов. Я бы сказал, что он даже более применим, потому что сайд-эффекты обычно проще придумать (до написания кода), чем потрошки интерфейсов.
    
    sshikov
    14.05.2020 14:15
    #21615808
    >сайд-эффекты обычно проще придумать
    Но зачастую сложнее проверить. Скажем, у нас эффект выполнения программы в целом — это создание каких-то файлов, или скажем запись чего-то в базу. Не то чтобы это было невозможно проверять, но трудоемкость таких тестов сопоставима с трудоемкостью написания основного кода — ну и понятно, что производительность это серьезно снижает.
    
    >TDD ровно так же применим для интеграционных тестов
    Ну то есть, наверное где-то применим — но может быть ужасно неудобно, если у вас весь код состоит из интеграций. Пробовал я на примере ESB такое делать… мок на моке сидит, и моком погоняет. А что мы протестировали — очень быстро перестаешь понимать.
    
    amarao
    14.05.2020 14:35
    #21615970
    Интеграционные тесты единичные, но очень сильные. (и медленные). Я к тому, что для хорошо сформулированной задачи TDD для интеграционных тестов может быть даже более разумным, чем для unit. Чёрный ящик в чистом виде, пиши как хочешь, но тесты должны пройти. При этом сами тесты завязаны на сайд-эффекты, то есть моками их не обманешь.
    
    Утрируя: у нас интеграционный тест для замка с удалённым открыванием. Интеграционный тест выглядит как кронштейн для карточки и тиски для замка, плюс проверка "открылось или нет" (посредством замыкания контакта на приёмнике языка замка).
    
    Дальше вы можете использовать любые методы, но с правильным ключом оно должно открыть, а с неправильным — не открыть. А уж монадки там или ассемблер уже не важно.
    
    И такой тест можно реализовать до того, как будет написана даже первая строчка кода для прошивки замка. И он не поменяется даже если вы отрефакторите всё и вся (кроме форм-фактора самого замка).
    
    sshikov
    14.05.2020 18:43
    #21617484
    Не, я в целом согласен, что так тоже бывает. Ну или иными словами, интеграционные тесты сами по себе TDD не противоречат (если интеграция быстрая, например, то какая разница?).
    
    0xd34df00d
    14.05.2020 20:16
    #21617820
    Скажем, у нас эффект выполнения программы в целом — это создание каких-то файлов, или скажем запись чего-то в базу.
    Заворачиваетесь в свободную монаду и интерпретируете.
1. Pieceofduke
  15.05.2020 13:16
  #21620356
  Ну да, TDD начинается там, где исследование закончено и уже стало ясно, как будем решать задачу…
  1. amarao
    15.05.2020 16:58
    #21621408
    Есть ещё один момент. Бывает так, что не совсем понятно, какую задачу решаем. Т.е. есть интуитивное ощущение "сделать лучше", но как именно — не понятно. И пока не напишешь, понятно не станет. Именно так появляется инновационный (в смысле, "новый в своём классе") софт.

iroln
14.05.2020 12:21
#21614876
После прочтения исследований, у меня есть только один логичный ответ — эффективность и применимость TDD зависит, прежде всего, от конкретного разработчика
Эффективность и применимость TDD зависит, прежде всего, от предметной области и особенностей решаемой задачи. О чём выше уже сказали.
1. senpay Автор
  14.05.2020 12:26
  #21614920
  Это тоже хорошая гипотеза, но я склонен считать, что разработчик является бОльшим фактором. К примеру, на проекте, где тех лид утверждал что TDD не применимо Эиз-за предметной области" — я «на слабо» сделал case study и показал применимость и улучшение качества, но это в тех случаях, когда я был автором кода.
  
  У вас есть какие-нибудь научные обоснования, или это основано на Вашем опыте?
  
  В любом случае — гипотеза принята к рассмотрению, спасибо.
  1. iroln
    14.05.2020 12:39
    #21615032
    Вся ваша статья вроде бы о том, что научные обоснования — не обоснования. :)
    
    Моё мнение основано на личном опыте и наблюдении за происходящим в проектах, в которых я участвовал/участвую. Это в основном R&D проекты, зачастую без конкретных ТЗ и спецификаций. Несколько проектов переписывались с нуля несколько раз, всё что создавалось на начальных этапах просто выбрасывалось.
    
    Кстати, тот же спор можно развязать о применимости Agile и прочих скрамов.
    
    Я сторонник разумного подхода. Если в конкретном проекте или части проекта на конкретном этапе его разработки видно, что можно применить TDD, значит нужно попробовать его использовать, хуже точно не будет. Если я вижу, что вот этот конкретный модуль/функция точно будет именно таким и я могу сразу специфицировать его логику и входы/выходы, я сразу пишу тесты.
    
    senpay Автор
    14.05.2020 12:52
    #21615122
    Вся ваша статья вроде бы о том, что научные обоснования — не обоснования. :)
    
    Не совсем, скорее о том, что у нас нет (пока?) убедительных доказательств любого из утверждений:
    1) TDD эффективен
    2) TDD не эффективен
    3) TDD не оказывает влияния на эффективность
    
    И, соответственно, нужны еще исследования.
    
    Но, насколько я пониманию
    
    Несколько проектов переписывались с нуля несколько раз, всё что создавалось на начальных этапах просто выбрасывалось.
    
    никак не противоречит применимости TDD, т.к. изменение самих тестов является одним из возможных шагов в «цикле» TDD. С учетом того, что фокус Unit Test это метод или даже определенная ветка в методе, наличие Т.З. не должно оказывать существенного влияния.
    
    Нужно ли лучше формализовать понятие TDD?

CoreTeamTech
14.05.2020 12:58
#21615172
+1
Давайте договоримся об определениях для начала. Что понимается под эффективностью, продуктивностью и качеством? Вот у меня проект, где критерии качества формализованы. Если качество не 100% — продуктивность и эффективность равны 0. Или вот у меня менеджер, который качество продукта измеряет по метрике: чем меньше пользователи жалуются, тем качественнее. Или вот мой коллега, который получил «медальку» от системы трекинга задач за то, что закрыл их больше всего за спринт.

Еще интересно, измеряем мы эффективность отдельного разработчика в вакууме или команды, или отдельного разработчика в команде?
1. senpay Автор
  14.05.2020 12:59
  #21615180
  Отличное замечание! У меня тоже есть вопросы к определению этих понятий, и в исследованиях, действительно, эти понятия не были определенны одинаково.

vserykh
14.05.2020 14:39
#21616022
Есть тезис о том, что юнит-тесты помогают в разработке более качественной и гибкой архитектуры компонентов (тех самых юнитов, которые тестируются). Юнит-тесты помогают снижать связанность, повышать переиспользуемость компонентов, улучшать применение SOLID-принципов.

Почему-то этот тезис используется для подкрепления полезности TDD. Но я не вижу логики в таких рассуждениях. Никто мне не мешает сделать изначально всё хорошо, а потом написать тесты. Или сделать криво, иметь проблемы с написанием тестов, поправить интерфейсы и зависимости и успешно написать тесты. Тесты помогают, да. Почему их надо писать перед написанием кода? Не знаю.
1. vserykh
  14.05.2020 14:42
  #21616050
  Я больше поддерживаю подход такой:
  1. Написали какой-то скелет. Архитектура, интерфейсы устаканились.
  2. Написали юнит-тесты.
  3. После этого желательно держать уровень покрытия тестами не ниже какой-то планки относительно текущего уровня.
  4. Потом, для новой функциональности уже можно делать Test-First или Test-Last. Не уверен, что это имеет большое значение. Имеет значение наличие хороших тестов.
  1. senpay Автор
    14.05.2020 14:49
    #21616112
    При подходе написания скелета, архитектуры, интерфейсов, не делаем ли мы преждевременных предположений? Как быть, если вдруг окажется, что архитектура неэффективна или нереалезуема для конкретного приложения, среды или языка программирования?
1. senpay Автор
  14.05.2020 14:48
  #21616096
  Гипотеза о целесообразности написание тестов до кода я думаю формулируется, примерно, так:
  При TDD тесты являются формальным описанием (микро)задачи. Таким образом, как только тест становится «passed» мы можем сделать вывод, что (микро) задача выполнена.
  
  Также, при таком подходе исчезает соблазн «подгонять» тесты под код (а то будет как в лабораторных по теории цепей в старом, добром университете — "пофиг что намеряли, пиши что соответствует заданию, а то все поймут что мы цепь хреново сделали")
  
  Ну, по крайней мере, такая изначальная гипотеза

Tiendil
14.05.2020 16:37
#21616732
Тесты нужны, а TDD — вкусовщина
1. senpay Автор
  14.05.2020 16:46
  #21616848
  На самом деле можно выделить не две, а три модели предметной области:
  
  модель в коде функциональности;
  
  модель в коде тестов;
  
  модель в голове разработчика.
  
  Это отличная цитата из статьи, но не противоречит ли Ваше высказывание Вашей же статье?
  
  Даже если мы признаем утверждение
  
  Тесты — это хороший пример дублирования, метода повышения надёжности за счёт реализации нескольких копий критической части системы. Нюанс заключается в том, что в нашем случае через дублирование контролируется не работа результирующей системы, а точность её формальной модели.
  
  истинным (оно, как минимум, правдоподобно), это, тем не менее, не исключает возможности влияния тестов на качество продукта.
  
  Более того, пропоненты TDD, как раз считают, что смысл TDD не в тестах, а в понимании и точности модели.
  
  Ваш ход?
  1. Tiendil
    14.05.2020 17:08
    #21616982
    +2
    не противоречит ли Ваше высказывание Вашей же статье?
    
    А в чём конкретно противоречие?
    
    Я стою на том, что тесты нужны как хороший способ гарантии качества через дублирование, независимо от порядка их написания. В каком порядке писать зависит от привычек и тараканов разработчиков, от предметной области.
    
    не исключает возможности влияния тестов на качество продукта.
    
    Я нигде не утверждал о каком-либо исключении влияния на качество. Собственно, из цитаты (и статьи) влияние на качество непосредственно следует.
    
    Более того, пропоненты TDD, как раз считают, что смысл TDD не в тестах, а в понимании и точности модели.
    
    Ошибка выжившего.
    
    Те, кому легче формировать понимание предметной области тестами, используют TDD по факту своей работы. Они бы его использовали, даже если бы такого названия не было.
    
    Тем, кому легче разбираться с предметной областью не через тесты, TDD мешает и они от него отказываются.
    
    senpay Автор
    14.05.2020 17:11
    #21617010
    +1
    Признаю, я был не внимателен и прочитал как «тесты не нужны».
    
    Ошибка выжившего.
    
    Те, кому легче формировать понимание предметной области тестами, используют TDD по факту своей работы. Они бы его использовали, даже если бы такого названия не было.
    
    Тем, кому легче разбираться с предметной областью не через тесты, TDD мешает и они от него отказываются.
    
    Абсолютно согласен, это по сути — моя гипотеза, но иными словами. Ваша формулировка даже более удачная!
1. CoreTeamTech
  14.05.2020 17:24
  #21617078
  В вашей статье есть упрощение. Вы не учитываете в процессе формализации участие, скажем, аналитика. Уточнить требования во время написания тестов получится быстрее, что высвободит аналитика для другой работы или даже в худшем случае, реализация функционала может быть отложена, если потребуется доработка требований. Аналитик обычно один и является узким местом процесса, поэтому раннее прототипирование очень полезно. Далее, повышение качества кода связано с наличием процесса код-ревью. Своему коллеге вы предлагаете оценить по тестам вашу реализацию моделей. Суждения о валидности этой модели по отношению к изначальным требованиям не могут быть поревьюены по истории коммитов. Потребуется чтение ТЗ. В случае TDD можно посмотреть эволюцию формализации требований. Понять что система должна делать. А потом посмотреть финальный коммит рабочей системы, чтобы оценить непосредственно реализацию и вторичные аспекты (стиль, практики и т.п.). После написания тестов, я иногда, по необходимости, подключаю тестировщика, чтобы указать на то, что можно будет исключить из плана тестирования. Нередко, тестировщик дополняет тесты указывая на пограничные случаи.
  
  TDD — это не вкусовщина, а скорее контракт взаимодействия, который все еще ничего не гарантирует, но значительно помогает контролировать реализацию задач и кодовую базу в целом.
  1. Tiendil
    14.05.2020 18:17
    #21617342
    +1
    Уточнить требования во время написания тестов получится быстрее
    
    Не согласен. Почему?
    
    раннее прототипирование очень полезно.
    
    Согласен, но раннее прототипирование — это не написание тестов перед кодом. Прототип может быть любым: кодом, тестами, моделью в специализированном софте, ролевой игрой с живыми участниками.
    
    Своему коллеге вы предлагаете оценить по тестам вашу реализацию моделей.
    
    Или по коду. Не вижу проблемы.
    
    Суждения о валидности этой модели по отношению к изначальным требованиям не могут быть поревьюены по истории коммитов. Потребуется чтение ТЗ.
    
    Не понял про что это утверждение.
    
    В случае TDD можно посмотреть эволюцию формализации требований.
    
    Эфолюцию формализции требований можно посмотреть по чему угодно, что находится под контролем версий.
    
    senpay Автор
    14.05.2020 18:26
    #21617402
    Эфолюцию формализции требований можно посмотреть по чему угодно, что находится под контролем версий.
    
    Может ли предположить, что тесты выступают как ubiquitous language, понятный всем разработчикам\заинтересованным лицам?
    
    Tiendil
    14.05.2020 18:37
    #21617466
    Если под разработчиками понимается вся команда (включая непрограммистов), то определённо нет.
    
    Тесты будут понятны также как и основная логика, поскольку и то и другое — код. Читают код, который уже в голове интерпретируется в тесты или основную логику.
    
    Можно приложить усилия и сделать тесты более понятными для части людей (визуализировав их как-то, например), но можно те же самые усилия приложить к коду и получить тот же эффект. Зависит от того, что выгоднее в данной команде на данном проекте.
    
    senpay Автор
    14.05.2020 18:40
    #21617474
    +1
    Окей, я готов согласиться в том, что это субъективный фактор.
    
    Я, например, предпочитаю смотреть Pull Request начиная с тестов — так я могу понять чего пытались достичь, и более внимательно\продуктивно рассмотреть сам предложенный код.
    
    Но я не могу исключить возможности, что этот метод работает не для всех.
    
    CoreTeamTech
    14.05.2020 18:43
    #21617480
    Уточнить требования получится быстрее потому, что на естественном языке можно создать иллюзию связей между сущностями, а на языке программирования эту связь придется описывать формально. Большая часть вопросов возникнет на этапе проектирования сигнатур методов. Каковы допустимые значения входных параметров? А может ли быть нулл на выходе? Можем ли бросить эксепшен на каком-то этапе? На следующей стадии, когда строится более высокоуровневая логика из интерфейсов, возникнут другие вопросы. Вызываем пять методов, один может возвращать эксепшен, как это влияет на результат, если в принципе большую часть мы можем сформировать из остальных?
    
    Сложность ревью, порой, состоит в том, что ревьюер не в контексте и конечный результат может обусловить (bias) его суждения о коде. То есть вы показываете конечную модель, как вы ее поняли, если ТЗ не тривиальное, то коллега будет склонен согласится с вашим видением. В тестах, где вы закрепили свою интерпретацию, тоже будет сложно заметить изъяны. Если же тесты написаны до реализации, и особенно, если идут отдельным коммитом, то их можно использовать в качестве референса для анализа конечного кода.
    
    Тесты в конце часто намешаны с рефакторингом, который кстати является индикатором того, что изначально проектированию было уделено мало внимания. Анализировать такие коммиты сложнее, имхо.
    
    Эфолюцию формализции требований можно посмотреть по чему угодно, что находится под контролем версий.
    
    Да, но вопрос в удобстве.

Tiendil
14.05.2020 17:08
#21616978
По ошибке запостил комментарий мимо ветки: habr.com/ru/post/501900/#comment_21616982

Эффективен ли TDD? +13

Ваше субъективное мнение о TDD

Комментарии (57)

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор

senpay Автор