Терзаем вместе основной кирпичик программиста — Алгоритм.
Проблема
Текущее состояние в области программирования — это обучение ремеслу по большей части личной практикой или разборами примеров стороннего кода, с которым по каким-то причинам приходится сталкиваться.
В результате программированию учишься по наитию. Лишь немного в этом труде помогают сборники алгоритмов, прикладных техник и шаблонов проектирования. Общая совокупность предлагаемых ими рецептов выстраивается длинным списком, и его длина грозит каждому из прочитанных приемов быть позабытым (как была забыта 53-яя личная группа в "телеге" до введения разбиения по каталогам). Но даже тот прием, который остался в памяти, чаще всего просто является описанием прикладной задачи, в которой было успешно его использование.
Почему конкретный прием был успешен в задаче-образце? Будет ли он успешен в твоём проекте? Какие признаки проекта дают понять, что использование приёма уместно?
В личном опыте существования в профессии не раз отмечено, что каждый Junior борется с одинаковыми ветряными мельницами и постигает методы создания программ основываясь только на своих ошибках. Но ведь такие ошибки совершили уже очень многие. Почему до сих пор не создана система правил программирования, которая поможет обойти новоиспеченному кораблю-программисту подводные прибрежные камни? Ну, например, объяснение вреда использования метода "Copy-Paste" для развития кода. Если такие правила получится объяснить малым набором причин, их сформировавшим, то это объяснение обеспечит их запоминание и последующее использование в практике, тем самым поможет уклониться от бесчисленных грабель, разложенных тут и там.
Для компактного и полезного набора объяснений нужно:
- систематизировать методы работы с кодом;
- разобрать по группам приёмы работы с алгоритмами, которые являются главной целью написания любого кода;
- выделить простые признаки применения шаблонов проектирования;
- разработать универсальные правила и наборы эффективных способов построения сложных алгоритмов.
Если обобщить, то нужны алгоритмы для написания и развития алгоритмов.
Задуманная серия статей не претендует на полное решение указанной проблемы. Предпринимается небесспорная попытка сделать первый шаг на пути к этому решению. Этот шаг состоит в выделении структуры и свойств главного кирпичика программиста — Алгоритма.
Задача
Сформулируем основную задачу, которую хочется решить. Для этого сначала запишем операции над алгоритмами, которые программист выполняет в ходе написания своего проекта:
- методы синтеза макро-алгоритма из под-алгоритмов (последовательной, параллельной и смешанной группировкой);
- методы структурной трансформации макро-алгоритмов (оптимизационной, специализирующей, стыковочной...);
- методы сохранения и переноса алгоритмов;
- методы синтеза универсального алгоритма из сходных алгоритмов разных областей исполнения;
- методы специализации универсального алгоритма в новой области исполнения;
- методы формирования и развития комплексной системы совместно работающих алгоритмов;
- методы взаимодействия одновременно исполняющихся алгоритмов;
- и другие методы, полный список которых привести сложно, да и нет необходимости.
Рассмотрим существующие на текущий момент варианты значения слова "алгоритм" в поисках подсказок, о том как можно работать с алгоритмами.
Так, например, формулировка "конечная совокупность точно заданных правил решения произвольного класса задач" говорит что есть возможность как-то "точно задать правила" из них собрать "совокупность" и этой совокупностью "решить" некоторый "класс задач".
Сразу возникает масса вопросов к этому определению:
- Что такое правило?
- Как, кому и для кого это правило можно задать?
- Что есть объединение совокупностью?
- Каким образом правила соотносятся с задачей?
- Что формирует класс задачи?
- Определяется ли способ формирования совокупности правилами и задачами?
- ...
Другая формулировка "набор инструкций, описывающих порядок действий исполнителя для решения некоторой задачи" говорит что есть "исполнитель", который может выполнять некоторые "действия", и при некотором "порядке" выполнения этих "действий" "решается задача". Вопросов не стало меньше:
- Какова структура набора?
- Какие есть варианты действий и исполнителей?
- Существуют ли минимально возможное действие, минимальный набор необходимых действий?
- Каким образом действия встроены в исполнителя?
- Какие есть способы создания копии исполнителя (например, если исполнитель — человек)?
- Как действия зависят друг от друга в упорядоченном выполнении?
- Что есть задача кроме того, что она выполняется последовательностью действий?
- Как задача соотносится с исполнителем и с действиями?
- Возможно ли использовать решение задачи в качестве действия?
- Какие возможны варианты указания порядка действий?
- Если воспроизведение патефоном записи звуков леса является алгоритмом, то какова структура этой задачи?
- Если репликация ДНК является алгоритмом, то каков её исполнитель?
- Если исполнителем является Машина Тьюринга, то как с её использованием решить механическую задачу, например, воспроизведение звука?
Перечислено много вопросов, но они мало помогают в поиске методов работы с алгоритмом. Поэтому поставим себе меньшую задачу, но тоже очень нам важную. Давайте попробуем сформулировать, что делает алгоритм способом решения наших задач, и какие процессы являются для него "действиями". Даже решение этой "маленькой" задачи оказывается очень объемным для одной статьи, поэтому будем его разбивать на части. И поэтому первую статью серии целиком посвятим только "Действию" и его признакам, которые опущены в указанных выше определениях алгоритма, но являются очень важными для ответов на все заданные вопросы.
Определение алгоритма
Рассмотрим определение алгоритма, говорящее, что он — приводящая к решению задачи последовательность действий. Как программисту мне приходится писать много кода. Этот код состоит из частей. Такими частями являются и функции, и классы, и модули. Когда я пишу текст функции — я занимаюсь написанием алгоритма.
Раньше алгоритм создавали в виде блок схем и полуавтоматически компилировали в машинные коды. Сейчас я избавлен от необходимости быть художником и компилятором для написания программы. Текст моей функции — это запись алгоритма в текстовом виде — его текстовая блок-схема. Здесь можно вспомнить Scratch, где используется визуальное создание блок-схемы алгоритма без написания текста. Способ записи алгоритма сейчас не так важен.
Важно, что в написании алгоритма функции я могу использовать вызовы других функции, которые я или другой программист уже написал до этого момента. Вспоминая фразу "последовательность действий, приводящая в решению задачи", можно отметить, что функции, написанные ранее, являются моими "действиями". То есть "действия" могут быть функциями. Если обобщать, то "действия" могут быть алгоритмами.
Если "действие = алгоритм", то определение можно попробовать переписать рекурсивно "алгоритм — это приводящая к решению задачи последовательность использования существующих алгоритмов". Рекурсивные определение не самое простое, что можно записать в словаре обычного человека. Но для программиста и математика эта форма знакома. Мы умеем с ней работать, и это даёт нам преимущество в рассмотрении разных задач, разбиваемых на подобные себе подзадачи. Так давайте воспользуемся этим преимуществом.
Чтобы разрешить рекурсию нам необходимо найти:
- терминальное условие выхода из рекурсии — минимальное неделимое "действие" (атомарный алгоритм), которое можно использовать в разработке алгоритма;
- способ перехода от текущего уровня рекурсии (набора "действий") к следующему уровню (алгоритму).
Действие
Для начала рассмотрим "действие" и попробуем найти причину, обеспечивающую возможность использования существующего "действия" для создания нового алгоритма.
Этой причиной является возможность повторного использования "действия" с получением тождественного результата. Только тогда разработанный с использованием этого "действия" алгоритм решения некоторой задачи будет одинаково решать эту задачу снова и снова. Мы нащупали важные законы нашего мира, в котором:
- существуют "действия", главным свойством которых является одинаковость результатов их исполнения в разные моменты времени и в разных местах,
- существует возможность создать такую схему использования нескольких "действий", которая сформирует из них новое "действие", которое мы назвали алгоритмом.
Какие признаки "действия" кроме повторимости делают возможным его использование в создании алгоритма? Что является терминальным неделимым "действием"? Чтобы ответить на этот вопрос стоит рассмотреть разные примеры "действий" из нашего опыта. Программисты встречали их много раз. Это и сложение, и умножение, и установка цвета пикселя на экране. Но мы знакомы с ними и вне программирования. Вся наука основывается на повторяемых явлениях.
Закон гравитации, описывающий повторяющееся явление падения яблока, тоже может стать действием. Ведь любое яблоко будет падать на землю? Значит этот процесс можно использовать в качестве "действия"! Например решая задачу прогнать Ньютона от яблони, на которую Вы случайно забрались ранее.
Рассмотрим, что происходит при выполнении "действия". Например, во время падения яблока с ветки яблони на землю. В этом процессе происходит несколько изменений. Если вспомнить школьную физику и рассмотреть ситуацию в системе отсчета, привязанной к Земле, то сила гравитации вызывает изменение скорости яблока, разгоняя его. При этом в процессе отмечается еще одно важное изменение — уменьшается расстояние между яблоком и Землей.
В рамках примера процесса "Земля-Яблоко" можно отметить у "действия" следующие признаки:
- наличие процесса изменения (расстояния и параметров движения объектов);
- наличие объектов, взаимодействие которых вызывает такие изменения;
- наличие локальности процесса, то есть существование значения расстояния между объектами, с превышением которого их взаимодействие перестает вызывать процесс изменения, что делает невозможным использование "действия" (Земля и гипотетическое яблоко, находящееся вне солнечной системы).
Рассмотрим с этими признаками разные области и процессы, выделяя в них примеры "действий" и контролируя особенности указанных признаков в описании структуры "действия".
Физические процессы
Для физических систем, процессы которых мы наблюдаем в нашем мире, характерные объекты и изменения опираются на фундаментальные взаимодействия и потому их достаточно просто выделить по аналогии с гравитационным взаимодействием Земли и яблока. Например, для системы из протона и электрона или системы двух протонов.
Отдельно от этих простых взаимодействий двух объектов стоят многокомпонентные процессы, например, ядерные реакции (по структуре "действия" близки к химическим процессам, рассматриваемым далее). Сложны и процессы описываемые суммарным взаимодействием большого числа элементов, например, "идеальный газ". Пока отложим их рассмотрение и сосредоточимся на самых простых примерах.
Химические процессы
Перейдем к следующей большой области — химическим процессам. Химические реакции (например, ) по признаку своей повторимости так же являются "действиями". Объектами в них являются атомы и молекулы. Для описания происходящих изменений необходимо немного преобразовать "физические" изменения. Так изменения параметров движения в совокупности дают нам изменение температуры в ходе химической реакции. А среди изменений расстояний между молекулами мы, игнорируя броуновское движение, можем выделить фиксацию расстояния в виде повторимого формирования и разрушения связей между частями взаимодействующих молекул. Локальность для химической реакции тоже существует — это отсутствие реакции при нахождении гидроксида натрия и соляной кислоты в разных пробирках и наличие реакции при соприкосновении веществ. Конечно, в "химической" области "действий" есть особенности не сводящиеся к молекулам, например, фотохимические реакции, где к объектам необходимо добавить фотоны. Самые простые процессы выбраны для рассмотрения намеренно.
Математические процессы
Следующей областью выберем "действия" из известных нам абстрактных алгоритмов. Самые яркие их представители — математические процессы. В этой области есть действительно "сложные случаи", но для этой статьи достаточно хорошо знакомых примеров. Рассмотрим в качестве "действия" достаточно элементарную операцию — сложение. А примером этого "действия" выберем сложение математиком двух целых чисел.
В ситуации с математиком можно выделить много объектов, но с точки зрения "действия" ("сложение математиком двух целых чисел"), объекта всего три: это объект "математик", объект "первое число" и объект "второе число". В отличие от всех рассмотренных ранее объектов числа являются обозначениями, то есть виртуальными объектами. И их преобразование в алгоритме более сложно устроено нежели изменение расстояния и параметров движения объектов, как это было для "химических" действий. Подробности такого преобразования — это тема отдельной увлекательной статьи. А в рамках текущей рассмотрим древнего математика, который складывает числа, используя кучки камешков (рим. 'calculi'), и более "современного" математика, использующего абак. Абстракции таких способов вычисления суммы не так далеко отошли от физических и химических процессов, поэтому структура процессов их "действий" полностью описывается изменениями расстояний и связей.
Интересно, что на примере древнего математика становится понятен смысл слова "сложить", которое отсылает нас к действию "класть" и к фразе "положить вместе".
Сложение и древний математик
Для математика, оперирующего камешками, сумма это "действие" со следующими характеристиками.
Исходные объекты:
- это сам "математик" (он взаимодействует со слагаемыми);
- лежащая отдельно кучка №1, содержащая и связывающая вместе камешки (подобно химическим связям), и обозначающая первое слагаемое;
- лежащая отдельно кучка камешков №2, обозначающая второе слагаемое.
Процессы:
- "математик" подходит к кучкам (физически изменяет расстояние между кучками и собой) и начинает с ними взаимодействие;
- "математик" объединяет две кучки (физически изменяет расстояние между двумя кучками или переносит все камешки одной кучки в другую, возможно, используя "действие" "Перенос по-одному" камешку)
Результирующие объекты:
- сформированная кучка камешков, обозначающая результат (сумму);
- "математик", отошедший от кучки результата и переставший на неё воздействовать.
Сложение и математик-абакист
У математика с абаком ситуация сложнее. Кучки разделены по значению на разрядные борозды.
Можно рассмотреть самый простой абак с двумя разрядами-бороздами. Пусть он будет десятичный. Тогда один камешек на борозде десятков соответствует десяти камешкам на борозде единиц. И 10 — это максимальное количество камешков на борозде единиц. По сравнению с действием первого математика меняется представление слагаемых. И в арсенале математика уже необходимы нескольких готовых "действий".
Действия:
- "Перенос по-одному" из борозды в борозду одинакового уровня (действие, позаимствованное у первого математика);
- "Перенос в десятки", которое необходимо выполнять, если борозда единиц полностью заполняется, тогда из неё убираются все камешки кроме одного, который переносится в борозду десятков.
Исходные объекты:
- это сам "математик" (он взаимодействует со слагаемыми);
- группа камешков №1, лежащих и удерживаемых двумя бороздами (единиц и десятков), и обозначающих первое слагаемое;
- группа камешков №2, лежащих и удерживаемых двумя бороздами (единиц и десятков), и обозначающих второе слагаемое;
Процессы:
- "математик" подходит к группам борозд (физически изменяет расстояние между ними и собой) и начинает с ними взаимодействие;
- "математик" объединяет камешки из двух борозд единиц (физически изменяет расстояние между камешками, разрушает связи со старой бороздой и создает связи с новой) с использованием действий "Перенос по-одному" и "Перенос в десятки";
- "математик" объединяет камешки из двух борозд десятков с использованием действия "Перенос по-одному"
Результирующие объекты:
- сформированная группа камешков в двух бороздах (единиц и десятков), обозначающая результат (сумму);
- "математик", отошедший от группы камешков результата и переставший на них воздействовать.
Локальность в этих математических "действиях" описывается отсутствием взаимодействия двух слагаемых, находящихся далеко от математика, и запуском процессов сложения когда все три объекта сложения "близко". Повторяемое изменение в математическом "действии" выражается в изменении связей между камнями и удерживающими их локациями (кучками, бороздами).
Сложение и машина Тьюринга
Можно пойти чуть дальше и заменить математика в таких "действиях" на "управляющее устройство" машины Тьюринга. Тогда "ячейки ленты" машины Тьюринга будут содержать слагаемые.
При этом остаётся и признак локальности как возможность взаимодействия управляющего устройства только с текущей ячейкой ленты, и признак изменения параметров объектов, который можно описать как изменение состояния ячеек.
Подробное описание исходных и результирующих состояний объектов, а так же "действий" производящих эти изменения для сложения, исполняемого машиной Тьюринга, оставим за рамками этой статьи. Но упомянем, что перейдя к машине мы снижаем требования к исполнителю "действия", что является главным способом для создания формальных методов работы с алгоритмом. Можно поставить себе целью упрощение каждой составляющей алгоритма до состояния, когда её выполнение можно будет поручить компьютеру. Тогда в определении алгоритма не останется темных мест, и многочисленные вопросы перечисленные в начале найдут свои ответ. Пока формализован только исполнитель. Скажем спасибо за это Тьюрингу и вспомним про "действие", формализация которого уже на пороге.
Выводы
Соберём всё, что мы отметили рассматривая разные примеры "действия":
- "действие" можно использовать для создания алгоритма;
- "действие" может быть элементарным;
- "действие" может быть реализовано алгоритмом;
- в "действии" обязательно участвует некоторый объект или группа объектов;
- для группы объектов "действие" происходит только тогда, когда эти объекты "достаточно близко";
- в действии изменяются связи и параметры объектов (включая параметры их движения);
- "действие" всегда и обязательно должно быть повторимо.
Признак Повторимости помогает нам в создании наших алгоритмов. С его использованием мы из всех процессов выделяем те, что являются "действием" и на их основе создаём новые алгоритмы. Более того этот признак достаточно прост и на основе его формализации можно снизить требования к системе обнаруживающей и создающей "действия" и поручить это нашему компьютеру.
Следующая статья серии (Часть 2) будет посвящена рассмотрению способов, с использованием которых "действия" могут быть сгруппированы в алгоритм. Этих способов достаточно много и есть предпосылки, что их описание не получится уместить в одну статью. Напишем — увидим.
Спасибо Вам за внимание.
Отзывы
Буду очень благодарен за отзывы и предложения, так как они помогают мне скорректировать направление развития работы в области.
Отдельное волнение у меня есть по стилю и форматированию, используемым в статье (кавычки, абзацы, курсив). Напишите, пожалуйста, если у Вас есть замечания к ним. Можно личным сообщением.
Ссылки
- Open source (GPL) проект: (Общая теория алгоритмов wiki)
- Первая статья темы "Разрабатываем теорию алгоритмов как проект с открытым исходным кодом": (Статья Хабр)
- Все рисунки к статье (кроме заглавного) сформированы сообществом Wikipedia. Лицензия (Creative Commons Attribution-Share Alike 4.0 International)
sshikov
Что-то типа GEB решили написать в виде цикла статей? :)
>Текущее состояние в области программирования — это обучение ремеслу по большей части личной практикой
>В результате программированию учишься по наитию.
Не понимаю такие обобщения. «в области программирования» — это где? В вашей средней школе? В вашем ВУЗе? В вашей стране (в какой конкретно)? В мире? Если в мире, то откуда вы знаете, как устроено обучение во всем мире? Ну вот не верю я, что знаете. Было бы честнее сказать, что это только личный опыт и есть.
Уж всяко кроме личной практики и наития еще бывают умные книги. Это как минимум.
Кстати, если уж вы стали рассказывать про Тьюринга, то не стоит забывать его учителя Алонзо, и его лямбда-исчисление. Это как минимум другой способ описания алгоритмов. И не последний.
ai_borisov Автор
Вы правы. Перестарался с этим обобщением. Конечно, тут говорится о моей школе, моём ВУЗе и месте работы.
А умные книжки — это очень хорошо. Они действительно помогают.
Для лямбда-исчисления А.Чёрча намечена отдельная часть в этой серии статей. Надеюсь, что режим самоизоляции позволит еще поработать в этом направлении.
С уважением.
sshikov
Ждем продолжения. Не скажу, что начало бесспорное, но посмотрим, как пойдет.