Это философская заметка про управление и воспитание, а также про очень неожиданное озарение связанное с моделированием цифровой плесени. Навеяно беседами о проблемах управления строительством, а также сетью существенно удалённых филиалов.

image

Борьба популяций цифровой плесени под воздействие испепеляющего солнца.

Предуведомление. Статья состоит из трёх частей, и первые две кажутся вообще друг к другу никак не относящимися, однако есть третья объединяющая их.

Предуведомление второе. Есть разные способы мотивации и есть адепты подхода в котором наказание(и вообще отрицательное подкрепление в целом) не применяется. Неплохо описано в книге Карен Прайор «Не рычите на собаку!» очень рекомендую всем, кто не читал. Однако эта заметка про иной подход, и скорее про эффективность разных вариантов отрицательного подкрепления.

Предуведомление третье. Я, по своим взглядам, эволюционист и уверен что естественный отбор происходит не только среди живых организмов но также и среди специалистов, предпринимателей, фирм и предприятий, народов и иногда даже идей.

Часть первая. Неотвратимое наказание и выборочная проверка


Я многократно слышал про принцип неотвратимости наказания, и о том что важен не размер наказания а его неотвратимость, и тогда такая мера воздействия будет работать эффективнее.
Но жизнь-штука сложная и производить непрерывный постоянный контроль дорого и нецелесообразно. В ответ на это человечество изобрело концепцию внезапных и внеплановых проверок. Будь то периодические внезапные проверочные работы в школе, или штрафы за несоблюдение ПДД которые раздаёт припрятанный в кустах автомобиль автоинспекции, внеплановые аудиторские проверки предприятий, контрольные закупки и т.д.

Кратко закрепим на примере ПДД: Камера которая стоит и штрафует всех с нарушением — неотвратимое наказание(тех кто отсудится сюда не включаем). Экипаж ГИБДД в кустах который стоит в случайном месте и выборочно контролирует скорость — внезапная проверка.

По идее внезапные проверки должны работать следующим образом: человек понимает что в любой момент его деятельность могут проверить, потому он будет действовать с соблюдением норм. И собственно если он работает нормально, то действительно, внеплановые проверки будут выявлять отсутствие нарушений и всё будет отлично.

Однако, если мы посмотрим вокруг, то внезапно выясним что внеплановые проверки мягко говоря не так эффективны как хотелось бы.

Часть вторая. Цифровая плесень


Игрался я с симуляцией плесени, по мотивам статьи habr.com/post/418545 Также как описано у автора, в моей реализации каждая клетка имеет свой геном и исполняет его. Может я когда-нибудь опубликую и свою реализацию. Существенным отличием является то, что различные гены имеют существенно(около двух десятичных порядков) разное время исполнения. Ну например принять решение на основе температуры — легко. А принять решения на основе оценки насколько родственны тебе соседи (для этого надо сравнить много внешних признаков) многократно тяжелее.

Изначально я сделал для любой команды одинаковые затраты внутренней энергии.

Добавив очередной сложный ген и запустив это дело я обнаружил существенное проседание производительности. Анализ выявил популяцию чудиков которые очень активно использовали долгие по исполнению гены, и надо сказать весьма эффективно, так что все кто освоили эти гены прут со страшной силой и давят остальных, а хотелось большего разнообразия и конкуренции видов. И тут мне пришла в голову идея о том, что можно затраты внутренней энергии на исполнение гена сделать пропорциональными времени исполнения оного. И я тупо вписал замер времени и домножил затраченные наносекунды на коэффициент и вычел из внутренней энергии клетки. Это мне казалось хорошим решением т.к. полностью автоматизировало учёт сложности исполнения гена и в целом хорошо ложилось на эволюционные идеи, пусть выживают те, кто действительно по делу использует сложные вещи, а сложные вещи дороги.

Запуск показал ещё большее проседание производительности, виной всему достаточно дорогой на используемой платформе замер времени, всё-таки код интерпретатора генома написан достаточно производительно и замер времени на фоне обычной интерпретации стал перевешивать. Однако злостные эксплуататоры очень дорогой но эффективной операции перестали жёстко доминировать. Я проверил, ген есть и иногда работает, но теперь не так бездумно часто. Разнообразие вернулось, снова можно было наблюдать войны разноцветной плесени.

И тут я подумал, а давайте я буду делать выборочный замер, с вероятностью 10% я буду замерять затраты времени, а коэффициент пересчёта времени в энергию увеличу в 10 раз. В среднем влияние на систему окажется таким же (думал наивный я), а затраты времени на замер упадут в 10 раз.

Запускаю и опять махровым цветом разрастаются всё те-же чудики которые очень активно используют тяжёлую но выгодную команду. Что? Почему? Ещё раз включаю замер на каждой итерации и они не так прут. Включаю выборочный замер и они опять есть. Равномерные затраты и увеличенные в 10 раз затраты применяемые с вероятностью 10% дают радикально разный результат. На тупейшей плесени. А дело казалось вот в чём. Обычные затраты на этот ген были большими, но посильными для клетки. Однако увеличенные в 10 раз затраты оказывались непосильными и просто напрочь убивали клетку на месте. А теперь давайте прикинем. Злостные эксплуататоры этого гена например исполняют его раз в 5 тактов симуляции(это очень часто). И с шансом 10% их на этом спалят и убьют. Это по сути превращается в условие — делайте что хотите но каждый такт 2% вашей популяции попадутся на использовании очень дорогой операции и их убьют. И в таких условиях эти гены опять показывали преимущество и злостно давили всех остальных. Всё что должна делать такая популяция — размножаться более чем на 2% в такт симуляции, что они с успехом и делали. И что самое страшное, ещё большее увеличение штрафа за эти гены вообще ничего не меняет, как убивало попавшихся так и будет убивать.

Т.е. получилось что вместо цены за этот ген есть случайное наказание(убийство) тех кто его использует. В среднем, интегрально, затраты энергии ровно такие-же. Но результат кардинально разный.

И вот тут для меня в новом ключе открылся смысл утверждения про неотвратимость наказания и про, то почему внезапные проверки не работают.

Часть третья объединение


Существуют незаконные приёмы в бизнесе. Для примера возьмём продавцов которые обвешивают на рынке(манипулируя весами продадут вам меньше чем озвучат). Те, кто не обманывают имеют один показатель прибыли. Те, кто начинает обманывать начинают извлекать существенную дополнительную прибыль, и даже могут ставить очень низкие ценники, за счёт чего привлекать покупателя. Если бы за каждый обвес продавца бы наказывали небольшим штрафом который делает этот обвес невыгодным, то никто бы так не делал. Но давайте рассмотрим ситуацию, если мы будем периодически в случайный момент времени проводить контрольные закупки и выписывать очень большой штраф который будет выводить продавца с рынка. Допустим продавец в 30% продаж решает обмануть покупателя. И также допустим что до каждого продавца мы доходим с контрольной проверкой в случайный день раз в месяц, что означает примерно 3% шанс того что этого продавца будут проверять в этот день. 3% * 30% шанс того что он решит обмануть нашего контрольного закупщика даёт 1% того что он будет обнаружен в этот день. Допустим все продавцы такие. Это значит что каждый день мы будем вылавливать на мошенничестве 1% от имеющихся у нас продавцов и выписывать им огромный штраф и они будут уходить с рынка. А теперь интересное. 1% наказания означает что в 99% нарушение не будет замечено. Теперь прикинем за 365 рабочих дней, каков шанс что вас ниразу не поймают? 0.99^365~0.025 Т.е. 2.5% торгашей которые каждый день обманывают 30% покупателей в течении года не будут пойманы такими проверками. А у них будет самая хорошая прибыль. И именно они будут гораздо конкурентнее тех, кто не пользуется таким хаком. Аналогично произойдёт и например с людьми которые воруют на работе.

Самое страшное в этой ситуации именно то, что появляются систематические нарушители правил и которые никогда не попадаются. И для этого не нужна никакая сознательная деятельность. Они просто будут потому что нарушать выгодно, те, кто попались вылетели, а кто не попался — остались. Таким образом назначая такие внезапные проверки мы сами создаём тех, кто всё равно нарушает правила и не попадается. А люди же ещё разговаривают друг с другом, берут пример. В случае с воровством появится условный Петя, который регулярно приворовывает, также регулярно проходит выборочные проверки и ни разу за много лет не попался.

Итог всей заметки: вводя выборочные проверки мы сами создадим тех, кто регулярно нарушает правила и ни разу не попался. А они будут оказывать дурное влияние на остальных, в итоге будем иметь очень много нарушающих, постоянную ловлю нарушителей, будем их увольнять, но это никак не будет снижать долю нарушающих.

Для меня именно это явилось ключевым моментом понимания того, почему схема с выборочными проверками и мгновенным увольнением попавшихся в итоге не приводит к хорошей дисциплине.
И точно также с техникой безопасности. Нарушающие её быстрее и проще делают свою работу, но т.к. их не всегда при этом убивает появляются дяди Вани, «да я 100 раз так делал, не ссы». Вот почему работодатель заинтересованный соблюдении ТБ должен постоянно наблюдать за её соблюдением и ключевым моментом должно быть постоянство, а не размер кары.

Создание условий где нарушение правил не выгодно работает гораздо лучше чем редкие но очень сильные наказания. И теперь стал полностью понятен механизм, почему это так.

Отдельно за рамки этой статьи выпал гемблинг. Т.е. азарт на тему попался-не попался. А это также имеет важнейшую роль в философии нарушения правил или кражах.

Комментарии (88)


  1. lexnekr
    08.10.2018 11:49

    Только стационарная камера — тоже выборочная проверка. Постоянной проверкой был бы, скажем, чип в транспортном средстве. Впрочем, тут уже возникает вопрос, как проверять что тип не сломан и не обманут (и не удалён).


    1. Aquahawk Автор
      08.10.2018 12:16

      Вы верно уловили посыл.


    1. ariklus
      08.10.2018 14:56
      +1

      Достаточно часто установленные камеры или достаточно трудноудаляемый чип уже превращают наказание из «случайно распределяемого» в «неотвратимое». Другое дело что неотвратимое-случайное это скорее шкала чем два дискретных статуса.

      Неотвратимым будем, например, считать такое наказание, которое происходит более чем в 50% нарушений (или в случае с частыми нарушениями вроде обвешивания 30% покупателей — более чем с 50% вероятностью за неделю нарушений).

      С помощью различных уловок и инвестиций неотвратимое наказание можно превратить в случайное или вообще сделать риск наказания ничтожным, но ресурсы затраченые на это могут превышать прибыль извлекаемую из нарушения.


      1. lexnekr
        08.10.2018 15:02

        Если на дороге стоит камера, то нарушать перестают ровно ПЕРЕД камерой. Сразу после неё — тапку в пол.
        Как результат, если на участке трассы в 100км есть 10 камер, то соблюдать скоростной режим будут на 10км (10 раз по 1км перед каждой камерой).


        1. ariklus
          08.10.2018 15:14

          Потому и говорю о стоимости уменьшения вероятности наказания.

          Если у нас стоят знаки за 500 метров до каждой камеры — то нарушать перестанут лишь те водители которым влом все время тормозить-разгоняться.

          Если камеры без знаков — то нарушать перестанут те водители которым влом запоминать расположение камер (если они постоянно там ездят) или как-то занести их расположение в навигатор.

          Если камеры мобильные (перевешиваются/переставляются каждый месяц) то стоимость избежания камер возрастает настолько что нарушать продолжат или те, кому плевать на штрафы, или те для кого это представляет спортивный интерес.


          1. lexnekr
            08.10.2018 15:35

            И это тоже не совсем верно. Если поток на дороге есть, то многие просто идут со скоростью потока, который как раз замедляется только перед камерами.


        1. Seawind
          08.10.2018 18:26
          +3

          Читал, что в некоторых странах засекают время проезда между камерами.


          1. smilyfox
            09.10.2018 09:05

            В России — комплекс Автодория. Минус для контролирующих, в том что стационарный


        1. roscomtheend
          09.10.2018 10:18

          Камера может смотреть и назад, у нас не нужно фото водителя.


          1. lexnekr
            09.10.2018 10:31

            +1км после камеры не меняет ситуации в целом.


        1. botyaslonim
          10.10.2018 12:59

          Да нет. Это же не теоретический вопрос. Сейчас водители многие уже настолько дрессированы, что больше +20 не едут почти никогда. А многие перед камерами тормозят до 60 даже за городом, где разрешено 90


          1. lexnekr
            10.10.2018 13:59

            Такое ощущение, что мы с вами в разных странах по разным дорогам перемещаемся.
            Вокруг Дефолт-сити по крайней мере такой законопослушности не замечено. Ну т.е. в районе камеры едут может и 60, но в остальных местах и 150 и сколько могут…


            1. botyaslonim
              10.10.2018 14:01

              Именно вокруг дефолт-сити я и живу. В Сибири этим летом был — там по-другому, там камер практически нет, и такого животного страха у людей нет. А в подмоскве даже с левого ряда уже не сгоняют. И МКАД может вечером всеми рядами сразу ехать средние 80 просто так.


              1. lexnekr
                10.10.2018 14:02

                Да, 100% разные страны и разные МКАДы.


                1. Aquahawk Автор
                  10.10.2018 14:06

                  Это кстати ещё один интереснейший момент управления. Одни и те-же условия люди воспринимают совершенно по разному. Это косяки восприятия, и какие методы, кроме пропанагды или управления ожиданиями, применять для выравнивания — не понятно.


  1. KonkovVladimir
    08.10.2018 11:50

    Одна единственная проверка — на страшном суде, я так думаю самая не эффективная.


    1. Aquahawk Автор
      08.10.2018 12:17

      Мы, к счастью одних и сожалению других работаем в этом мире и одного суда с финальным решением тут нет.


    1. ariklus
      08.10.2018 15:04

      Страшный суд — это крайний случай страшного но маловероятного и отложенного наказания.
      Поедание устриц может привести к вечным мучениям после смерти.
      Но наказание: а) Не факт что действительно будет
      б) Если будет то будет нескоро, что создает достаточно наблюдаемых примеров людей которые едят устриц и не горят в адском пламени при отсутствии наблюдаемых примеров обратного.


    1. roscomtheend
      09.10.2018 10:20

      «Нельзя попасть в рай одной религии, не попав в ад остальных», потому эффективность пугала страшного суда достаточно низко, особенно когда единственное.


    1. amarao
      09.10.2018 11:31

      Мне кажется, называя суд «страшным» вы высказываете неуважение к социальной группе судей. Не?


  1. Hardcoin
    08.10.2018 12:33

    Очень крутая статья, спасибо. Очень хорошо всё уложилось. Теперь бы это как-то короче сформулировать (в идеале — виде теоремы), что б другим рассказывать.


    1. Aquahawk Автор
      08.10.2018 12:39

      Несколько месяцев вынашивал идею того как это изложить, и короче не получилось. Раньше вообще излагал только в достаточно длительном разговоре.


      1. Hardcoin
        08.10.2018 12:45

        Полное описание может быть длинным. Но должно быть ещё короткое описание и название.


        Приведу в пример иллюзию частотности. Есть название, есть краткое описание (это когнитивное искажение, что новая информация, которая повторилась дважды, воспринимается как очень часто повторяющаяся) и есть длинное описание (в Вики).


        Без названия и краткого описания (хоть и не полного) идея не может распространяться, к сожалению.


        1. Aquahawk Автор
          08.10.2018 12:49

          Кратко можно сказать так: выполняя выборочную проверку всегда будет некое количество систематически нарушающих, которые в силу вероятности никогда не будут проверены в момент совершения нарушения. А назвать можно: систематическая безнаказанность при выборочных проверках.


          1. DGN
            08.10.2018 21:36

            Отсюда растут ноги у так называемого воровского фарта…

            К счастью, ну или к сожалению, люди не роботы и не склонны высчитывать свое вероятностное вознаграждение и долгосрочную выгоду.

            Еще, есть такой момент, что наказание от робота человек психологически переживает намного легче, чем от человека. Скорее всего, по причине того, что, вещи наказывали конкретного человека куда чаще и больше других людей (как там по классике — за лишнюю рюмку асфальт поднялся и ударил меня в лицо).

            Получается, для людей (но не факт что для человечества) будет куда лучше жить в мире тотального контроля и пеницитарного импланта. Скорее всего, в таком мире они будут чувствовать себя полностью свободными. Сказал бранное слово — три дня мутит. Захотел пойти на митинг, и вдруг понос. Взял чужое — руку свело.


            1. SwingoPingo
              09.10.2018 08:09

              Вы исходите из следующих предпосылок:
              — Интересы управляющего системой наказаний совпадают с интересами наказуемых
              — Система наказаний не стоит ничего или стоит мало
              — управляющий не допускает ошибок в управлении хотя бы действуя в своих собственных интересах.

              И все три предпосылки не верны.


              1. DGN
                09.10.2018 10:35

                2 и 3 пункты упрощены с целью удобства моделирования… Хотя, можно отбирать энергию у всех в некотором объеме, обеспечивая тотальную проверку и посмотреть какая будет картина.

                А пункт 1 в вашей терминологии из чего следует? КМК тут большое поле для дискуссий. Если отойти от модели в реальное общество, то с обывательсткой точки зрения очевидны две модели. Теория заговора, тайного или явного правительства, преследующего свои неведомые (или очевидные) нам цели. Либо очеловечивание государства, предусматривая наличия у него например воли и целей.


                1. SwingoPingo
                  09.10.2018 13:09

                  «Очеловечивание» допустим государства, хотя тут возможна система шире (или уже) среднестатистически происходит путем назначения конкретных человеков на абстрактные посты.
                  Если даже взять что абстрактному посту цели написаны идеально сбалансированные для всех участников социума (а не в перевес для генерального секретаря организации, например), то конкретный исполнитель на посту имеет собственные интересы, зачастую противоположные интересам социума. Любого социума. В той же песочнице геном получивший контроль над правилами развития судя по всему выиграет всю карту. Гармоничное же влияние всех интересантов на систему наказаний в интересах всех же этих интересантов задача в принципе неразрешимая.


                  1. DGN
                    09.10.2018 14:02

                    Конкретные люди во первых совершают конкретные ошибки, и ошибка наверху транслируется на всю систему, зачастую с усилением (сделать глупость проще). Во вторых есть конфликт правил и условий. Они не то что не идеально сбаллансированы, а зачастую прямо противоречат друг другу. До кучи, есть еще и личные и кланово-семейные цели индивида на посту. Все это приводит к закономерному итогу, индивид оптимизирует свою деятельность на посту совсем не по тем критериям, которые подразумеваются.

                    Цели социума. Самая спорная часть, а корректно ли говорить о том что социум имеет цель? Можно ли её упростить до максимального расширения и пожирания (контроля) ресурсной базы?


                    1. SwingoPingo
                      09.10.2018 14:40

                      Скажем так. Если взять дополнительное условие гармоничности системы, т.е. она должна существовать очень долгое время. При этом да, есть смысл в контроле над ресурсной базой. Но тогда получается что средневековье лучший вариант. И ресурсы под контролем и система гармонична. Дилемма


    1. zerg59
      08.10.2018 14:23

      Отчасти похоже на «ошибку выжившего»: Тот, то ни разу не попался — говорит, как он крут. А те, кто попался — не говорят ничего.


      1. Aquahawk Автор
        08.10.2018 14:28

        Да, ошибка выжившего играет большую роль в этом процессе.


      1. DGN
        08.10.2018 21:37
        +1

        Еще как говорят, но они ведь нытики и неудачники, не так ли?


      1. qw1
        08.10.2018 22:26
        +1

        То есть, чтобы достичь эффекта, нужно попавшимся мазать уши зелёнкой и выпускать обратно. Когда у 98% будут уши зелёные, все задумаются


        1. SwingoPingo
          09.10.2018 08:10

          И если у тебя уши не зеленые, то тебя исключают из социума, что само по себе наказание.


  1. sergehog
    08.10.2018 12:36

    немного поработать над текстом — и статья в какой-нибудь журнал Social Behavioral Science готова!


    1. Aquahawk Автор
      08.10.2018 12:38

      Спасибо, да, тексты — моя слабость.


  1. SwingoPingo
    08.10.2018 15:17
    +1

    То есть модулятору поведения социума выгоднее всего плодить в социуме как можно больше «чуть чуть» наказанных индивидуумов? Как найти максимум по эффективности соотношения частота проверок/тяжесть наказания?

    Второй вопрос — при повышении частоты проверок есть ли смысл уменьшать наказание или так же максимально — удалять попавшихся?


    1. Aquahawk Автор
      08.10.2018 15:25

      Оптимально всегда(в смысле нарушил — получи штраф). Можно конечно удалять сразу всех провинившихся, но тогда никого не останется. А вот если просто сделать это невыгодным, т.е. регулярный штраф превышает регулярную выгоду, тогда никто кроме совсем отбитых так делать не будет. Ну и прощать таки надо, смотрите notdotteam.github.io/trust


      1. SwingoPingo
        08.10.2018 15:31

        А если в систему ввести свойство генома запоминать на некоторое время результат действий? Т.е. ошибся — получил штраф, 10 минут помнишь об этом, потом забыл.


        1. Aquahawk Автор
          08.10.2018 15:36

          В принципе это можно, ну всмысле могут додуматься. У меня геном может читать любые состояния клетки и по ним делать if. Соответственно можно сделать так чтобы клетка завела дополнительно состояние типа сумма штрафов и могла от него плясать. Но она может и игнорировать это. А если они и так прут не считаясь с тем что 2% их цивилизации выкашивает каждый шаг симуляции, зачем им отказываться от столь эффективной стратегии, ради сохранения жизни некоторых своих собратьев? У меня вообще самые эффективные получились каннибалы которые во все стороны всех жрут, в т.ч. своих. И итоге хорошие гены быстро распространяются на уже занятой этой популяцией территории.


          1. KonkovVladimir
            08.10.2018 19:53

            У меня вообще самые эффективные получились каннибалы

            В обычном мире так не происходит потому что из 1кг пищи не получается 1 кг биомассы, а гораздо меньше и пищеварительная система каждого животного приспособилась к поеданию определенной пищи — газель есть траву, тигр есть газель.
            Тигр не станет есть траву, а газель — мясо даже well done прожарки.


          1. KonkovVladimir
            08.10.2018 20:31

            В обычном мире гораздо больше ограничений, например размер генома ограничен это не позволяет организму иметь какую угодно сложную программу поведения — возникает специализация, каждый приспособлен к каким-то специфическим условиям обитания.
            Важно понять что размер генома ограничен не общим количеством ячеек памяти, а вероятностью ошибки копирования между поколениями, которая в реальности составляет 1 байт на N байт генома, а не 1 байт на весь геном любой длины.


            1. Aquahawk Автор
              08.10.2018 20:46

              В моей симуляции кстати рейт задан именно как шанс корректного копирования одного гена.


              1. KonkovVladimir
                09.10.2018 11:43

                Наверное стоит подробнее раскрыть мою мысль.
                Представьте у вас есть жесткий диск объемом X и есть устройство копирования допускающее ошибки, причем так совпало что для нашего диска объемом X в 50% случаев происходит копирование без ошибок, после копирования можно проверить возникла ли ошибка и выбросить копии с ошибками (в природе этим занимается естественный отбор).
                Для диска объемом X нужно в среднем копировать дважды и одну копию выбрасывать (2-х кратный избыток энергии).
                Для диска объемом 2X нужно копировать в среднем 4 раза, 3X — 8 раз, 4X — 16 раз и.т.д.
                Видно что энергетические затраты возрастают экспоненциально с возрастанием объема копирования. В вашей игре насколько я понял вероятность безошибочного копирования фиксирована и равна 75%?


    1. ariklus
      08.10.2018 15:49
      +1

      Для частых нарушений «неизбежно» — значит «случается с нарушителями достаточно часто чтобы связь между преступлением и наказанием формировалась быстрее и сильнее связи между преступлением и профитом от него».

      При квази-неизбежном наказании в принципе достаточно такого которое переведет подавляемое поведение из «выгодного» в «невыгодное». «Страшность» же наказания отлично разбивается о «пронесет» и «вот у Михалыча все норм».
      Например, в восприятии среднего человека (психологически) два года тюрьмы за Х и пять лет тюрьмы за Х — почти одно и то же, и при раскрываемости в 5% повышение средней цены преступления с ~35 дней до ~90 пройдет незамеченным. А вот уменьшение количества позитивных примеров которые делают Х годами и получают с этого профит — сделает намного больше.


    1. DGN
      08.10.2018 21:43
      +1

      А собственно что происходит сейчас? Это самое! Наказания за переход улицы, за лайки, за торренты, за чувства верующих…

      По идее, невыгодно удалять. Вот скажем есть воры. Сейчас их сажают в тюрьму. В итоге обыватель видит успешных воров, неуспешные выведены из социума куда то там на колыму. А если рубить руки — они будут в общей популяции и обыватель будет наглядно видеть результат.


      1. Fracta1L
        09.10.2018 08:13

        А если рубить руки

        Как же нравится мне вот такое вот мышление — пляшет человек вокруг одной сладкой для него догмы (типа «рубить руки ворам» или «расстреливать за взятки»), и упорно не хочет проанализировать её с разных сторон и разных последствий. Из всего набора вариантов вытягиваются только те, что идут в пользу догме.

        (это я не конкретно про комментатора выше, а вообще)


      1. roscomtheend
        09.10.2018 10:23

        Рубить руки за лайки — это выход. Вы уже придумали куда деть столько рук?


        1. DGN
          09.10.2018 10:37

          Зелёный сойлент?


  1. dtrs
    08.10.2018 15:17
    +1

    Популяция плесени выигрывает, потому что наказание оказывается избыточным. Если четверти наказания достаточно, чтобы уничтожить особь, то остальные 3/4 уходят в пустоту. Популяция таким образом получает только четверть возможного ущерба. Если наказанные будут иметь хороший шанс все-таки выжить, вы получите тот же результат, что и с постоянными проверками. Вывод должен быть о необходимости гуманизацию наказаний.


    1. Aquahawk Автор
      08.10.2018 15:23

      Я знал что кто-то этот вопрос задаст. Вы правы, если бы смерть клетки имела последствием только вымершую клетку. В моей симуляции популяция получает полный вред почти всегда. Потому что когда особь убило, в ошмётках осталось отрицательное количество энергии(точнее сначала после симуляции у клетки стало внутренней энергии меньше нуля и по результату её признали сдохшей, энергию при этом никто не обнулял). И когда эта же популяция будет размножаться туда, он должна будет восполнить эту энергию. Т.к. в системе действует теплопередача(для тепловой энергии) а передача химической энергии сейчас работает только при делении клетки в соседнюю, то туда можно уйдёт и химическая и тепловая энергии. Да, если бы плесень росла узким фронтом съедая всё впери и оставляя позади трупы, таком могло бы иметь место быть. Но этот эффект тут не наблюдался.


      1. Weerel
        08.10.2018 20:47

        Но это все равно не эквивалентно. Для популяции есть же разница, если взять весь штраф сразу или сказать — сейчас возьмем немного (убрать одну клетку), а остальное отдадите когда сможете (восполнить отрицательную энергию). Может быть стоит забирать энергию у всех соседних клеток, пока не погасится штраф? Чтобы популяция это сразу почувствовала. Тогда при неотвратимом варианте популяция просто будет испытывать угнетение в развитии. А при выборочных проверках буйный рост с микро взрывами в точках проверки, где погибает и клетка-нарушитель и соседние клетки, что компенсирует избыточный рост.


    1. Aquahawk Автор
      08.10.2018 15:28

      Ну и при уменьшенных наказаниях они прут просто как на дрожжах(собственно поведение дрожжей и демонстрируют, тупо размножаются во все стороны с огромной силой)


  1. shadovv76
    08.10.2018 16:27
    -1

    есть религия, там контроль построен на отсутствии срока давности…


    1. roscomtheend
      09.10.2018 10:25

      Там контроль построен на запугивании невежественных воображаемым наказанием и как только запуганный понимает что его надули, а других тормозов у него нет, то случается упс.


  1. dart_w
    08.10.2018 17:32

    Есть ли в Вашей системе метрика, которая показывает соседям от чего погибла некая клетка? Возможно, используя такую метрику, выжившие клетки смогли бы менять вектор своего развития и лучше адаптироваться?


    1. Aquahawk Автор
      08.10.2018 17:33

      Нет, в моей версии этого нет. Ну точнее она всегда погибает либо от холода, либо от перегрева, либо от истощения хим энергии.


  1. agp88
    08.10.2018 17:35
    +2

    Заголовок спойлера
    Анекдот вспомнился:
    В крутой кабак заходит мужик и говорит бармену:
    — Мне 100 грамм водки.
    Бармен наливает, подает. Мужик достает из кармана мензурку и удостоверение:
    — Контрольная закупка. 75 грамм! Штраф $50.
    Следующий вечер. Те же лица. Мужик снова измеряет мензуркой и снимает полтинник штрафа. Потом спрашивает бармена:
    — Слушай, ты же меня узнал, почему все равно недолил?
    — Да мне проще полтинник отдать, чем руку сбивать из-за тебя...


    1. Aquahawk Автор
      08.10.2018 17:36

      Да, примерно так. Очень в тему анекдот. И даже если бы он посадил в тюрьму этого бармена, а в целом по индустрии недоливать было бы значимо выгодно, ничего бы не поменялось.


      1. mapron
        08.10.2018 18:24

        Я недавно хорошее видео Савватеева, про наказание коррупционера.
        В конце один грустный вывод про применимость этих всех теорий к жизни:
        www.youtube.com/watch?v=pjEhGZpQLn0?t=51m40


        1. Aquahawk Автор
          09.10.2018 10:23

          Спасибо, вчера вечером посмотрел, интересная штука.


  1. tamtakoe
    08.10.2018 20:22

    Увеличте частоту выборочных проверок и напишите, что получится. Вполне возможно, что при каждой второй выборочной проверке результат будет иной


    1. Aquahawk Автор
      08.10.2018 20:49

      Да, будет лучше, но и затраты на эти измерения будут таковы что всё будет слишком медленно.


  1. oneclick
    08.10.2018 20:47

    0,01 вероятность поймать
    0,99 вероятность не поймать.

    вероятность не поймать 365 дней = 0.99^365 = 0.025
    вероятность поймать за 365 дней = 1-0.99^365 = 0.975


    1. Aquahawk Автор
      08.10.2018 20:48

      Да, всё верно. Тех кого поймали — выкинули с рынка. Но на рынке есть продавцы. Все обманывают и их всех не поймали. кто не обманывал — разорился. что будет делать новый продавец?


  1. arkdlite
    08.10.2018 20:48

    Часто поведение людей сравнивают с поведением животных, а тут… Плесень! Это же страшно, что люди ведут себя, как совершенно неразумное существо! В то же время восхищает то, сто мы находим столь сложное в столь простом.


    1. Aquahawk Автор
      08.10.2018 20:52

      Тут дело вообще не в людях и никто себя никак не ведёт. Если вы возьмёте охапку штакетных досок для забора, то среди них всегда найдётся самая длинная, самая тяжёлая и самая крепкая. При отборе из ограниченного количества особей у самый сильный найдётся всегда, и в это не будет его заслугой.


  1. Weerel
    08.10.2018 21:02

    Я думаю тут имеет место сильная нелинейность во времени. Это как использовать чит и получить ресурс, вложиться в развитие, получить хорошую капитализацию процентов. А потом опомнятся, отберут все что присвоил. А ты все равно в большом плюсе остался. Тогда нужно отбирать все, что успел на этом заработать.
    Конкретный пример. Допустим на одного родителя приходится один потомок. Это соответствует условию воспроизводства поколений. Численность популяции не меняется со временем. И все популяции находятся в равновесии. Причем для всех конфигураций это значение не больше единицы. Есть проигрышные варианты меньше единицы. И есть множество оптимальных решений в точности равных единице. Умение играть сводится к умению найти одно из этих решений. Каждый находит свое решение — в итоге куча популяций и большое разнообразие. Идеальный игровой баланс. Допустим найден чит, позволяет на одного родителя иметь два потомка. Это соответствует экспоненциальному росту популяции. Нужно найти решение, чтобы выправить баланс. Пусть проверка каждые десять поколений. За это время появится 2^10 потомков (допустим для простоты в новом поколении предки не остаются). Понятно, что штраф должен быть не 10, а 1023. Модель тут такая:
    (1 + чит - неотвратимый штраф)^N = 1
    неотвратимый штраф = чит
    (1 + чит)^N - штраф проверки = 1
    штраф проверки = (1 + чит)^N -1


    1. Aquahawk Автор
      08.10.2018 21:25

      Направление мысли интересное. Но мы же не знаем априорно полезность данного гена. Есть и бесполезные затратные. И комбинации которые дадут пользу. Иначе говоря есть цена за пользование инструмента, но прибыль извлекают не все, а только те кто умеют.


  1. ready_for_sky_team
    09.10.2018 07:09

    Замечательная статья!


  1. maep
    09.10.2018 07:10

    … и дай нам мудрости отличить первое от второго…


  1. rinaty
    09.10.2018 07:42

    Часть один строится на неправильной трактовке, когда говорят про неотвратимость наказания не имеют ввиду что наказание будет со 100% вероятностью.
    Во второй и третьей части как уже отметили выше в комментариях ошибка с величиной наказания, слишком низкая: так во второй эффективно срабатывает только часть наказания, а в третьей маленький штраф при каждом обмане больше чем вероятность штрафа на величину штрафа при проверках (да и вообще задача не полностью сформулирована, не дается функция выигрыша продавца в случае когда проверка выявляет обман).

    P.S. Разница между наказанием в 100% случаях на величину P и наказанием в 10*P только в 10% случаях все же есть, но она обычно заключается что эти 10% не равномерно распределены, что есть некие индивиды избегающие/обманывающие проверку и тем самым имеющие в реальности не 10% вероятность, а ниже.


    1. Aquahawk Автор
      09.10.2018 08:22

      неотвратимость наказания это сразу два момента. 1. Каждое нарушение было зафиксировано. 2. За каждое зафиксированное нарушение получен и оплачен штраф. Но как раз потому что на практике это не всегда осуществимо отходят от этой концепции и делают выборочные проверки.


      1. rinaty
        09.10.2018 12:07

        Действительно ошибся с первым пунктом, когда вводили эти термины именно про вероятность говорили. Но если рассмотреть ту же игру с продавцами, то там нечестный продавец будет неизбежно наказан, если вероятность проверки действительно случайная и дней достаточно много, так что в некотором смысле наказание неотвратимо (смерть неотвратима, но это не означает что она будет завтра).

        Проблема не в том что наказание вероятно, а в том что есть действия которые позволяют его избежать (ну или матожидание штрафа ниже выгод от нарушения). Пример, я могу купить билет на электричку за 1 руб или поехать без билета рискуя нарваться на штраф 100 руб, из практики контролеры появляются при каждой 10-й поездки, т.е. вероятность 10%. Матожидание от поехать без билета сильно хуже (-10) чем купить билет (-1), очевидно что я пойду и куплю билет (кстати исходя из теории проспектов большой маловероятный штраф в представлении людей хуже чем просто заплатить -10). Но если я считаю что глаз у меня остер, а ноги быстры и избегу наказания попросту сбежав от контролеров в другой вагон, то все меняется и мне уже нет смысла покупать билет.


  1. Varim
    09.10.2018 08:12

    Часть один строится на неправильной трактовке, когда говорят про неотвратимость наказания не имеют ввиду что наказание будет со 100% вероятностью.
    А что имеют в виду? Что если поймали, то 100% накажут, за взятку не отпустят, или что? А взятка не наказание?


  1. ggo
    09.10.2018 10:12

    Это теория игр.
    Вот тут habr.com/company/jugru/blog/346364, (10. Задача о коллективной (без)ответственности) подробнее и детальнее. Там в том числе про выборочные проверки, и достижение целей по снижению обмана.


    1. Aquahawk Автор
      09.10.2018 10:15

      Савватеев там же говорит о том что это применимо когда играет рациональный агент. В нашем случае клетка никакой не рациональный агент, но тем не менее эти процессы работают. Это я нахожу достаточно интересным.


  1. catharsis
    09.10.2018 11:47

    Два десятка порядков — это разница между наносекундой и тысячелетиями.
    Для эволюции в природе хорошая модель,
    Для поведения продавцов на рынке: вы видите, что за год 98 из ста ваших коллег пересажали, и завтра проверка придет снова.
    Другими словами, какие ваши шансы как продавца, если вы перестанете обманывать? Зависит ли от дополнительного профита ваша жизнь или ваших детей?
    Немного людей сознательно согласятся на работу, которая убьет вас в 97.5% случаев кроме как в крайней безысходности.
    Возможностями выжить с меньшим риском занимается социальная политика.


    1. Aquahawk Автор
      09.10.2018 12:06

      Два десятичных порядка, а не два десятка порядков. В 100 раз примерно.


      1. catharsis
        09.10.2018 12:39

        я неправильно прочитал, приношу свои извинения


  1. virrus
    09.10.2018 12:06

    Очень интересный эксперимент, спасибо автору.
    А вы можете проделать этот эксперимент с «армейской» формой наказания, когда штраф получает не только попавшийся индивид, но и его «взвод»? Тут можно сделать даже в двух вариантах — раздавать штраф клетке и её геометрическим соседям или клетке и её «родственникам». Второй вариант теоретически может решить изначальную цель оптимизации.


    1. Aquahawk Автор
      09.10.2018 12:07

      Да, уже предлагали, может и займусь. В моём случае только на самом деле не всегда явно определяется родство, только по внешним признакам, цвету в моём случае. Я не веду родословной, это потребовало бы слишком много памяти.


    1. catharsis
      09.10.2018 12:39

      На первый взгляд качественно ничего не изменится, будут эволюционировать «взводы» вместо отдельных организмов.
      К тому же в игре «взвод» не сможет сам дополнительно «наказать» нарушителя, просто вокруг станет чуть меньше «своих». Примерно также как уклоняясь от уплаты налогов вы получаете меньше общественных благ, но разница незначительна для индивидуальной стратегии.


  1. catharsis
    09.10.2018 12:44

    Игра в разные стратегии в «повторяющейся дилемме заключенного»
    Эволюция доверия
    Или почему сотрудничать, доверять, соблюдать правила и прощать выгодно (или по крайней мере пример модели, в которой это выгодно)


  1. ebt
    09.10.2018 13:05

    Можно ли вашу теорию распространить на российский менталитет и, например, объяснить с её помощью пресловутую российскую коррупцию?


  1. evocatus
    09.10.2018 14:37

    Тут столько ошибок…

    НЕЛЬЗЯ просто так перекладывать вероятность во времени на вероятность в пространстве. Один и тот же продавец, обвешивающий каждый день покупателей в течение года, и 365 продавцов, обвешивающих покупателей в течение одного дня — это РАЗНЫЕ ситуации.

    Люди — не плесень. Люди — эгоисты. Продавцу, который обвешивает покупателей, важно, чтобы прибыль получал ЛИЧНО ОН, ему ПЛЕВАТЬ, будут ли получать прибыль остальные. И ваша же модель показывает, что если он будет систематически так действовать в течение года, то при заданных условиях его шанс попасться: 100 — 2,5 = 97,5 %. Когда он принимает решение — рисковать или не рисковать поимкой, он не учитывает остальных. Если он вылетит из бизнеса из-за огромного штрафа, его не утешит тот факт, что остальных его жуликоватых коллег не поймали.

    Если 6 человек сыграют в русскую рулетку со ставкой в миллион за выстрел, то пятеро выживут и получат по миллиону. Если один человек 6 раз подряд сыграет в русскую рулетку с такой же ставкой, то он умрёт, и выигрыш его — ноль.

    Читайте Нассима Талеба, в общем.


  1. acidnik
    09.10.2018 14:43

    В случае с плесенью объектом воздействия должна являться популяция, а не отдельная клетка. Так как отдельная клетка не ставит перед собой целей, получается что цель есть только у популяции — выжить. При этом достаточно, чтобы выжила хотя бы одна клетка. Аналогией можно предложить группу людей, для которых главная цель в жизни — кататься на метро бесплатно. Разумеется, штрафы или даже тюрьма не повлияют на поведение этой группы, потому что их цель иррациональна.

    В случае с торговцами всё наоборот. Отдельному торговцу (в отличие от клетки) нет выгоды в том, чтобы все вокруг были такими же, как он, скорее наоборот. Торговец рационален и думает только о себе. Если P(штраф)*штраф будет больше, чем ожидаемая выгода от нарушения закона, то торговец не будет рисковать, либо для общества будет происходить перераспределение незаконно полученой прибыли, и будет выгодно чаще устраивать проверки.

    2.5% торговцев, которые выживут, не размножатся до изначального количества, а будут пойманы в следующем году. 97.5% вероятности вылететь — это хороший сигнал другим торговцам не ввязываться в незаконную деятельность.

    Таким образом, на мой взляд, модель, приведенная в статье, неверна и выводы не соответсвуют действительности.