Три месяца назад, в феврале, я написал комментарий, что LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод. Некоторые коллеги эту идею поддержали, некоторые наоборот - раскритиковали. Это нормально, у нас у всех свой собственный опыт, которым и форматируется наше мышление.

Мой опыт говорит мне о том, что агентов можно выстроить в цепочку, подать на вход задачу (issue) и на выходе иметь готовый результат - код. Или отказ в обработке и причину отказа - тоже себе результат. Ведь именно такую цепочку я и сделал. Цепочку, которая автоматически, без моего участия, превращает запрос любого github-пользователя в страницу моего сайта. Или не превращает, если не посчитает нужным. Теперь любой github-пользователь может не просто критиковать мой февральский коммент, а критиковать предметно - на деле показать, что агенты действительно не могут справляться с возложенной на них задачей. Или убедиться на практике, что могут.

Список демо-страниц, сгенерированных агентами по GitHub Issues
Список демо-страниц, сгенерированных агентами по GitHub Issues

Это простое веб-приложение, которое регистрирует события github-репо через веб-хуки и поднимает по определённым событиями докер-контейнер с агентом внутри. Агент анализирует входящие данные, принимает решение, изменяет код и выкатывает результат на прод через GitHub Actions. На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей. Их поочерёдное применение и позволяет тикету пользователя превращаться в страницу моего сайта.

Это не production ready решение совершенно. Я сделал этот конвейер прежде всего для самого себя. Конвейер позволяет настроить запуск агентов только на определённых пользователей github'а. У меня уже настроено несколько таких конвейеров на разных репозиториях. Но вот этот конвейер я настроил без ограничения по автору тикета. Любой может запостить issue и посмотреть на результат работы - что сделал агент, дошёл ли он до публикации страницы, на каком этапе "срезался". Особо любопытные могут даже попытаться ломануть окружение, в котором работает агент, или заставить его сделать какое-нибудь безобразие на внешних ресурсах. Всё, что удерживает агента в рамках - это стартовые промпты. Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия. В любом случае, ответственность за применение инструмента не на производителе инструмента, а на его пользователе. Просто помните об этом.

Я приглашаю всех энтузиастов и скептиков самим попробовать этот конвейер в работе. Проверить свои ожидания и опасения. Ну а я взамен получаю опыт эксплуатации продукта в "естественной среде обитания" :)

Сделать тикет - https://github.com/flancer32/site-teqfw/issues

Посмотреть результат - https://teqfw.com/demo/pages/

Да, агент, который производит обработку - это Codex с моделью gpt-5.4-mini на самом низком уровне reasoning'а. Самый дешёвый тариф. Поэтому чудес "разумного поведения" не будет. Но лично для меня главное в этом эксперименте - предсказуемость. Будет ли конвейер работать так, как я предполагаю, или пытливые умы экспериментаторов, ежели таковые будут, смогут меня озадачить.

Комментарии (27)


  1. vdudouyt
    24.05.2026 06:26

    github-репо

    Как я понимаю, данная агентная цепочка так же способна автоматически писать статьи на Хабре?


    1. flancer Автор
      24.05.2026 06:26

      Не понял вопроса. Что вас смутило в "github-репо"?


  1. vasyan_podpivkovich
    24.05.2026 06:26

    А потом к вам приходят конкуренты, пишут кипу вредительских issue, которые не обязательно будут отличимы от обычных пользовательских отзывов и как следствие неотличимы каким-нибудь эвристическим фильтром. Агент это всё подхватывает, переваривает. Утром вы приходите и ваш ресурс превращается в тыкву.


    1. flancer Автор
      24.05.2026 06:26

      Попробуйте, не голословьте.


      1. vasyan_podpivkovich
        24.05.2026 06:26

        Вы, ответьте, пожалуйста предметно на критику. Есть вопросы доверенного доступа и качественной базы предыдущего опыта для направления таргетированной генерации контента.

        Это может звучать некорректно, но вы отнюдь не первый придумали схему подобной генерации. И она упирается в то, что у вас должны быть изначально качественные данные и вы не можете дать доступ абсолютно всем за рамками подобных песочниц. Ведь за глюки системы в этих песочницах в отличии от бизнесового прода вам ответственность не нести.

        В своих проектах, например, у нас скоуп пользователей ограничен внутренними. Поэтому большинства проблем это позволяет избежать. У вас же не вижу ответа в статье, кроме расплывчатых формулировок в духе "Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия."


        1. flancer Автор
          24.05.2026 06:26

          А где здесь критика? В том, что "ресурс можно превратить в тыкву"? Я согласен, что можно. Это не так просто сделать, но можно. Абсолютной защиты не бывает, но хороша та защита, затраты на преодоление которой не оправдываются "призом". Мне, например, не сложно откатить мой сайт на несколько коммитов назад, если что-то пойдёт не так.

          А так-то я тоже не во все свои проекты всех подряд запускаю.

          У вас же не вижу ответа в статье

          А ответ простой: "серебряной пули не существует". Каждая задача требует своих решений. У вас - свои задачи, у меня - свои. Применять мои ответы к вашим задачам... ну как-то неправильно, что ли. Сами ищите.


          1. Dhwtj
            24.05.2026 06:26

            Денег с такими подходом не ждите


            1. flancer Автор
              24.05.2026 06:26

              Ну, я не универсальный проблем солвер. У меня есть ответы лишь на определённый класс вопросов. Да и не то, чтобы есть, я их всё ещё ищу. Но спасибо, что поделились своим мнением :)


    1. ProgerMan
      24.05.2026 06:26

      Это первое, что захотелось сделать, даже не будучи конкурентом. Чисто попробовать, посмотреть, получится ли базу прочистить. Делать я этого, конечно же, не буду.

      Сначала дают доступ к критическим системам, а потом плачут, что базу удалили, пользователей потеряли, бизнес обанкротился.


      1. flancer Автор
        24.05.2026 06:26

  1. copyhold
    24.05.2026 06:26

    Работает в общем хорошо, но guardrails бы не помешали.
    Также было бы хорошо не закрывать тикет сразу , а позволить человеку отреагировать на коммент.


    1. flancer Автор
      24.05.2026 06:26

      Это делается путём изменения промптов к агентам. В других репо у меня другой workflow.


  1. cthtuf
    24.05.2026 06:26

    Подход интересный, я так понимаю у вас внешняя интеграция которая слушает тикеты и потом запускает агента в работу. А не пробовали все то же самое реализовать средствами самого GitHub без внешних интеграций через https://github.blog/ai-and-ml/github-copilot/onboarding-your-ai-peer-programmer-setting-up-github-copilot-coding-agent-for-success/ и что думаете на этот счёт?


    1. flancer Автор
      24.05.2026 06:26

      Я имею опыт взаимодействия именно с кодексом. С Copilot'ом как-то не сложилось. Плюс, я могу агента менять, на того же Клода, например. А вместо гитхаб взять гитлаб. Ну, могу думать в эту сторону. А решение от Майкрософта - это вендор-лок.


  1. m0tral
    24.05.2026 06:26

    Чисто спортивный интерес? Можно да, дать инструмент тестерам закрывать мелкие баги UI, вполне, что то более менее серьезное - неа.


    1. flancer Автор
      24.05.2026 06:26

      Можно и посерьезнее, но, конечно, не через доступ всем, кому ни попадая.


  1. kain64b
    24.05.2026 06:26

    Как же это все далеко от реального прода, issues, да разработки в принципе.. когда этот ваш нейрослопа уже кончится


    1. flancer Автор
      24.05.2026 06:26

      Никогда. Теперь уже никогда. Привыкайте.


  1. alex1478
    24.05.2026 06:26

    Какой-то бред, это даже не забавно. Полный нейрослоп
    Написал свои замечания по сайту (issues/102) и получил какой-то слоп в виде дополнительной страницы на сайте https://teqfw.com/demo/pages/required-elements-are-missing/


    1. alex1478
      24.05.2026 06:26

      Посмотрел другие issues. Судя по ответам сетки, как бы автор нам не говорил о полном доступе, фактически сетке запрещено менять что-то вне текстового содержимого /demo/pages/. Получается автор сам не доверяет своему ИИ лол


      1. flancer Автор
        24.05.2026 06:26

        И в каком месте автор "говорил о полном доступе"? Вы очень странный для айтишника.


        1. alex1478
          24.05.2026 06:26

          LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод

          Выглядит как заявка на полный доступ к кодовой базе, а не как ограниченная песочница где можно только генерировать текст для новых страничек


          1. flancer Автор
            24.05.2026 06:26

            Ну так это так и есть - агенты могут обновлять кодовую базу по тикетам пользователей и выкатываться на прод. В ограниченных мной пределах. Что не так-то? Где тут заявка на полный доступ? Вы можете предоставить по такой схеме доступ к своему сайту и установить свои пределы. На свой страх и риск. Welcome, как говорится.


  1. danilovmy
    24.05.2026 06:26

    На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей.

    ....

    Любой может запостить issue и посмотреть на результат работы

    А сами промпты посмотреть можно? Мне как-бы не важен результат, интересно посмотреть ход инженерной мысли.


    1. flancer Автор
      24.05.2026 06:26

      Да, конечно. Вот промпты и весь workflow - http://cms.teqfw.com/output.zip


      1. danilovmy
        24.05.2026 06:26

        Спасибо. Хотел в карму добавить... а, оказывается, я уже давно как. Могу только откатить и опять добавить :)


        1. flancer Автор
          24.05.2026 06:26

          Спасибо. Не надо откатывать, пусть остаётся как есть. Не будем повышать энтропию :)