Три месяца назад, в феврале, я написал комментарий, что LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод. Некоторые коллеги эту идею поддержали, некоторые наоборот - раскритиковали. Это нормально, у нас у всех свой собственный опыт, которым и форматируется наше мышление.
Мой опыт говорит мне о том, что агентов можно выстроить в цепочку, подать на вход задачу (issue) и на выходе иметь готовый результат - код. Или отказ в обработке и причину отказа - тоже себе результат. Ведь именно такую цепочку я и сделал. Цепочку, которая автоматически, без моего участия, превращает запрос любого github-пользователя в страницу моего сайта. Или не превращает, если не посчитает нужным. Теперь любой github-пользователь может не просто критиковать мой февральский коммент, а критиковать предметно - на деле показать, что агенты действительно не могут справляться с возложенной на них задачей. Или убедиться на практике, что могут.

Это простое веб-приложение, которое регистрирует события github-репо через веб-хуки и поднимает по определённым событиями докер-контейнер с агентом внутри. Агент анализирует входящие данные, принимает решение, изменяет код и выкатывает результат на прод через GitHub Actions. На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей. Их поочерёдное применение и позволяет тикету пользователя превращаться в страницу моего сайта.
Это не production ready решение совершенно. Я сделал этот конвейер прежде всего для самого себя. Конвейер позволяет настроить запуск агентов только на определённых пользователей github'а. У меня уже настроено несколько таких конвейеров на разных репозиториях. Но вот этот конвейер я настроил без ограничения по автору тикета. Любой может запостить issue и посмотреть на результат работы - что сделал агент, дошёл ли он до публикации страницы, на каком этапе "срезался". Особо любопытные могут даже попытаться ломануть окружение, в котором работает агент, или заставить его сделать какое-нибудь безобразие на внешних ресурсах. Всё, что удерживает агента в рамках - это стартовые промпты. Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия. В любом случае, ответственность за применение инструмента не на производителе инструмента, а на его пользователе. Просто помните об этом.
Я приглашаю всех энтузиастов и скептиков самим попробовать этот конвейер в работе. Проверить свои ожидания и опасения. Ну а я взамен получаю опыт эксплуатации продукта в "естественной среде обитания" :)
Сделать тикет - https://github.com/flancer32/site-teqfw/issues
Посмотреть результат - https://teqfw.com/demo/pages/
Да, агент, который производит обработку - это Codex с моделью gpt-5.4-mini на самом низком уровне reasoning'а. Самый дешёвый тариф. Поэтому чудес "разумного поведения" не будет. Но лично для меня главное в этом эксперименте - предсказуемость. Будет ли конвейер работать так, как я предполагаю, или пытливые умы экспериментаторов, ежели таковые будут, смогут меня озадачить.
Комментарии (27)

vasyan_podpivkovich
24.05.2026 06:26А потом к вам приходят конкуренты, пишут кипу вредительских issue, которые не обязательно будут отличимы от обычных пользовательских отзывов и как следствие неотличимы каким-нибудь эвристическим фильтром. Агент это всё подхватывает, переваривает. Утром вы приходите и ваш ресурс превращается в тыкву.

flancer Автор
24.05.2026 06:26Попробуйте, не голословьте.

vasyan_podpivkovich
24.05.2026 06:26Вы, ответьте, пожалуйста предметно на критику. Есть вопросы доверенного доступа и качественной базы предыдущего опыта для направления таргетированной генерации контента.
Это может звучать некорректно, но вы отнюдь не первый придумали схему подобной генерации. И она упирается в то, что у вас должны быть изначально качественные данные и вы не можете дать доступ абсолютно всем за рамками подобных песочниц. Ведь за глюки системы в этих песочницах в отличии от бизнесового прода вам ответственность не нести.
В своих проектах, например, у нас скоуп пользователей ограничен внутренними. Поэтому большинства проблем это позволяет избежать. У вас же не вижу ответа в статье, кроме расплывчатых формулировок в духе "Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия."

flancer Автор
24.05.2026 06:26А где здесь критика? В том, что "ресурс можно превратить в тыкву"? Я согласен, что можно. Это не так просто сделать, но можно. Абсолютной защиты не бывает, но хороша та защита, затраты на преодоление которой не оправдываются "призом". Мне, например, не сложно откатить мой сайт на несколько коммитов назад, если что-то пойдёт не так.
А так-то я тоже не во все свои проекты всех подряд запускаю.
У вас же не вижу ответа в статье
А ответ простой: "серебряной пули не существует". Каждая задача требует своих решений. У вас - свои задачи, у меня - свои. Применять мои ответы к вашим задачам... ну как-то неправильно, что ли. Сами ищите.

ProgerMan
24.05.2026 06:26Это первое, что захотелось сделать, даже не будучи конкурентом. Чисто попробовать, посмотреть, получится ли базу прочистить. Делать я этого, конечно же, не буду.
Сначала дают доступ к критическим системам, а потом плачут, что базу удалили, пользователей потеряли, бизнес обанкротился.

cthtuf
24.05.2026 06:26Подход интересный, я так понимаю у вас внешняя интеграция которая слушает тикеты и потом запускает агента в работу. А не пробовали все то же самое реализовать средствами самого GitHub без внешних интеграций через https://github.blog/ai-and-ml/github-copilot/onboarding-your-ai-peer-programmer-setting-up-github-copilot-coding-agent-for-success/ и что думаете на этот счёт?

flancer Автор
24.05.2026 06:26Я имею опыт взаимодействия именно с кодексом. С Copilot'ом как-то не сложилось. Плюс, я могу агента менять, на того же Клода, например. А вместо гитхаб взять гитлаб. Ну, могу думать в эту сторону. А решение от Майкрософта - это вендор-лок.

alex1478
24.05.2026 06:26Какой-то бред, это даже не забавно. Полный нейрослоп
Написал свои замечания по сайту (issues/102) и получил какой-то слоп в виде дополнительной страницы на сайте https://teqfw.com/demo/pages/required-elements-are-missing/
alex1478
24.05.2026 06:26Посмотрел другие issues. Судя по ответам сетки, как бы автор нам не говорил о полном доступе, фактически сетке запрещено менять что-то вне текстового содержимого /demo/pages/. Получается автор сам не доверяет своему ИИ лол

flancer Автор
24.05.2026 06:26И в каком месте автор "говорил о полном доступе"? Вы очень странный для айтишника.

alex1478
24.05.2026 06:26LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод
Выглядит как заявка на полный доступ к кодовой базе, а не как ограниченная песочница где можно только генерировать текст для новых страничек

flancer Автор
24.05.2026 06:26Ну так это так и есть - агенты могут обновлять кодовую базу по тикетам пользователей и выкатываться на прод. В ограниченных мной пределах. Что не так-то? Где тут заявка на полный доступ? Вы можете предоставить по такой схеме доступ к своему сайту и установить свои пределы. На свой страх и риск. Welcome, как говорится.

danilovmy
24.05.2026 06:26На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей.
....
Любой может запостить issue и посмотреть на результат работы
А сами промпты посмотреть можно? Мне как-бы не важен результат, интересно посмотреть ход инженерной мысли.

flancer Автор
24.05.2026 06:26Да, конечно. Вот промпты и весь workflow - http://cms.teqfw.com/output.zip
vdudouyt
Как я понимаю, данная агентная цепочка так же способна автоматически писать статьи на Хабре?
flancer Автор
Не понял вопроса. Что вас смутило в "github-репо"?