Пользователь пишет issue, агент меняет сайт. Да, я это сделал / forpes.ru

Главная
Пользователь пишет issue, агент меняет сайт. Да, я это сделал

Пользователь пишет issue, агент меняет сайт. Да, я это сделал

24.05.2026 06:12

flancer 28 14000 Источник

Три месяца назад, в феврале, я написал комментарий, что LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод. Некоторые коллеги эту идею поддержали, некоторые наоборот - раскритиковали. Это нормально, у нас у всех свой собственный опыт, которым и форматируется наше мышление.

Мой опыт говорит мне о том, что агентов можно выстроить в цепочку, подать на вход задачу (issue) и на выходе иметь готовый результат - код. Или отказ в обработке и причину отказа - тоже себе результат. Ведь именно такую цепочку я и сделал. Цепочку, которая автоматически, без моего участия, превращает запрос любого github-пользователя в страницу моего сайта. Или не превращает, если не посчитает нужным. Теперь любой github-пользователь может не просто критиковать мой февральский коммент, а критиковать предметно - на деле показать, что агенты действительно не могут справляться с возложенной на них задачей. Или убедиться на практике, что могут.

Список демо-страниц, сгенерированных агентами по GitHub Issues

Это простое веб-приложение, которое регистрирует события github-репо через веб-хуки и поднимает по определённым событиями докер-контейнер с агентом внутри. Агент анализирует входящие данные, принимает решение, изменяет код и выкатывает результат на прод через GitHub Actions. На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей. Их поочерёдное применение и позволяет тикету пользователя превращаться в страницу моего сайта.

Это не production ready решение совершенно. Я сделал этот конвейер прежде всего для самого себя. Конвейер позволяет настроить запуск агентов только на определённых пользователей github'а. У меня уже настроено несколько таких конвейеров на разных репозиториях. Но вот этот конвейер я настроил без ограничения по автору тикета. Любой может запостить issue и посмотреть на результат работы - что сделал агент, дошёл ли он до публикации страницы, на каком этапе "срезался". Особо любопытные могут даже попытаться ломануть окружение, в котором работает агент, или заставить его сделать какое-нибудь безобразие на внешних ресурсах. Всё, что удерживает агента в рамках - это стартовые промпты. Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия. В любом случае, ответственность за применение инструмента не на производителе инструмента, а на его пользователе. Просто помните об этом.

Я приглашаю всех энтузиастов и скептиков самим попробовать этот конвейер в работе. Проверить свои ожидания и опасения. Ну а я взамен получаю опыт эксплуатации продукта в "естественной среде обитания" :)

Сделать тикет - https://github.com/flancer32/site-teqfw/issues

Посмотреть результат - https://teqfw.com/demo/pages/

Да, агент, который производит обработку - это Codex с моделью gpt-5.4-mini на самом низком уровне reasoning'а. Самый дешёвый тариф. Поэтому чудес "разумного поведения" не будет. Но лично для меня главное в этом эксперименте - предсказуемость. Будет ли конвейер работать так, как я предполагаю, или пытливые умы экспериментаторов, ежели таковые будут, смогут меня озадачить.

Комментарии (28)

vdudouyt
24.05.2026 06:26
#30011532
github-репо

Как я понимаю, данная агентная цепочка так же способна автоматически писать статьи на Хабре?
1. flancer Автор
  24.05.2026 06:26
  #30011564
  Не понял вопроса. Что вас смутило в "github-репо"?

vasyan_podpivkovich
24.05.2026 06:26
#30011690
А потом к вам приходят конкуренты, пишут кипу вредительских issue, которые не обязательно будут отличимы от обычных пользовательских отзывов и как следствие неотличимы каким-нибудь эвристическим фильтром. Агент это всё подхватывает, переваривает. Утром вы приходите и ваш ресурс превращается в тыкву.
1. flancer Автор
  24.05.2026 06:26
  #30011694
  Попробуйте, не голословьте.
  1. vasyan_podpivkovich
    24.05.2026 06:26
    #30011722
    Вы, ответьте, пожалуйста предметно на критику. Есть вопросы доверенного доступа и качественной базы предыдущего опыта для направления таргетированной генерации контента.
    
    Это может звучать некорректно, но вы отнюдь не первый придумали схему подобной генерации. И она упирается в то, что у вас должны быть изначально качественные данные и вы не можете дать доступ абсолютно всем за рамками подобных песочниц. Ведь за глюки системы в этих песочницах в отличии от бизнесового прода вам ответственность не нести.
    
    В своих проектах, например, у нас скоуп пользователей ограничен внутренними. Поэтому большинства проблем это позволяет избежать. У вас же не вижу ответа в статье, кроме расплывчатых формулировок в духе "Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия."
    
    flancer Автор
    24.05.2026 06:26
    #30011754
    А где здесь критика? В том, что "ресурс можно превратить в тыкву"? Я согласен, что можно. Это не так просто сделать, но можно. Абсолютной защиты не бывает, но хороша та защита, затраты на преодоление которой не оправдываются "призом". Мне, например, не сложно откатить мой сайт на несколько коммитов назад, если что-то пойдёт не так.
    
    А так-то я тоже не во все свои проекты всех подряд запускаю.
    
    У вас же не вижу ответа в статье
    
    А ответ простой: "серебряной пули не существует". Каждая задача требует своих решений. У вас - свои задачи, у меня - свои. Применять мои ответы к вашим задачам... ну как-то неправильно, что ли. Сами ищите.
    
    Dhwtj
    24.05.2026 06:26
    #30012212
    Денег с такими подходом не ждите
    
    flancer Автор
    24.05.2026 06:26
    #30012940
    Ну, я не универсальный проблем солвер. У меня есть ответы лишь на определённый класс вопросов. Да и не то, чтобы есть, я их всё ещё ищу. Но спасибо, что поделились своим мнением :)
1. ProgerMan
  24.05.2026 06:26
  #30011760
  Это первое, что захотелось сделать, даже не будучи конкурентом. Чисто попробовать, посмотреть, получится ли базу прочистить. Делать я этого, конечно же, не буду.
  
  Сначала дают доступ к критическим системам, а потом плачут, что базу удалили, пользователей потеряли, бизнес обанкротился.
  1. flancer Автор
    24.05.2026 06:26
    #30011762
    Уже сделали :)

copyhold
24.05.2026 06:26
#30011740
Работает в общем хорошо, но guardrails бы не помешали.
Также было бы хорошо не закрывать тикет сразу , а позволить человеку отреагировать на коммент.
1. flancer Автор
  24.05.2026 06:26
  #30011764
  Это делается путём изменения промптов к агентам. В других репо у меня другой workflow.

cthtuf
24.05.2026 06:26
#30011928
Подход интересный, я так понимаю у вас внешняя интеграция которая слушает тикеты и потом запускает агента в работу. А не пробовали все то же самое реализовать средствами самого GitHub без внешних интеграций через https://github.blog/ai-and-ml/github-copilot/onboarding-your-ai-peer-programmer-setting-up-github-copilot-coding-agent-for-success/ и что думаете на этот счёт?
1. flancer Автор
  24.05.2026 06:26
  #30011964
  Я имею опыт взаимодействия именно с кодексом. С Copilot'ом как-то не сложилось. Плюс, я могу агента менять, на того же Клода, например. А вместо гитхаб взять гитлаб. Ну, могу думать в эту сторону. А решение от Майкрософта - это вендор-лок.

m0tral
24.05.2026 06:26
#30011988
Чисто спортивный интерес? Можно да, дать инструмент тестерам закрывать мелкие баги UI, вполне, что то более менее серьезное - неа.
1. flancer Автор
  24.05.2026 06:26
  #30012066
  Можно и посерьезнее, но, конечно, не через доступ всем, кому ни попадая.
1. seregadomain
  24.05.2026 06:26
  #30014364
  А можно и сквозной конвеер по написанию 2е2 регресс автотестов на основе тасок

kain64b
24.05.2026 06:26
#30012006
Как же это все далеко от реального прода, issues, да разработки в принципе.. когда этот ваш нейрослопа уже кончится
1. flancer Автор
  24.05.2026 06:26
  #30012062
  Никогда. Теперь уже никогда. Привыкайте.

alex1478
24.05.2026 06:26
#30012276
Какой-то бред, это даже не забавно. Полный нейрослоп
Написал свои замечания по сайту (issues/102) и получил какой-то слоп в виде дополнительной страницы на сайте https://teqfw.com/demo/pages/required-elements-are-missing/
1. alex1478
  24.05.2026 06:26
  #30012444
  Посмотрел другие issues. Судя по ответам сетки, как бы автор нам не говорил о полном доступе, фактически сетке запрещено менять что-то вне текстового содержимого /demo/pages/. Получается автор сам не доверяет своему ИИ лол
  1. flancer Автор
    24.05.2026 06:26
    #30012812
    И в каком месте автор "говорил о полном доступе"? Вы очень странный для айтишника.
    
    alex1478
    24.05.2026 06:26
    #30012834
    LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод
    
    Выглядит как заявка на полный доступ к кодовой базе, а не как ограниченная песочница где можно только генерировать текст для новых страничек
    
    flancer Автор
    24.05.2026 06:26
    #30012956
    Ну так это так и есть - агенты могут обновлять кодовую базу по тикетам пользователей и выкатываться на прод. В ограниченных мной пределах. Что не так-то? Где тут заявка на полный доступ? Вы можете предоставить по такой схеме доступ к своему сайту и установить свои пределы. На свой страх и риск. Welcome, как говорится.

danilovmy
24.05.2026 06:26
#30012372

На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей.

....

Любой может запостить issue и посмотреть на результат работы

А сами промпты посмотреть можно? Мне как-бы не важен результат, интересно посмотреть ход инженерной мысли.
1. flancer Автор
  24.05.2026 06:26
  #30012806
  Да, конечно. Вот промпты и весь workflow - http://cms.teqfw.com/output.zip
  1. danilovmy
    24.05.2026 06:26
    #30013042
    Спасибо. Хотел в карму добавить... а, оказывается, я уже давно как. Могу только откатить и опять добавить :)
    
    flancer Автор
    24.05.2026 06:26
    #30013240
    Спасибо. Не надо откатывать, пусть остаётся как есть. Не будем повышать энтропию :)

Пользователь пишет issue, агент меняет сайт. Да, я это сделал

Комментарии (28)

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор

flancer Автор