Откуда я на это смотрю
Захожу в компании временным техническим директором — часто как раз в момент, когда «мы вложились в AI, а результата не видно, разберись». Клиенты под NDA, поэтому пишу под псевдонимом и без названий. Истории ниже обезличены, но не выдуманы.
И сразу оговорю позицию, чтобы не было холивара на пустом месте: я не против AI-инструментов. Я против того, как мы их меряем. Это разные вещи, и весь текст — про вторую.
Мы уже проходили это с строчками кода
Лет двадцать индустрия смеялась над метрикой «строки кода». Все согласились, что считать LOC — глупость: больше строк не значит больше ценности, скорее наоборот.
А потом пришёл AI, и мы радостно начали считать… промпты на разработчика, процент «AI-assisted» коммитов, количество занятых лицензий, adoption rate. То есть ту же самую метрику активности, только в новой обёртке. Строки кода вернулись, переодевшись.
Проблема та же, что и была. Активность — не результат. Команда может очень интенсивно пользоваться AI и выдавать ровно те же бизнес-исходы, что и до него. Дашборд при этом будет зелёным.
Куда уезжает узкое место
Вот механика, которую дашборд адопшна не показывает.
Когда генерация кода дешевеет в разы, узкое место не исчезает — оно переезжает вниз по потоку. На ревью. На QA. На интеграцию. На разбор того, что нагенерили.
Раньше написать код было дорого, а проверить — относительно дёшево на фоне написания. Теперь написать — почти бесплатно, и вся стоимость переехала на проверку и доведение. Senior-инженеры это чувствуют первыми: ревью-очередь распухает, потому что в неё валится в разы больше изменений, и каждое надо понять, а не просто пробежать.
То есть команда реально занята. AI реально используется. А сквозная пропускная способность — время от идеи до того, что увидел клиент — могла не сдвинуться вообще или даже просесть. Потому что пропускная способность конвейера определяется самым узким его местом, а это место теперь завалено дешёвым кодом, ждущим дорогого человеческого внимания.
Три уровня зрелости отчётности
Когда смотрю, как в компании отчитываются по AI, вижу три уровня.
Уровень 1 — активность. Лицензии, adoption, промпты, токены. Ставится по умолчанию, потому что это то, что отдаёт вендор из коробки. Отвечает на вопрос «пользуются ли люди тем, что мы купили» — это вопрос закупок, а не инженерии.
Уровень 2 — движение. Cycle time, число PR, время в ревью. Уже лучше — мерим конвейер. Но эти метрики локально оптимизируются и игнорят результат: PR можно дробить, cycle time улучшать, а клиент изменений не почувствует.
Уровень 3 — результат на единицу затрат. Сократилось ли время доставки изменения, которое видит клиент? Упала ли стоимость инцидентов? Выкатили ли роадмап тем же составом? И главное — сколько каждый из этих исходов стоил в деньгах на AI?
Третий уровень — единственный, который понимает финдир без перевода. Потому что он в той же валюте, что и его вопрос: вложили деньги — получили результат.
Почему честную метрику обходят стороной
Если результат-на-затраты — очевидно правильная метрика, почему её почти никто не показывает?
Потому что она опасная. Дашборд активности умеет только расти. Дашборд результата умеет сказать «это не работает». Мерить результат на затраты — значит признать, что часть AI-вложений (возможно, бóльшая) пока не приносит ничего, и сказать это вслух, перед теми, кто эти траты одобрил.
Кажется, что это карьерный риск. На деле — наоборот. В переговорке через квартал хуже всех будет тому, чья красивая история про adoption развалится от одного деления финдиректором столбика «потратили» на столбик «получили». А лучше всех — тому, кто пришёл первым и сам сказал: вот здесь AI окупается, вот здесь пока нет, вот это я срезаю, а вот сюда хочу добавить. Это не признание поражения. Это единственная версия разговора про AI, которая наращивает доверие, а не сжигает его.
Что спросить у себя на этой неделе
Без дашбордов, просто честно:
Если финдир спросит «что нам дал AI за прошлый квартал» — сможете ответить в терминах результата, за минуту, без слова «adoption»?
Знаете, куда переехало ваше узкое место? (Подсказка: спросите senior-ревьюеров, как у них с нагрузкой.)
Назовёте хоть один AI-сценарий, который сегодня отключили бы за ненадобностью? Если «ни одного» — у вас не портфель, у вас подписка.
Есть в команде кто-то, кто отвечает за стоимость AI на единицу результата — или это общий инструмент и ничей показатель?
Большинство руководителей пока не отвечают на эти вопросы уверенно. Это не личный провал — вендоры, хайп 2023–2024 и метрики из коробки толкали ровно в обратную сторону. Но «у всех дашборд такой же» не будет аргументом в переговорке, где спросят именно про ваш.
Что со всем этим делать
Коротко: меряйте не активность, а стоимость результата. Снимите честный baseline до внедрения. Возьмите метрики, которые финдир признаёт за результат. Сопоставьте с тратами в тех же единицах. Относитесь к AI как к портфелю, которым управляете, а не как к фиче, которую «внедрили».
Это не про то, чтобы быть против AI. Это единственное, что вообще сохраняет AI-бюджет живым после первого серьёзного разговора с финансами.
Вопрос к вам, и он мне правда интересен: куда у вас переехало узкое место после внедрения AI? По моим наблюдениям — почти всегда в ревью и переделки, но интересно, у кого иначе. Читаю и отвечаю в комментариях.
Рабочие материалы по теме первых 90 дней руководителя — чек-лист и шаблоны — собрал в бесплатный набор, ссылку держу в профиле, чтобы не превращать статью в рекламу.
Комментарии (9)

funca
17.06.2026 19:39Если финдир спросит «что нам дал AI за прошлый квартал»
Простите, а что нам дал финдир за прошлый квартал? Сократилось ли время доставки изменения, которое видит клиент? Упала ли стоимость инцидентов? Выкатили ли роадмап тем же составом? Ну вот то-то же. Пусть задает такие вопросы своему AI ассистенту.

MasterSEED
17.06.2026 19:39Если ваш финдир увидит такой коммент он реально сократит время доставки, вашей зарплаты, причем может даже оптимизировать и исключить должность сотрудника который не понимает кто и за что в компании отвечает и какие несет обязаности.

funca
17.06.2026 19:39Я даже не подозревал, что мой короткий коммент может принести столько пользы. Кадровые проблемы - вот чем финдиру нужно заниматься, - а не выдумывать какие-то вопросы про AI.

h01d3r
17.06.2026 19:39У нас узкое место переехало в ревью пулл реквестов за ai, это стало съедать огромное количество времени и иногда уходить в цикл правок

not-allowed-here
17.06.2026 19:39соответственно следующий логичный виток это перенос существенной доли рутины ревью в AI? И что мешает уже сейчас начать иcпользовать отдельный AI для Ревью и проверок Соответствия?
Возможно что у половины организаций использующих AI для кодинга до половины потока срежется на этом - как минимум так получается если судить по статьям про тех кто уткнулся в кодинг от AI и научился с этим жить.....

theshadowcto Автор
17.06.2026 19:39Направление вы поймали верно — отдельный AI на ревью и комплаенс это уже не гипотеза, инструменты есть, и народ катит их в прод прямо сейчас. Вопрос только в том, какую именно половину ревью он срезает.
Потому что в ревью две разные работы, которые мы по привычке зовём одним словом. Первая — дешёвая и механическая: стиль, очевидные баги, забытые тесты, «соответствует ли правилу». Вот её AI снимает отлично, и слава богу — её и раньше наполовину делали линтеры и статика. Вторая — дорогая: имеет ли этот кусок смысл в этой системе, ляжет ли в архитектуру, не рванёт ли через полгода, и понимает ли вообще автор, что он только что выкатил. Это не поиск дефектов, это перенос контекста и общая ответственность за код. Вот она с места не двигается.
И тут ловушка ровно из той же оперы, что в статье. AI пишет код, другой AI ревьюит его на соответствие, оба рисуют зелёные галочки. Снаружи — два контроля, по факту — двойной театр: один играет в adoption, второй в комплаенс, а вопрос «а оно нам вообще нужно в таком виде и в таком объёме» не задаёт никто. Галочка от человека и галочка от AI на дашборде выглядят одинаково — поэтому так соблазнительно отдать машине не дешёвую половину, а дорогую. Дёшево же, и красиво.
Про «срежется половина потока» я бы поосторожничал. Статьи про тех, кто «уткнулся и научился жить», — это обычно те, кто выжил и рассказал; кто утонул в объёме AI-кода, статей не пишет. На практике AI не столько сокращает ревью, сколько переносит его: перестаёшь вычитывать синтаксис и начинаешь ловить, где модель сорок раз скопировала тонко неправильный паттерн или придумала несуществующий метод. А объём, который тот же AI и генерит, легко съедает всё, что AI-ревью сэкономил.
Так что да, рутину отдавать правильно. Главное — отдавать именно рутину, а не то, что под неё маскируется. И мерить не «сколько галочек закрыли», а пережил ли релиз контакт с продом.
MasterSEED
А потом придет CISO и скажет - теперь с вас 200% к расходам на проверку вашего AI который надо валидировать на соответствия отраслевым нормам, правилам и законам.
theshadowcto Автор
Так и будет, и это, кстати, ровно та же болезнь, просто с другого бока.
CISO добавит свой слой проверок — и сделает это абсолютно правильно, AI и впрямь надо валидировать на соответствие. Но смотрите, что произойдёт дальше: эти 200% к расходам тоже осядут в дашборде как «затраты на безопасность AI» — и точно так же никто не свяжет их с результатом. Просто к строке «потратили на внедрение» добавится строка «потратили на проверку внедрения», а столбик «что получили» как был пустым, так и останется.
Получается двойной театр: одни играют в adoption, другие — в compliance, и оба показывают зелёные галочки. А вопрос финдиректора от этого только злее: теперь вы потратили вдвое — и что?
Поэтому я и гну линию про стоимость на результат. Она единственная переживает и CISO, и CFO одновременно: если AI-сценарий не окупается даже без затрат на комплаенс — его надо резать, а не валидировать. Дешевле перестать делать ненужное, чем сертифицировать его на соответствие.
Dreams_and_magic
этот ваш кисо должен отправить юристов к фирме, предоставляющий инференс, и всё, пачка подписанных бумажек решает юридические вопросы.