Откуда я на это смотрю

Захожу в компании временным техническим директором — часто как раз в момент, когда «мы вложились в AI, а результата не видно, разберись». Клиенты под NDA, поэтому пишу под псевдонимом и без названий. Истории ниже обезличены, но не выдуманы.

И сразу оговорю позицию, чтобы не было холивара на пустом месте: я не против AI-инструментов. Я против того, как мы их меряем. Это разные вещи, и весь текст — про вторую.

Мы уже проходили это с строчками кода

Лет двадцать индустрия смеялась над метрикой «строки кода». Все согласились, что считать LOC — глупость: больше строк не значит больше ценности, скорее наоборот.

А потом пришёл AI, и мы радостно начали считать… промпты на разработчика, процент «AI-assisted» коммитов, количество занятых лицензий, adoption rate. То есть ту же самую метрику активности, только в новой обёртке. Строки кода вернулись, переодевшись.

Проблема та же, что и была. Активность — не результат. Команда может очень интенсивно пользоваться AI и выдавать ровно те же бизнес-исходы, что и до него. Дашборд при этом будет зелёным.

Куда уезжает узкое место

Вот механика, которую дашборд адопшна не показывает.

Когда генерация кода дешевеет в разы, узкое место не исчезает — оно переезжает вниз по потоку. На ревью. На QA. На интеграцию. На разбор того, что нагенерили.

Раньше написать код было дорого, а проверить — относительно дёшево на фоне написания. Теперь написать — почти бесплатно, и вся стоимость переехала на проверку и доведение. Senior-инженеры это чувствуют первыми: ревью-очередь распухает, потому что в неё валится в разы больше изменений, и каждое надо понять, а не просто пробежать.

То есть команда реально занята. AI реально используется. А сквозная пропускная способность — время от идеи до того, что увидел клиент — могла не сдвинуться вообще или даже просесть. Потому что пропускная способность конвейера определяется самым узким его местом, а это место теперь завалено дешёвым кодом, ждущим дорогого человеческого внимания.

Три уровня зрелости отчётности

Когда смотрю, как в компании отчитываются по AI, вижу три уровня.

Уровень 1 — активность. Лицензии, adoption, промпты, токены. Ставится по умолчанию, потому что это то, что отдаёт вендор из коробки. Отвечает на вопрос «пользуются ли люди тем, что мы купили» — это вопрос закупок, а не инженерии.

Уровень 2 — движение. Cycle time, число PR, время в ревью. Уже лучше — мерим конвейер. Но эти метрики локально оптимизируются и игнорят результат: PR можно дробить, cycle time улучшать, а клиент изменений не почувствует.

Уровень 3 — результат на единицу затрат. Сократилось ли время доставки изменения, которое видит клиент? Упала ли стоимость инцидентов? Выкатили ли роадмап тем же составом? И главное — сколько каждый из этих исходов стоил в деньгах на AI?

Третий уровень — единственный, который понимает финдир без перевода. Потому что он в той же валюте, что и его вопрос: вложили деньги — получили результат.

Почему честную метрику обходят стороной

Если результат-на-затраты — очевидно правильная метрика, почему её почти никто не показывает?

Потому что она опасная. Дашборд активности умеет только расти. Дашборд результата умеет сказать «это не работает». Мерить результат на затраты — значит признать, что часть AI-вложений (возможно, бóльшая) пока не приносит ничего, и сказать это вслух, перед теми, кто эти траты одобрил.

Кажется, что это карьерный риск. На деле — наоборот. В переговорке через квартал хуже всех будет тому, чья красивая история про adoption развалится от одного деления финдиректором столбика «потратили» на столбик «получили». А лучше всех — тому, кто пришёл первым и сам сказал: вот здесь AI окупается, вот здесь пока нет, вот это я срезаю, а вот сюда хочу добавить. Это не признание поражения. Это единственная версия разговора про AI, которая наращивает доверие, а не сжигает его.

Что спросить у себя на этой неделе

Без дашбордов, просто честно:

  1. Если финдир спросит «что нам дал AI за прошлый квартал» — сможете ответить в терминах результата, за минуту, без слова «adoption»?

  2. Знаете, куда переехало ваше узкое место? (Подсказка: спросите senior-ревьюеров, как у них с нагрузкой.)

  3. Назовёте хоть один AI-сценарий, который сегодня отключили бы за ненадобностью? Если «ни одного» — у вас не портфель, у вас подписка.

  4. Есть в команде кто-то, кто отвечает за стоимость AI на единицу результата — или это общий инструмент и ничей показатель?

Большинство руководителей пока не отвечают на эти вопросы уверенно. Это не личный провал — вендоры, хайп 2023–2024 и метрики из коробки толкали ровно в обратную сторону. Но «у всех дашборд такой же» не будет аргументом в переговорке, где спросят именно про ваш.

Что со всем этим делать

Коротко: меряйте не активность, а стоимость результата. Снимите честный baseline до внедрения. Возьмите метрики, которые финдир признаёт за результат. Сопоставьте с тратами в тех же единицах. Относитесь к AI как к портфелю, которым управляете, а не как к фиче, которую «внедрили».

Это не про то, чтобы быть против AI. Это единственное, что вообще сохраняет AI-бюджет живым после первого серьёзного разговора с финансами.

Вопрос к вам, и он мне правда интересен: куда у вас переехало узкое место после внедрения AI? По моим наблюдениям — почти всегда в ревью и переделки, но интересно, у кого иначе. Читаю и отвечаю в комментариях.


Рабочие материалы по теме первых 90 дней руководителя — чек-лист и шаблоны — собрал в бесплатный набор, ссылку держу в профиле, чтобы не превращать статью в рекламу.

Комментарии (9)


  1. MasterSEED
    17.06.2026 19:39

    А потом придет CISO и скажет - теперь с вас 200% к расходам на проверку вашего AI который надо валидировать на соответствия отраслевым нормам, правилам и законам.


    1. theshadowcto Автор
      17.06.2026 19:39

      Так и будет, и это, кстати, ровно та же болезнь, просто с другого бока.

      CISO добавит свой слой проверок — и сделает это абсолютно правильно, AI и впрямь надо валидировать на соответствие. Но смотрите, что произойдёт дальше: эти 200% к расходам тоже осядут в дашборде как «затраты на безопасность AI» — и точно так же никто не свяжет их с результатом. Просто к строке «потратили на внедрение» добавится строка «потратили на проверку внедрения», а столбик «что получили» как был пустым, так и останется.

      Получается двойной театр: одни играют в adoption, другие — в compliance, и оба показывают зелёные галочки. А вопрос финдиректора от этого только злее: теперь вы потратили вдвое — и что?

      Поэтому я и гну линию про стоимость на результат. Она единственная переживает и CISO, и CFO одновременно: если AI-сценарий не окупается даже без затрат на комплаенс — его надо резать, а не валидировать. Дешевле перестать делать ненужное, чем сертифицировать его на соответствие.


    1. Dreams_and_magic
      17.06.2026 19:39

      этот ваш кисо должен отправить юристов к фирме, предоставляющий инференс, и всё, пачка подписанных бумажек решает юридические вопросы.


  1. funca
    17.06.2026 19:39

    Если финдир спросит «что нам дал AI за прошлый квартал»

    Простите, а что нам дал финдир за прошлый квартал? Сократилось ли время доставки изменения, которое видит клиент? Упала ли стоимость инцидентов? Выкатили ли роадмап тем же составом? Ну вот то-то же. Пусть задает такие вопросы своему AI ассистенту.


    1. MasterSEED
      17.06.2026 19:39

      Если ваш финдир увидит такой коммент он реально сократит время доставки, вашей зарплаты, причем может даже оптимизировать и исключить должность сотрудника который не понимает кто и за что в компании отвечает и какие несет обязаности.


      1. funca
        17.06.2026 19:39

        Я даже не подозревал, что мой короткий коммент может принести столько пользы. Кадровые проблемы - вот чем финдиру нужно заниматься, - а не выдумывать какие-то вопросы про AI.


  1. h01d3r
    17.06.2026 19:39

    У нас узкое место переехало в ревью пулл реквестов за ai, это стало съедать огромное количество времени и иногда уходить в цикл правок


  1. not-allowed-here
    17.06.2026 19:39

    соответственно следующий логичный виток это перенос существенной доли рутины ревью в AI? И что мешает уже сейчас начать иcпользовать отдельный AI для Ревью и проверок Соответствия?

    Возможно что у половины организаций использующих AI для кодинга до половины потока срежется на этом - как минимум так получается если судить по статьям про тех кто уткнулся в кодинг от AI и научился с этим жить.....


    1. theshadowcto Автор
      17.06.2026 19:39

      Направление вы поймали верно — отдельный AI на ревью и комплаенс это уже не гипотеза, инструменты есть, и народ катит их в прод прямо сейчас. Вопрос только в том, какую именно половину ревью он срезает.

      Потому что в ревью две разные работы, которые мы по привычке зовём одним словом. Первая — дешёвая и механическая: стиль, очевидные баги, забытые тесты, «соответствует ли правилу». Вот её AI снимает отлично, и слава богу — её и раньше наполовину делали линтеры и статика. Вторая — дорогая: имеет ли этот кусок смысл в этой системе, ляжет ли в архитектуру, не рванёт ли через полгода, и понимает ли вообще автор, что он только что выкатил. Это не поиск дефектов, это перенос контекста и общая ответственность за код. Вот она с места не двигается.

      И тут ловушка ровно из той же оперы, что в статье. AI пишет код, другой AI ревьюит его на соответствие, оба рисуют зелёные галочки. Снаружи — два контроля, по факту — двойной театр: один играет в adoption, второй в комплаенс, а вопрос «а оно нам вообще нужно в таком виде и в таком объёме» не задаёт никто. Галочка от человека и галочка от AI на дашборде выглядят одинаково — поэтому так соблазнительно отдать машине не дешёвую половину, а дорогую. Дёшево же, и красиво.

      Про «срежется половина потока» я бы поосторожничал. Статьи про тех, кто «уткнулся и научился жить», — это обычно те, кто выжил и рассказал; кто утонул в объёме AI-кода, статей не пишет. На практике AI не столько сокращает ревью, сколько переносит его: перестаёшь вычитывать синтаксис и начинаешь ловить, где модель сорок раз скопировала тонко неправильный паттерн или придумала несуществующий метод. А объём, который тот же AI и генерит, легко съедает всё, что AI-ревью сэкономил.

      Так что да, рутину отдавать правильно. Главное — отдавать именно рутину, а не то, что под неё маскируется. И мерить не «сколько галочек закрыли», а пережил ли релиз контакт с продом.