Я внедрял всё это, и мы договорились, что можно использовать статистику по обезличенным логам. Это прямые подсчёты транзакций. Не прогнозы аналитиков, не презентации вендоров — а конкретные реальные логи.
Компания решила возглавить безобразие и дать всем сотрудникам внятный сервис, попробовать все модели рынка и вообще посмотреть, что это даст на практике в приросте производительности и так далее.
Они выбирали между подпиской и моделью с оплатой за токены, и, к счастью, выбрали второе.
Потому что в среднем пользователь использует LLM далеко не так, как может показаться. Если что, крупные модели показывают пользователей, но тщательно скрывают количество запросов и трафик. Потому что его там крайне мало.

Якоб Нильсен предположил, что только 20% населения могут нормально сформулировать промпт. Пробуют пару раз и уходят.
Короче, за 7 месяцев с июня по декабрь 2025:
416 пользователей из 527 хоть раз потыкались
122346 запросов (в среднем 42 запроса на пользователя в месяц)
6851 доллар расходов (535 тысяч рублей, 184 руб/месяц на активного юзера)
Если бы они брали 20-долларовые подписки GPT, то получили бы то же самое в 8,5 раз дороже.
При этом мы внедряли агрегатор нейросетей, и там были картинки. 64% бюджета — генерация картинок.
Если только LLM, включая SOTA-модели вроде Gemini 3 Pro Preview, последние GPT, Gemini, последние Антропики — то было бы всего 62 рубля в месяц на пользователя.
Те, кто понял, зачем ему модель, возвращался постоянно.
В общем, заходите, расскажу, что реальные люди, если не бить их палкой, в реальном мире делают с LLM. На практике.
AI у вас уже внедрён
Иногда вы это знаете, иногда нет, но 50-60% ваших сотрудников уже используют нейросети в работе. Ежедневно. Вопрос не в том, внедрять ли. Вопрос в том, контролируете вы это или нет. 71% офисных работников используют AI без одобрения IT. 38% делятся конфиденциальными данными компании с публичными AI-сервисами.
Да, они сольют все ваши данные в OpenAI. Им же хуже!
Запретить AI невозможно (46% сотрудников продолжат использовать даже при явном запрете). Единственный способ контролировать — дать официальный доступ и мониторить.
Вот тут и решили возглавить безобразие.
Основные результаты нашего 7-месячного опыта
Если хочется покрутить данные самостоятельно — есть страница с интерактивными графиками. 16 визуализаций, от почасовой активности до кривой Парето. Можно залипнуть.


Откуда 62 рубля в месяц на пользователя или 184 рубля в месяц?
85% компаний ошибаются в прогнозах расходов на AI больше чем на 10%. Обычно в большую сторону.
Три главные причины:
1. ChatGPT Plus стоит $20 в месяц на человека. На 400 сотрудников — $8 000/мес, $96 000/год. Этот клиент работает через API. На человека выходит $2.35/мес. Разница — в 8,5 раз. Почему? Подписка — это all-you-can-eat буфет. Платишь за возможность есть бесконечно, даже если съедаешь одну тарелку. API — платишь за каждую тарелку отдельно. Если сотрудник делает 50 запросов в месяц — платишь за 50. Если 500 — за 500. При каком объёме подписка выгоднее? При 53 миллионах токенов в месяц на человека для GPT-4o-mini. Это примерно 40 000 страниц текста. В месяц. На одного сотрудника. Реалистично? Нет. Разве что у корректора или технического переводчика — но им-то как раз нужны не mini-модели.
2. Треть запросов съедает две трети бюджета. Генерация картинок дороже текста в 3,5 раза. 74% сотрудников хотя бы раз генерировали картинки — 308 из 416. Это не «отдел дизайна». Это почти все. Включая бухгалтерию. Зачем бухгалтерии картинки — отдельный вопрос. По McKinsey, только 35% организаций используют AI для картинок. Наши 74% — вдвое выше рынка. Люди распробовали. Если думаете, что картинки — нишевая функция для дизайнеров, вы ошибаетесь.
GPT Image стоит $0.44 за запрос. Gemini Image — $0.053. Разница в 8 раз. Midjourney — $0.16. В сентябре компания перешла с GPT Image на Gemini. Тихо, без фанфар. Миграция заняла день. 30 599 запросов через Gemini за 4 месяца. Если бы остались на GPT — заплатили бы $13 558. Заплатили $1 621. Экономия: $11 936.
Средний чек на пользователя в сентябре: $6.47. В октябре: $3.67. Упал вдвое за месяц. Люди генерировали столько же картинок — просто каждая стала в 8 раз дешевле.
Качество для бизнес-задач сравнимо. GPT иногда лучше для текста в картинках, но это редко нужно. Если в команде много людей — закладывайте картинки. И сразу выбирайте дешёвого провайдера.
3. 20% пользователей генерируют 79,4% расходов. Парето работает с точностью до процента. Топ-10 пользователей (2,4% от всех) потратили $1 910 — 20% всего бюджета. Лидер — условный «Лазурный Дрозд» — $308 за 7 месяцев, 3 578 запросов. При этом «Мятный Барсук» сделал 2 757 запросов, но потратил $139. Потому что один генерирует картинки, другой — текст.
Все считают неправильно, всё дешевле в 5 раз
95% AI-пилотов не дают измеримого влияния на P&L — MIT, 2025. 42% компаний отказались от большинства AI-инициатив в 2025 году. Почему? Потому что считают стоимость внедрения, а не стоимость использования. Покупают enterprise-подписки на всех, хотя активно пользуются 20%.
Правильный расчёт: API + мониторинг + обучение. Не «сколько стоит лицензия», а «сколько стоит запрос».
Кто попробовал — не бросают
В этом случае retention 85%. Кто попробовал AI — не бросает.
Это значит: если дать доступ 100 сотрудникам, через полгода активных будет не 20, а 60-80. Бюджет вырастет. Не потому что стало дороже — потому что распробовали.
Это хорошо для бизнеса. Плохо для тех, кто не заложил рост.
Таблицы — разрыв ожиданий
Бухгалтеры, PM-ы, аналитики — все работают с таблицами. Логичное ожидание: загружу Excel в AI, получу анализ.
Реальность: человек пихает файл на миллион строк в чат. Ничего не работает. Человек злится.
Почему? Обычный чат-интерфейс не умеет работать с таблицами. Для этого нужны агенты с code interpreter — они запускают Python, обрабатывают данные в изолированном окружении. Это другой продукт, другая цена, другие ограничения.
Хуже того: некоторые сервисы делают вид, что анализируют таблицу. На самом деле берут первые 100 строк и галлюцинируют выводы на их основе. Пользователь получает уверенный бред.
Что делать: объяснять ограничения на старте. AI — не замена Excel. Пока. Кроме Gemini и реально не очень больших таблиц. И подвижки уже идут.
Бухгалтерию в OpenAI и другие агрегаторы они почти слили, конечно. Но есть нюанс — для обучения она не используется, потому что есть правило, про него ниже.
Настройки картинок съедают бюджет незаметно
GPT Image позволяет выбрать качество и количество картинок за раз. Что выбирают люди? Максимальное качество. Четыре картинки сразу. Потому что «а вдруг пригодится».
Математика: 4 картинки x $0.25 = $1 за один запрос. Человек делает 15-20 итераций, пока не получит то, что хочет. Итого: $15-20 на одну задачу. Когда это увидели в логах — объяснили людям, как работает ценообразование. Ограничили доступ к картинкам тем, кому они не нужны для работы. Проблема исчезла.
Бонус: вышла Gemini Image, которая стоит в 8 раз дешевле при сравнимом качестве.
Они всегда используют самую дорогую модель для всего
Если дать сотруднику доступ ко всем моделям — он будет использовать самую дорогую. Для любой задачи. Даже для «напиши письмо клиенту».
GPT-5 Mini стоит в 6 раз дешевле GPT-5. Gemini Flash — в 7 раз дешевле Pro.
Сколько запросов через дешёвые модели? 4 875 из 123 458. 4 (четыре!) процента.
Почему? Status quo bias. Люди не переключают то, что работает. Даже если рядом лежит то же самое за копейки.
95% предприятий переплачивают за AI. Это не статистика — это бизнес-модель OpenAI.
Решение: сделайте дешёвую модель дефолтом. Дорогую — по запросу. Не всем нужен Claude Sonnet 4.5 или GPT-5.2. Для большинства задач хватает GPT-5 Mini или Gemini Flash.
А оно вообще окупается?
AI экономит 2-5 часов в неделю на сотрудника — Federal Reserve, BCG, Adecco. Power users экономят до 11 часов.
Если применить эти данные к нашему случаю:
400 активных сотрудников x 3 часа/неделю x 4 недели = 4 800 часов/месяц
Средняя зарплата 80 000 руб/мес = ~460 руб/час
Экономия: 4 800 x 460 руб = 2.2 млн руб/мес
Расходы на AI: ~77 000 руб/мес
ROI: 2800%. За месяц.
Даже если AI экономит не 3 часа, а 30 минут в неделю — всё равно окупается в 4-5 раз.
Вероятно, оценки завышенные, потому что нет периода адаптации, и они могут использовать экономию для своих собственных задач (отправлять медицинские анализы, советоваться с психологом, просить нарисовать мем для чата), но большая часть задач шла от рабочей роли.
А данные точно утекут в OpenAI?
Утекут — точно. Примерно как все ваши гуглодоки.
Будут ли там обработаны — нет, если работаете через API.
С марта 2023 данные, отправленные через API, не используются для обучения моделей OpenAI. По умолчанию. Это касается и Anthropic, и Google.
Важно понимать разницу:
Бесплатный ChatGPT — данные могут использоваться для обучения (можно отключить в настройках)
API — данные не используются для обучения по умолчанию
Логи хранятся до 30 дней для мониторинга злоупотреблений. Enterprise-клиенты могут получить Zero Data Retention — тогда вообще ничего не хранится.
Администратор аккаунта видит логи и может брать за разные места тех, кто использует модель не по назначению. А может и не брать.
Санкции — всё заблокируют
Риск есть. Но есть и решения.
В этом случае за 7 месяцев — ни одного критичного простоя.
Один провайдер — это не стратегия, это лотерея. Обычно всё работает. Но бывают дни, когда даже OpenAI выдаёт 90-95% успешных ответов — можете проверить на их странице статуса. Случается не каждый день, но для компании и одного раза достаточно.
Джентльменский набор 2026:
Прямые API: OpenAI, Anthropic, Google (Gemini), xAI (Grok)
Агрегатор: OpenRouter — если один провайдер лежит, трафик идёт через другой
Резерв: Azure OpenAI — те же модели, другая инфраструктура
Как работает: запрос идёт в основной провайдер. Таймаут или ошибка — автоматически переключается на следующий. Пользователь не замечает. Замечает только ваш мониторинг. И вы в три часа ночи.
Про российские модели (YandexGPT, GigaChat): это не fallback. Люди приходят за GPT и Claude. Подменять их на локальные — как заменить BMW на Ладу и сказать «ну едет же».
Нужен выделенный человек?
Нет. Нужен ответственный, но это не full-time работа.
Настроить систему, периодически смотреть логи, отвечать на вопросы — это часть работы одного человека, не отдельная должность.
Full-time понадобится, только если добавить: регулярное обучение новых сотрудников, вебинары с лучшими практиками, обмен опытом между отделами. Но это уже про развитие, не про поддержание.
Как развернуть самим
Не хотите платить за готовые решения — разворачивайте сами. Open source уже не для бородатых энтузиастов с красными глазами.
Три варианта:
Dify (125K звёзд на GitHub) — визуальный конструктор. RAG, агенты, аналитика из коробки. Подключаете свои API-ключи, получаете корпоративный ChatGPT за вечер.
Open WebUI (120K звёзд) — проще некуда. Docker, LDAP-авторизация, работает офлайн. Идеально для параноиков и компаний, где безопасник спит с файрволом под подушкой.
LobeChat (70K звёзд) — самый красивый интерфейс. 42 провайдера моделей, плагины в один клик. Если сотрудники привыкли к ChatGPT — не заметят разницы.
Что нужно: сервер, Docker, API-ключи провайдеров. Время на развёртывание: день-два. Время на допиливание под себя: неделя-месяц. Время на объяснение бухгалтерии, зачем это нужно: вечность.
Хотите российский сервис со всеми закрывашками и т.п. — ну вот я занимаюсь )
Важные советы
Считайте по API, не по подпискам (разница в 5-10 раз)
Закладывайте рост: retention 80%+, активных станет больше
Лучше ставить отдельный бюджет на картинки или отдельные лимиты
Мониторьте топ-20% пользователей — они определяют бюджет
Смотрите на стоимость запроса, не на общую сумму
Давайте официальный доступ — иначе shadow AI
58% пользователей не получают никакого тренинга
Это ошибка. Мы сделали так:
2 часа записанного видео (промптинг, ограничения, разные модели для разных задач)
2 недели на просмотр в удобное время
Живой вебинар на час с ответами на вопросы
Главный урок: обучение без проверки — это рекомендация, а не знание. Человек всё равно попробует засунуть таблицу на миллион строк, даже если ему сказали не засовывать. Потому что «а вдруг». То же с дорогими моделями и 4 картинками за раз — люди учатся на своих ошибках, а не на чужих видео.
И ещё один урок — не торопиться с запуском. Клиент настоял на неделе тестирования перед раскаткой на всех. Цитата из переписки: «Подключать не готовый сервис — сразу потеряет среди пользователей интерес и репутацию». Корпоративные пользователи не прощают глюков. Один раз не заработало — больше не откроют.
Методология
Источник данных: анонимизированные логи запросов к AI-сервису, 122 346 записей
Период: июнь — декабрь 2025 (7 полных месяцев)
Компания: образовательная, ~500 сотрудников (профиль изменён для защиты данных)
Курс: 78.2 руб/$ — ЦБ РФ на 08.01.2026
Средняя зарплата: 80 000 руб/мес — расчёт ФОТ/численность
Данные без января 2026 — новогодние каникулы, неполная неделя, 1 112 запросов от 47 человек. Выбросы искажали бы картину.
Итоги
AI для 500 человек стоит меньше одной годовой зарплаты. Меньше одной!
85% компаний этого не делают и ошибаются в бюджете на 10%+. 95% AI-пилотов не показывают ROI.
Вот так это выглядит!
DvoiNic
А чем занимается компания?
enjoykaz Автор
Образовательная. В методологии написано, но кто ж её читает.
DvoiNic
Cпасибо! видимо, глаз замылился.
Графики посмотрел, красивое™. Пользователи, конечно, еще те - один МедныйПеликан® чего стОит...
Я все думаю, как в дистрибуторской компании AI применить...
enjoykaz Автор
Спасибо за графики.
По дистрибуции — ну, КП под клиента, ответы на "где моя поставка", сейлзам скрипты, договоры проверять. Стандартный набор.
Но это я гадаю. А можно не гадать.
Половина ваших людей уже что-то используют. Спросите — расскажут. Или дайте доступ и через месяц гляньте логи. Там будут не мои фантазии, а реальные задачи.
DvoiNic
Угу. директор филиала картинки генерит. и всё. (ну и я научился заставлять железяку помогать в кодинге. Особенно в верстке).
Вот как применять ИИ в обучении - идеи (благодаря хаброветкам и хабросрачам на тему "упадка образования") есть. а вот насчет собственной отрасли (кроме, пожалуй, поддержки заказов) - нет. Но там как раз работа с таблицами. Не миллионы строк, конечно, но 200*300 за раз - норма жизни, да и те обсчитываются математикой.
enjoykaz Автор
А "только картинки" — это и есть нормальное начало.
Директор филиала не будет с ходу строить RAG-пайплайн. Он сгенерил картинку для презентации, получилось, запомнил. Через месяц попросит письмо написать. Ещё через месяц — "а можно отчёт пересказать кратко?"
74% в нашем кейсе хоть раз генерили картинки. Включая бухгалтерию. Это не "только картинки". Это точка входа.
DvoiNic
Это "начало" - уже 2 года
а зачем нужны отчеты, которые нужно пересказывать кратко? у нормального отчета должно быть "саммари".
У нас это так не работает. (я не говорю, что это не работает вообще). Ну и у меня не хватает квалификации, чтобы подготовить массив данных, который люди могли бы анализировать.
Вот сейчас статья про "корпоративные знания" подвигла поглядеть в эту сторону - посмотрим, что получится...
vkni
В профессию программиста?
Wesha
Точняк!
aspid-crazy
Кажется есть отдельные режимы работы LLM - гуглить Guided Learning
https://habr.com/ru/companies/bothub/news/934964/
https://claude.com/solutions/education
Wesha
Реальность: ИИ отвечает на вопросы недовольных клиентов «где моя поставка»
Ожидание: ИИ всё устроит так, что у клиентов этих вопросов возникать не будет...
DvoiNic
Если поставка по виртуальным каналам - тогда проблем не будет. а в реальности на дорогах пробки 10 баллов, с соответствующими проблемами...
EriIaz
В ВЭДе? Там у людей довольно много нагрузки по переводам, и почти все задачи - это работа с уже существующими данными, так что места для галюнов в нейронки немного. Не всё можно светить в облака, конечно, но то, что дозволено - оно как правило довольно побочное, а делать надо. И съедает времени оно не сильно меньше, если не больше основного функционала. Полностью коммуникацию и документооборот нейросеть не заменяет, но режиме вычитки помогает работать сильно быстрее.
Так вот, ИИ отлично справляется с подстрочниками, при условии минимального понимания принципов работы LLM, реализованных в добротном промте и грамотных примерах, плюс помощи в виде классических переводческих практик - ведение глоссариев, прозрачное внесение собственных правок, явные указания по стилистике. По запаре можно применять LLM для быстрой сверки двуязычных текстов. Некоторые инструменты очень помогают переводить презентации, превращенные в растровые PDF файлы. Ещё бы кто-то научил нейросеть верстать это непотребство обратно - я был бы вообще в восторге.
И на самом деле даже с тем, что нельзя светить в облака, часто очень простые локальные модели справяются. Я даже не про DeepSeek V3.2, Qwen3-235B-A22B и GLM-4.7 - эти в задачах на перевод от моделей Google, ClosedAI и Misanthropic почти неотличимы - даже сравнительно пожилая и ужатая Gemma 3 27B Q4 QAT весьма недурно справляется. А есть модели посвежее, есть модели специализированные. Ну красота же?
И бывают вообще комичные случаи. Называется, "никто на языке поставщика не разговаривает, а очень надо")) Тогда выручает метод Розеттского камня: я так малазийцу писал, который по что по-английски, что по-китайски, ну... Вообще никак. В итоге - пишу заготовку по-русскии –> перевод на англ, вычитка-правка + перевод на кит, вычитка-правка, -> перевод с трёх языков разом на малазийский –> вычитка обратного перевода другой моделью. Циферки итак видно, тут ошибки быть не может. Удовлетворительно? Отправляем. А самое смешное то, что дело сдвинулось))
Shizarium
А почему английский-малазийский не работал? Слишком много ошибок? И почему тот же гугл транслейт с обратной проверкой каким-нибудь другим переводчиком не работал?
Вопрос не праздный, я по работе с китайцами и исландцами через гугл транслейт общался, с китайцами даже договор подписали, благо они нашли юристов, которые и на английском нормально шпрехали. И я постоянно думаю, что мб надо переходить на ИИ в деловых переводах, но с другой стороны зачем, если старые переводчики работают...
Mausglov
Там же написано "профиль изменён для защиты данных". То есть на самом деле не образовательная? Средняя зарплата как-то не похожа на учебное заведение...
enjoykaz Автор
Под "образовательной" имелось ввиду EdTech. Но, в целом, все равно, потому что и не EdTech.