Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так / forpes.ru

Главная
Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так

Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так +125

19.01.2026 07:07

enjoykaz 112 38000 Источник

Я внедрял всё это, и мы договорились, что можно использовать статистику по обезличенным логам. Это прямые подсчёты транзакций. Не прогнозы аналитиков, не презентации вендоров — а конкретные реальные логи.

Компания решила возглавить безобразие и дать всем сотрудникам внятный сервис, попробовать все модели рынка и вообще посмотреть, что это даст на практике в приросте производительности и так далее.

Они выбирали между подпиской и моделью с оплатой за токены, и, к счастью, выбрали второе.

Потому что в среднем пользователь использует LLM далеко не так, как может показаться. Если что, крупные модели показывают пользователей, но тщательно скрывают количество запросов и трафик. Потому что его там крайне мало.

На что уходит бюджет AI: 64% на картинки, 36% на текст

Якоб Нильсен предположил, что только 20% населения могут нормально сформулировать промпт. Пробуют пару раз и уходят.

Короче, за 7 месяцев с июня по декабрь 2025:

416 пользователей из 527 хоть раз потыкались
122346 запросов (в среднем 42 запроса на пользователя в месяц)
6851 доллар расходов (535 тысяч рублей, 184 руб/месяц на активного юзера)
Если бы они брали 20-долларовые подписки GPT, то получили бы то же самое в 8,5 раз дороже.

При этом мы внедряли агрегатор нейросетей, и там были картинки. 64% бюджета — генерация картинок.

Если только LLM, включая SOTA-модели вроде Gemini 3 Pro Preview, последние GPT, Gemini, последние Антропики — то было бы всего 62 рубля в месяц на пользователя.

Те, кто понял, зачем ему модель, возвращался постоянно.

В общем, заходите, расскажу, что реальные люди, если не бить их палкой, в реальном мире делают с LLM. На практике.

AI у вас уже внедрён

Иногда вы это знаете, иногда нет, но 50-60% ваших сотрудников уже используют нейросети в работе. Ежедневно. Вопрос не в том, внедрять ли. Вопрос в том, контролируете вы это или нет. 71% офисных работников используют AI без одобрения IT. 38% делятся конфиденциальными данными компании с публичными AI-сервисами.

Да, они сольют все ваши данные в OpenAI. Им же хуже!

Запретить AI невозможно (46% сотрудников продолжат использовать даже при явном запрете). Единственный способ контролировать — дать официальный доступ и мониторить.

Вот тут и решили возглавить безобразие.

Основные результаты нашего 7-месячного опыта

Если хочется покрутить данные самостоятельно — есть страница с интерактивными графиками. 16 визуализаций, от почасовой активности до кривой Парето. Можно залипнуть.

85% пользователей продолжают использовать AI после первого месяца

Эволюция популярности моделей: рост запросов в 27 раз за полгода

Откуда 62 рубля в месяц на пользователя или 184 рубля в месяц?

85% компаний ошибаются в прогнозах расходов на AI больше чем на 10%. Обычно в большую сторону.

Три главные причины:

1. ChatGPT Plus стоит $20 в месяц на человека. На 400 сотрудников — $8 000/мес, $96 000/год. Этот клиент работает через API. На человека выходит $2.35/мес. Разница — в 8,5 раз. Почему? Подписка — это all-you-can-eat буфет. Платишь за возможность есть бесконечно, даже если съедаешь одну тарелку. API — платишь за каждую тарелку отдельно. Если сотрудник делает 50 запросов в месяц — платишь за 50. Если 500 — за 500. При каком объёме подписка выгоднее? При 53 миллионах токенов в месяц на человека для GPT-4o-mini. Это примерно 40 000 страниц текста. В месяц. На одного сотрудника. Реалистично? Нет. Разве что у корректора или технического переводчика — но им-то как раз нужны не mini-модели.

2. Треть запросов съедает две трети бюджета. Генерация картинок дороже текста в 3,5 раза. 74% сотрудников хотя бы раз генерировали картинки — 308 из 416. Это не «отдел дизайна». Это почти все. Включая бухгалтерию. Зачем бухгалтерии картинки — отдельный вопрос. По McKinsey, только 35% организаций используют AI для картинок. Наши 74% — вдвое выше рынка. Люди распробовали. Если думаете, что картинки — нишевая функция для дизайнеров, вы ошибаетесь.

GPT Image стоит $0.44 за запрос. Gemini Image — $0.053. Разница в 8 раз. Midjourney — $0.16. В сентябре компания перешла с GPT Image на Gemini. Тихо, без фанфар. Миграция заняла день. 30 599 запросов через Gemini за 4 месяца. Если бы остались на GPT — заплатили бы $13 558. Заплатили $1 621. Экономия: $11 936.

Средний чек на пользователя в сентябре: $6.47. В октябре: $3.67. Упал вдвое за месяц. Люди генерировали столько же картинок — просто каждая стала в 8 раз дешевле.

Качество для бизнес-задач сравнимо. GPT иногда лучше для текста в картинках, но это редко нужно. Если в команде много людей — закладывайте картинки. И сразу выбирайте дешёвого провайдера.

3. 20% пользователей генерируют 79,4% расходов. Парето работает с точностью до процента. Топ-10 пользователей (2,4% от всех) потратили $1 910 — 20% всего бюджета. Лидер — условный «Лазурный Дрозд» — $308 за 7 месяцев, 3 578 запросов. При этом «Мятный Барсук» сделал 2 757 запросов, но потратил $139. Потому что один генерирует картинки, другой — текст.

Все считают неправильно, всё дешевле в 5 раз

95% AI-пилотов не дают измеримого влияния на P&L — MIT, 2025. 42% компаний отказались от большинства AI-инициатив в 2025 году. Почему? Потому что считают стоимость внедрения, а не стоимость использования. Покупают enterprise-подписки на всех, хотя активно пользуются 20%.

Правильный расчёт: API + мониторинг + обучение. Не «сколько стоит лицензия», а «сколько стоит запрос».

Кто попробовал — не бросают

В этом случае retention 85%. Кто попробовал AI — не бросает.

Это значит: если дать доступ 100 сотрудникам, через полгода активных будет не 20, а 60-80. Бюджет вырастет. Не потому что стало дороже — потому что распробовали.

Это хорошо для бизнеса. Плохо для тех, кто не заложил рост.

Таблицы — разрыв ожиданий

Бухгалтеры, PM-ы, аналитики — все работают с таблицами. Логичное ожидание: загружу Excel в AI, получу анализ.

Реальность: человек пихает файл на миллион строк в чат. Ничего не работает. Человек злится.

Почему? Обычный чат-интерфейс не умеет работать с таблицами. Для этого нужны агенты с code interpreter — они запускают Python, обрабатывают данные в изолированном окружении. Это другой продукт, другая цена, другие ограничения.

Хуже того: некоторые сервисы делают вид, что анализируют таблицу. На самом деле берут первые 100 строк и галлюцинируют выводы на их основе. Пользователь получает уверенный бред.

Что делать: объяснять ограничения на старте. AI — не замена Excel. Пока. Кроме Gemini и реально не очень больших таблиц. И подвижки уже идут.

Бухгалтерию в OpenAI и другие агрегаторы они почти слили, конечно. Но есть нюанс — для обучения она не используется, потому что есть правило, про него ниже.

Настройки картинок съедают бюджет незаметно

GPT Image позволяет выбрать качество и количество картинок за раз. Что выбирают люди? Максимальное качество. Четыре картинки сразу. Потому что «а вдруг пригодится».

Математика: 4 картинки x $0.25 = $1 за один запрос. Человек делает 15-20 итераций, пока не получит то, что хочет. Итого: $15-20 на одну задачу. Когда это увидели в логах — объяснили людям, как работает ценообразование. Ограничили доступ к картинкам тем, кому они не нужны для работы. Проблема исчезла.

Бонус: вышла Gemini Image, которая стоит в 8 раз дешевле при сравнимом качестве.

Они всегда используют самую дорогую модель для всего

Если дать сотруднику доступ ко всем моделям — он будет использовать самую дорогую. Для любой задачи. Даже для «напиши письмо клиенту».

GPT-5 Mini стоит в 6 раз дешевле GPT-5. Gemini Flash — в 7 раз дешевле Pro.

Сколько запросов через дешёвые модели? 4 875 из 123 458. 4 (четыре!) процента.

Почему? Status quo bias. Люди не переключают то, что работает. Даже если рядом лежит то же самое за копейки.

95% предприятий переплачивают за AI. Это не статистика — это бизнес-модель OpenAI.

Решение: сделайте дешёвую модель дефолтом. Дорогую — по запросу. Не всем нужен Claude Sonnet 4.5 или GPT-5.2. Для большинства задач хватает GPT-5 Mini или Gemini Flash.

А оно вообще окупается?

AI экономит 2-5 часов в неделю на сотрудника — Federal Reserve, BCG, Adecco. Power users экономят до 11 часов.

Если применить эти данные к нашему случаю:

400 активных сотрудников x 3 часа/неделю x 4 недели = 4 800 часов/месяц
Средняя зарплата 80 000 руб/мес = ~460 руб/час
Экономия: 4 800 x 460 руб = 2.2 млн руб/мес
Расходы на AI: ~77 000 руб/мес

ROI: 2800%. За месяц.

Даже если AI экономит не 3 часа, а 30 минут в неделю — всё равно окупается в 4-5 раз.

Вероятно, оценки завышенные, потому что нет периода адаптации, и они могут использовать экономию для своих собственных задач (отправлять медицинские анализы, советоваться с психологом, просить нарисовать мем для чата), но большая часть задач шла от рабочей роли.

А данные точно утекут в OpenAI?

Утекут — точно. Примерно как все ваши гуглодоки.

Будут ли там обработаны — нет, если работаете через API.

С марта 2023 данные, отправленные через API, не используются для обучения моделей OpenAI. По умолчанию. Это касается и Anthropic, и Google.

Важно понимать разницу:

Бесплатный ChatGPT — данные могут использоваться для обучения (можно отключить в настройках)
API — данные не используются для обучения по умолчанию

Логи хранятся до 30 дней для мониторинга злоупотреблений. Enterprise-клиенты могут получить Zero Data Retention — тогда вообще ничего не хранится.

Администратор аккаунта видит логи и может брать за разные места тех, кто использует модель не по назначению. А может и не брать.

Санкции — всё заблокируют

Риск есть. Но есть и решения.

В этом случае за 7 месяцев — ни одного критичного простоя.

Один провайдер — это не стратегия, это лотерея. Обычно всё работает. Но бывают дни, когда даже OpenAI выдаёт 90-95% успешных ответов — можете проверить на их странице статуса. Случается не каждый день, но для компании и одного раза достаточно.

Джентльменский набор 2026:

Прямые API: OpenAI, Anthropic, Google (Gemini), xAI (Grok)
Агрегатор: OpenRouter — если один провайдер лежит, трафик идёт через другой
Резерв: Azure OpenAI — те же модели, другая инфраструктура

Как работает: запрос идёт в основной провайдер. Таймаут или ошибка — автоматически переключается на следующий. Пользователь не замечает. Замечает только ваш мониторинг. И вы в три часа ночи.

Про российские модели (YandexGPT, GigaChat): это не fallback. Люди приходят за GPT и Claude. Подменять их на локальные — как заменить BMW на Ладу и сказать «ну едет же».

Нужен выделенный человек?

Нет. Нужен ответственный, но это не full-time работа.

Настроить систему, периодически смотреть логи, отвечать на вопросы — это часть работы одного человека, не отдельная должность.

Full-time понадобится, только если добавить: регулярное обучение новых сотрудников, вебинары с лучшими практиками, обмен опытом между отделами. Но это уже про развитие, не про поддержание.

Как развернуть самим

Не хотите платить за готовые решения — разворачивайте сами. Open source уже не для бородатых энтузиастов с красными глазами.

Три варианта:

Dify (125K звёзд на GitHub) — визуальный конструктор. RAG, агенты, аналитика из коробки. Подключаете свои API-ключи, получаете корпоративный ChatGPT за вечер.

Open WebUI (120K звёзд) — проще некуда. Docker, LDAP-авторизация, работает офлайн. Идеально для параноиков и компаний, где безопасник спит с файрволом под подушкой.

LobeChat (70K звёзд) — самый красивый интерфейс. 42 провайдера моделей, плагины в один клик. Если сотрудники привыкли к ChatGPT — не заметят разницы.

Что нужно: сервер, Docker, API-ключи провайдеров. Время на развёртывание: день-два. Время на допиливание под себя: неделя-месяц. Время на объяснение бухгалтерии, зачем это нужно: вечность.

Хотите российский сервис со всеми закрывашками и т.п. — ну вот я занимаюсь )

Важные советы

Считайте по API, не по подпискам (разница в 5-10 раз)
Закладывайте рост: retention 80%+, активных станет больше
Лучше ставить отдельный бюджет на картинки или отдельные лимиты
Мониторьте топ-20% пользователей — они определяют бюджет
Смотрите на стоимость запроса, не на общую сумму
Давайте официальный доступ — иначе shadow AI

58% пользователей не получают никакого тренинга

Это ошибка. Мы сделали так:

2 часа записанного видео (промптинг, ограничения, разные модели для разных задач)
2 недели на просмотр в удобное время
Живой вебинар на час с ответами на вопросы

Главный урок: обучение без проверки — это рекомендация, а не знание. Человек всё равно попробует засунуть таблицу на миллион строк, даже если ему сказали не засовывать. Потому что «а вдруг». То же с дорогими моделями и 4 картинками за раз — люди учатся на своих ошибках, а не на чужих видео.

И ещё один урок — не торопиться с запуском. Клиент настоял на неделе тестирования перед раскаткой на всех. Цитата из переписки: «Подключать не готовый сервис — сразу потеряет среди пользователей интерес и репутацию». Корпоративные пользователи не прощают глюков. Один раз не заработало — больше не откроют.

Методология

Источник данных: анонимизированные логи запросов к AI-сервису, 122 346 записей
Период: июнь — декабрь 2025 (7 полных месяцев)
Компания: образовательная, ~500 сотрудников (профиль изменён для защиты данных)
Курс: 78.2 руб/$ — ЦБ РФ на 08.01.2026
Средняя зарплата: 80 000 руб/мес — расчёт ФОТ/численность

Данные без января 2026 — новогодние каникулы, неполная неделя, 1 112 запросов от 47 человек. Выбросы искажали бы картину.

Итоги

AI для 500 человек стоит меньше одной годовой зарплаты. Меньше одной!

85% компаний этого не делают и ошибаются в бюджете на 10%+. 95% AI-пилотов не показывают ROI.

Вот так это выглядит!

Комментарии (112)

DvoiNic
19.01.2026 07:23
#29402120
А чем занимается компания?
1. enjoykaz Автор
  19.01.2026 07:23
  #29402266
  Образовательная. В методологии написано, но кто ж её читает.
  1. DvoiNic
    19.01.2026 07:23
    #29402376
    Cпасибо! видимо, глаз замылился.
    
    Графики посмотрел, красивое™. Пользователи, конечно, еще те - один МедныйПеликан® чего стОит...
    
    Я все думаю, как в дистрибуторской компании AI применить...
    
    enjoykaz Автор
    19.01.2026 07:23
    #29402428
    Спасибо за графики.
    
    По дистрибуции — ну, КП под клиента, ответы на "где моя поставка", сейлзам скрипты, договоры проверять. Стандартный набор.
    
    Но это я гадаю. А можно не гадать.
    
    Половина ваших людей уже что-то используют. Спросите — расскажут. Или дайте доступ и через месяц гляньте логи. Там будут не мои фантазии, а реальные задачи.
    
    DvoiNic
    19.01.2026 07:23
    #29402646
    Половина ваших людей уже что-то используют. Спросите — расскажут.
    
    Угу. директор филиала картинки генерит. и всё. (ну и я научился заставлять железяку помогать в кодинге. Особенно в верстке).
    
    Вот как применять ИИ в обучении - идеи (благодаря хаброветкам и хабросрачам на тему "упадка образования") есть. а вот насчет собственной отрасли (кроме, пожалуй, поддержки заказов) - нет. Но там как раз работа с таблицами. Не миллионы строк, конечно, но 200*300 за раз - норма жизни, да и те обсчитываются математикой.
    
    enjoykaz Автор
    19.01.2026 07:23
    #29402772
    А "только картинки" — это и есть нормальное начало.
    
    Директор филиала не будет с ходу строить RAG-пайплайн. Он сгенерил картинку для презентации, получилось, запомнил. Через месяц попросит письмо написать. Ещё через месяц — "а можно отчёт пересказать кратко?"
    
    74% в нашем кейсе хоть раз генерили картинки. Включая бухгалтерию. Это не "только картинки". Это точка входа.
    
    DvoiNic
    19.01.2026 07:23
    #29403596
    "только картинки" — это и есть нормальное начало.
    
    Это "начало" - уже 2 года
    
    Ещё через месяц — "а можно отчёт пересказать кратко?"
    
    а зачем нужны отчеты, которые нужно пересказывать кратко? у нормального отчета должно быть "саммари".
    
    Это точка входа
    
    У нас это так не работает. (я не говорю, что это не работает вообще). Ну и у меня не хватает квалификации, чтобы подготовить массив данных, который люди могли бы анализировать.
    
    Вот сейчас статья про "корпоративные знания" подвигла поглядеть в эту сторону - посмотрим, что получится...
    
    vkni
    19.01.2026 07:23
    #29404928
    Это не "только картинки". Это точка входа.
    
    В профессию программиста?
    
    Wesha
    19.01.2026 07:23
    #29404970
    Точняк!
    
    aspid-crazy
    19.01.2026 07:23
    #29404230
    Вот как применять ИИ в обучении - идеи (благодаря хаброветкам и хабросрачам на тему "упадка образования") есть. а вот насчет собственной отрасли (кроме, пожалуй, поддержки заказов) - нет.
    
    Кажется есть отдельные режимы работы LLM - гуглить Guided Learning
    https://habr.com/ru/companies/bothub/news/934964/
    https://claude.com/solutions/education
    
    Wesha
    19.01.2026 07:23
    #29404918
    ответы на «где моя поставка»
    
    Реальность: ИИ отвечает на вопросы недовольных клиентов «где моя поставка»
    Ожидание: ИИ всё устроит так, что у клиентов этих вопросов возникать не будет...
    
    DvoiNic
    19.01.2026 07:23
    #29405250
    Если поставка по виртуальным каналам - тогда проблем не будет. а в реальности на дорогах пробки 10 баллов, с соответствующими проблемами...
    
    EriIaz
    19.01.2026 07:23
    #29405402
    В ВЭДе? Там у людей довольно много нагрузки по переводам, и почти все задачи - это работа с уже существующими данными, так что места для галюнов в нейронки немного. Не всё можно светить в облака, конечно, но то, что дозволено - оно как правило довольно побочное, а делать надо. И съедает времени оно не сильно меньше, если не больше основного функционала. Полностью коммуникацию и документооборот нейросеть не заменяет, но режиме вычитки помогает работать сильно быстрее.
    
    Так вот, ИИ отлично справляется с подстрочниками, при условии минимального понимания принципов работы LLM, реализованных в добротном промте и грамотных примерах, плюс помощи в виде классических переводческих практик - ведение глоссариев, прозрачное внесение собственных правок, явные указания по стилистике. По запаре можно применять LLM для быстрой сверки двуязычных текстов. Некоторые инструменты очень помогают переводить презентации, превращенные в растровые PDF файлы. Ещё бы кто-то научил нейросеть верстать это непотребство обратно - я был бы вообще в восторге.
    
    И на самом деле даже с тем, что нельзя светить в облака, часто очень простые локальные модели справяются. Я даже не про DeepSeek V3.2, Qwen3-235B-A22B и GLM-4.7 - эти в задачах на перевод от моделей Google, ClosedAI и Misanthropic почти неотличимы - даже сравнительно пожилая и ужатая Gemma 3 27B Q4 QAT весьма недурно справляется. А есть модели посвежее, есть модели специализированные. Ну красота же?
    
    И бывают вообще комичные случаи. Называется, "никто на языке поставщика не разговаривает, а очень надо")) Тогда выручает метод Розеттского камня: я так малазийцу писал, который по что по-английски, что по-китайски, ну... Вообще никак. В итоге - пишу заготовку по-русскии –> перевод на англ, вычитка-правка + перевод на кит, вычитка-правка, -> перевод с трёх языков разом на малазийский –> вычитка обратного перевода другой моделью. Циферки итак видно, тут ошибки быть не может. Удовлетворительно? Отправляем. А самое смешное то, что дело сдвинулось))
    
    Shizarium
    19.01.2026 07:23
    #29407812
    А почему английский-малазийский не работал? Слишком много ошибок? И почему тот же гугл транслейт с обратной проверкой каким-нибудь другим переводчиком не работал?
    
    Вопрос не праздный, я по работе с китайцами и исландцами через гугл транслейт общался, с китайцами даже договор подписали, благо они нашли юристов, которые и на английском нормально шпрехали. И я постоянно думаю, что мб надо переходить на ИИ в деловых переводах, но с другой стороны зачем, если старые переводчики работают...
  1. Mausglov
    19.01.2026 07:23
    #29406194
    Там же написано "профиль изменён для защиты данных". То есть на самом деле не образовательная? Средняя зарплата как-то не похожа на учебное заведение...
    
    enjoykaz Автор
    19.01.2026 07:23
    #29406202
    Под "образовательной" имелось ввиду EdTech. Но, в целом, все равно, потому что и не EdTech.

Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так +125

AI у вас уже внедрён

Основные результаты нашего 7-месячного опыта

Откуда 62 рубля в месяц на пользователя или 184 рубля в месяц?

Все считают неправильно, всё дешевле в 5 раз

Кто попробовал — не бросают

Таблицы — разрыв ожиданий

Настройки картинок съедают бюджет незаметно

Они всегда используют самую дорогую модель для всего

А оно вообще окупается?

А данные точно утекут в OpenAI?

Санкции — всё заблокируют

Нужен выделенный человек?

Как развернуть самим

Важные советы

58% пользователей не получают никакого тренинга

Методология

Итоги

Комментарии (112)

enjoykaz Автор

enjoykaz Автор

enjoykaz Автор

enjoykaz Автор