Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026 / forpes.ru

Главная
Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026

Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026

26.05.2026 21:18

kliment_ceo 35 16000 Источник

ЦИПР — «Цифровая индустрия промышленной России» — это одна из главных в стране конференций про промышленную цифровизацию, проходит уже одиннадцатый год. И это, вопреки названию, не выставка станков и не парад чиновников. Это место, где разработка встречается с промышленностью: Яндекс, Сбер, «Газпром нефть», «Росатом», «Северсталь», операторы связи привозят сюда не пресс-релизы, а свои инженерные команды и то, что эти команды собрали: ИИ-агентов, компьютерное зрение, языковые модели, MLOps-платформы. По стендам ходят не только министры и губернаторы, но и те, кто эти системы реально пишет: CTO, тимлиды, руководители ИИ-направлений. На пленарке — премьер-министр; на сессиях рядом — доклады про инференс, дообучение и архитектуру агентов. В этом году форум собрал больше 13 тысяч человек из 46 стран, около 185 стендов и за 350 подписанных соглашений. Если коротко — это место, где видно не моду, а то, что промышленность и госкорпорации реально готовы внедрять и за что готовы платить.

Я только что оттуда вернулся — и первым делом полез на Хабр посмотреть, что пишут с форума. Почти ничего. Профильная же тема, ну? Ладно, напишу сам. Только это будет не обзор стендов: три дня я ходил по сессиям, слушал, говорил с людьми — и дальше попробую разобрать, как рынок ИИ в России устроен на самом деле, без презентационного глянца.

На всякий случай напомню, меня зовут Климент Викулов, я сооснователь GPTunneL. Это платформа, через которую 2 миллиона человек и 4500 компаний работают с ИИ: единый доступ к двум сотням топовым ИИ-моделей с оплатой в рублях, а поверх — RAG, агенты, оркестрация, и, собственная модель GROM. Среди наших корпоративных клиентов Северсталь, Евраз, ряд дочерних компаний Сбера, и ещё с полсотни компаний такого же калибра; с самим Сбером работаем по GigaChat. Энтерпрайз такого уровня не приходит на сервис, который не прошёл ряд его корпоративных проверок, а это долгая и муторная процедура, и в сфере ИИ её проходят единицы.

Говорю это не ради хвастовства, а чтобы было понятно, откуда я смотрю на рынок: не из зала, а изнутри — вижу, что реально внедряется у крупных заказчиков, а что остаётся красивым слайдом. На ЦИПР мы стояли на стенде МТС, с которым делаем совместное решение, к нему я ещё вернусь позже, отдельным разделом.

И сразу обозначу: всё, что дальше — это моё личное мнение, взгляд из нашей практики, а не истина в последней инстанции. Что-то я говорю как факт, а что-то — это просто моя оценка, и я буду честно показывать, где одно, а где другое. С какими-то выводами вы не согласитесь — и это нормально.

Вывод, к которому я пришёл, простой. Весь промышленный ИИ в России сегодня держится на двух компаниях — на Сбере и Яндексе. Дальше — о том, почему так вышло, к чему это ведёт и где в этой картине все остальные.

Форум двух компаний

Я походил по стендам и сессиям, послушал, кто что внедряет и поймал ощущение, которое потом подтверждалось в каждом втором разговоре. С кем из корпоратов ни заговоришь про ИИ, за спиной у него либо Сбер, либо Яндекс.

Это не фигура речи. Объединённая авиастроительная корпорация (ОАК) тестирует GigaChat для проектирования авиадеталей. Объединённая двигателестроительная корпорация (ОДК) делает со Сбером компьютерное зрение для контроля качества двигателей. «Газпром нефть» и «Норникель» строят промышленных агентов с Яндексом. «Северсталь» принципиально идёт своим путём на открытых моделях, но это лишь исключение, подтверждающее правило. Слушаешь сессии по промышленному ИИ, и складывается устойчивая картинка: по одну сторону стола заказчик, по другую — один из двух.

Дальше можно было бы съехать в публицистику про монополизацию. Но мне интереснее разобрать, почему так вышло. Потому что это не лень рынка и не заговор — это его физика.

Три дефицита: вычисления, данные, деньги

Чтобы построить и содержать сильную модель, нужны три вещи: вычисления, данные и деньги. Деньги — это ещё и люди, и время. Не хватает хотя бы одного — и ты уже не игрок в лиге моделей. В России в дефиците все три сразу. И всё, что по этим трём пунктам в стране вообще набралось, собрано ровно у двух компаний.

Разберу по очереди — от самого обсуждаемого дефицита к самому, на мой взгляд, недооценённому.

Дефицит первый: вычисления

Про дефицит железа на форуме говорил каждый, кто внедряет ИИ. Цифры, которые звучали: в 2024-м в России запустили около 14 тысяч серверных стоек, в 2025-м — примерно впятеро меньше. Срок окупаемости одного ЦОДа из-за ключевой ставки вырос с 6–8 до 10–12 лет — замораживать деньги на такой срок мало кто готов. Все дата-центры страны потребляют порядка 1,5 ГВт; в Китае для сравнения — около 30 ГВт. Новейших чипов Blackwell в товарных количествах нет почти ни у кого.

Это уровень, на котором ресурс конечен даже у гигантов. Сбер в своё время просил у государства 450 млрд рублей на дата-центр и получил отказ — предложили строить за свой счёт. Если уж Сберу говорят «стройте сами», то у остальных вопрос «где взять вычисления для своей модели» закрыт по умолчанию.

И здесь — оговорка, без которой вся картина выйдет кривой. «Держится на двух» не значит, что эти двое сильны по мировым меркам. По оценкам отраслевых источников, у Сбера и Яндекса вместе — порядка пары десятков тысяч ускорителей NVIDIA. Для России это много. Но один крупный западный гиперскейлер ворочает сотнями тысяч, а у мировых лидеров счёт идёт уже на миллионы. Так что два игрока держат рынок не потому, что они огромные, а потому что все остальные отстали ещё сильнее.

Дефицит в России вообще не точечный, а сплошной. Не хватает, по сути, всего сразу: мощных дата-центров под обучение, размеченных датасетов, денег и — отдельная боль — собственных чипов. Россия не производит ИИ-ускорители; всё, на чём работают и Сбер, и Яндекс, и мы, — это NVIDIA, приехавшая по параллельному импорту. Именно поэтому Сбер лезет в микроэлектронику: в начале 2026-го он выкупил долю в группе «Элемент», крупнейшем российском производителе чипов, по сути, заявка на роль «русского Huawei». История долгая, не на один год, но сам факт показателен: лидер рынка вынужден закрывать дефицит на уровне физического кремния.

А теперь — то, в чём я с рынком расхожусь.

Смотрел инфраструктуру у крупных российских игроков и обратил внимание: инференс крутится на тяжёлых датацентровых картах NVIDIA — A100, H100, где-то и H200. Это отличное железо — для обучения моделей это топ, без вариантов. Но гонять на такой карте продакшн-инференс средних моделей — это как возить пиццу на КамАЗе. Доедет, просто посмотрите на расход.

Логика простая. Большая часть реальных корпоративных задач — это модели на 7–32 миллиарда параметров: агенты, ассистенты, классификаторы, разбор документов. Фронтир на 200B+ нужен далеко не везде. А модель уровня 30B в квантизации спокойно живёт на потребительском Blackwell — RTX 5090 с 32 ГБ и даёт цену за миллион токенов ниже, чем H100 на сопоставимой нагрузке. Это не маркетинг, это публичные бенчмарки. Китайцы, которых зажали экспортными ограничениями, давно считают экономику инференса именно так — дешёвое железо плюс агрессивная квантизация плюс грамотный батчинг.

Честный нюанс: 70B+ и фронтир на потребительской карте не закрыть — не хватит памяти, нет NVLink, нет ECC. Для этого по-прежнему нужен датацентровый Blackwell или связка A100/H100. Так что нехватка вычислений никуда не девается: фронтир требует масштаба, который есть у двоих.

Но часть дефицита — рукотворная. Дорогое железо занято тем, что прекрасно уехало бы на железо в разы дешевле. И это не теория: я и сам на ЦИПР искал, у кого взять серверы под инференс нашей модели GROM, предварительно нашёл поставщиков. Потребительский Blackwell, привезённый через Китай и сертифицированный для ввоза в РФ, задачу закрывает. Российская модель на видеокартах, приехавших по параллельному импорту — над словом «суверенитет» тут можно иронизировать сколько угодно, но экономически это работает.

Дефицит второй: данные

А вот это, на мой взгляд, самый недооценённый из трёх дефицитов, и я бы хотел, чтобы на форуме про него говорили больше, чем про видеокарты.

Современная модель учится на триллионах токенов текста. И тут неудобная арифметика: качественного русскоязычного текста в мире кратно меньше, чем англоязычного. Для общих моделей Сбер и Яндекс выгребли русскоязычный веб настолько, насколько он вообще выгребается. Лёгкие данные закончились.

Но ЦИПР — форум не про общие модели, а про промышленный ИИ. А самые ценные промышленные данные — чертежи, телеметрия станков, базы дефектов, логи ремонтов, технологические карты лежат запертыми внутри корпораций. Это их интеллектуальная собственность, и просто так наружу её никто не отдаст. На пленарке это, кстати, прямо признали: данных для обучения индустриальных моделей у разработчиков, по сути, нет, а как корпоративную ИС «допускать» к обучению — Минцифры ещё только предстоит придумать.

И вот тут ключевая мысль всего текста.

Промышленный ИИ в России сегодня нельзя купить как готовый продукт. Потому что это пока и не продукт — это серия партнёрств вокруг доступа к данным. ОАК пускает партнёра к своим данным по нервюрам — и тот обучает модель. ОДК пускает к данным с производства двигателей — и появляется компьютерное зрение. Каждый промышленный кейс — это отдельная сделка про данные, а не покупка лицензии.

А чтобы такие сделки заключались, нужна не технология. Нужен вес: масштаб, репутация, возможность сесть за стол с ОАК или «Норникелем» на равных. Такой вес в стране есть у двух компаний. Поэтому Сбер и Яндекс в каждом проекте — не потому, что у них "лучшая российская модель", а потому что промышленный ИИ устроен как переговоры о данных, а вести их по плечу единицам.

Это и есть ответ на вопрос «почему два имени». Не модель — данные.

Здесь добавлю и свой опыт. У нас есть собственная модель, GROM, и работа над ней показывает то же самое. Видеокарты — вопрос решаемый: ищем варианты, и в ближайшее время закроем. А данные — нет. Самое ценное здесь, отраслевые наборы, заперто у тех, кто сам модели не строит. И в этот потолок упирается каждый — лидеры тоже, просто у них он выше.

Дефицит третий: деньги

И последнее. Обучение конкурентоспособной фронтир-модели - это, по оценкам, которые звучали на форуме, расходы порядка триллиона рублей, и дальше будет только дороже. Один только Сбер вкладывает в ИИ около 600 млрд рублей за 2024–2026 годы, из них 350 млрд — в одном лишь 2026-м. Это не венчурные деньги и не раунд — это бюджет корпорации или государства, который надо жечь годами без гарантии возврата.

Любопытно, что отставания в кадрах и фундаментальной науке эксперты на форуме как раз не фиксируют — российские специалисты сильны и востребованы, в том числе в западных командах. То есть деньги тут не про то, чтобы нанять умных. Они про то, кто может позволить себе не останавливаться.

Сложите три дефицита вместе — и список тех, кто закрыл все три, закономерно сходится к двум.

Что показал сам Сбер и Яндекс

Раз уж речь о них — коротко, что Сбер и Яндекс привезли на форум.

Сбер показывал ГигаКоворк — платформу управления автономными агентами для всей компании. На стенде нам сказали, что решение уже в проде. Я честно попробовал это пощупать: потыкал демо, нажал «назад» — и поймал моргающий курсор, будто страница всё ещё считает себя полем ввода. Мелочь, не спорю, и вполне может быть частностью конкретного стенда. Но ощущения готового боевого продукта у меня лично не возникло. Сразу оговорюсь: это субъективное впечатление от 30 минут у чужого стенда, а не вердикт.

Андрей Белевцев, старший вице-президент Сбера рассказывает про достижения и планы банка в части ИИ

Зацепило меня другое, посерьёзнее. Под капотом у платформы — только GigaChat. На мой взгляд, агентскому решению такого масштаба логично уметь работать и с открытыми моделями: под разные задачи — разные модели, так и дешевле, и гибче. Но тут признаю честно — не мне решать: у Сбера своя модель и свои причины её продвигать.

Яндекс зашёл с другой стороны — со стороны продукта для людей: Алиса, агенты, которые выполняют задачи за пользователя, агентная коммерция, носимые устройства со встроенным ИИ. Если совсем коротко, разница в акцентах такая: Сбер заходит в ИИ как инфраструктура, Яндекс — как продукт. Обе ставки выглядят рабочими.

«Промт-инженер» — это не профессия

Отдельно зацепила одна реплика. Андрей Белевцев, старший вице-президент Сбера и руководитель блока «Технологическое развитие», высказался про модную профессию «промт-инженер». Смысл был такой: отдельной должности «промт-инженер» не существует, и если кто-то предлагает вас на неё выучить — это инфоцыганство. Писать промты сегодня должен уметь каждый. Это как 30 лет назад искали «человека, который умеет работать с компьютером», а потом навык стал базовым для всех, и отдельная вакансия отпала сама собой.

Согласен полностью. Уметь писать промты обязан каждый — от бухгалтера до разработчика. Это не отдельная каста, это новая базовая грамотность. И если видите курс «выучись на промт-инженера за два месяца» — сэкономьте деньги: навык набивается ежедневной практикой, а не сертификатом в рамочке от новомодного коуча из инстаграмма.

Где в этой картине все остальные

Если фронтир-модели — удел двоих, значит ли это, что остальным на рынке ИИ делать нечего? Наоборот. Ценность для бизнеса создаётся не на уровне модели, а поверх неё — в продуктах, которые решают конкретную задачу. И этот слой открыт для всех: тут не нужны ни свой дата-центр, ни триллион рублей, ни доступ к данным «Норникеля» — нужно понимать боль заказчика и быстро собирать работающее.

И тут пора разобраться с термином, который на нас вешают регулярно. GPTunneL почти в каждом обзоре записывают в «агрегаторы нейросетей» — и я знаю эту категорию изнутри, поэтому скажу прямо: как самостоятельный бизнес чистый агрегатор сегодня мёртв. Собрать в одном окне доступ к чужим моделям было хорошей идеей для 2023–2024 годов, когда дефицитом был сам доступ. Сейчас это просто арбитраж — обернул чужой API, добавил оплату рублём, взял маржу, — и эту маржу схлопнули с двух сторон.

Снизу давит серый рынок: масса продавцов, в том числе китайских, льёт доступ через API кратно дешевле себестоимости — фермы аккаунтов, серые ключи, промокредиты. Часто это даже не настоящий API: продавцы проксируют доступ через подписочные продукты вроде Codex и выдают его за API — снаружи похоже, но функционал урезан, ни стабильных лимитов, ни гарантий. И главное — это ненадёжно: такие сервисы появляются десятками в месяц и так же тихо закрываются через пару месяцев (нам в компанию только за неделю прилетает два-три подобных предложения). В моменте выигрываешь на цене, а потом остаёшься без доступа посреди рабочего процесса.

Сверху маржу давят крупные игроки с собственной инфраструктурой. Когда у тебя свои дата-центры, доступ к моделям перестаёт быть отдельным бизнесом и становится копеечной услугой поверх того, что и так есть. Чистому перепродавцу против этого играть нечем: ни серых схем, ни своего железа. Токен стал биржевым товаром, а бизнесом — то, что строится поверх него.

Поэтому всерьёз закрепляются те, кто пошёл глубже: снаружи всё то же окно с моделями, а внутри — пайплайны и целые продукты на нейросетях, RAG, агенты, оркестрация, контроль данных. В этот слой зашли и сами крупные компании. У Ростелекома есть Нейрошлюз. Билайн пошёл к малому бизнесу и ИП: доступ к топовым моделям — Claude, Seedance 2.0, Veo, NanоBanana и тд — можно подключить прямо в личном кабинете оператора; ход, на мой взгляд, разумный. Свои сборки есть у MWS GPT и ещё у нескольких крупных компаний.

Интерфейс Билайна для доступа к нейросетям

Интерфейс Ростелекома по доступу к нейросетям

ИИ-Фабрика: продуктовый слой встречает инфраструктуру

Вот на этом, продуктовом слое, работаем и мы. GPTunneL даёт бизнесу доступ ко всем актуальным моделям в одном интерфейсе — да, это в том числе и есть тот самый «доступ», и это нормальная, живая часть продукта. Но только им мы не ограничиваемся: поверх — пайплайны, RAG, агенты, оркестрация, своя модель GROM. Доступ — это вход; ценность создаёт то, что на нём построено.

ИИ Фабрика на стенде МТС за моей спиной (извиняюсь за не самое удачное фото, но другого не имею :) )

На стенде МТС мы показывали ИИ-Фабрику — совместный продукт GPTunneL и МТС. Он хорошо объясняет, что я имею в виду под «продуктом поверх инфраструктуры», поэтому разберу его как пример, а не как витрину.

Для заказчика это выглядит как наш типовой интерфейс - т.е. одно окно ко всем топовым нейросетям: 200+ моделей, доступных без VPN и с оплатой российской картой, причём не только текстовых — модели для фото, видео и музыки тоже здесь. Одна из моделей под капотом — наша GROM. Всё это либо работает в дата-центрах МТС, либо разворачивается on-premise, в контуре заказчика — и тогда данные не покидают периметр компании вообще.

Зачем это бизнесу — видно на простом примере. Маркетингу нужно снять киношную рекламу на современных видеомоделях, разработчикам — подключить Claude для написания кода. Обычный путь сегодня — идти на сторону, и тут два варианта, оба так себе. Первый — сомнительный посредник: непонятно, как закрывать оплату документами, лишние вопросы от бухгалтерии, и тот самый риск, о котором шла речь выше, — сегодня сервис есть, завтра нет. Второй — личная иностранная карта: корпоративный контент уходит через чужой периметр, а аккаунт, который сегодня работает, завтра может быть заблокирован. ИИ-Фабрика делает ту же задачу внутри собственного контура компании. Ценность здесь — не в моделях, модели у всех одни и те же. Ценность в том, что вокруг них собрано.

Губернатор Нижегородской области Глеб Никитин, вице-премьер и руководитель Аппарата Правительства России Дмитрий Григоренко знакомятся с совместным продуктом GPTunneL и МТС - ИИ-Фабрикой на стенде МТС. Я - на фоне слева — *Губернатор Нижегородской области Глеб Никитин, вице-премьер и* руководитель Аппарата Правительства России Дмитрий Григоренко *знакомятся с совместным продуктом GPTunneL и МТС - ИИ-Фабрикой на стенде МТС. Я - на фоне слева*

Лоукод, который всё никак не кончится

Ещё одно наблюдение, и оно тревожит меня сильнее моргающего курсора.

На ЦИПР очень много лоукода и ноукода: конструкторы, визуальные сборщики пайплайнов, «перетащи блок, соедини стрелочкой». Само по себе это не плохо — лоукод закрывает реальную боль. Проблема в другом: когда лоукодом меряют передовой край.

Мир разработки за последний год уехал в другую сторону — в vibe coding. Ты формулируешь, что хочешь, а агент пишет код, чинит баги, гоняет тесты, патчит репозиторий. Это не «блоки мышкой» — это работа с кодовой базой на естественном языке. На ЦИПР вайбкод как мейнстрим почти не звучал. И тут Россия выглядит на полтакта позади: мы обстоятельно осваиваем конструкторы ровно тогда, когда передовой край уже сместился к агентам, которые пишут сами. Ощущение, будто все увлечённо учатся водить машину с автоматом, а по соседней полосе уже едут вообще без водителя.

Телеком: своя железка наконец поехала

Физически чуть ли не половину форума занимали операторы связи — повестка у них своя, отдельная от ИИ-трека. Коротко: МегаФон с YADRO впервые запустил отечественную базовую станцию в городе-миллионнике, она работает прямо в Нижнем. Билайн тестирует 5G в 11 городах, но коммерчески запуститься пока не может — нет разрешения регулятора. МТС показала аэромобильный комплекс связи — по сути, дрон с базовой станцией, разворачивающий покрытие там, где его нет.

Что показательно: для ИИ-трека новость дня — «агент заменил рабочую роль», для телекома — «наконец-то своя железка вместо импортной». Один форум, а скорости — будто из разных десятилетий.

Что в итоге

Дуополия, с которой я начал — это палка о двух концах.

С одной стороны, концентрация сейчас эффективна. Кто-то должен тащить инфраструктуру и заключать тяжёлые сделки про данные, и хорошо, что в стране есть кому. С другой — это хрупко. Когда хребет всего промышленного ИИ страны — это один банк и одна интернет-компания, любой их сбой или разворот становится сбоем целой отрасли. И главный дефицит в этой картине — даже не видеокарты и не данные, а тонкий продуктовый слой поверх двух гигантов. Лидеры дают инфраструктуру. А тепло по домам должен развозить кто-то ещё, и вот этого «кого-то ещё» в стране пока мало.

Отставание есть, отрицать его глупо. Но закрывается оно не лозунгами с пленарок, а скучной работой: считать экономику инференса, доводить продукты до боевого состояния, придумать наконец рамку, по которой корпорации смогут отдавать данные в обучение, не теряя на этом интеллектуальную собственность. Вот это — повестка. А «у нас тоже есть своя модель» — давно уже почти не новость.

И последнее, чтобы по-честному. Всё выше — мой личный разбор: один форум, одна точка зрения, взгляд практика, а не объективный отчёт. В деталях я вполне могу ошибаться. Если вы видите рынок иначе — спорьте в комментариях, ради такого разговора я это и пишу.

ЦИПР для меня не последняя точка в ближайший месяц. Дальше — ПМЭФ: если там будет что-то стоящее по части ИТ, напишу отдельно. А в середине июня едем в Китай — искать решения для наших моделей и заключать официальные партнёрства с рядом китайских поставщиков. По сути, едем напрямую к лидерам — и в моделях, и в железе. Про эту поездку расскажу отдельным постом, как вернёмся. Так что продолжение следует.

Если хотите следить за этим вживую, не дожидаясь статей на Хабре, то у меня есть телеграм-канал https://t.me/kliment_vikulov , там пишу о таких вещах намного чаще и подробнее и показываю изнанку (которая не под NDA): поездки, переговоры, тесты моделей, иногда — неожиданных пользователей нашего сервиса.

Комментарии (35)

verticalacid
27.05.2026 01:33
#30024010
Сбер объяснил наконец, каким образом создал с нуля Gigachat 3 на своих A100, и почему поведение получилось дипсика, со всей унаследованной от GPT русофобией?

До этого ни о каких российских LLM говорить смысла нет. У Яндекса квен за безумные деньги - тоже ни о чем.
1. formerchild
  27.05.2026 01:33
  #30024706
  Там вообще сплошная фобия. Меня забанили за безобидный вопрос по философии Хайдеггера (именно по философии, по БиВ, а не по его политическим взглядам). Человеческие админы подтвердили бан. Пытаюсь понять, это что вообще было? 451 градус какой-то
  1. kliment_ceo Автор
    27.05.2026 01:33
    #30026416
    Где забанили? Не понял комментарий, если честно
1. ogukuu
  27.05.2026 01:33
  #30025712
  Модель АвтоВАЗа это максимум на что можно рассчитывать в нашем государстве сейчас.
  
  Ну или москвич 3)
  1. kliment_ceo Автор
    27.05.2026 01:33
    #30026420
    Будем надеятся что ИИ не постигнет учесть АвтоВАЗ :)
1. kliment_ceo Автор
  27.05.2026 01:33
  #30026414
  Тут не могу сказать. Лучше у самого Сбера спросить. В целом мы подобный вопрос с ними обсуждали - но они настаивают что у них своя модель полностью обученная с нуля (во что, лично я, слабо верю)
  1. Weron2
    27.05.2026 01:33
    #30028284
    Сами данные такие в большинстве своем, я так думаю

Shalundrive
27.05.2026 01:33
#30024014
Типичный взгляд представителя бизнес-слоя, который судорожно пытается спасти умирающую модель чистого агрегатора под соусом партнерства с МТС. Но если убрать пиар-глянец ЦИПРа и посмотреть на текст глазами системного инженера, то автор находится в глубочайших и опасных заблуждениях.

Он пишете про дуализм Сбера и Яндекса, но на самом деле никакого дуализма нет. То, что две огромные компании монополизировали рынок, завезли по параллельному импорту стойки с H100 и выкатили закрытые облачные API, ровным счетом ничего не значит. В реальные мозги промышленности они не пошли и пойти не могут.

Весь пассаж про то, что гонять инференс на датацентровых картах, это возить пиццу на КамАЗе, и предложение строить enterprise-контур на потребительских RTX 5090 выдает человека, который никогда не держал под реальной нагрузкой (high concurrency) боевые системы с жестким SLA.

На инференсе больших моделей главным бутылочным горлышком (bottleneck) является не вычислительная мощность ядра, а пропускная способность памяти (Memory Bandwidth) при генерации токенов. Игровые карты с их GDDR-шиной сольют датацентровым картам с HBM3e памятью на первом же серьезном батче (Batch Size). Latency улетит в космос. На потребительских картах нет полноценной коррекции ошибок памяти. В режиме 24/7 под нагрузкой случайный переворот бита (bit flip) от перегрева, это норма. Для геймера это вылет текстуры. Для ИИ-агента в банке или на производстве, это невалидный json, перепутанная цифра в счете и сломанная база данных. Попробуйте засунуть четыре прожорливые RTX 5090 с их гигантскими воздушными кулерами в стандартную серверную стойку 19", они расплавят сами себя. Датацентровые шасси (SXM5/OAM) спроектированы под сквозной продув и жидкое охлаждение не просто так. Автор радуется, что ОАК или ОДК тестируют GigaChat. Но ни один вменяемый архитектор критической инфраструктуры никогда не пустит внешнюю закрытую модель (black box) через облачный API в реальный технологический контур. Если проектирование деталей или контроль сборки зависит от удаленного сервера Сбера или Яндекса, это не суверенитет, это критическая уязвимость системы (а если сеть моргнет, а если веса на сервере обновят и модель начнет галлюцинировать?). Реальной промышленности нужен On-Premise и Open-Source (по типу Llama-3, Qwen и собственные дообученные модели), развернутые локально, внутри своего закрытого контура, а не ваши ИИ-Фабрики и Нейрошлюзы. Его так же удивляет засилие лоукода и тому, что Россия на полтакта позади от мирового Vibe Coding. А как иначе? Конструкторы вроде перетащи кубик, соедини стрелочкой тоннами закупаются ИТ-директорами легаси-структур ровно потому, что их можно красиво показать на слайдах министерствам. Реальные автономные ИИ-агенты, работающие напрямую с кодовой базой, тестами и компиляцией, требуют жесткой, суровой инженерной культуры разработки. Корпоративная машина ленива и неповоротлива, ей проще купить обертку над чужим API, назвать это ИИ-Фабрикой и продолжать штамповать неэффективный софт.

Вся статья по сути, это прекрасный маркер паники агрегаторов, чью маржу схлопнули серый рынок снизу и облачные монополисты сверху. Но не нужно выдавать попытки коммерсантов продать губернаторам обертки над GigaChat за реальное технологическое развитие отрасли. Настоящие мозги ИИ создаются на уровне оптимизации инференса в компиляторах и железе, а не на выставках и показах высокому начальству.
1. ITDiver77
  27.05.2026 01:33
  #30024668
  Совершенно сугубо. По хорошему крупняк должен не фигнёй страдать, из серии яша/сбер запили нам своё. А открывать специализированные отделы а то и депы, проектирующие интеграцию с ИИ. На крайняк - нанимать профи для настройки процессов и поддержания потом, но это такое. "приходящий сисадмин" актуален для компании в 10 человек, но аутсорсить айти для корпорации - нонсенс. Тут ровно всё так-же, и лишь костность мышления ЛПР компаний сдерживает от бурного роста. Да, с железом есть сложности, но решаемые на уровне корпораций.
1. kliment_ceo Автор
  27.05.2026 01:33
  #30026406
  Спасибо за разбор по делу, приятно читать такие комментарии :)
  
  Где вы правы - там не спорю. HBM против GDDR, bandwidth как боттлнек на больших батчах, ECC, bit flip от перегрева - всё так.
  
  Про перегрев именно четырых 5090 в стаднатрных 19 дюймах серверных юнитах - пока лично я не могу сказать, тк мы как раз в изучении данного вопроса. Но есть заявление, как минимум, одного поставщика, что так работать может и уже проведены нагрузочные тесты. Как узнаю - напишу результат.
  
  Под задачи на 7–32B, а их в корпоратах большинство — спокойно живут на потребительском железе, и там оно дешевле. Фронтир и 70B+ требуют датацентровых карт с NVLink и ECC - я так и писал.
  
  Далее Вы пишите что корпам нужен on-premise в закрытом контуре. ИИ-Фабрика - это и есть on-premise в контуре заказчика, данные не покидают периметр. Возможно, вы упустили это в моем тексте.
  
  Про «панику агрегатора», чтобы обвинить меня в том, что агрегатор мёртв, надо пропустить целый абзац в моей статье и не читать мои другие статьи на хабре, где я пишу что на чистом агрегаторстве, как это массово сложилось сейчас в России (обертка поверх чужих апи) - бизнес не построишь, и мы уже давно не там. Я это говорю с начала 2025 года :)
  
  Спасибо за комментарий, еще раз!

ToniDoni
27.05.2026 01:33
#30024020
А почему у вас в gptunnel кэшированные токены не тарифицируются отдельно, если что, они обычно в 10 раз дешевле ;)

А модель уровня 30B в квантизации спокойно живёт на потребительском Blackwell — RTX 5090 с 32 ГБ

И сколько клиентов такой сервер одновременно обслужит?

Обучение конкурентоспособной фронтир-модели - это, по оценкам, которые звучали на форуме, расходы порядка триллиона рублей

А чего не квадралион?
А то вот чуваки из Стэнфорда не знают, говорят LLaMA 3 400 B всего за 75M $ обучили
https://www.youtube.com/watch?v=9vM4p9NN0Ts&t=3496s

Сверху маржу давят крупные игроки с собственной инфраструктурой. Когда у тебя свои дата-центры, доступ к моделям перестаёт быть отдельным бизнесом и становится копеечной услугой поверх того, что и так есть.

А почему же у них тогда цены в сто (или в тысячу?) раз дороже, чем в остальном мире?

У Ростелекома есть Нейрошлюз. Билайн пошёл к малому бизнесу и ИП: доступ к топовым моделям — Claude, Seedance 2.0, Veo, NanоBanana и тд — можно подключить прямо в личном кабинете оператора; ход, на мой взгляд, разумный.

А покупать у Билайна чатгпт который забанил РФ это надежное решение?) Кстати где у Билайна Seedance?

ToniDoni
27.05.2026 01:33
#30024048
подключить Claude для написания кода... ИИ-Фабрика делает ту же задачу внутри собственного контура компании

ну чудеса)
1. kliment_ceo Автор
  27.05.2026 01:33
  #30026444
  Данные у вас - а не в Клоде. Клод - api, которое потом можно еще и на GLM в своем контуре, например, переключить.
  1. ToniDoni
    27.05.2026 01:33
    #30027652
    Клод - api
    
    А апи сервер клода в Америке)
    
    Если ли вы и пользователям такие чудеса рассказываете, то приготовьтесь что к вам могут прийти, за то что не уведомили о возможной трансграничной передаче ПД.

pg_expecto
27.05.2026 01:33
#30024284
Яндекс зашёл с другой стороны — со стороны продукта для людей

Вот когда Алиса AI подойдёт к уровню DeepSeek по практическому применению для реальных инженерных задач , тогда этот тезис станет истинным.

А пока - с Алисой только поиграться .

ayteayoga
27.05.2026 01:33
#30024446
Всю статью можно поместить в десяток хороших абзацев, но тогда придётся бахнуть весь нейрослоп. Чудовищный жест, ничего не скажешь. Будем читать нейрослоп.
1. kliment_ceo Автор
  27.05.2026 01:33
  #30026466
  спасибо за обратную связь! Тут даже не столько нейрослоп, сколько моя "неоптимизированная" подача мысли в статье. Дальше буду стараться более компактно писать, что бы повышать дочитываемость текста.

ZamirHa
27.05.2026 01:33
#30024698
За статью спасибо. Хотя она интересна не оценками, а информацией, поверх которой эти оценки делаются.

Действительно, в России пока никаких более менее заметных подвижек с ИИ не видно и не предвидится. Не вовремя мы с колен начали вставать, уж извините за такое проявление нелояльности.

И, кстати, дежурное уже "но специалисты у нас все равно клевые" не сильно соответствует действительности. Разработчики действительно клевые, но они такие везде, а вот другие слои, которые должны этих разработчиков направлять и оборачивать - в полном Ж.
1. kliment_ceo Автор
  27.05.2026 01:33
  #30026490
  Спасибо. И спасибо отдельно за «интересна информацией, а не оценками» — это ровно то, чего я и хотел: оценки мои личные, верно. А вот по фактуре каждый может сделать свои выводы.
  
  Про «слои, которые оборачивают разработчиков» - соглашусь, но смягчу. Не везде Ж. Там, где продуктом занимаются люди, которые сами понимают технологию, а не пересказывают её с чужих слайдов, то там получается нормально. Но проблема в том, что таких пока мало.

LinkToOS
27.05.2026 01:33
#30024882
Весь промышленный ИИ в России сегодня держится на двух компаниях — на Сбере и Яндексе.
Но ЦИПР — форум не про общие модели, а про промышленный ИИ.

Явное противоречие в этих фразах. Раз уж “промышленный ИИ” это общее понятие, а не только про генеративные модели, то “промышленный ИИ” никак не сводится к двум компаниям.

И вот тут ключевая мысль всего текста.
Промышленный ИИ в России сегодня нельзя купить как готовый продукт. Потому что это пока и не продукт — это серия партнёрств вокруг доступа к данным. ОАК пускает партнёра к своим данным по нервюрам — и тот обучает модель. ОДК пускает к данным с производства двигателей — и появляется компьютерное зрение. Каждый промышленный кейс — это отдельная сделка про данные, а не покупка лицензии.

Ключевая мысль сгенерирована ИИ ?

Объединённая двигателестроительная корпорация (ОДК) делает со Сбером компьютерное зрение

Компьютерным зрением начали заниматся задолго до распространения генеративных моделей. Компаний, которые занимаются компьютерным зрением, явно больше чем две.

allowq
27.05.2026 01:33
#30025166
Банально, но ИИ это дорого. В странах, с которыми мы постоянно сравниваемся, деньгами заливают ошибки инженеров и менеджеров. По сложившейся традиции заимствуем, повторяем и улучшаем, с запазднием. Хотим дёшево и быстро, а потом ругаемся на качество.

В части баснасловных сумм. Представьте, что у вас штат 1000+ в RnD и их нужно занимать чем-то где есть спрос. Не следует трактовать эти цифры будто это исключительно инвестиции. Часто это OPEX и небольшие (по меркам корпораций) вложения под ожидаемую выручку. Не прибыль. Выручку. Далее маркетинг делает своё дело и появляются истории для всех целевых аудиторий:
- для чиновников ради субсидий;
- для разработчиков ради найма;
- для пользователей ради хайпа.
Итого, вы просто перераспределили бюджет прошлого года. Далее, например, придумали такую смелую историю как "коммерциализация". Идея в том, чтобы начать продавать то, что делается внутри и для собственных нужд организации. Улучшая собственные процессы вы пытаетесь отбить затраты делая Продукты, заключаете партнёрства и подписываете соглашения о намерениях для дальнейшей продажи/внедрения. Выглядит как правильное дело! Если вы продуктовая компания, то даже проще.

В заключении, эффект от всех перечисленных историй крайне сложно посчитать, а в силу отсутствия конкуренции в стране денежные потоки оборачиваются и оборачиваются. Тот самый эффект подтверждается под честное слово. Бюджет переносится в новый год. Бонусы за отечественный ИИ платятся. Всем выгодно, кроме конечного потребителя, но куда мы денемся благодаря помощи государства в лице РКН и прочих лобистов, кому не выгодно терять тот самый бюджет?

ЦИПР хорош. Выводы делает каждый сам.

ENick
27.05.2026 01:33
#30025326
"""Любопытно, что отставания в кадрах и фундаментальной науке эксперты на форуме как раз не фиксируют """ - а оно им надо??? В МГУ открыли факультет ИИ. Интересно узнать мнение Автора статьи о предполагаемых зарплатах выпускников, насколько меньше доставщиков пиццы?
1. kliment_ceo Автор
  27.05.2026 01:33
  #30026504
  Отвечу за себя - мы нанимаем сеньоров и сильных людей, команда у нас относительно небольшая (сейчас 52 человека), и идём мы несколько быстрее рынка за счёт уровня, а не числа рук. Платим таким людям по рынку.
  1. ENick
    27.05.2026 01:33
    #30026622
    Очень интересно (вопрос не академический), а после мехмата у Вас есть народ? Я сомневаюсь
    
    kliment_ceo Автор
    27.05.2026 01:33
    #30035072
    Конкретно после мехмата у нас, по-моему, нет, но тут могу ошибаться, специально не отслеживаю. Я на образование почти не смотрю. Смотрю на перформанс конкретного человека и на то, какие задачи он реально закрывает.
    
    Для примера: у нас есть ряд ребят, кто много лет работал в Яндексе на разных позициях, в том числе топовых - показывают отличный результат. А есть сотрудники 2004–2005 года рождения, без высшего образования вообще, и это не мешает им работать на высоком уровне. Причём это люди уже с другим мышлением, чем поколения родившиеся в 1980-90-х.
    
    Так что диплом сам по себе, лично для меня, мало о чём говорит.

Lisitsina
27.05.2026 01:33
#30026094
"С кем из корпоратов ни заговоришь про ИИ, за спиной у него либо Сбер, либо Яндекс"

вопрос оптики. Вы говорите с теми, кто плохо знаком с промышленным ИИ. Да, рынок молодой, не все решения зрелые и упакованы как продукт. Но компаний, которые пушат эту тему, более чем достаточно. Просто они не готовы сливать бюджеты на выставочные стенды как Сбер.

kliment_ceo Автор
27.05.2026 01:33
#30026514
Справедливо - "вопрос оптики". Конкретно ЦИПР показывает тех, кто на ЦИПР приехал.

Опять же, повторюсь, возможно, картину я вижу не всю. Будет фактура, которая её поправит - скидывайте, с удовольствием разберу.
1. Lisitsina
  27.05.2026 01:33
  #30030784
  версия Форбс. Но даже она сильно субъективна, в фокусе только компании, которые активно работают со СМИ и участвуют в выставках. Год назад мы анализировали рынок, игроков с 1-3 типовыми решениями было более сорока.

KonstantinTokar
27.05.2026 01:33
#30027294
Вот статья, которая человеческим языком раскрывает все тайны Российского ИИ: https://www.comnews.ru/content/245257/2026-05-14/2026-w20/1008/vychislitelnyy-tupik-pochemu-rossiyskiy-ii-ostaetsya-bez-moschnostey

Вкратце. За единицу приняли H100. В России (как примерно и у автора) 20.000 карт. А дальше сравните порядки цифр: и всё становится ясно. Никаких отечественных моделей не существует, и дело не в данных.

Сергей Миневич назвал топ стран по ИИ-вычислениям (TRG Datacenters / Forbes, сентябрь 2025):

1. США (39.7 млн H100e) 2. ОАЭ (23.1 млн H100e) - за счёт масштабных госпрограмм и партнерства с Microsoft (G42) 3. Саудовская Аравия (7.2 млн H100e) 4. Южная Корея (5.1 млн H100e) 5. Франция (2.4 млн H100e) 6. Индия (1.2 млн H100e) 7. Китай - в официальном рейтинге Epoch AI Китай занижен из-за "темных вычислений", но реальные оценки (GeoCoded) ставят его на уверенное второе место.
1. rPman
  27.05.2026 01:33
  #30034810
  у ОАЭ мощности виртуальные или физические? а то договор аренды 23млн железок у США это не плюс а минус.
  1. KonstantinTokar
    27.05.2026 01:33
    #30034870
    Не знаю. В том контексте о котором и я написал, и автор это непринципиально

octoMax
27.05.2026 01:33
#30027618
так, стоп, не ныть! Мы тут сверх (всего) держава! у нас самые стойкие оловянные солдатики и самый мудрый пендальф-правитель! а вы тут со своим ИИ лезете! кому надо - тот стойки привез откуда нада! вместо писательства -все валим на заводы - собирать стимпанк-дроны!

vladimir-habr
27.05.2026 01:33
#30029326
Поделитесь пожалуйста опытом. Вот вы 32B модель раскатываете на RTX5090. А под нагрузкой параллельных запросов от пользователей куда деваете KVкэш?
1. rPman
  27.05.2026 01:33
  #30034882
  llama.cpp server делает их в ram автоматически (объем в –cache-ram), и на диск по запросу slots/3?action=save/restore, к сожалению не поддерживает vision модели.
  
  помню был прокси, который это использует и управляет этим на лету

Scank
27.05.2026 01:33
#30030050
Спасибо за обзор, приятно читать, хотя местами показалось водянисто.
Не ясно почему тот же Сбер и Яндекс не строят Цоды - купить H200 по паралельному не сложно. Все есть в наличии. Возможно вопрос договоров на коммерческие поставки.

Яндекс со своими ценами в 100 раз выше на модели чем западные компании идет в лес.
Вместо того чтобы занять поляну розничного инференса, которая освобождается в свете блокировок западных компаний, кажется они всеми силами делают все наоборот. Ощущение что развитие ИИ и ИТ отрасли специально тормозят.
И тот же Сбер буксует, скорее всего из за лютой бюрократии и не понимания менеджмента. Гигачат который успешно стартанул в прошлом году, сейчас отстал, и давно не обновлялся. Статьи сравнения, можно найти тут на хабре.