Собрали главные события недели с 21 по 26 июля 2025 года в российском AI-сегменте: технические прорывы, корпоративные внедрения и неожиданные результаты соревнований человека с машиной.
TabM от Yandex Research превзошел градиентный бустинг на табличных данных
Команда Артема Бабенко из Yandex Research представила TabM (Tabular Mixer) — архитектуру, специально разработанную для табличных данных. В отличие от попыток адаптировать трансформеры, исследователи создали решение с нуля.
Результаты впечатляют:
На 46 benchmark-датасетах TabM показал средний ранг 1.8 против 2.4 у XGBoost
Стабильность при изменении гиперпараметров: 0.92 против 0.78 у TabNet
Эффективная работа с mixed-type features без предобработки
# Пример использования TabM
from tabm import TabMClassifier
model = TabMClassifier(
n_epochs=100,
batch_size=256,
lr=1e-3
)
model.fit(X_train, y_train)
predictions = model.predict(X_test)
Код и веса модели доступны на GitHub. Уже появились кейсы применения в логистике Wildberries и медицинской классификации в Инвитро.
T-Bank AI Research: управление семантикой LLM без переобучения
Исследователи из T-Bank AI Research решили фундаментальную проблему — как контролировать поведение языковой модели без fine-tuning. Их подход основан на Sparse Autoencoders (SAE) и Feature Flow Graphs.
Как это работает
SAE выделяет интерпретируемые признаки из активаций модели
Строится граф потока признаков между слоями
Целевые концепты активируются или подавляются на нужных слоях
# Концептуальная схема вмешательства
def steer_llm(model, prompt, steering_vector):
with model.forward_hooks(layer_range=[10, 20]):
# Получаем активации
activations = model.get_activations(prompt)
# Применяем управляющий вектор
modified = activations + alpha * steering_vector
# Генерируем с измененными активациями
output = model.generate_from_activations(modified)
return output
Практический результат: можно менять тон, стиль или тематику ответов модели «на лету». Это открывает путь к созданию более безопасных и управляемых AI‑систем без затрат на переобучение.
Промышленность не готова: исследование барьеров внедрения ИИ
ФГАУ «Цифровые индустриальные технологии» и «К2Тех» опросили 100+ промышленных предприятий. Картина неутешительная:
Барьер |
% предприятий |
---|---|
Непрогнозируемость эффектов |
61% |
Риски кибербезопасности |
53% |
Отсутствие реальных кейсов |
46% |
Дефицит кадров |
38% |
Неготовность инфраструктуры |
93% |
Парадокс: половина ожидает от ИИ снижения издержек, но 93% не имеют инфраструктуры для внедрения. Минпромторг готовит программу субсидирования, но проблема глубже — нужны типовые решения и методологии внедрения.
Человек vs OpenAI: неожиданная победа на AtCoder
На AtCoder World Tour Finals в Токио произошла сенсация. Пшемыслав Дебяк (ник Psyho) обыграл модель OpenAI в 10-часовом марафоне программирования.
Ключевая задача: оптимизация пути робота на сетке 30×30 Результат: человек победил с отрывом 9.5% Причина: в условиях ограниченных вычислительных ресурсов человеческая эвристика оказалась эффективнее brute force подхода ИИ
Это напоминание: несмотря на рост метрик (с 4.4% в 2023 до 71.7% в 2024), ИИ всё ещё уязвим там, где нужны креативность и оптимизация под ограничения.
Корпоративные внедрения: от экспериментов к production
Билайн запустил 5 ИИ-агентов
Компания официально перешла от «пилотов» к боевому внедрению:
Мониторинг сети с предиктивной аналитикой
Автоматизация архитектурного проектирования
Виртуальные ассистенты для операционных задач
МТС: комплексная AI-трансформация
MWS AI представила линейку продуктов:
Speech Analytics 2.0: распознавание речи + эмоций + демография
MWS Data Platform: унифицированная платформа для ML (обещают -40% расходов)
Cotype Pro 2: LLM на базе Qwen 2.5 для корпоративного сектора
Инвестиции в собственные модели в 2024: 1 млрд рублей.
Яндекс: первый в России сертификат ISO/IEC 42001
Это международный стандарт для систем управления ИИ. Сертификация подтверждает соответствие требованиям по:
Этичности и прозрачности алгоритмов
Управлению рисками AI-систем
Полному циклу разработки и эксплуатации
Параллельно Yandex B2B Tech запустил:
Доступ к Qwen 3 (72B параметров) для enterprise
«Нейроаналитик» — AI‑агент для BI-аналитики
Государственные инициативы
Минцифры: генеративный ИИ в госуправлении
Стартует эксперимент по внедрению LLM в госорганы:
Проверка резюме и генерация тестов для госслужбы
Анализ законопроектов на ошибки
Автоматизация ответов на обращения граждан
Ограничения строгие: без доступа к гостайне, только через ЕСИА, никакого прогнозирования соцэкономики.
Региональные проекты
Москва: ИИ-диктор в метро на основе голосов реальных дикторов Нижний Новгород: 340 умных светофоров с ML-адаптацией к трафику Подмосковье: ИИ-распознавание документов для приватизации (250 типов)
Инвестиции и образование
262.5 млн на интеллектуальные дроны
Фонд NTI профинансировал 5 проектов:
«Воздушный дозор» — мониторинг с computer vision
«Саранча» — алгоритмы роевого управления
«Цитадель» — нейроморфные чипы для обнаружения целей
Массовое обучение ИИ
«Код будущего. ИИ»: 75,000 школьников и студентов
Сбербанк: обязательные AI-компетенции для всех сотрудников
Нацстратегия-2030: план выпускать 15,500 ИИ-специалистов в год (сейчас 3,000)
Анализ: между хайпом и реальностью
Торстен Слок (Apollo Global Management) предупреждает о пузыре:
P/E топ-10 S&P 500 превысил уровни краха доткомов
Microsoft сократил 9,000 человек ради $80 млрд инвестиций в ИИ
Весь рост индекса обеспечивают 10 AI-компаний
В России картина противоречивая:
Лидеры (Яндекс, Сбер, МТС) активно внедряют и масштабируют
Промышленность не готова инфраструктурно и методологически
Государство пытается догнать, но с жёсткими ограничениями
Выводы
Неделя показала: российский AI-сектор неоднороден. Есть команды мирового уровня (TabM, управление LLM), есть успешные корпоративные внедрения, но есть и системные проблемы с инфраструктурой и кадрами.
Главный вызов — не в технологиях, а в их применении. Пока одни создают state-of-the-art решения, другие не могут внедрить даже базовую автоматизацию. Разрыв растёт, и это создаёт риски для всей экосистемы.