Собрали главные события недели с 21 по 26 июля 2025 года в российском AI-сегменте: технические прорывы, корпоративные внедрения и неожиданные результаты соревнований человека с машиной.

TabM от Yandex Research превзошел градиентный бустинг на табличных данных

Команда Артема Бабенко из Yandex Research представила TabM (Tabular Mixer) — архитектуру, специально разработанную для табличных данных. В отличие от попыток адаптировать трансформеры, исследователи создали решение с нуля.

Результаты впечатляют:

  • На 46 benchmark-датасетах TabM показал средний ранг 1.8 против 2.4 у XGBoost

  • Стабильность при изменении гиперпараметров: 0.92 против 0.78 у TabNet

  • Эффективная работа с mixed-type features без предобработки

# Пример использования TabM
from tabm import TabMClassifier

model = TabMClassifier(
    n_epochs=100,
    batch_size=256,
    lr=1e-3
)
model.fit(X_train, y_train)
predictions = model.predict(X_test)

Код и веса модели доступны на GitHub. Уже появились кейсы применения в логистике Wildberries и медицинской классификации в Инвитро.

T-Bank AI Research: управление семантикой LLM без переобучения

Исследователи из T-Bank AI Research решили фундаментальную проблему — как контролировать поведение языковой модели без fine-tuning. Их подход основан на Sparse Autoencoders (SAE) и Feature Flow Graphs.

Как это работает

  1. SAE выделяет интерпретируемые признаки из активаций модели

  2. Строится граф потока признаков между слоями

  3. Целевые концепты активируются или подавляются на нужных слоях

# Концептуальная схема вмешательства
def steer_llm(model, prompt, steering_vector):
    with model.forward_hooks(layer_range=[10, 20]):
        # Получаем активации
        activations = model.get_activations(prompt)
        
        # Применяем управляющий вектор
        modified = activations + alpha * steering_vector
        
        # Генерируем с измененными активациями
        output = model.generate_from_activations(modified)
    return output

Практический результат: можно менять тон, стиль или тематику ответов модели «на лету». Это открывает путь к созданию более безопасных и управляемых AI‑систем без затрат на переобучение.

Промышленность не готова: исследование барьеров внедрения ИИ

ФГАУ «Цифровые индустриальные технологии» и «К2Тех» опросили 100+ промышленных предприятий. Картина неутешительная:

Барьер

% предприятий

Непрогнозируемость эффектов

61%

Риски кибербезопасности

53%

Отсутствие реальных кейсов

46%

Дефицит кадров

38%

Неготовность инфраструктуры

93%

Парадокс: половина ожидает от ИИ снижения издержек, но 93% не имеют инфраструктуры для внедрения. Минпромторг готовит программу субсидирования, но проблема глубже — нужны типовые решения и методологии внедрения.

Человек vs OpenAI: неожиданная победа на AtCoder

На AtCoder World Tour Finals в Токио произошла сенсация. Пшемыслав Дебяк (ник Psyho) обыграл модель OpenAI в 10-часовом марафоне программирования.

Ключевая задача: оптимизация пути робота на сетке 30×30 Результат: человек победил с отрывом 9.5% Причина: в условиях ограниченных вычислительных ресурсов человеческая эвристика оказалась эффективнее brute force подхода ИИ

Это напоминание: несмотря на рост метрик (с 4.4% в 2023 до 71.7% в 2024), ИИ всё ещё уязвим там, где нужны креативность и оптимизация под ограничения.

Корпоративные внедрения: от экспериментов к production

Билайн запустил 5 ИИ-агентов

Компания официально перешла от «пилотов» к боевому внедрению:

  • Мониторинг сети с предиктивной аналитикой

  • Автоматизация архитектурного проектирования

  • Виртуальные ассистенты для операционных задач

МТС: комплексная AI-трансформация

MWS AI представила линейку продуктов:

  • Speech Analytics 2.0: распознавание речи + эмоций + демография

  • MWS Data Platform: унифицированная платформа для ML (обещают -40% расходов)

  • Cotype Pro 2: LLM на базе Qwen 2.5 для корпоративного сектора

Инвестиции в собственные модели в 2024: 1 млрд рублей.

Яндекс: первый в России сертификат ISO/IEC 42001

Это международный стандарт для систем управления ИИ. Сертификация подтверждает соответствие требованиям по:

  • Этичности и прозрачности алгоритмов

  • Управлению рисками AI-систем

  • Полному циклу разработки и эксплуатации

Параллельно Yandex B2B Tech запустил:

  • Доступ к Qwen 3 (72B параметров) для enterprise

  • «Нейроаналитик» — AI‑агент для BI-аналитики

Государственные инициативы

Минцифры: генеративный ИИ в госуправлении

Стартует эксперимент по внедрению LLM в госорганы:

  • Проверка резюме и генерация тестов для госслужбы

  • Анализ законопроектов на ошибки

  • Автоматизация ответов на обращения граждан

Ограничения строгие: без доступа к гостайне, только через ЕСИА, никакого прогнозирования соцэкономики.

Региональные проекты

Москва: ИИ-диктор в метро на основе голосов реальных дикторов Нижний Новгород: 340 умных светофоров с ML-адаптацией к трафику Подмосковье: ИИ-распознавание документов для приватизации (250 типов)

Инвестиции и образование

262.5 млн на интеллектуальные дроны

Фонд NTI профинансировал 5 проектов:

  • «Воздушный дозор» — мониторинг с computer vision

  • «Саранча» — алгоритмы роевого управления

  • «Цитадель» — нейроморфные чипы для обнаружения целей

Массовое обучение ИИ

  • «Код будущего. ИИ»: 75,000 школьников и студентов

  • Сбербанк: обязательные AI-компетенции для всех сотрудников

  • Нацстратегия-2030: план выпускать 15,500 ИИ-специалистов в год (сейчас 3,000)

Анализ: между хайпом и реальностью

Торстен Слок (Apollo Global Management) предупреждает о пузыре:

  • P/E топ-10 S&P 500 превысил уровни краха доткомов

  • Microsoft сократил 9,000 человек ради $80 млрд инвестиций в ИИ

  • Весь рост индекса обеспечивают 10 AI-компаний

В России картина противоречивая:

  • Лидеры (Яндекс, Сбер, МТС) активно внедряют и масштабируют

  • Промышленность не готова инфраструктурно и методологически

  • Государство пытается догнать, но с жёсткими ограничениями

Выводы

Неделя показала: российский AI-сектор неоднороден. Есть команды мирового уровня (TabM, управление LLM), есть успешные корпоративные внедрения, но есть и системные проблемы с инфраструктурой и кадрами.

Главный вызов — не в технологиях, а в их применении. Пока одни создают state-of-the-art решения, другие не могут внедрить даже базовую автоматизацию. Разрыв растёт, и это создаёт риски для всей экосистемы.

Комментарии (0)