В реальных компаниях на стол падают десятки тысяч коротких, шумных временных рядов с пропусками и скачущими горизонтом и частотой. Главная боль — не сама модель, а всё вокруг: очистка данных, грамотная валидация, ансамбли, отчеты для аудита. Узкоспециализированные решения плохо переносятся между доменами, а универсальные часто ломаются на грязных данных. Команда авторов предлагает освежающий взгляд: вместо гонки за еще одной моделью — собрать мультиагентную систему на базе LLM, которая имитирует работу внимательного исследователя и закрывает весь конвейер от входного файла до проверяемого отчета.

Как устроен TSci изнутри

TSci — это четыре согласованно работающих агента, каждый со своей ролью и набором инструментов.

  • Curator: диагностирует данные, чинит пропуски и выбросы, строит визуализации и вытягивает структуру ряда — тренд, сезонность, стационарность.

  • Planner: по диагностике и графикам выбирает семьи моделей из библиотеки (21 вариант от ARIMA до градиентного бустинга и простых нейросетей), настраивает гиперпараметры и формирует короткие обоснования выбора.

  • Forecaster: обучает топ-к моделей и решает, как объединять их прогнозы — выбрать лучшую, усреднить по качеству или применить робастную агрегацию.

  • Reporter: собирает прозрачный отчет с метриками, допущениями, уверенность оценками и полным протоколом решений.

Обзор фреймворка TSci: кооперативная многоагентная система для анализа и прогнозирования временных рядов, работающая как человеческий учёный. После получения данных запускается конвейер из четырёх агентов: Curator формирует аналитические отчёты, Planner выбирает конфигурации моделей через рассуждение и валидацию, Forecaster объединяет результаты моделей для итогового прогноза, Reporter создаёт итоговый отчёт.
Обзор фреймворка TSci: кооперативная многоагентная система для анализа и прогнозирования временных рядов, работающая как человеческий учёный. После получения данных запускается конвейер из четырёх агентов: Curator формирует аналитические отчёты, Planner выбирает конфигурации моделей через рассуждение и валидацию, Forecaster объединяет результаты моделей для итогового прогноза, Reporter создаёт итоговый отчёт.

Видеть ряды глазами и руками

TSci не полагается на текстовый контекст: он извлекает признаки и из графиков. Простые визуальные дескрипторы — из обзора, декомпозиции, ACF/PACF — помогают Planner сузить выбор, а Curator принять корректные решения по предобработке. Это практичный компромисс: легкий визуальный анализ без громоздкого компьютерного зрения, но с реальной пользой для выбора модели и настроек.

Рабочий процесс Curator: исходный набор данных диагностируется и очищается, строятся визуализации и формируется итоговое резюме с трендом, сезонностью и стационарностью.
Рабочий процесс Curator: исходный набор данных диагностируется и очищается, строятся визуализации и формируется итоговое резюме с трендом, сезонностью и стационарностью.

От прогноза к отчету, который удобно проверять

Reporter не просто склеивает картинки. Он фиксирует:

  • финальный ансамблевый прогноз и доверительные интервалы;

  • метрики по всем кандидатам и по ансамблю;

  • объяснение, почему именно такие модели и такие веса;

  • допущения и ограничения;

  • полный след инструментальных решений.

Такой отчет проще обсуждать с экспертами и переносить между командами.

Авторы проверили TSci на восьми бенчмарках из пяти доменов: энергия, климат, финансы, здоровье. В среднем система снижает ошибку по сравнению со статистическими базовыми методами на 10.4%, а относительно LLM-бейзлайнов — на 38.2–38.3%. Особенно заметна разница на сложных наборах с длинными горизонтами и выраженной сезонностью. На Weather средний MAE у TSci ниже конкурентов; на ECL система уверенно обходит как статистику, так и LLM-подходы; на Exchange и ILI преимущество сохраняется даже при коротких историях.

Сравнение производительности TSci с пятью базовыми методами на основе LLM на восьми наборах данных.
Сравнение производительности TSci с пятью базовыми методами на основе LLM на восьми наборах данных.

Почему это работает

Абляционные эксперименты честно показывают вклад каждого блока. Уберите предобработку — и MAE в среднем скачет вверх на 41.8%. Сотрите аналитическую часть Curator — ещё плюс 28.3%. Отключите настройку гиперпараметров — получаете заметное ухудшение, особенно на длинных горизонтах, где цена ошибки растет лавинообразно. Другими словами, выигрывает не отдельная хитрая модель, а продуманный процесс с диагностикой, разумным сужением выбора, валидацией и устойчивым ансамблем.

Абляционное исследование TSci с тремя вариантами: без предобработки данных, без анализа данных и без оптимизации параметров. TSci достигает наименьшего MAE в большинстве настроек.
Абляционное исследование TSci с тремя вариантами: без предобработки данных, без анализа данных и без оптимизации параметров. TSci достигает наименьшего MAE в большинстве настроек.

В парных сравнениях отчетов с пятью LLM-системами TSci чаще побеждает по всем параметрам качества — от обоснованности анализа и выбора моделей до структуры и практичности рекомендаций. Особенно высоки преимущества по строгой аргументации и объяснениям.

Кейс: электроэнергетика

На выбранном срезе ECL видны выраженные циклы и нестационарность. Planner предпочел ARIMA, Prophet и экспоненциальное сглаживание; ансамбль увеличил веса моделей, лучше ловящих сезонность. На длинном горизонте одиночные модели накапливают ошибку, ансамбль остается устойчивым и совпадает с циклическим рисунком.

Пример декомпозиции временного ряда на наборе данных ECL: исходный ряд, тренд, сезонная и остаточная компоненты.
Пример декомпозиции временного ряда на наборе данных ECL: исходный ряд, тренд, сезонная и остаточная компоненты.
Кейс ансамблевого прогноза с индивидуальными предсказаниями моделей на наборе данных ECL.
Кейс ансамблевого прогноза с индивидуальными предсказаниями моделей на наборе данных ECL.

Итог

TSci смещает фокус с модели на процесс вокруг данных. Для команд это означает меньше ручной рутины, меньше ошибок на этапе подготовки, больше устойчивости и лучшее качество объяснений. Важно и то, что библиотека моделей широка, а решения — аудируемы, что упрощает внедрение в доменно-агностичных сценариях. Дальнейшие шаги авторы видят в поддержке мультимодальных настроек, подключении внешних знаний и повышении эффективности для масштаба.

? Полная статья

? Код

***

Если вам интересна тема ИИ, подписывайтесь на мой Telegram‑канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Комментарии (0)