В этом посте поговорим про различия в двух подходах моделирования, а именно, чем отличаются физически обоснованные модели от моделей, основанных на данных. На самом деле между этими двумя понятиями есть и кое-что среднее, что становится актуальнее в решении научных задач. Но об этом позже.
Data-driven модели
Итак, начнем с моделей, основанных на данных. Такого рода модели встречаются почти на каждом шагу. Любая задача машинного обучения, будь то регрессия (например, предсказание цен на товары), классификация (определение маркера болезни по данным об анализах пациента), рекомендация (определение более подходящего видео в вашей ленте), сегментация (определение объектов на фото или видео) и т. д. Задач машинного обучения достаточно много, но все они требуют одного - данных.
В этом классе моделей требуется собрать подходящий набор данных, обработать его (например, убрать различные аномалии или трансформировать переменные), определиться с типом задачи, выбрать модель для этого типа задачи и подать данные на вход. И, наконец, обучить модель, подбирая оптимальным образом весовые коэффициенты.
Модели, основанные на данных, по факту являются статистическими моделями, которые наилучшим образом аппроксимируют неизвестную зависимость. Во многих задачах неизвестны закономерности между независимыми переменными и результирующим признаком или признаками. Они либо сложны для описания, либо у нас нет четкой формулы для получения ответа. Именно здесь такие статистические модели приходят на помощь.
Physics-based модели
Физически обоснованные модели — модели, которые опираются внутри себя на законы физики. Такие модели обычно записываются в виде математических уравнений и имеют достаточно строгое описание переменных и закономерностей между ними. Собственно, любая физическая теория состоит из большого числа моделей для описания тех или иных явлений.
Рассмотрим простой пример — колебание маятника. Для описания положения маятника достаточно использовать одну обобщенную координату, а именно угол отклонения от вертикали . Не будем заниматься выводом уравнения, а сразу выпишем его
где — ускорение (производная второго порядка по времени), — ускорение свободного падения и — длина подвеса маятника. Решая данное уравнение, мы получим выражение для определения угла как функции времени.
Таким образом физически обоснованная модель дает четкое представление о поведении системы или хотя бы позволяет качественно исследовать уравнение.
Гибридные модели
Пусть тайное станет явным. Опишем еще один тип моделей, который собирает в себе лучшее из двух миров.
Гибридные модели — модели, которые используют данные и одновременно опираются на физику рассматриваемого явления. В области глубокого обучения хорошо известны PINNs — Physics-Informed Neural Networks. Не стоит путать их с physics-based моделями. Также к гибридным моделям обычно относят методы, которые комбинируют вычисления на данных и символьные операции.
PINNs помогают решать задачи разного характера. Например, можно определить неизвестные параметры уравнения, а можно вывести неоднородность, которая отвечает за возмущение уравнения. Но они в любом случае опираются на точки данных, как и любая нейронная сеть. Только данными тут выступают сетки координат переменных (в которых вычисляются производные при помощи методов автоматического дифференцирования) или граничные точки уравнения. Оригинальные PINN — это unsupervised модели. Есть и inverse PINN, которые используют обучающую выборку, например, когда известны некоторые положения маятника можно восстановить параметр частоты свободных колебаний или даже найти правую часть уравнения, т.е. возмущение этих колебаний.
Помимо PINNs хорошо известна концепция нейронных дифференциальных уравнений (NeuralODE), а также модель Sindy.
Большое преимущество гибридных моделей состоит в том, что мы можем варьировать качество предсказания в зависимости от интерпретируемости нашей модели. Можно построить гибридную модель так, что она не будет отличима от physics-based модели, но при этом мы будем ограничены только теми свойствами и предсказаниями, которые закладывает модель. А можно собрать побольше данных и не сильно заботится о точном удовлетворении законов физики, а лишь заставить модель следовать схожему тренду. Тогда модель сможет уловить и скрытые закономерности в данных и дать нам инсайты.
Сравнение
На рисунке 1 продемонстрированы три типа моделей. В области большого количества данных располагаются data-driven модели. При этом они обладают низким уровнем интерпритируемости и не опираются на физику явления. Напротив, physics-based модели не требует данных вовсе для нахождения зависимостей. Как правило эти зависимости определяются из решения соответствующих уравнений. По середине распалагаются гибридные модели, так как они способны обработать информацию из данных и при этом воспользоваться физическими законами. Справа на рисунке представлен типичный пример data-driven модели — нейронная сеть с двумя скрытыми слоями.
Рисунок 2 демонстрирует физическую модель — уравнения Максвелла, которые описывают электромагнитное поле. Вся модель формулируется при помощи системы из четырех дифференциальных уравнений в векторной форме.
Наконец, рисунок 3 показывает различные типы гибридных моделей. Физика может быть использована как источник дополнительных переменных, либо для получения данных из симуляции, либо в роли вспомогательных элементов архитектуры нейронной сети.
Преимущества и недостатки всех подходов представлены в таблице.
Преимущества |
Недостатки |
|
Data-driven |
1. Высокая точность 2. Масштабируемость и гибкость 3. Автоматизация 4. Поиск ранее неизвестных закономерностей |
1. Зависимость от качества данных 2. Переобучение или недообучение 3. Низкая интерпретируемость 4. Низкое понимание предметной области 5. Ресурсозатратность |
Physics-based |
1. Высокая интерпретируемость 2. Высокая предсказательная способность 3. Обобщаемость 4. Контролируемость параметров |
1. Могут быть сложные математические модели без аналитического решения 2. Часто есть допущения и упрощения 3. Неустойчивость к новым неизученным закономерностям 4. Чувствительность к начальным условиям |
Hybrid |
1. Высокая точность (модель опирается на известные физ. законы плюс уменьшает ошибку, подгоняя модель под данные) 2. Масштабируемость и гибкость 3. Средняя интерпретируемость (по сравнению с двумя предыдущими подходами) |
1. Проблема баланса между интепретируемостью и качеством 2. Ресурсозатратность 3. Сложность в интеграции и обучении |
Цель поста была дать краткий обзор по трем методам моделирования. Далее планирую раскрыть подробнее полезные темы из гибридного ИИ.
Комментарии (2)
kirillzx Автор
02.12.2024 22:45Да, Вы правы, существует много моделей, здесь лишь дал краткий обзор именно направлений. Например, упомянутый Sindy — это spatial symbolic regression. Это гибридный ИИ. Генетические алгоритмы тоже можно отнести к гибридным методам. Есть различные обобщения для нахождения дифференциальных уравнений (например, EPDE).
SharomePokatee
Как-то забытыми оказались символьные регрессии (symbolic regression). Мощный инструмент, когда есть данные и подозревается некая физика в их основе, а модели позволяют её обнаружить. Возможно, под гибридными методами и подразумевалось нечто такое, но не в явном виде.
Помимо нейронок (в т.ч. КАН, набирающие популярность), которые ищут уравнения, описывающие закономерности данных, успешно работают генетические алгоритмы. На Питоне есть несколько любопытных решений: GPLearn (медленно), PySR (с Джулией под каптом), PyOperon (C++ под капотом) и feyn (C, закрытый код).