Научная группа из Московского Энергетического Института провела исследование о наиболее распространённых методах и способах применения нейросетевого программного обеспечения в области прогнозирования нагрузок нагрузок на энерговырабатывающие объекты.

Первые работы по методам прогнозирования нагрузок энергетических систем появились на рубеже в четрвой четверти ХХ‑го века. Основной недостаток регрессионных моделей и моделей на основе временных рядов, в основе которых лежат статистические методы, состоит в небольшой степени детализации прогнозируемых энергосистем.

С развитием вычислительных мощностей компьютерной техники в решении задач прогнозирования энергетических нагрузок стали применяться модели на основе искусственных нейронных сетей (ИНС). Сначала это были экспертные системы с использованием нечетких множеств, так называемые Fuzzy Expert Systems. Последующее развитие привело к появлению гибридных систем (экспертная система и нейронная сеть) и нейронные сети с нечеткой логикой — Fuzzy Neural Networks (FNN).

Подобные подходы являются перспективными, что обусловлено возможностью построения модели объекта без подробного его описания при одновременной достаточной адекватности модели. Анализ также позволяет выявить факторы, наиболее влияющие на энергопотребление объекта, получить их весовое участие в процессе энергопотребления и рассчитать вероятностные характеристики, соответствующие различным явлениям.

Почему применение нейронных сетей лучше классических методов?

Существующие аналитические и статистические методы (в т.ч. метод нечеткого множества) в данном случае являются менее эффективными, т.к. с их помощью не всегда возможно описать накопленный массив нецифровой статистической информации. Эволюционный метод, основанный методе фильтра Винера, методе искусственных нейронных сетей, генетическом алгоритме и т. д., обладает преимуществом самостоятельного поиска оптимального решения, где в качестве критерия оптимальности используется минимизация ошибки прогнозирования. Ещё одно преимущество ИНС состоит в отказе от допущения распределения флуктуаций характеристик энергосистем по нормальному распределению случайного процесса. Существенным преимуществом является возможность создания набора решений в виде подсистем, полученных с применением тензорно‑топологического метода Г. Крона. Решения, найденные для отдельных подсистем, могут сохраняться и затем использоваться для определения решений более сложных ЭСиК, содержащих эти подсистемы, соединенные самым разнообразным образом.

Множество решений, например, при наличии двух свободных параметров, может быть представлено в виде выпуклого многогранника в трёхмерном пространстве. Процесс решения задачи будет выглядеть как последовательный переход от одной вершины многогранника к другой, получаемое на каждом шаге значение целевой функции будет приближаться к оптимальному.

Графическое представление решения оптимизационной задачи
Графическое представление решения оптимизационной задачи

При этом принимаются допущения:

  • математические модели отдельных установок и вводимые ограничения всегда линейны;

  • все переменные неотрицательны;

  • изменения по шкале времени характеристик установок, связанные с запуском, остановкой и переходными режимами, не учитываются, т.к. переходные режимы занимают малую долю от времени работы установок;

  • малые изменения характеристик установок в результате изменения режима их работы не учитываются, т.к. влияние этих изменений на общую эффективность работы системы полагается незначительным.

А по сути вопроса что?

Наибольшее применение для оперативного и краткосрочного прогнозирования нагрузок получили искусственные нейронные сети. Под искусственной нейронной сетью понимается совокупность нейронных элементов и связей между ними. ИНС состоит из формальных нейронов, выполняющих нелинейное преобразование произведений входных сигналов на коэффициенты веса, просуммированных по всем сигналам:

где X – вектор входного сигнала, W – вектор весов; F – оператор нелинейного преобразования.
где X – вектор входного сигнала, W – вектор весов; F – оператор нелинейного преобразования.

Аппарат ИНС не накладывает никаких требований на процедуру прогнозирования, но предполагает экспертное задание параметров объекта. Важно, чтобы параметры сети не опирались на одни те же исходные факторы, т.к. это приводит к переобучению сети. Кроме того, при изменении поведения потребления нагрузки, наступлении разладки, ошибка прогнозирования нейронной сети, обученной на предыдущих данных временного ряда, значительно возрастает и зачастую превышает допустимые значения.

Для прогнозирования энергопотребления объектов среднего и крупного масштаба целесообразным для прогнозирования ТЭР является использование многослойных ИНС на основании сетей Элмана; с прямым или каскадным распределением, с задержкой по времени и пр. Для эмуляции ИНС на обычном компьютере используются программы‑имитаторы — нейропакеты, например, NeuroPro. Обучение нейронной сети в программе NeuroPro производится по принципу двойственного функционирования с применением одного из следующих методов оптимизации: градиентного спуска; модифицированного ParTan‑метода; метода сопряжённых градиентов.

Считается, что для решения большинства задач в различных отраслях науки и техники достаточно использование двухслойной персептронной сети с одним скрытым слоем и сигмоидальной функцией активации. Однако, ИНС c прямым распределением при рении задач прогнозирования ТЭР присуще четыре минимума по критерию погрешности наблюдающейся при численности нейронов, равной при 25, 35, 45, 55 и 75 единиц. Ограниченность однослойных нейронных сетей, связанная с линейной неразделимостью обучающих данных. Поэтому наиболее распространённым типом ИНС является персептронная многослойная сеть, состоящая из нескольких последовательно соединённых слоёв нейронов с реализацией векторной функции нескольких переменных.

Для оценки оптимального числа нейронов в скрытых слоях персептрона может применяться формула, являющаяся следствием теорем Арнольда — Колмогорова — Хехт‑Нильсена:

где Ny – размерность выходного сигнала; Q– число элементов обучающей выборки; Nw – необходимое число синаптических весов; Nx – размерность входного сигнала.
где Ny – размерность выходного сигнала; Q– число элементов обучающей выборки; Nw – необходимое число синаптических весов; Nx – размерность входного сигнала.

Формальный нейрон, отражающий основные свойства биологического нейрона — это элементарный преобразовательный элемент, имеющий множество входов, на которые поступают сигналы, сумматорная функция, блок преобразования сигнала с помощью передаточной функции (или функции активации) и один выход y. Каждому входу приписан свой «вес» и параметр смещения.

Модель формального нейрона
Модель формального нейрона

Функционирует нейрон в два такта. На первом этапе в суммирующем блоке вычисляется величина возбуждения, полученного нейроном:

Формула для вычисления величины возбуждения
Формула для вычисления величины возбуждения

С точки зрения реализации модели нейрона параметр смещения θ часто представляется в виде единичного входа:

Представление параметра смещения в виде единичного выхода
Представление параметра смещения в виде единичного выхода

На втором этапе суммарное возбуждение пропускается через активационную (преобразующую) функцию, в результате чего определяется выходной сигнал.

Определение выходного сигнала
Определение выходного сигнала
Число нейронов скрытого слоя двухслойного персептрона
Число нейронов скрытого слоя двухслойного персептрона

Нетривиальной задачей является поиск наиболее оптимального по критерию точности типа активирующей функции.

Сигмоидальная (logsig) является монотонно возрастающей нелинейной функцией. Функция является S‑образной, нелинейной, дифференцируемой на всём своём протяжении, с насыщением.

Линейный нейрон — простейшая однослойная модель, применяющаяся, например, для прогнозирования какой‑нибудь непрерывной величины:

Функция линейного нейрона
Функция линейного нейрона
График линейного нейрона
График линейного нейрона

ReLU — Rectified linear unit (ReLU) — улучшенный линейный нейрон.

Функция такого нейрона имеет вид:

Функция улучшенного линейного нейрона
Функция улучшенного линейного нейрона
График функции ReLU
График функции ReLU

Для задания нечетких множеств могут быть использованы также типовые L‑R-функции (гауссова, колоколообразная, треугольная, трапецеидальная). Основное преимущество данных функций заключается в их дифференцируемости на всей оси абсцисс, что является необходимым для алгоритмов обучения ИНС с операцией дифференцирования. Сигмоид обладает свойством при ненасыщении от сильных сигналов, одновременно усиливать слабые сигналы, и описывается функцией:

где α – критерий наклона функции.
где α – критерий наклона функции.

Недостатком персептрона является недифференцируемость и прерывистый характер.

Гиперболический тангенс (tansig) является одним из видом сигмоида, все значения которого заключены в границах [–1;1]:

Гиперболический тангенс
Гиперболический тангенс

Поскольку:

Но не все так просто
Но не все так просто

то tansig отличается от сигмоида исключительно в кратности по оси абсцисс:

Основные виды функции активации: а –logsig; б – tansig; в –purelin;
Основные виды функции активации: а –logsig; б – tansig; в –purelin;

Purelin — разновидность линейных функций, чаще всего используется в качестве функции активации во входных или выходных нейронах. Другая разновидность линейной функции активации — линейная передаточная функция с насыщением. Она обладает большим недостатком в виде невозможности дифференцирования на всей числовой оси, что сужает ее применение.

oftplus — аналитическое приближение ReLU. Преимуществом является дифференцируемость (в отличие от функции ReLU). Функция имеет вид:

Функция Softplus
Функция Softplus
Графическое отображение функции Softplus
Графическое отображение функции Softplus

 

В качестве активационной в первом слое целесообразно применять logsig, т.к. она позволяет устранить проблему проникновения шумов во второй слой. Во внутренних слоях целесообразно использовать tansig. Полученная нейронная сеть может быть обучена алгоритму обратного распространения ошибки, который определяет стратегию подбора весов многослойной сети с применением градиентных методов оптимизации. Его основу составляет целевая функция, формулируемая в виде квадратичной суммы разностей между фактическими и ожидаемыми значениями выходных сигналов.

Основным достоинством нейросетевых методов для прогнозирования электрических нагрузок можно отметить отсутствие каких‑либо требований о к входным данным. Главный недостаток состоит в том, что ИНС работает как «черный ящик», т. е. не позволяет интерпретировать результаты прогнозирования в понятной эксперту форме.

При решении задач прогнозирования энергетических нагрузок часть взаимозависимостей между анализируемыми переменными возможно описать аналитически, с минимальным набором допущений. В таком случае целесообразно применять ИНС со слоем правил либо с задержкой по временной шкале, либо сеть Сугэно с задержкой по времени и несколькими входами типа.

Авторы материала: Гужов С.В., Варшавский П.Р., Башлыков М.С., Тороп Д.В.

Работа выполнена в рамках проекта «Разработка нейросетевого программного обеспечения по прогнозированию спроса на тепловую энергию объектами массового строительства города Москвы» при поддержке гранта НИУ «МЭИ» на реализацию программы научных исследований «Приоритет 2030: Технологии будущего» в 2022–2024 гг.

Комментарии (3)


  1. yatanai
    24.04.2023 10:17

    персептронная...


  1. ValeriyPus
    24.04.2023 10:17

    1) А не дороговато ли прогнозировать уровень энергопотребления нейросетями? )

    Тем более необходимо иметь много данных, а нагрузки на сеть растут, характер потребителей меняется, а 100 МВт в час это более 33 млн в час по деньгам.

    2) А зачем подбирать активирующую функцию если данные об энергопотреблении - дай бог 20 мегабайт? ) И все обучается на домашнем ПК за минуты.

    3) Почему не кластеризация и полиноминальная регрессия? (более адекватная к изменениям модель)