Доброго времени суток!

Меня зовут Дмитрий.

Я инженер-программист в области автоматизации технологических процессов. Работаю в проектной компании и параллельно обучаюсь в аспирантуре, пишу диссертацию.

Решил поделиться очередной историей проведения исследований. 

Введение

Ядром исследований в моей работе являются модели.  Моделирование — это метод воспроизведения и исследования фрагмента действительности, (предмета, явления, процесса, ситуации) основанный на представлении объекта с помощью модели.

Все множество моделей можно условно разделить на два больших класса:

- Аналитические. Взаимосвязи таких моделей выражены в виде физико-математических законов. Такие модели часто представляются в форме ряда дифференциальных уравнений. Чтоб было яснее, модель вышеуказанного качающегося маятника будет выглядеть так:

По мне, ужасно выглядит.

- Эмпирические. Эти модели не содержат глубинных знаний о внутренних процессах модели. Они предназначены для имитации поведения интересующей части реальной системы. В большинстве случаев, при описании таких моделей используют образ «черного ящика». 

То есть мы, как наблюдатели, можем видеть только входные и выходные параметры некоего моделируемого процесса. Что происходит внутри, неясно. 

Постановка задачи

В качестве объекта моделирования в работе выступает технологический процесс сгорания смеси природного газа и воздуха сушилки на производстве калия.

Нам нужно знать: как ведет себя температура дымовых газов после горелки в зависимости от изменения расхода природного газа. Эта информация может использоваться в задачах оптимизации температурного режима технологического процесса сушки.  Стабилизация температуры сушки позволит минимизировать избыточность энергопотребления процесса, сэкономить немало денег и уменьшить углеродный след производства.

Необходимо построить такую модель, которая будет имитировать (повторять) поведение реальной температуры дымовых газов после горелки в зависимости от того, сколько газа мы на эту горелку подаем.

Таким образом, получится рассчитать такую систему регулирования горелкой, которая будет успешно справляться с поставленной задачей. На реальном объекте при «наладке» такой системы управления с использованием промышленных экспериментов пришлось бы сжечь сотни кубометров топлива. А это немалые деньги.

Основная сложность моделирования технологических процессов заключается в том, что на взаимосвязи между параметрами процесса влияет бесконечное большое количество различных факторов. От свойств используемого сырья до уровня зашумленности линии связи конкретного датчика. 

Инструменты

Сегодня существует множество классов эмпирических моделей: регрессионные и авторегрессионные модели, нейросетевые модели, модели экспоненциального сглаживания, модели на базе цепей Маркова, классификационные модели и др. Наиболее популярными являются классы регрессионных и нейросетевых моделей.

Как правило, при решении той или иной задачи принято идти от простого к сложному. Если выбранный метод не справляется с поставленной задачей, используют другие, более сложные методы моделирования. Регрессия является самым простым из известных классов эмпирических моделей.

Характерными признаками регрессионного метода является его простота. Модели регрессии быстро и легко обучаются, не требуя больших объемов данных. Но, в то же время, модели регрессии не очень эффективны при моделировании сложных нелинейных процессов.

Существенным недостатком класса нейросетевых моделей является сложность обучения, требования значительного объема данных обучения и недоступность промежуточных вычислений, выполняющихся в «черном ящике». В то же время, ИНС являются мощным инструментом при моделировании сложных, нелинейных и многопараметрических объектов.

Искусственные нейронные сети (ИНС или искусственные НС)

При использовании регрессии в решении поставленной задачи результаты оказались грубыми. Одной из причин может быть явно выраженная нелинейность моделируемого объекта. Дальше попробуем решить задачу с привлечением ИНС.

Инструмент на хайпе. Специалисты немало зарабатывают на умении эффективно его применять.

Рекуррентные нейронные сети (РНС)

Сегодня существует необъятное количество всевозможных вариантов НС, отличающихся структурой, функциями активации, используемыми алгоритмами обучения и пр.

Отдельным типом ИНС в данной статье я выделил РНС. Рекуррентные нейронные сети это тип НС, предназначенный для распознавания паттернов в последовательности данных, будь это текст, геном, почерк, произнесенные слова, или числовые последовательности, исходящие из сенсоров, рынка акций и пр.

Отличием таких сетей является использование прошлых состояний систем в прогнозировании будущего.

«Последовательности» – ключевое слово в этом определении. РНС используют предысторию процесса, что позволяет их успешно использовать в задачах идентификации динамических систем.

Отлично, с инструментами разобрались!

Эксперимент

Далее представлен фрагмент данных технологического процесса сгорания природного газа на исследуемой горелке в условиях производства.

На графиках представлены тренды параметров расхода природного газа, измеряемого расходомером на линии подачи газа после регулирующей арматуры и параметра температуры дымовых газов под решеткой сушилки, которая измеряется с помощью датчика термосопротивления. Измерение производилось раз в 5 секунд.

Все выглядит понятно. Газ выше – температура увеличивается, и наоборот. Но получилось как в сказке: дед бил-бил, не разбил… И я бил-бил эту задачу, не получалось! ПРОСТО НЕ ПОЛУЧАЛОСЬ! Модель вела себя капризно, как ребенок.

Крутил настройки параметров обучения, варьировал данные обучения… Все. Начал уже грешить на участие потусторонних сил.

Миссия невыполнима?

Мораль 1: очень важно вовремя сделать перерыв, иначе можно в исследовании уйти совсем не туда.

Через какое-то время снова посмотрел на сырые данные и что я увидел? Расход воздуха сильно влияет (значительно) на поведение температуры сгоревших газов. Особенно это видно на периодах, когда расход газа не меняется, а температура «плывет». (Сверху вниз: тренд расхода воздуха, расхода газа, температуры)

Я рассматривал параметр расхода воздуха как жестко связанный с расходом газа. Потому что на предприятиях и вообще, в любых газовых горелках соотношение расхода газа и воздуха строго выдерживается.  Но здесь расход воздуха сильно не похож на тренд расхода газа.

Сделал запрос на расположение датчика температуры и схему смешивания воздуха (это оказался вторичный воздух, подмешивающийся в дымовые газы после сгорания газовоздушной смеси в горелке). Делается это для увеличения потока воздуха и уменьшения общей температуры (дымовые газы разбавляют уличным воздухом).

В результате, объект представляет собой не просто горелку, а последовательное соединение горелки и клапана подмешивания вторичного воздуха.

Ничего, ошибок не делает только тот, кто ничего не делает.

Канал измерения расхода воздуха сильно зашумлен. В среднем, параметр изменяется каждые 5 секунд на 5 тыс. куб.м./час. Попробуем использовать фильтр.

Разница есть, но небольшая. Используем усреднение прошедшего скользящего окна. Использовал три варианта с окном в 30, 50 и 300 точек.

Далее попробовал посмотреть какая из этих функций наиболее близко походит на график изменения параметра температуры. Для этого нормализовал все рассматриваемые временные ряды параметров процесса.

С параметром воздуха параметр расхода воздуха имеет обратную функциональную связь, так как воздух остужает поток.

В данном случае было проверено, какого окна усреднения будет достаточно чтобы сеть распознавала полезную составляющую сигнала расхода воздуха. Более близко усреднение по окну в 300 точек. Но при обучении может оказаться наоборот. На это указывают выводы авторов в исследовании: (https://ieeexplore.ieee.org/abstract/document/809097).

Далее попробовал для больше ясности попробовать посмотреть на параметр соотношения расхода газа и воздуха и посмотреть, может этот косвенный параметр будет более тесно связан с поведением температуры?

Построил нормализованные графики.

Нет, судя по графикам, одного параметра отношения расхода газа к расходу воздуха будет недостаточно. На некоторых участках можно видеть, что температура (зеленый график) то меньше, то больше рассчитанного параметра.

Что ж, используем в ходе экспериментов два параметра (расход газа и расход воздуха с фильтрацией и без).

Анализ результатов

Построил по пять РНС моделей с использованием различных вариантов фильтрации параметра расхода воздуха) со следующими гиперпараметрами:

1.      15 нейронов в скрытом слое

2.      Задержка по входам на 5 тактов

3.      Память выхода на 7 тактов

Почему по пять РНС? Потому что при обучении начальные веса нейронов принимают случайные значения. В выводах откроется, к чему это приводит.

Номер модели

MSE (Среднеквадратичная ошибка работы сети) на тестовых данных

РНС на сырых данных

РНС на усредненных по 30 точкам данных

РНС на усредненных по 50 точкам данных

РНС на усредненных по 300 точкам данных

1

16,78371

29,96932

14,24177

216,658

2

22,38716

60,76088

26,74221

5,311396

3

9,980965

68,94234

33,23217

25,66592

4

35,90194

18,98549

25,59462

9,314115

5

5,195285

10,64459

34,94109

230,6077

 Визуализируем полученные результаты:

Можно видеть, что на одних и тех же данных и при одних и тех же параметрах обучения результаты обучения разительно отличаются. В связи с этим, на практике приходится обучать не одну, а ряд искусственных нейронных сетей и выбирать лучшую по итогам тестирования.

Также шум в канале измерения расхода воздуха помог обучить более качественную сеть.  Погодите фильтровать данные, если вы хотите делать НС.

Выводы

В результате исследования получилось обучить рекуррентную нейросетевую модель процесса сгорания смеси природного газа и воздуха в промышленной горелке на производстве калия.

Выяснено, что помимо параметра расхода газа на температуру дымовых газов влияет и расход подмешиваемого воздуха. Также, соответственно результатам работы (https://ieeexplore.ieee.org/abstract/document/809097), все действия по фильтрации временного ряда расхода воздуха оказались бесполезными, нейронные сети лучше обобщают именно зашумленные данные.

Обученную модель процесса планируется использовать в задаче оптимизации режимов процесса сушки с целью уменьшения избыточности потребления топлива и уменьшения углеродного следа производства.

Мораль 2. Что я понял из этой истории? Все крутится вокруг данных. Нужно быть внимательнее на этапе предварительной обработки и планирования факторного пространства будущей модели. Тем самым можно избежать 80 % ошибок на дальнейших этапах.

P.S. Подробнее о нечеткой логике:  https://habr.com/ru/post/125614/

Подробнее об ИНС: https://habr.com/ru/post/369349/

Обзорная статья об основных типах НС: https://habr.com/ru/company/wunderfund/blog/313696/

Подробнее об РНС: https://habr.com/ru/post/326966/\

P. P. S. Галопом по Европам, это же не научная статья, все что непонятно спрашивай в комментариях или Гугл в помощь!

P. P. P. S.  Статья по проведенным исследованиям на том же объекте: ПОВЫШЕНИЕ ТОЧНОСТИ ВИРТУАЛЬНОГО АНАЛИЗАТОРА ОСТАТОЧНОЙ ВЛАЖНОСТИ KCL ПОСЛЕ ПЕЧИ КИПЯЩЕГО СЛОЯ С ИСПОЛЬЗОВАНИЕМ КЛАСТЕРНОГО АНАЛИЗА // Вестник ПНИПУ. Электротехника, информационные технологии, системы управления. 2021. №37. URL: https://cyberleninka.ru/article/n/povyshenie-tochnosti-virtualnogo-analizatora-ostatochnoy-vlazhnosti-kcl-posle-pechi-kipyaschego-sloya-s-ispolzovaniem-klasternogo (дата обращения: 05.11.2021).

Комментарии (14)


  1. Schokn-Itrch
    30.05.2022 15:20

    Модель никогда не будет лучше данных, на которых она построена

    Математически точная модель никогда не будет лучше данных, на которых она построена.

    Но, для частных случаев, коих большинство, она, как правило, лучше чем исходные данные.

    P.S. Формулирование заголовка это тоже наука.


    1. LirikVechniy Автор
      30.05.2022 17:58

      Здесь нужно уточнить, что речь идет про экспериментально-статистические модели. Такие модели строятся на данных и в конце концов результаты работы модели сравниваются с исходно имеющимися даннными. Но исходные данные также имеют погрешность измерения. Так что, полученная ЭКСПЕРИМЕНТАЛЬНО СТАТИСТИЧЕСКАЯ модель НИКОГДА не будет лучше исходных данных соответствовать реальности (не относится к аналитическим моделям).


      1. Schokn-Itrch
        30.05.2022 20:25
        +1

        Ой ли? Тут уже переходим к вопросу о "фактически идентичной" и "психологически приемлемой". Фишка в том, что иногда вторая лучше первой.

        Но вопрос не в контексте аналитики, а именно в формулировке заголовка. Я бы озаглавил статью как "Статистическая модель практически всегда лучше ожиданий"


    1. Alesso
      01.06.2022 07:31

      Модель не будет лучше уровня развития и опыта человека, который её построил. А если в исходных данных есть ошибки, то полный провал))


  1. b01d
    30.05.2022 15:46

    Выяснено, что помимо параметра расхода газа на температуру дымовых газов влияет и расход подмешиваемого воздуха.

    Странно вообще об этом вам должен был сказать любой грамотный технолог. Или вы без участия представителей производства работали?


    1. LirikVechniy Автор
      30.05.2022 17:59

      На этапе исследования процесса не обратили внимания на этот узел. Первый проект.


  1. commanderxo
    30.05.2022 15:55

    Формулирование заголовка это тоже наука.

    Квантор «никогда» сильная штука и пользоваться им нужно осторожно, потому как для опровержения достаточно одного контрпримера.

    Не ясно кто изображён на КПДВ, но по кругам и треугольникам можно предположить, что это Фалес Милетский. Если выдать транспортиры сотне школьников и попросить измерить сумму углов разных треугольников, то получим случайные числа в диапазоне от 160° до 200°. При том что ещё древние греки на основе этих неточных данных построили математическую модель, дающую точное значение в 180° (в рамках Евклидовой геометрии вестимо).


    1. LirikVechniy Автор
      30.05.2022 18:01

      В статье речь идет не про аналитические модели, а про экспериментально статистические. Если бы измеренные с помощью транспортиров углы использовались при обучении модели, модель не смогла бы измерить углы лучше этих школьников.


  1. shakaleha
    30.05.2022 17:30

    Интересно почему при наладке так много сгорает кубометров, и почему будет хуже составить с допущениями упрощённое аналитическое описание на основе экспериментов. Имхо нейросеть оверхайп и не рационально использовать в этой задачи, но я не эксперт.


    1. LirikVechniy Автор
      30.05.2022 18:06

      Пока промышленная горелка запустится и выйдет на режим, сгорит порядка 100-200 м3 топливного газа. Плюс, в ходе эксперимента каждые 10 минут будет израсходовано около 150 м3. При средней стоимости газа в 4500 руб./м3 это эквивалентно сумме в 1 млн. 350 тыс. руб. Причем 10 минут - достаточно малое время для проведения экспериментов.

      P. S. Плюс простой линии производства, трудозатраты по проведению экспериментов со стороны оперативного персонала


      1. borovichok13
        31.05.2022 16:51

        Оптовая цена за газ: 4500 руб за ....1000 кубометров газа.

        Если так обращаться с данными, то - можно очень много напортачить.


        1. LirikVechniy Автор
          31.05.2022 19:55

          Прошу прощения, поторпился при написании ответа.


    1. sepetov
      31.05.2022 08:54

      Оффтоп, но в качестве аналогии. На одном молочном заводе, где я раньше работал, тоже очень много расходов на наладку любых аппаратов, даже фасовочных. Причин тому всегда хватает, приведу для примера фасовку масла:

      • смесь каждый день имеет разную температуру, а значит и разную "текучесть". Из-за этого в одну пачку масла "наливается" разная масса. Оператор тратит некоторое время на калибровку дозатора, чтобы в пачке было ровно 180 г.

      • сам фасовочный аппарат в ходе работы нагревается от подаваемого в него масла, из-за этого слегка меняется диаметр труб, что тоже приводит к изменению подаваемой за один такт массы

      • принтеры, стоящие на аппаратах, почти всегда имеют первобытную конструкцию крепления, поэтому их положение "влево-вправо" всегда делается на глаз, из-за этого первые 100-200 пачек масла уходит в брак, так как на них срок годности напечатался не в том месте, где положено

      Словом, запуск любого промышленного оборудования - это всегда головная боль, а вот дальше уже "всё само".


  1. WiZzor
    01.06.2022 10:36

    Странные ощущения я испытал читая вот это вот все. То, что эффективность сгорания природного газа зависит от количества подаваемого воздуха, это ново? ОК. Предлагаю еще проверить зависимость температуры дымовых газов от состава природного газа, от влажности подаваемой воздушной смеси, от еще кучи параметров указанных в проектной документации горелки. Это ж артефакт - горелка создана человеком, в доках описаны основные параметры, влияющие на эффективность ее работы. И уж точно там описаны параметры поддающиеся регулированию. Вот по всем этим параметрам и разумно было бы статистику набирать и потом анализировать. Не? А то получится, что зимой у установки один оптимум работы, а летом другой - из-за температуры воздуха, в дождь - третий (из-за влажности).

    И уж совсем очевидное - ведь наверняка кто-то уже проводил точно такие же исследования для горелок ТЭЦ, работающих на природном газе, или газоперекачивающих агрегатов на магистральных газопроводах, тоже сжигающих природный газ. Или на газохимических комбинатах.... Сдается мна, что в основе этого исследования не решение поставленной задачи, а банальное желание применить понравившийся инструмент хоть к чему нибудь. Как-то непрофессионально, imho. Извините, если это прозвучало резко.