Обычно об ИТ в промышленности думают так: отчёты в 1С, легаси и никакой свободы действий. Если и есть цифровизация, то внедряют её только для того, чтобы выполнить KPI. Но если по-настоящему погрузиться в задачи разработчиков в промышленности, то станет ясно: здесь работают над сложными интересными кейсами, которые влияют на работу заводов и упрощают работу инженерам.
Мы в СИБУРе не понаслышке знаем о том, как важна цифровизация, ведь наша компания — крупнейший производитель полимеров и каучуков в России. Полиэтилен, эластомеры и пластики, которые мы производим, используются в разных индустриях, от строительства и автомобилестроения до пищевой промышленности и медицины. Масштабы производства огромные: 17 предприятий, 75 тысяч единиц оборудования и сотни параметров технологических режимов. Без цифровой трансформации управлять таким сложным и большим производством невозможно.
И вот в нашем ИТ-кластере — Цифровом СИБУРе — мы задумались, как показать, что продукты наших разработчиков влияют на огромный промышленный комплекс. Тогда мы решили вместе с Хабром рассказать, какие технологии и решения мы создаём и как это помогает двигать промышленность вперёд.
Цифровой двойник печи пиролиза и RTO: как работает автопилот на производстве

Полимеры окружают нас повсюду, от одноразового стаканчика и пластикового пакета до носового обтекателя ракеты и крыла авиалайнера. Самые востребованные и распространённые из них — это полиэтилен и полипропилен. В основе этих материалов лежат длинные цепочки химически связанных простых молекул — этилена и пропилена. Это лёгкие горючие газы, которые практически не встречаются в природе. В промышленности их получают из природного сырья — этана, пропана или более тяжёлых насыщенных углеводородов с помощью пиролиза.
Пиролиз — это энергозатратный высокотемпературный процесс, который происходит в специальных реакторах — печах пиролиза. Оптимальное с точки зрения наработки мономеров и затрат энергии ведение технологического процесса невозможно без точной, быстродействующей и робастной модели реакторной установки.
Раньше при цифровизации производства мы в Цифровом СИБУРе полагались на зарубежные лицензируемые программные продукты. Но в 2022-м всё изменилось: вендоры ушли с российского рынка, поддержка и лицензии стали недоступны. На действующих производствах софт продолжал работать, но через 2–3 года лицензии бы закончились. Возник вопрос, как продолжать работать, когда привычное ПО больше не доступно. И тут стало понятно — пора создавать своё решение, которое будет считать оптимальные режимы и поможет управлять производством в реальном времени.
Так появился целый программный комплекс — цифровой двойник печи пиролиза. Он работает в связке с RTO (Real-Time Optimization) и Системой усовершенствованного управления технологическим процессом (СУУТП) (или APC — Advanced Process Control, как её называют в остальном мире). Его главная задача — оптимизировать производственные процессы в реальном времени. Состав сырья и внешние условия могут меняться, поэтому система постоянно контролирует показатели и производит расчёты, чтобы знать, какой режим работы сейчас наиболее экономически выгоден. После расчётов цифровой двойник подаёт сигнал об оптимальном режиме СУУТП. Система управляет технологическим процессом в реальном времени: меньше затраченного сырья, меньше энергии — больше выхода продукта и выше прибыль компании.
При разработке собственного решения мы не просто пошли по пути импортозамещения: мы создали высокотехнологичный продукт только с помощью Open Source. Модель реализована на Python с использованием библиотек TensorFlow, NumPy и SciPy. Для развёртывания и работы в продакшене мы применяли Docker, Redis, Celery и Flask (REST API). В нашей модели имеется поддержка GPU/CPU, модульность, кастомизация, открытый API. Также поддерживается интеграция с nanoCAD для удобства моделирования конфигурации печи пиролиза в 3D.
Самым сложным в проекте было создание математической модели пиролизного реактора и разработка алгоритмических решений, которые обеспечивают необходимое быстродействие. Логически модель разделяет пиролизную печь на две сущности — змеевик печи пиролиза и радиантную камеру. Змеевик — это «сердце» реактора, в котором продуктовый поток движется с околозвуковой скоростью и претерпевает сложные химические превращения. Модель змеевика основана на законах сохранения массы, энергии, импульса и компонентного состава. Чтобы не превращать расчёты в бесконечную задачу для суперкомпьютера, мы применяли одномерное приближение: оно сводит математическое описание к системе обыкновенных дифференциальных уравнений (СОДУ). Задача при этом остаётся нетривиальной — в механизмах участвуют сотни компонентов и десятки тысяч реакций. Здесь мы принципиально не использовали квазистационарные упрощения, технологические особенности эксплуатации печи требуют решения СОДУ с граничными условиями. В результате мы смогли достичь времени расчёта в пределах нескольких секунд — почти как лучшие решения на рынке. Дополнительно мы применили техники снижения размерности механизма пиролиза, «отсекающие» реакции и компоненты, которые не влияют на конечный результат.
Радиантная камера — это «тело» реактора с десятками газовых горелок и разогретыми выше 1000 °С стенками. Она подводит тепло к змеевику. Для неё мы использовали строгие модели, основанные на уравнениях математической физики. Решение этих уравнений построено на методе конечных объёмов. Поиск общего стационарного состояния двух моделей (модели змеевика и модели радиантной камеры) мы осуществляли методом простой итерации с некоторыми модификациями. По сути, мы добились того, что сложная термодинамика печи пиролиза укладывается в алгоритм, который считает быстро, точно и стабильно.
Для нашего производства в этом решении всё прозрачно: никаких чёрных ящиков, никаких лицензий. Экономический эффект от внедрения цифрового двойника — примерно 670 миллионов рублей ежегодно на действующих производствах. В перспективе, по нашим расчётам, мы сможем сэкономить ещё по 400 миллионов рублей в год на новых производствах.
Предиктивная диагностика: когда поломка не застаёт врасплох

Страшный сон работников промышленных предприятий — это внезапные остановки оборудования, когда посреди смены что-то ломается, графики срываются, сотрудники нервничают, а компания теряет деньги. Но как поймать поломку до того, как она случится?
Раньше в СИБУРе использовали импортную систему предиктивной диагностики, но в 2022 году она, как и многие, отправилась в one way ticket поездку из России. Новые производства подключать стало нельзя, поддержка умерла. Надо было срочно найти замену. Конечно, на рынке уже существовали ИТ-решения, которые умели сообщать о проблемах «из коробки». Но они были слишком дорогими и не покрывали всех потребностей нашего производства. Мы начали искать более доступные варианты и поняли, что эффективнее разработать такое решение самим — ведь мы являемся экспертами в этой области, и у нас есть своя команда специалистов по Data Science.
Вместе с коллегами из центра мониторинга и диагностики (ЦМД) СИБУРа мы приступили к разработке своего софта — системы на базе машинного обучения. Эта система должна была следить за состоянием оборудования в режиме 24/7 и предупреждать о проблемах ещё до того, как они станут критичными.
Сначала мы подобрали датчики и написали верхнеуровневое ПО, которое выполняет функцию сбора информации и мониторинга состояния оборудования: отслеживает температуру, вибрацию, давление и другие параметры, а если что-то начинает отклоняться от нормы, подаёт сигнал.
На этом этапе мы изучили, как должен вести себя здоровый агрегат: при каждой установке системы на новом производстве мы заново обучали модель: условия на производствах отличаются, и старые настройки модели можно применять крайне ограниченно. Мы собирали реальные данные за год работы оборудования, фильтровали их и на основе этих данных обучали модель до нормального состояния. В итоге мы получили цифровой «слепок» здорового оборудования на конкретном производстве.
После обучения такая система в автоматическом режиме проводит мониторинг состояния оборудования. Если система обнаруживает первые признаки отклонения от нормы, то генерирует сообщение об аномалии. Диагносты ЦМД анализируют это сообщение и вместе со специалистами на производстве составляют рекомендации о том, как избежать неисправности. Такой подход помогает предотвращать аварии, планировать ремонты, заранее закупать запасные части и избегать финансовых потерь от простоев.
В нашей системе есть правила автоматической оценки результатов мониторинга, которые помогают быстро выделять наиболее важные события и формировать рекомендации для команды ЦМД. Если отклонение параметров находится в пределах допусков, проверка не требуется. Если оно выходит за эти рамки, мы формируем задачу на проверку оборудования. Дополнительно включены экспертные правила, которые по динамике изменения большого количества параметров помогают определить возможную причину отклонений и предложить рекомендации по их устранению. При этом система автоматически оценивает приоритет задачи: аналитические алгоритмы назначают уровень от 1 (высокий) до 5 (низкий), учитывая величину и характер отклонений. Так мы определяем, насколько срочно необходимо взять задачу в работу.
Сейчас мы используем такие статистические математические модели — модернизированный алгоритм Similarity-Based Modeling (SBM). Этот подход основан на идее, что объекты с похожими атрибутами демонстрируют схожее поведение. В будущем планируем полностью перейти на нейросетевые модели на автоэнкодерах и уже приступили к их внедрению в наш софт.
Под капотом у программы Hi-Tech-стек: AI/ML и Digital Twin. Всё строится на открытых библиотеках Python (SciPy, TensorFlow). Для корректного мониторинга оборудования важно понимать, какие дефекты могут на нем возникнуть и как они проявляются, то есть по каким данным — прямым или косвенным показателям — мы можем увидеть это в режиме реального времени. Для этого мы используем упрощенный Failure Mode and Effects Analysis (FMEA-анализ) — метод, который помогает связать потенциальные дефекты и отказы оборудования с параметрами, собираемыми в реальном времени. Так нам удается выявлять риски на раннем этапе и принимать меры для их устранения.
Финальный результат: снижение потерь на оборудовании, которое находится под мониторингом, на 10–15%. Но главное — меньше внештатных ситуаций и выше предсказуемость работы оборудования, что напрямую повышает надёжность и спокойствие команды.
Цифровая лидогенерация: как ИИ помогает искать новых клиентов

Проблема: классика больше не работает. Раньше в промышленном B2B, особенно в масштабах СИБУРа, поток клиентов держался на олдскульной магии: SEO, SMM, командировки и «посидели на конференции, обменялись визитками». Но в какой-то момент всё это перестало приносить результат, а во время пандемии некоторые из используемых каналов продаж и вовсе стали труднодоступными. Лидов становилось всё меньше, маркетологи были в панике, сейлзы в грусти. Вот тогда и пришла мысль: а давайте подключим ИИ и научим его искать для нас лояльных клиентов?
Цифровая лидогенерация должна была решить сразу несколько задач: расширить воронку продаж, помочь выйти на новые рынки и находить клиентов быстрее при запуске новых продуктов. ИИ должен был добавить гибкости в работу с продажами: помогать оперативно перенаправлять потоки и адаптироваться к изменениям рыночной конъюнктуры, автоматизировать процесс работы с воронкой от первого лида до сделки. Так родился продукт «Цифровая лидогенерация» — рекомендательная система, которая не просто ищет потенциальных клиентов, а выбирает тех, кто действительно готов работать с нами.
В качестве основы для лидогенерации мы использовали так называемое «озеро данных» — совокупность разных баз и источников, где собирается вся нужная информация, включая таможенную статистику и отраслевые базы, например SPARK и его аналоги в других странах. С помощью отраслевых баз можно автоматически разделить компании по сегментам производства и подготовить описания, которые станут ориентирами для поиска потенциальных клиентов.
Алгоритм работы такой: сначала мы берём данные из этого «озера», после этого вся информация проходит предобработку: данные очищаются от заведомо нереалистичных значений, удаляются дубликаты, а сами записи обогащаются дополнительными признаками. Затем включается «умная» фильтрация: на этом этапе важно учитывать приоритеты, заданные маркетологами. Задача — не просто собрать огромное количество лидов, а отобрать именно те, которые действительно подходят. В итоге из миллиона потенциальных лидов мы сокращаем выборку до нескольких сотен тёплых. Затем эти данные автоматически дополняются описанием и контактной информацией и отправляются в CRM. В итоге для менеджера отдела продаж всё готово: карточка клиента, контакты, краткое описание компании. Остаётся только позвонить и подписать договор.
Когда мы только разработали прототип, в команде были скептически настроенные участники: «Ну да, сейчас нейросеть нам клиентов найдёт, ага». А потом, через пару месяцев, уже благодарили за «тёплых» лидов, которые превращались в сделки, а у сейлзов появилось больше времени на стратегию вместо ледяных звонков.
Раньше процесс лидогенерации был долгим: сотрудник искал и обрабатывал лидов вручную, формировал общий список, который сразу уходил в продажи. Теперь процесс стал более продуманным и эффективным: лиды разделяются на холодных и тёплых и приоритизируются, появилось больше источников, а все данные хранятся и обрабатываются в единой системе. Плюс у нас теперь есть отдельный кол-центр, который прозванивает лидов перед отправкой в отдел продаж.
Цифровая лидогенерация помогла улучшить внутренний процесс работы отдела продаж и взаимодействие с клиентами. Внутри компании появилась выстроенная система работы с лидами и оцифрованный путь клиента с прозрачной аналитикой и отчётностью. Срок от запроса на генерацию до квалифицированного лида сократился с трёх месяцев до одного, а стоимость лида снизилась на 41%. Для внешних клиентов изменения тоже ощутимы: сотрудники стали быстрее отвечать на входящие обращения, а небольшие компании получили возможность напрямую сотрудничать с СИБУРом. Нам удалось сократить время сбора и анализа данных, отсеять нерелевантных лидов, а это сотни часов сэкономленной работы сейлзов и маркетологов. А кроме этого, мы получили лиды в новых для нас направлениях и регионах. Итоговые цифры, которыми мы гордимся: более 28 000 лидов и 1500 новых клиентов за полтора года.
Откуда берутся идеи
Цифровая лидогенерация — это один из кейсов, где мы применяем ИИ. После запуска цифровой трансформации гипотез с применением нейросетей внутри компании стало больше. Для того чтобы проверить их без финансовых рисков, мы в Цифровом СИБУРе открыли «Лабораторию ИИ». В неё попадают новые идеи по искусственному интеллекту. Каждую идею оцениваем: хватает ли данных, сколько денег можно сэкономить или заработать, насколько востребовано решение. Затем команда разрабатывает MVP, тестирует и решает, есть ли у этой идеи потенциал, или её стоит отправить в архив. Приоритет за теми решениями, которые принесут наибольшую пользу для компании и могут быть масштабированы. Если гипотеза проходит все уровни проверок, она превращается в полноценный проект, который внедряется в производство.
Когда мы запустили «Лабораторию», запросы на проверку таких продуктовых гипотез стали приходить от всех бизнес-функций компании, и сейчас в реестре «Лаборатории ИИ» более 330 идей. Мы уже реализовали более 30 кейсов, а около 140 гипотез находятся в работе на разных этапах. Ниже расскажем о проекте, который родился из гипотезы, проверенной в «Лаборатории ИИ».
«Co-pilot казначея»: управляем ликвидностью с помощью ИИ

Представим себе огромную промышленную компанию, где каждый рубль может превратиться в два, а может пропасть, если было принято неправильное решение. А теперь добавим контекста — каждое утро ребята из финансового отдела открывают Excel с десятками вкладок, чтобы подготовить прогноз: вручную, с копипастой, формулами в духе =ЕСЛИ(ОШИБКА(...)). Такой подход плох и для сотрудников, и для бизнеса: прогнозы отнимают много времени, в них закрадываются ошибки, которые не дают эффективно инвестировать деньги, чтобы получить доход. Тогда от бизнеса пришёл запрос — создать удобного помощника, который бы составлял более точные прогнозы, свёл ошибки к минимуму и освободил время финансовых аналитиков для решения более творческих задач (например, придумать, куда инвестировать свободные деньги предприятия).
Так появился «Co-pilot казначея» — программное решение, которое помогает делать прогнозы по ликвидности на 90 дней. Если объяснить простыми словами, то «Co-pilot казначея» — это искусственный интеллект, обученный на исторических данных для решения задачи прогнозирования денежных потоков — поступлений и расходов — с определённой высокой точностью.
В основе нашего решения по прогнозированию денежных потоков лежит глубокий разбор временных рядов: мы аккуратно рассортировали все данные по контрагентам и статьям расходов и доходов до каждой трендовой, сезонной, аномальной и других компонент. И только после этого собрали систему прогнозирования. Под капотом у нас каскад моделей: мультисезонный Prophet плюс набор линейных регрессий, заточенных под плавающий график платежей контрагентов. Данные не самые простые: тут и недельная, и месячная, и квартальная, и годовая сезонность (часть аддитивная, часть мультипликативная), и ещё «условные» сезонности, зависящие от календаря, например конец месяца или квартала, налоговые даты, праздники. Тренд — ломаный, паттерны — нестационарные, так что просто линейной моделью не обойтись. Для валидации используем time series split с расширяющимся окном: каждый день к нам приходят новые данные, и эта стратегия показала лучшие метрики в сравнении с другими. А в продакшен всё уходит через MLFW — наш внутренний сервис для безопасного запуска и мониторинга ML-моделей. Там мы регулируем частоту запусков, следим за качеством и, если надо, быстро выкатываем апдейты. Кроме этого, мы использовали SAP ERP и BW для сбора данных, «озеро данных» на Vertica, а еще FineBI, чтобы красиво рисовать графики прогнозов.
Экономический эффект от внедрения «Co-pilot казначея» превзошёл наши ожидания — 365 миллионов рублей за первые шесть месяцев этого года.
Заключение
Вот мы и завершили наше путешествие в мир ИТ в СИБУРе. О некоторых из наших проектов мы рассказали — они наглядно показывают, как цифровизация упрощает работу больших производственных комплексов на разных уровнях, от генерации лидов до отслеживания исправности оборудования. Каждый продукт нашего ИТ-кластера — это реальная задача, решённая современными подходами, от RTO до ML, а проекты — это вызов для нашей команды, сложный, технически ёмкий и очень интересный.
Мы верим, что ИТ в промышленности — это когда твой код делает работу тысяч людей проще и быстрее: предотвращает аварии на производстве и помогает коллегам из финансового отдела приумножать свободные деньги в компании. Здесь технологии двигают индустрию вперёд — и это трушный Heavy Digital. А если вы хотели бы спросить о наших технологиях и проектах, задавайте вопросы, мы с удовольствием ответим на них!
Обычно об ИТ в промышленности думают так: отчёты в 1С, легаси и никакой свободы действий. Если и есть цифровизация, то внедряют её только для того, чтобы выполнить KPI. Но если по-настоящему погрузиться в задачи разработчиков в промышленности, то станет ясно: здесь работают над сложными интересными кейсами, которые влияют на работу заводов и упрощают работу инженерам.
Мы в СИБУРе не понаслышке знаем о том, как важна цифровизация, ведь наша компания — крупнейший производитель полимеров и каучуков в России. Полиэтилен, эластомеры и пластики, которые мы производим, используются в разных индустриях, от строительства и автомобилестроения до пищевой промышленности и медицины. Масштабы производства огромные: 17 предприятий, 75 тысяч единиц оборудования и сотни параметров технологических режимов. Без цифровой трансформации управлять таким сложным и большим производством невозможно.
И вот в нашем ИТ-кластере — Цифровом СИБУРе — мы задумались, как показать, что продукты наших разработчиков влияют на огромный промышленный комплекс. Тогда мы решили вместе с Хабром рассказать, какие технологии и решения мы создаём и как это помогает двигать промышленность вперёд.
Цифровой двойник печи пиролиза и RTO: как работает автопилот на производстве

Полимеры окружают нас повсюду, от одноразового стаканчика и пластикового пакета до носового обтекателя ракеты и крыла авиалайнера. Самые востребованные и распространённые из них — это полиэтилен и полипропилен. В основе этих материалов лежат длинные цепочки химически связанных простых молекул — этилена и пропилена. Это лёгкие горючие газы, которые практически не встречаются в природе. В промышленности их получают из природного сырья — этана, пропана или более тяжёлых насыщенных углеводородов с помощью пиролиза.
Пиролиз — это энергозатратный высокотемпературный процесс, который происходит в специальных реакторах — печах пиролиза. Оптимальное с точки зрения наработки мономеров и затрат энергии ведение технологического процесса невозможно без точной, быстродействующей и робастной модели реакторной установки.
Раньше при цифровизации производства мы в Цифровом СИБУРе полагались на зарубежные лицензируемые программные продукты. Но в 2022-м всё изменилось: вендоры ушли с российского рынка, поддержка и лицензии стали недоступны. На действующих производствах софт продолжал работать, но через 2–3 года лицензии бы закончились. Возник вопрос, как продолжать работать, когда привычное ПО больше не доступно. И тут стало понятно — пора создавать своё решение, которое будет считать оптимальные режимы и поможет управлять производством в реальном времени.
Так появился целый программный комплекс — цифровой двойник печи пиролиза. Он работает в связке с RTO (Real-Time Optimization) и Системой усовершенствованного управления технологическим процессом (СУУТП) (или APC — Advanced Process Control, как её называют в остальном мире). Его главная задача — оптимизировать производственные процессы в реальном времени. Состав сырья и внешние условия могут меняться, поэтому система постоянно контролирует показатели и производит расчёты, чтобы знать, какой режим работы сейчас наиболее экономически выгоден. После расчётов цифровой двойник подаёт сигнал об оптимальном режиме СУУТП. Система управляет технологическим процессом в реальном времени: меньше затраченного сырья, меньше энергии — больше выхода продукта и выше прибыль компании.
При разработке собственного решения мы не просто пошли по пути импортозамещения: мы создали высокотехнологичный продукт только с помощью Open Source. Модель реализована на Python с использованием библиотек TensorFlow, NumPy и SciPy. Для развёртывания и работы в продакшене мы применяли Docker, Redis, Celery и Flask (REST API). В нашей модели имеется поддержка GPU/CPU, модульность, кастомизация, открытый API. Также поддерживается интеграция с nanoCAD для удобства моделирования конфигурации печи пиролиза в 3D.
Самым сложным в проекте было создание математической модели пиролизного реактора и разработка алгоритмических решений, которые обеспечивают необходимое быстродействие. Логически модель разделяет пиролизную печь на две сущности — змеевик печи пиролиза и радиантную камеру. Змеевик — это «сердце» реактора, в котором продуктовый поток движется с околозвуковой скоростью и претерпевает сложные химические превращения. Модель змеевика основана на законах сохранения массы, энергии, импульса и компонентного состава. Чтобы не превращать расчёты в бесконечную задачу для суперкомпьютера, мы применяли одномерное приближение: оно сводит математическое описание к системе обыкновенных дифференциальных уравнений (СОДУ). Задача при этом остаётся нетривиальной — в механизмах участвуют сотни компонентов и десятки тысяч реакций. Здесь мы принципиально не использовали квазистационарные упрощения, технологические особенности эксплуатации печи требуют решения СОДУ с граничными условиями. В результате мы смогли достичь времени расчёта в пределах нескольких секунд — почти как лучшие решения на рынке. Дополнительно мы применили техники снижения размерности механизма пиролиза, «отсекающие» реакции и компоненты, которые не влияют на конечный результат.
Радиантная камера — это «тело» реактора с десятками газовых горелок и разогретыми выше 1000 °С стенками. Она подводит тепло к змеевику. Для неё мы использовали строгие модели, основанные на уравнениях математической физики. Решение этих уравнений построено на методе конечных объёмов. Поиск общего стационарного состояния двух моделей (модели змеевика и модели радиантной камеры) мы осуществляли методом простой итерации с некоторыми модификациями. По сути, мы добились того, что сложная термодинамика печи пиролиза укладывается в алгоритм, который считает быстро, точно и стабильно.
Для нашего производства в этом решении всё прозрачно: никаких чёрных ящиков, никаких лицензий. Экономический эффект от внедрения цифрового двойника — примерно 670 миллионов рублей ежегодно на действующих производствах. В перспективе, по нашим расчётам, мы сможем сэкономить ещё по 400 миллионов рублей в год на новых производствах.
Предиктивная диагностика: когда поломка не застаёт врасплох

Страшный сон работников промышленных предприятий — это внезапные остановки оборудования, когда посреди смены что-то ломается, графики срываются, сотрудники нервничают, а компания теряет деньги. Но как поймать поломку до того, как она случится?
Раньше в СИБУРе использовали импортную систему предиктивной диагностики, но в 2022 году она, как и многие, отправилась в one way ticket поездку из России. Новые производства подключать стало нельзя, поддержка умерла. Надо было срочно найти замену. Конечно, на рынке уже существовали ИТ-решения, которые умели сообщать о проблемах «из коробки». Но они были слишком дорогими и не покрывали всех потребностей нашего производства. Мы начали искать более доступные варианты и поняли, что эффективнее разработать такое решение самим — ведь мы являемся экспертами в этой области, и у нас есть своя команда специалистов по Data Science.
Вместе с коллегами из центра мониторинга и диагностики (ЦМД) СИБУРа мы приступили к разработке своего софта — системы на базе машинного обучения. Эта система должна была следить за состоянием оборудования в режиме 24/7 и предупреждать о проблемах ещё до того, как они станут критичными.
Сначала мы подобрали датчики и написали верхнеуровневое ПО, которое выполняет функцию сбора информации и мониторинга состояния оборудования: отслеживает температуру, вибрацию, давление и другие параметры, а если что-то начинает отклоняться от нормы, подаёт сигнал.
На этом этапе мы изучили, как должен вести себя здоровый агрегат: при каждой установке системы на новом производстве мы заново обучали модель: условия на производствах отличаются, и старые настройки модели можно применять крайне ограниченно. Мы собирали реальные данные за год работы оборудования, фильтровали их и на основе этих данных обучали модель до нормального состояния. В итоге мы получили цифровой «слепок» здорового оборудования на конкретном производстве.
После обучения такая система в автоматическом режиме проводит мониторинг состояния оборудования. Если система обнаруживает первые признаки отклонения от нормы, то генерирует сообщение об аномалии. Диагносты ЦМД анализируют это сообщение и вместе со специалистами на производстве составляют рекомендации о том, как избежать неисправности. Такой подход помогает предотвращать аварии, планировать ремонты, заранее закупать запасные части и избегать финансовых потерь от простоев.
В нашей системе есть правила автоматической оценки результатов мониторинга, которые помогают быстро выделять наиболее важные события и формировать рекомендации для команды ЦМД. Если отклонение параметров находится в пределах допусков, проверка не требуется. Если оно выходит за эти рамки, мы формируем задачу на проверку оборудования. Дополнительно включены экспертные правила, которые по динамике изменения большого количества параметров помогают определить возможную причину отклонений и предложить рекомендации по их устранению. При этом система автоматически оценивает приоритет задачи: аналитические алгоритмы назначают уровень от 1 (высокий) до 5 (низкий), учитывая величину и характер отклонений. Так мы определяем, насколько срочно необходимо взять задачу в работу.
Сейчас мы используем такие статистические математические модели — модернизированный алгоритм Similarity-Based Modeling (SBM). Этот подход основан на идее, что объекты с похожими атрибутами демонстрируют схожее поведение. В будущем планируем полностью перейти на нейросетевые модели на автоэнкодерах и уже приступили к их внедрению в наш софт.
Под капотом у программы Hi-Tech-стек: AI/ML и Digital Twin. Всё строится на открытых библиотеках Python (SciPy, TensorFlow). Для корректного мониторинга оборудования важно понимать, какие дефекты могут на нем возникнуть и как они проявляются, то есть по каким данным — прямым или косвенным показателям — мы можем увидеть это в режиме реального времени. Для этого мы используем упрощенный Failure Mode and Effects Analysis (FMEA-анализ) — метод, который помогает связать потенциальные дефекты и отказы оборудования с параметрами, собираемыми в реальном времени. Так нам удается выявлять риски на раннем этапе и принимать меры для их устранения.
Финальный результат: снижение потерь на оборудовании, которое находится под мониторингом, на 10–15%. Но главное — меньше внештатных ситуаций и выше предсказуемость работы оборудования, что напрямую повышает надёжность и спокойствие команды.
Цифровая лидогенерация: как ИИ помогает искать новых клиентов

Проблема: классика больше не работает. Раньше в промышленном B2B, особенно в масштабах СИБУРа, поток клиентов держался на олдскульной магии: SEO, SMM, командировки и «посидели на конференции, обменялись визитками». Но в какой-то момент всё это перестало приносить результат, а во время пандемии некоторые из используемых каналов продаж и вовсе стали труднодоступными. Лидов становилось всё меньше, маркетологи были в панике, сейлзы в грусти. Вот тогда и пришла мысль: а давайте подключим ИИ и научим его искать для нас лояльных клиентов?
Цифровая лидогенерация должна была решить сразу несколько задач: расширить воронку продаж, помочь выйти на новые рынки и находить клиентов быстрее при запуске новых продуктов. ИИ должен был добавить гибкости в работу с продажами: помогать оперативно перенаправлять потоки и адаптироваться к изменениям рыночной конъюнктуры, автоматизировать процесс работы с воронкой от первого лида до сделки. Так родился продукт «Цифровая лидогенерация» — рекомендательная система, которая не просто ищет потенциальных клиентов, а выбирает тех, кто действительно готов работать с нами.
В качестве основы для лидогенерации мы использовали так называемое «озеро данных» — совокупность разных баз и источников, где собирается вся нужная информация, включая таможенную статистику и отраслевые базы, например SPARK и его аналоги в других странах. С помощью отраслевых баз можно автоматически разделить компании по сегментам производства и подготовить описания, которые станут ориентирами для поиска потенциальных клиентов.
Алгоритм работы такой: сначала мы берём данные из этого «озера», после этого вся информация проходит предобработку: данные очищаются от заведомо нереалистичных значений, удаляются дубликаты, а сами записи обогащаются дополнительными признаками. Затем включается «умная» фильтрация: на этом этапе важно учитывать приоритеты, заданные маркетологами. Задача — не просто собрать огромное количество лидов, а отобрать именно те, которые действительно подходят. В итоге из миллиона потенциальных лидов мы сокращаем выборку до нескольких сотен тёплых. Затем эти данные автоматически дополняются описанием и контактной информацией и отправляются в CRM. В итоге для менеджера отдела продаж всё готово: карточка клиента, контакты, краткое описание компании. Остаётся только позвонить и подписать договор.
Когда мы только разработали прототип, в команде были скептически настроенные участники: «Ну да, сейчас нейросеть нам клиентов найдёт, ага». А потом, через пару месяцев, уже благодарили за «тёплых» лидов, которые превращались в сделки, а у сейлзов появилось больше времени на стратегию вместо ледяных звонков.
Раньше процесс лидогенерации был долгим: сотрудник искал и обрабатывал лидов вручную, формировал общий список, который сразу уходил в продажи. Теперь процесс стал более продуманным и эффективным: лиды разделяются на холодных и тёплых и приоритизируются, появилось больше источников, а все данные хранятся и обрабатываются в единой системе. Плюс у нас теперь есть отдельный кол-центр, который прозванивает лидов перед отправкой в отдел продаж.
Цифровая лидогенерация помогла улучшить внутренний процесс работы отдела продаж и взаимодействие с клиентами. Внутри компании появилась выстроенная система работы с лидами и оцифрованный путь клиента с прозрачной аналитикой и отчётностью. Срок от запроса на генерацию до квалифицированного лида сократился с трёх месяцев до одного, а стоимость лида снизилась на 41%. Для внешних клиентов изменения тоже ощутимы: сотрудники стали быстрее отвечать на входящие обращения, а небольшие компании получили возможность напрямую сотрудничать с СИБУРом. Нам удалось сократить время сбора и анализа данных, отсеять нерелевантных лидов, а это сотни часов сэкономленной работы сейлзов и маркетологов. А кроме этого, мы получили лиды в новых для нас направлениях и регионах. Итоговые цифры, которыми мы гордимся: более 28 000 лидов и 1500 новых клиентов за полтора года.
Откуда берутся идеи
Цифровая лидогенерация — это один из кейсов, где мы применяем ИИ. После запуска цифровой трансформации гипотез с применением нейросетей внутри компании стало больше. Для того чтобы проверить их без финансовых рисков, мы в Цифровом СИБУРе открыли «Лабораторию ИИ». В неё попадают новые идеи по искусственному интеллекту. Каждую идею оцениваем: хватает ли данных, сколько денег можно сэкономить или заработать, насколько востребовано решение. Затем команда разрабатывает MVP, тестирует и решает, есть ли у этой идеи потенциал, или её стоит отправить в архив. Приоритет за теми решениями, которые принесут наибольшую пользу для компании и могут быть масштабированы. Если гипотеза проходит все уровни проверок, она превращается в полноценный проект, который внедряется в производство.
Когда мы запустили «Лабораторию», запросы на проверку таких продуктовых гипотез стали приходить от всех бизнес-функций компании, и сейчас в реестре «Лаборатории ИИ» более 330 идей. Мы уже реализовали более 30 кейсов, а около 140 гипотез находятся в работе на разных этапах. Ниже расскажем о проекте, который родился из гипотезы, проверенной в «Лаборатории ИИ».
«Co-pilot казначея»: управляем ликвидностью с помощью ИИ

Представим себе огромную промышленную компанию, где каждый рубль может превратиться в два, а может пропасть, если было принято неправильное решение. А теперь добавим контекста — каждое утро ребята из финансового отдела открывают Excel с десятками вкладок, чтобы подготовить прогноз: вручную, с копипастой, формулами в духе =ЕСЛИ(ОШИБКА(...)). Такой подход плох и для сотрудников, и для бизнеса: прогнозы отнимают много времени, в них закрадываются ошибки, которые не дают эффективно инвестировать деньги, чтобы получить доход. Тогда от бизнеса пришёл запрос — создать удобного помощника, который бы составлял более точные прогнозы, свёл ошибки к минимуму и освободил время финансовых аналитиков для решения более творческих задач (например, придумать, куда инвестировать свободные деньги предприятия).
Так появился «Co-pilot казначея» — программное решение, которое помогает делать прогнозы по ликвидности на 90 дней. Если объяснить простыми словами, то «Co-pilot казначея» — это искусственный интеллект, обученный на исторических данных для решения задачи прогнозирования денежных потоков — поступлений и расходов — с определённой высокой точностью.
В основе нашего решения по прогнозированию денежных потоков лежит глубокий разбор временных рядов: мы аккуратно рассортировали все данные по контрагентам и статьям расходов и доходов до каждой трендовой, сезонной, аномальной и других компонент. И только после этого собрали систему прогнозирования. Под капотом у нас каскад моделей: мультисезонный Prophet плюс набор линейных регрессий, заточенных под плавающий график платежей контрагентов. Данные не самые простые: тут и недельная, и месячная, и квартальная, и годовая сезонность (часть аддитивная, часть мультипликативная), и ещё «условные» сезонности, зависящие от календаря, например конец месяца или квартала, налоговые даты, праздники. Тренд — ломаный, паттерны — нестационарные, так что просто линейной моделью не обойтись. Для валидации используем time series split с расширяющимся окном: каждый день к нам приходят новые данные, и эта стратегия показала лучшие метрики в сравнении с другими. А в продакшен всё уходит через MLFW — наш внутренний сервис для безопасного запуска и мониторинга ML-моделей. Там мы регулируем частоту запусков, следим за качеством и, если надо, быстро выкатываем апдейты. Кроме этого, мы использовали SAP ERP и BW для сбора данных, «озеро данных» на Vertica, а еще FineBI, чтобы красиво рисовать графики прогнозов.
Экономический эффект от внедрения «Co-pilot казначея» превзошёл наши ожидания — 365 миллионов рублей за первые шесть месяцев этого года.
Заключение
Вот мы и завершили наше путешествие в мир ИТ в СИБУРе. О некоторых из наших проектов мы рассказали — они наглядно показывают, как цифровизация упрощает работу больших производственных комплексов на разных уровнях, от генерации лидов до отслеживания исправности оборудования. Каждый продукт нашего ИТ-кластера — это реальная задача, решённая современными подходами, от RTO до ML, а проекты — это вызов для нашей команды, сложный, технически ёмкий и очень интересный.
Мы верим, что ИТ в промышленности — это когда твой код делает работу тысяч людей проще и быстрее: предотвращает аварии на производстве и помогает коллегам из финансового отдела приумножать свободные деньги в компании. Здесь технологии двигают индустрию вперёд — и это трушный Heavy Digital. А если вы хотели бы спросить о наших технологиях и проектах, задавайте вопросы, мы с удовольствием ответим на них!