Отвага и отвага: как мы выбирались из полного абзаца с неработающей ERP на 39 производствах / forpes.ru

Главная
Отвага и отвага: как мы выбирались из полного абзаца с неработающей ERP на 39 производствах

Отвага и отвага: как мы выбирались из полного абзаца с неработающей ERP на 39 производствах

20.06.2024 11:01

Leon1987_4 47 19000 Источник

39 наших площадок вагоноремонтных депо перешло из холдинга РЖД в Группу ОМК. Нам надо было за год перейти на новую систему управления производством, потому что оставаться в ИТ-ландшафте железных дорог было нельзя. Мы выбрали 1С ERP и восемь месяцев от ТЗ до дедлайна вместе с подрядчиком героически внедряли первую её очередь.

Итогом стало:

Прошлая система отключена.
Новая система запущена в фактической альфе, функционал — около 40 %, и она не работала.
Пользователи из депо готовы поднять нас на вилы, сжечь и растоптать. И повторить.
Многие данные вбиваются без проверок сотрудниками цехов, то есть в первичке — настоящий ад. Чтобы вы понимали, какой: чуть не влетели на 29 миллиардов рублей, потому что кто-то забил серийный номер в стоимость.
Железо не тянет всё это на местах, в том числе и серверы.
Каналы тоже всё это не тянут. Между двумя полями ввода на одной форме — от 30 секунд до разрыва и вбивания всех данных заново.
Поскольку мы успели собрать ТЗ только с центрального офиса, от региональных депо появляются всё новые и новые требования.
Мало кто понимает, как это всё работает, а надо править прямо в бою.
Вторая-третья линии поддержки (пять человек нашего ИТ-отдела) не понимают мастеров, первой линии вообще нет, и ресурса нет, чтобы её создать. Хвост обращений — несколько тысяч неотвеченных тикетов.
Ковид и карантины.
Бухгалтерия немного нервничает.

А дальше — обычная для вагоноремонтного депо ситуация: нужно любыми доступными средствами выполнить задачу. Выбора нет!

Собственно, продолжаю рассказывать, что именно мы сделали.

Подробно про то, как мы попали в эту ситуацию, — вот тут в первом посте.

Команда

Во-первых, за год мы нашли новых людей, и от пяти человек изначального отдела нас стало чуть больше. Сначала по ролям у нас были руководитель ИТ-отдела, проект-менеджер (он же — аналитик), два разработчика, архитектор. Добавилось шесть человек функциональщиков для работы прямо конкретно с беклогом. Они понадобились потому, что команду консультантов наши мастера цехов просто не понимали и сообщали, что они говорят на каком-то «курином языке». В целом это известная проблема производств: наши мастера не были готовы строить диалог с людьми, которые ось не щупали.

На первой линии накопилось несколько тысяч неотвеченных тикетов. Официальный SLA был от недели до никогда. Люди почему-то смекнули, что никто не отвечает, перестали обращаться и стали вместо поддержки писать «матерные» письма руководству.

Поскольку очень многие документы проводились к этому моменту методом брутфорса ударами по клавиатуре (я сейчас не шучу), в исходных данных было много ошибок. Мы решили ввести в дело шесть человек из числа функциональщиков, которые ~~били бы по ночам тех, кто неправильно вбивает~~ помогали бы распутывать этот хаос, а подрядчик № 2 дал инструмент и методологию закрытия.

Людей-функциональщиков мы взяли максимально близко от функций производства. То есть закупщика из регионального депо, одного мастера, одного экономиста при депо и так далее, и всех — из разных городов: Ульяновска, Красноуфимска, Кургана, Арзамаса. Собрали их и сообщили, что они завязывают со своими прошлыми делами и начинают разбирать всё это безобразие, пока хаос не станет чуть меньше. Ну то есть они будут жить со всеми депо. Сразу скажу, что это было одним из лучших решений по исправлению ситуации. Когда мастер подошёл к функциональщику и попытался что-то доказать, его ждал далеко не «куриный язык», а разборчивый человекочитаемый мат с интуитивно понятным интерфейсом. Взаимопонимание сразу наладилось, потом прошло несколько циклов пятничного слаживания команд. Но эффективность проекта от этого сильно выросла. В городах, где таких функциональщиков не было и подходить было не к кому, они с этой командой общались просто по телефону.

Команда функциональщиков «data quality» не только исправляла ошибки, но и искала корневые причины этих ошибок, то есть ходила к конкретным людям и объясняла, как правильно делать такую же операцию дальше.

Главной проблемой было то, что типовая ERP не пытается контролировать в моменте логику цепочки документов, давая очень много свободы пользователям (очевидно, это заточено на то, что пользователь — бухгалтер, экономист, закупщик или продажник с пониманием процесса). А у нас большая часть пользователей — мастера и операторы. Мастеру пофиг на списание, заказ, остатки, ему важно закончить работу с колёсной парой и приступить к следующей. Поэтому, если в поля вбить что-то, что поможет закрыть окно, — это подходит.

Жара добавляло то, что по всем процессам после входа в ОМК у нас творились изменения. Всё было в движении — от кадров до инфраструктуры ИТ. Например, за время проекта сменилось огромное количество функциональных заказчиков ключевых блоков. Только директоров по экономике было четверо. Последнего мы называли v4_final.

Взаимодействие с конечными пользователями

Это была самая большая боль этого проекта. Мало того, что у нас всё пошло не так, но нас со всех сторон ещё и материли. В целом спасибо, что только материли, потому что в депо много тяжёлых штук.

Основной плач был про то, что: «Мы не можем ремонтировать вагоны, потому что зачем сотрудникам бухпрограмма?» Напомню, что раньше было две софтины: одна — с привычным и понятным интерфейсом, где мастера в два клика обозначали свои операции. Она была максимально заточена под конкретное производство и всё дописывала сама, собирая только необходимый минимум данных. Дальше мастер видел готовый документ и мог его поправить, если что-то в умолчаниях было не так. Вторая — SAP ERP — касалась только учёта. Теперь на базе 1С ERP мы делали сразу всё в одном месте. А как я уже говорил, 1С сделана для усреднённого человека, то есть ни для кого конкретного. Эта универсальность в перспективе означала, что дальше можно будет очень сильно вырасти в эффективности и всё кастомизировать, но здесь и сейчас это были неудобные незнакомые интерфейсы, куча лишних диалоговых окон, повторяющиеся тупые запросы и лишние с точки зрения людей в депо операции и документы.

И сделать с этим быстро ничего нельзя.

Здесь нас выручил директор по экономике — тот самый v4_final. Это было, пожалуй, самым грамотным решением проекта, которое я тогда не до конца понимал. Мне казалось, что он собирает лишние совещания, и можно потратить время гораздо лучше. Он сказал, что иногда нужно проводить еженедельные встречи — два или три раза в неделю — и собирать вообще всех ключевых пользователей. То есть итого — около 200 человек из 1 000 пользователей. Собирали огромную видеоконференцию, где спрашивали людей, что у них не так на этой неделе. Показывали какие-то хорошие практики, делились практическим опытом, как обходить баги и как правильно дышать, чтобы всё не рухнуло.

Внезапно оказалось, что «Да-да, мы страдаем», и факельное шествие не детализируется на «А что именно не так?» Не так всё! И вообще вы неправильные и делаете неправильный мёд. Тезисов нет, информации нет. Точнее, конкретные тезисы для занесения в беклог попадались существенно реже ожидаемого. 80 % времени занимало то, что я назвал бы ворчанием. Порой громким. Именно это меня смущало во встречах.

Оказалось, что главный эффект — это комната, где можно было покричать, и становилось легче. Люди видели, что у всех так, что с этим надо жить. А потом не появлялось оправданий вроде «Я не знал, меня не спросили, мне не показали». Мы всё у всех спрашивали, всё показывали, всё до всех доводили и из этого потока ловили зёрна здравых идей для доработок.

Дальше мы прошли несколько стадий:

Первая — полное отрицание. Активная часть кричит лозунги по типу «1С — г…о!», «Да эта программа — для пивного ларька!» — мы понимаем, но нужна конкретика, а её тогда не было. Молчаливая часть аудитории мыслит так: «Сказали делать — ну, значит, надо… Будем через боль и слёзы пользователей вносить данные… Молчать, не подсвечивать проблемные зоны». И те, кто понимает, зачем всё это, тащат свои идеи для улучшений. Из двух пилотных депо одно оказалось строго против программы для пивного ларька, а второе как раз зацепилось за цель сделать лучше и активно продвигало идеи, которые меняли процесс.

В общем, симптом первого этапа: «Ура! У них ничего не получится!»

Вторая была уже такой: «Ура! Всё плохо, и у них ничего не получается!» Это когда мы уже видели, что ситуация под контролем.

Третья: «Да, работает, но всё равно очень плохо работает и лучше не станет».

Четвёртая стадия, которая тоже уже пройдена: «Да, работает, вроде нормально, но мы уверены, что это ненадолго!»

Сейчас у нас уже пятая: стабильное развитие, и мы даже иногда слышим благодарные отзывы на новый функционал, что он стал ближе к народу и для народа.

Забегая вперёд, скажу, что сейчас директор по экономике, который провёл эту психологическую операцию, стал управляющим директором. Полностью заслуженно!

Фекан мамонта

Техника в депо на ряде рабочих мест не удовлетворяла требованиям. Это нивелировалось тем, что везде стояли тонкие клиенты и локальные сервера. В архитектуре — звезда, где в центре — ЦОД, а по лучам — депо, локальные расчёты не предполагались. Но при этом нужно было уметь работать с веб-компонентами 1С, а они сделаны не для… Короче, они плохо совместимы с IE 6.0 и Pentium II MMX 233. Ладно, я утрирую, такой мы нашли только один, но было много машин с 1 Гб оперативной памяти при том, что для работы браузера надо хотя бы два.

Серверный парк тоже нас подвёл, как я уже говорил в прошлой части. Мы-то закупились по минимальным системным требованиям, а оказалось, что всё чуточку не так. Минимальные — это когда оно в принципе запускается, но все страдают. В смысле больше, чем обычно. Мы привыкли к мощностям РЖД, где был ЦОД неизвестного нам объёма, но там работало три огромных вагоноремонтных предприятия, и ни у кого никогда не было проблем. Системе — годы от момента внедрения.

Проблемы у нас появились сразу, когда вместо 50 человек подключились 500. А надо было 1 000.

Четыре разрыва

Каналы тоже не были готовы к такой нагрузке. Как оказалось. Про то, что нам понадобится другая утилизация и что надо будет уходить с инфраструктуры РЖД, мы знали давно и успели подготовиться. Но мы подготовились организационно, то есть убедились, что каналы до всех площадок (составляющих нашу частную сеть) чисто наши и при смене холдинга договоры с провайдерами не пострадают.

Засада была в том, что мы не видели проблем, т. к. на каналы никто никогда не жаловался. Потому что одна из исторических систем (как раз важная для производства) была построена на основе распределённой БД, и при падении канала в депо работа продолжалась локально.

Весь прикладной софт тоже учитывал особенности каналов и мог работать асинхронно, то есть не падал при пропадании связи на несколько секунд на радиорелейном соединении. А радиорелеек до территории депо у нас было много где. Условно подул ветер или пошёл снег — и вот начинаются кратковременные проблемы, которых мы просто не видели из-за отличий сетевой обработки на прикладном уровне.

Когда мы сменили архитектуру, у нас сразу выросли количество одновременных подключений и требования к каналам. 1С требует синхронной работы, то есть на отправленный пакет сразу должен прийти ответ. Если канал отваливается, то веб-компонент показывает ошибку. Другими словами, любая задержка вела к тому, что надо вернуться в начало документа и заполнять его заново.

Веб-компоненты плохо работали с серверными тормозами (а, напомню, они были). При ожидании больше 30 секунд браузер говорил, что сервер долго не отвечает и надо перезагрузить: пользователь в 90 % случаев перезагружал, как было предложено. Тонкий клиент работал лучше: он просто никак не показывал, что тормоза — это что-то из ряда вон, просто висел (на экране «крутилось колесико», как нам говорили пользователи).

С каналами у нас была отдельная эпопея, если коротко — многое удалось переделать за несколько месяцев. Ещё пошли в сторону тонких клиентов везде, где можно, и стало постабильнее. Про каналы, пожалуй, стоит рассказать отдельно, но в итоге всё же проблему по большей части победили. В смысле пользователи продолжают страдать, но кто-то привык, кто-то знает, как легче страдать, кто-то страдает меньше, да и общее число страданий уменьшилось где-то втрое.

Что делали

Итак:

Расширили количество людей на проекте, чтобы можно было не увеличивать долг по отчётности, а уменьшать. ИТ-блоку даже пришлось совместно с HR проводить замеры времени на ввод документов и считать численность операторов, необходимую дополнительно для обеспечения ввода.
Выделили ту самую «икс-команду» функциональщиков, про которую уже говорили — людей с производства, которые точно знали, что делать, и могли, как спецназ, решать любые вопросы.
Группа на стороне второй и третьей линий тоже подросла и выполняла задачи взаимодействия с подрядчиком, развития и т. д.
Сделали эту модель совещаний, когда все ключевые люди были в курсе и не могли потом говорить, что они не знали, им не сообщили и т. п., то есть убедились, что если пользователи не за нас, то хотя бы не будут ставить палки в колёса внедрению (как это часто случается).
Обновили серверный парк, сильно его расширили. Купили дополнительные СХД и сервер. Продуктивные сервера 1С были переформированы в полноценный кластер (отдельно сервера СУБД, приложений для пользователей, приложений для фоновых заданий, приложений для расчёта себестоимости, лицензирования).
Ещё докинули мощностей на прод.
Разобрались с каналами (это отдельная эпопея).
Занялись парком оборудования пользователей на местах.

Начиная с января 2022 года работа по закрытию периодов уже пошла более-менее штатно. А с апреля 2022-го мы вышли на полностью своевременное закрытие периодов в 1С по утверждённым бизнесом графикам.

Команда «data quality» была передана ИТ-блоку и плавно переформатирована в поддержку первой линии. Смысл был не исправлять ошибки, как они раньше делали, а не допускать их и обучать пользователей.

Пока мы закрывали год с подрядчиком № 2, подрядчик № 1 продолжал работы по второму этапу проекта. Разойтись не решились, так как уже многое было сделано и наработано. Если расходимся, то начинай сначала.

И вот к осени 2022 года мы были готовы переносить новую версию на продуктив.

Первое большое техническое окно мы согласовали на целые выходные — с вечера 21 октября 2022-го (пятницы) до утра понедельника, 24 октября. Запустились, сутки ждали, но реструктуризация базы никак не заканчивалась. Мы поняли, что это что-то бесконечное, и приняли решение, что мы откатываемся назад и идём выяснять причины. Так и завершилась попытка № 1.

За две следующие недели нашли и пофиксили причины, а в начале ноября ушли на вторую итерацию. Новое окно взяли с вечера 4-го по 7 ноября 2022 года. На этот раз мы провели обновление за три бессонные ночи и запустили пользователей.

Конфликт блокировок

С первых же часов после обновления мы столкнулись с новыми проблемами. Как только объём пользователей перевалил критическую массу в 200–300 человек, начались постоянные блокировки по основным таблицам производства. Лаги с привычных 30 секунд в критичных случаях стали достигать минут. В редких ситуациях — часов. Это ухудшалось кучей не столь больших, но от этого не менее значимых проблем по всем остальным блокам.

Конфликты блокировок решаются не очень просто. Точнее, есть очевидные способы вроде правильного индексирования таблиц и добавления новых индексов так, как подсказывает SQL. Это даёт десятки процентов ускорения, но принципиально ситуацию не меняет.

Мы вывели эксперта со стороны подрядчика № 2 и человека с нашей стороны специально под эту задачу. Они начали разбирать каждую блокировку. Берётся тормозящая операция, надо разобраться, что там блокируется и почему. Наиболее очевидное — кто-то блокирует целую таблицу на операцию, хотя ему нужна только небольшая её часть. Но чтобы с этим разобраться, нужно посмотреть, как именно и где 1С решает, что блокировать. По факту это означало, что код многих операций нуждался в уточнении: это что-то вроде рефакторинга пополам с оптимизацией.

С другой стороны, мы знали проблемные отчёты — обычно за большой период. С прошлой системы у людей осталась привычка выгружать вообще все «сырые» данные за период в XLS, а уже затем делать формулами всякие преобразования. Идея, что можно получить агрегат уже из SQL, была для них незнакомой и местами пугающей. В общем, по всей базе они собирали джойн, которым так известен интерфейс 1С, и оставляли его считаться, чтобы получить свои данные. Иногда сборка такого отчёта занимала часы, на которые и блокировались все другие пользователи: они страдали, а работа системы кратно замедлялась. Мы выявляли людей с такими отчётами, били по рукам. Люди плакали, говорили: «Нет, нам нужны данные от момента рождения Вселенной до её тепловой смерти». Просто ограничивали выборку, перенастраивали отчёт.

Далее практически весь 2023 год был посвящён развитию внедрённого функционала и выстраиванию работы на стабильное развитие системы по заявкам на изменение от бизнеса.

С подрядчиком № 1 мы расстались. У него был гештальт по поводу обновления 2022 года. Он его закрыл, провёл несколько месяцев опытно-промышленной эксплуатации, сделал ещё ряд доработок, про которые забыли, и на этом попрощался… Пообещал гарантию, и мы его больше не видели.

С подрядчиком № 2 мы остались, он нам регулярно помогает с заковырками расчёта себестоимости и развитием системы.

Год тестов на продуктиве

Получилось, что некоторое время в начале проекта у нас не было стейджинга, мы каждый раз ловим исключения и ошибки уже на продуктиве.

Так, в феврале 2023 года мы начали запускать функционал по допуску вагонов на пути общего пользования (внешняя ОТК), построили интеграцию, запустили сначала на одном депо и вроде всё отладили. Но когда пошли на тираж по всем депо, выяснилось, что у системы-источника на стороне РЖД многие поля приходят не справочниками, а просто текстами, или даже могут быть не заполнены. Пришлось в очередной раз экстренно делать заплатки, чтобы не остановить работу бизнеса.

Акт допуска — это документ о внешней приёмке из системы РЖД. Его отправляет система-оркестратор. Это не конечная система, а один из шлюзов. Есть несколько источников с разными справочниками. В тестовом депо конкретный приёмщик работал только в одной из этих систем. И работал по шаблонам, которые знал как свои пять пальцев. Он даже неклассифицированные поля заполнял идеально унифицированно, педантично и однообразно. Отладку мы прошли успешно, потом запустились по всей стране. И полетели акты из других систем и с другими классификациями. В любом поле могла прийти не такая информация, которую мы ждали. Мы ожидали однозначного соответствия элементу какого-то справочника. Патчили уже на живых данных. Сначала снизили требования до однозначного нечёткого поиска, потом убрали жёсткие привязки и дали возможность пользователям выбрать то, что они считают правильным. Через выборы пользователей получили базу соответствий, накатили её. Обучили систему на этом, снова включили жёсткие привязки, сейчас стабильно работает.

В следующий раз, запуская функционал обмена данными с РЖД для ремонта деталей, мы уже пошли запускать небольшими группами (по пять–семь депо, начав с одного и длительно обкатав на нём процесс). Благодаря этому запуск прошёл для бизнеса без потрясений, а для нас — без факельных шествий.

И да, про всё это мы параллельно проводили вебинары, и на них из 500 присутствовавших всего несколько человек задавали вопросы, причём парочка с формулировками: «Я, наверное, пропустил…», «Можете повторить?»

Снова обновление, и снова не всё как по маслу

Всё то время, пока шёл проект, мы были на версии 1C ERP 2.5.4, с которой стартовали внедрение. Вендор 1С к этому времени убежал уже очень далеко в новых релизах типовой «коробки». Например, на осень 2023-го из стабильных версий была как минимум 2.5.8, там много всякого нового функционала. 1С ERP развивается вообще семимильными шагами. Обновляться надо с точки зрения поддержки законодательства и всех остальных фишек. И плюс приходит оптимизация по многим алгоритмам.

Первую половину 2023 года мы собирались с мыслями. В середине года несколько месяцев готовили обновление (то есть адаптацию всех наших доработок под новую версию «коробки»), тут как раз пришёлся в тему подрядчик № 2, который остался у нас на поддержке. Он подготовил нам обновление с 2.5.4 на 2.5.6. В этом обновлении для нас не было какого-то особо нового функционала, скорее всякие небольшие фишечки. Но, тем не менее, нужно поддерживать стабильную версию от вендора.

В общем, несколько месяцев мы его готовили и в пятницу 13 октября уже планировали стартовать. Но управляющий директор в последний момент пришёл и сказал: «Баста! Сегодня я вам обновления не дам».

После нескольких итераций согласования удалось выбить новую дату техокна в ночь с 31 октября на 1 ноября 2023 года. Когда мы уже были готовы дёргать рубильник на переключение после поверхностной проверки функционала, то заметили несколько задвоенных объектов и решили потратить ещё час, чтобы разобраться. И не зря! Мы дотаскивали там новый функционал, который был дописан через добавление новых реквизитов. И вот всё то, что мы дописали поверх, вызвало дублирование. Это вызвало бы коррапт базы до степени, что пришлось бы создавать временные таблицы для спасения данных, перекладывать их туда, а потом — обратно. Мы сами отменили обновление.

Далее согласовали ночь с 18 на 19 ноября 2023 года, и вот тогда мы обновились. Это заняло 12 часов, мы запустили пользователей, снова получили блокировки в системе и ряд пользовательских ошибок, которые все выходные героически исправляли.

Ещё одна новая неожиданная проблема — когда этап ЗаписьСформированныхДвижений стал длиться вместо двух-трёх 20–30 часов. Причина — полное отключение функционала параллельной записи в регистр, которое сделал вендор. После нескольких недель уточнений нам удалось зарегистрировать официальную ошибку. Вендор её устранил в тестовой версии 2.5.17, теперь адаптируем её под наш релиз.

Обновление с 2.5.6 на 2.5.7 провели в апреле 2024 года уже на опыте с первой попытки. Конечно, не без проблем после этого (с нашими любимыми блокировками), но уже существенно спокойнее и слаженнее.

Мораль

1С ERP достаточно давно развивается, но изначально поставщиками требований к системе были машиностроение и приборостроение, где чётко известны маршрутная карта и спецификация производства, где что-то берётся, списывается, выпускается и продаётся. А у нас ничего не производится. У нас вагону оказывается услуга, нам нужно те параметры, с которыми вагон приехал на ремонт, восстановить до нормативных.

Этот блок на тот момент не был практически никак реализован, да и сейчас пока далеко не продвинулись.

Поэтому потребовалось доработать систему в части функционала. Плюс есть ещё специфика в учёте вагонов и интеграции с этими системами, а ещё — с использованием серийных деталей со своими номерами с характеристиками. Каждая деталь с точки зрения системы должна трекаться по истории и быть уникальной. Ещё их можно снять с одного вагона, отремонтировать и поставить на другой. Плюс дополнительно — требования от бизнеса: мы хотим видеть себестоимость конкретной работы на конкретном вагоне.

То есть сначала мы дорабатывали всё под себя, потом 1С обновляла базу, мы обновлялись, смотрели, что отвалилось, и снова дорабатывали обратно. У хороших подрядчиков это занимает два-три месяца. Иногда доработки приводили нас в такие дебри, что мы откатывались на базовую версию и терпели её ограничения, потому что код 1С иногда бывает уровня «Не влезай — убьёт!».

Производство всё это время не останавливается.

Но всё же пока что мы изрядно отстали от типовых обновлений, и нам только предстоит их нагнать. Но знаете, я всё равно скажу, что мы довольны проделанной работой. Вот хоть тапками в меня кидайте, хоть напалмом жгите, а мы всё же молодцы!

Ближайшие планы

Вот так выглядит наша система на конец 2023 года:

Сегодня у нас 1 000 одновременно работающих пользователей в пике. Четыре терабайта — объём текущей базы, и единая база с 1 января 2021 года. По 200 гигабайт — ежемесячный прирост базы, сканы документов хранятся во внешней системе. И более полутора миллионов документов вводится ежедневно руками пользователей. Это кроме тех, которые ещё генерятся всякими обработками, распределения и так далее.

Уже готовим обновление на версию 2.5.8. Потом нужны построение процессов автоматического переноса обновлений на продуктив и организация автоматического тестирования. Если получится, то приготовим смузи.

Лучший проект 2022 года

Если вы сейчас читаете всё это, то примерно представляете, как мы себя чувствовали. Когда в 2023 году стало понятно, что мы дотащили всё это и это более-менее работает, мы испытывали удовлетворение только от того, что стало легче, и всё это более-менее закончилось. И тут подрядчик № 2 предложил нам заявиться на премию «1С: Проект года». По нашим внутренним ощущениям на тот момент — можно было заявиться на другое слово, начинающееся на «п», созвучное с «эпик фейл», но никак не «проект года». Но мы кивнули, потому что от нас было ничего не надо.

Через некоторое время нам вдруг начали писать бывшие коллеги с железных дорог и поздравлять с победой. В премии. Мы такие: «А в какой?» Они: «Лучший проекта года». Мы: «Спасибо!» И про себя — что это закончилось. Но всё же было приятно!

А самое смешное во всём этом то, что даже если бы мы знали, что будет происходить и как, мы всё равно ввязались бы в эту историю, потому что у производства была необходимость. Может, с опытом подошли бы по-другому, но в том состоянии, скорее всего, прошли бы примерно тот же путь.

P.S. Вот первая часть.

Комментарии (47)

Ivnika
20.06.2024 11:03
#26954910
+5
Интересно было бы провести морфологический разбор (надеюсь правилно применил умное слово) в статьях о разных продуктах, пока мне больше запомнилось что при упоминании 1с - героически, вопреки, подгорает.. :)
1. DMGarikk
  20.06.2024 11:03
  #26954970
  +4
  при упоминании 1с - героически, вопреки, подгорает
  
  потому что никто не упоминает как подгорает с другими продуктами
  
  я в комментах у прошлой статьи упоминал что при внедрении САП все подгорало точно также, но статей никто не писал на хабре...потому что наверное "божественный сап, это не эта ваша тормозная 1С" хотя я точно помню тормоза по 15 минут при вбивание данных по ремонту тормозов в терминале...и там был САП тогда только только внедренный
  
  p.s. фотки цеха по ремонту автотормозов...ох..прям воспоминания нахлынули...довелось там побывать, не там конечно откуда фотки в статье, но в аналогичном, всё максимально знакомое
  1. SmaginAleksandr
    20.06.2024 11:03
    #26955488
    +1
    Как рядовой юзер САП в одно время, скажу, что это отвратительная вещь

Dimsml
20.06.2024 11:03
#26954982
+2
@Ivnika

Я не уверен, что морфология это именно то слово, которое вы искали. Морфология - раздел грамматики об изменении форм слова.

Тут скорее подойдёт n-грамма или коллокация.
1. Ivnika
  20.06.2024 11:03
  #26955014
  +1
  Видимо вы правы, вспомнил просто что есть некий анализ текста на встречаемость слов и сочетаний и пр. )

AlexeichD
20.06.2024 11:03
#26955176
+1
Супер, просто молодцы!

mixsture
20.06.2024 11:03
#26955186
+8
Как же все кошмарно в управлении в крупных компаниях!
Давайте перечислим для краткости:
1) делаете перевод большого производства без пилотного проекта и/или попытки как-то отразить существующие операции за период в новой системе, ну хоть как-то попробовать что "это подходит"
2) не тестируете свои мощности
3) при расчете мощностей используете минимальные требования, хотя явно собираетесь работать с нагруженной операциями/пользователями базой. Или вообще ничего не используете, поэтому часть оборудования конечных компьютеров не подходит.
4) меняете и архитектуру заодно, тоже без учета мощностей
5) очень слабо попадаете в уже используемый функционал (40% - очень мало. И при этом рубильником отключаем старую систему!)
6) переходите с кастомного высокопроизводительного и удобного решения на универсальное и поэтому не особо предназначенное для вас (существенно неудобнее, кушает больше ресурсов, требует куда большего обучения пользователей)
7) ошибаетесь в разы в размере кастомизации и поддержки (отсюда ит отдел сильно вырос)
8) используете оперативную базу заодно и как аналитическую (отсюда "аналитики" - кто выгружает огромные куски данных себе убивает производительность операторам ввода - кто много пишет в данные)
9) используете управленческую базу заодно и как бухгалтерскую (отсюда погоня за обновлениями, невозможность сильной кастомизации, длительное ожидание фиксов от 1с, затраты времени на увлекательную переписку с 1с)
10) вы могли решить проблемы с очисткой и стандартизацией данных заранее, ведь ровно эти же данные были и в прошлой системе. Но почему-то делаете это в момент перехода, в самый неудачный момент.

Эти странные взаимоухудшающие пункты кто-то принял, что именно так и будем делать. А вместе с этим, подозреваю, что вы еще и "критическая инфраструктура", за которую можно и присесть. Извините, я бы тоже сбежал от вас.

P.S. очень посмешил абзац про гарантию от первого подрядчика при том, что систему одновременно изменяют 2 подрядчика. Как вы себе это представляете?
1. Leon1987_4 Автор
  20.06.2024 11:03
  #26955318
  +3
  Всё так. Прочитайте первый пост, там рассказ, как мы попали в эту ситуацию. Фактически, был выбор между делать так или просто остаться без ИТ-систем. Конечно, сейчас, если бы мы знали, как это делать правильно, наверное, сделали бы куда лучше, но круто быть умным постфактум.
  1. mixsture
    20.06.2024 11:03
    #26955716
    Ок, давайте вычеркнем 5 и 7 пункты, которые похожи на "постфактум". Осталось то очень немало, это принципиально картину не поменяет.
    Прочитал и первый ваш пост и только укрепился в мнении, что в управленцах у вас кошмар. Если максимально обобщить: вы делали автоматизацию без ресурсов: финансовых, человеческих, организационных. И кто-то из вашего руководства принял решение, что вот именно так и надо.
    Мне очень слабо верится, что ваш подрядчик не говорил ни о каком из пунктов выше, но он - консультант, а решение то за вашим руководством. И вобщем-то весь остальной движ о том, как героически тушить пожары за этим руководителем.
    
    Вы фио и должность этого руководителя определили (для себя. врятли вы сможете об этом открыто писать)?
    
    DMGarikk
    20.06.2024 11:03
    #26955808
    +4
    ну что вы еще хотите от не-ИТ компании которую насильно вписали в нереальный проект? чтобы они там всем ИТ отделом уволились героически?
    
    у них же был выбор - или перевозить сап на свою площадку или делать всё с нуля... проблема в том что они не осилили посчитать что перевозка сапа выйдет по факту дешевле с учетом тех костылей на которые они попали не пойдя по этому пути..но из-за того что они в этом не компетентны
    
    подрядчик понял задачу не как «Нужно кровь из носу сделать до дедлайна»,
    а как «Нужно расписать план работ до дедлайна, а там — как пойдёт».
    
    он всё отлично понял, подрядчик пишет план под бюджет, а не то что у вас там вагоны стоят
    
    я вот совсем недавно был на стороне такого подрядчика, задачи ставились примерно так:
    
    вам 2 недели чтобы написать линукс с нуля, начинайте..подписывая договор о заказной разработке 5 лет назад вы подписались на всё что мы тут вам говорим, по этому мы через 2 недели вам штраф выпишем что вы не справляетесь
    
    и делали именно так ... планируем то что на имеющемся бюджете влезет в дедлайн, а дальше - это ваши проблемы и на нас их не перекидывайте
    
    Silver_Vech
    20.06.2024 11:03
    #26958860
    +2
    Там в первом посте вроде было написано про то, почему сап не избавил бы от головняка. Как-то выходит, что собственно и альтернативы-то не было, кроме ЕРП С1. Реально ребята красавцы, что с таким справились
    
    DMGarikk
    20.06.2024 11:03
    #26959424
    вопрос лишь в сроках
    
    есть же два варианта
    
    1) все ломаем строем с нуля, причем методом рубильника
    
    2) переносим имеющуюся систему, параллельно строем новую никого не травмируя
    
    смотря на то что происходит, п.2 выглядит адекватнее
    
    Leon1987_4 Автор
    20.06.2024 11:03
    #26959464
    К сожалению у нас не было 2-го варианта. Старую систему оставить было нельзя, так как она в ландшафте старого собственника с кучей интеграций с другими системами, и просто так ее даже скопировать нельзя.
  1. R72
    20.06.2024 11:03
    #26956882
    Сразу видно человека с опытом :)
    
    Зрит в корень ошибок.
    
    Да, ребята по наполеоновски ввязались в проект, авось кривая в битве вывезет.
    
    Самое смешное, что при таком подходе внедряемая система ЕРП превращается в еле ворочащийся и никому неизвестно как работающий монолит.
    
    В итоге после "внедрения ЕРП" требуется новое внедрение - сия мысль доходит до многих только в конце проекта.
    
    Al_Pollitruk
    20.06.2024 11:03
    #26957648
    Мне вообще не понятно зачем втянули 1С ERP в цеха с таким уровнем нетиповых задач. Даже не вдаваясь в детали проекта явно просится какая-то MES система. Но в целом выглядит как подвиг, то ли "Как закалялась сталь", то ли «Через четыре года здесь будет город-сад!».
    
    R72
    20.06.2024 11:03
    #26961430
    Судя по тексту, приказ о выборе и внедрении 1С ERP и о сроках и условиях внедрения на лету спушен свыше. Срочные нужды. В тексте также упоминалась SAP, которая явно MES-функции давно уже выполняла. Вот её-то и втупую заменили на ERP. То что им блок "производство" от 1С слишком сложен для их операций вполне разумное предположение. Но ни оценку ни прототипирование видать не разрешили - срочность решает всё.

EvgenyAS
20.06.2024 11:03
#26955496
+3
Отличный рассказ, распечатал и сохранил в отдельной папке! Собраны абсолютно все грабли (подрядчик-теоретик ни разу не зашедший ножками в производство, великий человек, который предложить собирать ключевых сотрудников и их опрашивать, лишь всего через несколько месяцев нашлись люди, переводящие рабочий матерный в красивый русский и прочее, миллионы аналитик в бухгалтерии, из-за которых долго закрывались затратные счета и волевое решение свернуть эти статьи затрат, что означает их практическую ненадобность для дальнейшего анализа себестоимости). Особенно понравилась часть про совпадение добавленных реквизитов с приехавшими с обновления. Неужели никто (подрядчики и работающие прогеры на месте) не догадался как то оформлять свои модули и дописки (не ЗаявкаНаПогрузку, а м_ЗаявкаНаПогрузку)?
1. Leon1987_4 Автор
  20.06.2024 11:03
  #26955918
  Проблема была в том, что при разработке мы для ее упрощения просто переносим часть кода и реквизитов из новых версий 1С ERP в нашу 2.5.6.
  
  Так у нас у ряда документов были реквизиты из версии 2.5.8, а при обновлении на 2.5.7 они впервые появляются. И имя реквизитов одинаковое. А вот ИД при первичном переносе не сохранился, и при сравнении конфигураций 1С решила, что это не обновление реквизита, а удаление и добавление одного и того же.
  
  А так как при обновлении на новую типовую версию у нас сотни новых реквизитов, сразу это не заметили и при тестах тоже упустили, так как реквизиты были не основные.

NitroJunkie
20.06.2024 11:03
#26955912
Не совсем понял раздел конфликт блокировок. Мне казалось, что 1С уже очень давно для отчётов использует версионный режим READ_COMMITED_SNAPSHOT или как-то так он называется. Тогда отчёты не должны вешать транзакции. Потому как если они вешают, то это мрак, и будет вечный забег по граблям.
1. Leon1987_4 Автор
  20.06.2024 11:03
  #26957778
  
  Конфликт блокировок у нас возникал не на отчетах, а на проведениях\распроведениях документов, в частности: «Этапов производства». Количество большое, а блокировка накладывалась целиком на какой-то из больших регистров. Обошли наложением отбора для блокировок. Отчеты с огромными выборками приводили, да и иногда приводят к деградации системы.
  1. NitroJunkie
    20.06.2024 11:03
    #26957850
    А что тогда означает этот абзац?
    
    С другой стороны, мы знали проблемные отчёты — обычно за большой период. С прошлой системы у людей осталась привычка выгружать вообще все «сырые» данные за период в XLS, а уже затем делать формулами всякие преобразования. Идея, что можно получить агрегат уже из SQL, была для них незнакомой и местами пугающей. В общем, по всей базе они собирали джойн, которым так известен интерфейс 1С, и оставляли его считаться, чтобы получить свои данные. Иногда сборка такого отчёта занимала часы, на которые и блокировались все другие пользователи: они страдали, а работа системы кратно замедлялась. Мы выявляли людей с такими отчётами, били по рукам. Люди плакали, говорили: «Нет, нам нужны данные от момента рождения Вселенной до её тепловой смерти». Просто ограничивали выборку, перенастраивали отчёт.
    
    Но вообще то что 1С не использует версионные СУБД и их принцип работы (с update conflict'ами в частности), а предлагает блокировать все разработчику самому руками - это конечно треш. Что мешало им сделать нормально - загадка.
    
    А если еще учесть, что они даже в типовых по вашим словам блокируют криво (что в общем предсказуемо, с учетом того, что это должен делать разработчик) и нужно все "переблокировать" внедренцы, то вообще слов нет. Только разве сочувствие, что кто-то умудрился выбрать такое решение.
    
    McKinseyBA
    20.06.2024 11:03
    #26958778
    А что тогда означает этот абзац?
    
    То, что не надо делать отчеты на прод ~~сервере~~ кластере. Отчетность необходимо строить на отдельном корпоративном хранилище данных. В крайнем случае хотя бы на standby сервере. Но какое там DWH - хорошо, что проект вообще закончили) Впрочем именно через такие граблепоходы появляется профессионализм и экспертность.
    
    NitroJunkie
    20.06.2024 11:03
    #26958822
    Не понял, а чем мешают отчёты на мастере в версионном режиме. Работают и работают. У нас есть некоторые проекты с объемом и количеством данных больше чем у вас (там терабайтами измеряется объем данных, а логика десятками тысяч событий ) и работают без проблем. Да, что-то отдельно в BI (OLAP) крутится, но и в OLTP более чем много по ряду причин.
    
    Просто не надо блокировочники (пессимистичные блокировки в смысле) использовать в OLTP (что ручные на уровне сервера приложений, что автоматические на уровне СУБД) и будет счастье. А так, мы героически решаем проблемы, которые сами себе создаём.
    
    McKinseyBA
    20.06.2024 11:03
    #26958948
    У нас есть некоторые проекты с объемом и количеством данных больше чем у вас (там терабайтами измеряется
    
    У вас линейка на 2 порядка короче)
    
    Если серьезно, то вы сами привели цитатой выше потребность пользователей выгружать данные «данные от момента рождения Вселенной до её тепловой смерти» и разумеется я отвечал на это. Из любой современной OLTP БД можно выгрузить сферический отчет на полную глубину хранения таблиц фактов на миллиарды строк. Вот только в больших системах источниках редко хранятся данные за 5, а тем более 15 лет, но как правильно все оно выгружается в холодный слой. А DWH (которые вы, если я правильно считал, назвали OLAP) такие данные хранит, обрабатывает и предоставляет любому количеству пользователей за секунды/минуты, но не часы
    
    mixsture
    20.06.2024 11:03
    #26961684
    Просто не надо блокировочники (пессимистичные блокировки в смысле) использовать в OLTP (что ручные на уровне сервера приложений, что автоматические на уровне СУБД) и будет счастье.
    
    Все так, но разбивается это о совсем разные порядки затрат и более быстрый их рост. Разнесение читающей и пишущей нагрузки в разные базы (физические накопители) - это почти полностью решаемо на уровне системного администратора, кроме того является подвидом горизонтального масштабирования и в принципе его можно вширь увеличивать - появилась еще новая читающая неоперативная нагрузка => сделали для нее отдельную базу (условно имеем линейный рост затраты за наращивание). Путь про блокировки - требует уже программистов и тестировщиков (они дороже), мест исправлений много (больше затраты на каждый кейс, больше персонала), и потолок оптимизации гораздо ближе - условно выходит экспоненциальный рост затрат за наращивание.
    
    Думаю, метод с блокировками из-за характера роста затрат подходит либо для совсем точечных оптимизаций, либо на малых по сложности базах (самописных, например).

TimofeyAV
20.06.2024 11:03
#26956502
+1
Вы - большие молодцы. Хорошо, что руки не опустились. Боролись до конца и победили! Только одна ошибочка, но она не ваша, а умного руководства. Не надо было САП трогать. Но тогда бы не было пути настоящего самурая.

kozlov_de
20.06.2024 11:03
#26956512
Жила была бабушка...

Сама виновата

Может быть, надо было делать системно и с достаточными ресурсами? А на зарубежном ПО, до вашего прихода всё работало на ура? При том, что 1С должен быть дешевле.
1. Leon1987_4 Автор
  20.06.2024 11:03
  #26957580
  Может и надо системно, но у нас было ограничение для ухода из систем старого собственника. Вариантов мять булки у нас не было. Наверное, глядя ретроспективно, что-то можно было сделать иначе, и, например, внедрить простую бухню. Но хотелось параллельно исполнить давние планы по созданию опер. учета на ERP. Тогда мы всего этого не знали. Как говорит мой друг: "Загад не бывает богат".
  
  Зарубежное ПО было только у бухгалтерии, и у них не было вопросов, но вот же самый сок в том, что у нас и бухгалтера после перехода из РЖД к ОМК стали новые. И они переписанный SAP тоже не знали.

Armann
20.06.2024 11:03
#26956716
+1
В жизни всегда есть место подвигу. Главное - держаться от этого места подальше

Thomas_Hanniball
20.06.2024 11:03
#26957140
Героизм – это всегда чья-то недоработка. В данном случае случае, это проблема ТОП менеджмента, который купил вагоноремонтные депо и совсем не думал, как это будет интегрировано в текущую компанию ОМК. Проблемы интеграции коснулись не только IT, но и финансов и общей организации труда.

Про то, что не имея компетенций, купили сразу 39 ремонтных депо, я вообще молчу. Обычно покупается одна компания\депо, на ней проводится пилотное слияние, изучаются все подводные камни и прочее. После того, как процесс отработан, можно начинать масштабирование и купить ещё несколько депо.
1. Leon1987_4 Автор
  20.06.2024 11:03
  #26957410
  А вы не рассматриваете вариант, что в целом с учётом всех плюсов и минусов решение было принято рационально, и то, что в ИТ будут сложности, сильно перевешивало что-то другое?
1. DMGarikk
  20.06.2024 11:03
  #26958102
  +1
  Про то, что не имея компетенций, купили сразу 39 ремонтных депо, я
  вообще молчу. Обычно покупается одна компания\депо, на ней проводится
  пилотное слияние, изучаются все подводные камни и прочее.
  
  вы думаете решения о покупке ЖД депо принимаются просто так как на рынке? это инфраструктура обслуживания монополиста, причем в нашей стране. если подвернулось провести такую сделку - ее надо проводить сразу и целиком даже не вникая в потери, второго шанса не будет никогда.
  
  тут есть еще подводный камень, когда придет время, эти депо или отнимут или настоятельно попросят продать еще комуто

alexhott
20.06.2024 11:03
#26957914
Как будто в 2005 год попал, тогда тоже приходилось тормоза разруливать. Но с тех пор с таким проблемами не сталкивался, а может уже просто знал основные причины и быстро решал.

alexhott
20.06.2024 11:03
#26957932
+1
А перевод всего ремонта из РЖД в отдельную компанию это тоже из 2000х когда каждый начальник зарабатывал на том что выводил часть бизнеса на оутсорс. Оутсор выгоден только тогда когда работник не полностью у тебя занят, а если контора работает только на тебя то это работало когда эта контора не платила налоги и зп серая бвла .
1. DMGarikk
  20.06.2024 11:03
  #26958116
  А перевод всего ремонта из РЖД в отдельную компанию это тоже из 2000х
  когда каждый начальник зарабатывал на том что выводил часть бизнеса на
  оутсорс.
  
  о даа, я помню это, у нас было такое в депо, электронщики и кондиционерщики были отдельными ООО которые платили откат начальнику за право работать в депо (помимо официальных договоров)
  
  ===
  
  честно говоря я и тогда и сейчас поддерживаю перевод ремонта из контура РЖД, но не так как это делалось тогда...потому что видел чем занимается ремонт когда он был в РЖД

DisM
20.06.2024 11:03
#26958956
Вместо того, что бы нанять профессионалов для разработки и внедрения нового решения (для клиента), владельцы решили сэкономить, и повесить все на отдел эникея. Отдел героичесски бился, но по факту проиграл, но сами считают что победили, и сильно собой гордятся.

Вот краткий персказ длинной статьи.
1. Leon1987_4 Автор
  20.06.2024 11:03
  #26959552
  Вы упустили, что этим занималось два профильных подрядчика, каждый из которых даже без наличия ИТ-отдела должен был справиться в одиночку. И ещё пару деталей про то, как же всё-такие действовать в такой ситуации, и что может помочь — этот опыт может быть применим на более простых проектах.
  1. DMGarikk
    20.06.2024 11:03
    #26959686
    +1
    этим занималось два профильных подрядчика
    
    любой даже самый профи подрядчик завалит проект если ему ставить нереалистичные вводные
    
    mixsture
    20.06.2024 11:03
    #26961704
    Я бы даже добавил из своего опыта:
    Любое внедрение можно завалить на уровне управления персоналом и абсолютно не важно, сколь сильные технические специалисты и как героически пытаются этому помешать.
1. DM_man
  20.06.2024 11:03
  #26961284
  Именно так и это повсеместно в производстве. Такое ощущение , они не понимают или не хотят понимать и живут двухтысячными (как здесь вспоминали)

gennayo
20.06.2024 11:03
#26960146
+2
Интересно, хотябы по 5 окладов премии вам заплатили?

YaroshenkoDuha
20.06.2024 11:03
#26960200
+1
"Проект года" я так понимаю медальку повесил себе подрядчик-вендор? Они это любят

bolshoy_valenok
20.06.2024 11:03
#26960322
Взгляд со стороны обывателя на прирост вашей базы в 200 Гб/мес вызывает недоумение. Я попытался писать со скоростью 60 символов в минуту и сохранять в юникоде, у меня получилось 2.6 мегабайта текста в месяц при условии что я буду писать с этой скоростью 24/7, не отвлекаясь на еду и сон. как вы умудряетесь это делать, как?!?

seekinganswers
20.06.2024 11:03
#26960324
Спасибо, автору, статья была увлекательной и занимательной и очень хорошо написана. Спасибо!

Вот возник вопрос:
Напомню, что раньше было две софтины: одна — с привычным и понятным интерфейсом, где мастера в два клика обозначали свои операции.

Как я понял, что у мастеров не так много задач в 1С, показать что делают, статус поставить.

А у вы не рассматривали варианты интеграции с WEB, то есть написать WEB приложение с интеграции с 1С для тех кому все данные из 1С не нужны? А нужно лишь малый набор, это бы и не загружала сервера пользователями, нагрузка была меньше и вероятнее всего не было необходимости обновлять парк ПК, если грамотно подойти к оптимизации WEB проекта.

DM_man
20.06.2024 11:03
#26961128
+1
Охохо, снова героическое внедрение ERP на базе 1С. Последнее время наблюдаю следующее - берут и выдвигают на рукойводителя мальчика и говорят " чтобы завтра внедрили" так по простому по армейски. А потом мальчики понимают что ошиблись, но их не научили признавать ошибки их учили успеху и только успеху и карьерному лифту. А тем временем люди, те кто работал стабильно и до внедрения (рабочие и колхозницы) , начинают увольняться и недоавтоматизация недоучета доводит предприятие "до ручки" , таких примеров множество на зарубежном опыте, но книг мы не читаем по менеджменту.

NotToxic
20.06.2024 11:03
#26961474
На распределении запасов еще покушаете вкуснятинки. Так сказать пацанский подгон со стороны 1С.

mixsture
20.06.2024 11:03
#26961774
Есть еще одна проблема, которая меня печалит: это рынок партнеров у 1с (франчайзинга). Они соревнуются друг с другом по количеству внедрений ERP, потому что так придумала 1с.
Пример можно посмотреть тут: https://1c.ru/rus/partners/ckerp.jsp. Обращаем внимание на столбец АРМ в таблице и фильтр "опыт крупных внедрений" над таблицей.

Из-за этого странного соревнования партнеры стремятся всеми правдами и неправдами рейтинг поднять. Поэтому там, где стоило бы на 1000 мест внедрить: ЕРП на 100 мест, бухгалтерию на 50 и какую-то легковесную конфигурацию на 850 - теперь будет гордо ЕРП на 1000. Она будет железных ресурсов жрать раз в 5 больше. В этой ЕРП будут доработаны самые сложные блоки, что партнер тоже запишет себе в плюсы, а у клиента это будут десятикратные затраты. Почти всем пользователям все равно будет неудобно или переусложненно (или оба варианта вместе) - просто потому что сложные интерфейсы простыми не сделать, а также бюджет на внедрение ограничен - если какие-то фичи удалось сделать за десятикратный прайс, то это автоматически выдавило другие фичи, повышающие удобство.