Представим, что ваше желание уволиться можно описать одним числом. Что будет влиять на него? Понятно, соответствие зарплаты ожиданиям. Потом — ваш комфорт в коллективе, адекватность руководителя. Расстояние до офиса, если вы ездите в офис, или до ЦОДа, если вы ездите в ЦОД, возраст, срок последнего повышения и так далее.
В этой модели всегда было слабое место — сложно посчитать совокупность влияния людей на вас. В целом-то всё просто: если вы работаете с теми, кто вам неприятен, то в зависимости от частоты взаимодействий желание уволиться растёт.
Следующий фактор: когда на новое место работы уходит кто-то, с кем вы сработались, ваш шанс на увольнение также резко растёт. Потому что он позовёт к себе — или потому что у вас уменьшится число людей, с кем вам было комфортно.
Мы не можем сказать, кто и с кем сработался. Таких источников данных у нас просто нет. Но мы сделали допущение о том, что если сотрудники плотно друг с другом взаимодействуют, то уход одного сотрудника увеличит вероятность ухода другого. И дальше на основании этого допущения составили граф всех сотрудников, в котором учли плотность взаимодействия между ними.
И знаете что? Наша модель начала предсказывать увольнения за 3 месяца с точностью около 70%. В смысле, из тех, кого модель разметила на месяц вперёд подтвердилось 73% случаев (точность), при этом модель находит 40% от всех увольнений (полнота).
Теперь мы можем с этим что-то делать.
Естественно, у этой модели огромное количество ограничений. Сейчас мы с DVAMM про всё это расскажем.
Что мы делаем
Мы занимаемся исследованием графов, имеем свой набор софта, и применяем свои матмодели для предсказания эффективности рекламных кампаний, для поиска источников обращений клиентов в розницу, для ряда задач на добывающих производствах — но собственный граф сотрудников тоже оказался отличным инструментом.
На входе у нас есть список сотрудников. Первая задача — найти такой источник, который поможет понять, кто с кем общается и каково влияние этих людей друг на друга.
У нас есть формальная иерархия. Она даёт первый набор данных: кто в каком отделе, кто у кого руководитель и так далее. Этого мало, потому что формальная иерархия никак не покрывает взаимоотношения между отделами. К счастью, их покрывает открытый (внутрикорпоративно) календарь встреч, который после эпохи удалёнки стал использоваться намного активнее. Встреч в курилках стало меньше, встреч онлайн больше. Он и даёт нам недостающие данные для понимания, кто с кем общается и как часто.
Я знаю, что в некоторых компаниях внедрён сбор данных с DLP, отслеживание корпоративных телефонов, BL-маячки для пропусков, мониторинг корпоративных мессенджеров, вычисление одновременных проходов по СКУДам и так далее, но это всё довольно мрачно. Да, это может повысить точность модели, но нам это не потребовалось. Мы ориентируемся на куда меньшее число данных, зато собираемых этично.
Выявление лидеров
Чтобы предсказывать увольнение (а это не единственное конечное применение), нужно выявлять лидеров. Фактически это даже не лидеры, а более или менее влиятельные люди для каждого конечного сотрудника. Но мы также выявляем лидеров в качестве промежуточной задачи.
Лидеры влияют на других людей существенно больше остальных. Они определяют микроклимат, работу с проблемами внутри процессов, взаимоподдержку.
С общечеловеческой точки зрения лидер — это тот, кто своим мнением или действием способен влиять на действия других людей. С позиции HR лидер — это руководитель. Мы исходили из неформального лидерства (фактического). Настоящий лидер может не обладать формальной властью, но при этом влиять на большое количество людей.
Лидерами часто (но не обязательно) становятся те, кто важен в коллективе с точки зрения графа взаимодействий. Лидеры фактически перестраивают этот граф так, чтобы находиться в большом числе взаимодействий. Мы измеряем плотность коммуникаций между двумя сотрудниками, количество связей (со сколькими людьми взаимодействует сотрудник) и Katz centrality (центральность по Кацу).
Собственно, на берегу мы договорились, что я и другие сотрудники моей команды не могут посмотреть, кто с кем связан из сотрудников конкретно. Но можно получить числа влияния друг на друга в целом и посмотреть итоговый агрегат.
Датасет — 30 тысяч сотрудников за 2 года. Понятно, что не у всех полные 2 года, у кого-то меньше. Данные не очень глубокие, как видите, но их достаточно просто собрать практически в любой крупной компании. Датасет подразумевает обучение только по самостоятельным увольнениям, а не по увольнениям со стороны компании (например, за нарушения) и не такие случаи, как увольнение по причине пенсии или смерти.
Как это используется
Есть историческая витрина на каждый месяц. У каждого сотрудника есть признаки, которые влияют на его желание работать или сменить работу.
Например, это расстояние от дома до офиса, зарплата, возраст, количество дней с последнего повышения, время работы итого, семейный статус (есть дети или нет), образование и так далее. Это, условно говоря, статические коэффициенты.
Дальше есть граф взаимодействий внутри компании. Из него также высчитывается динамический коэффициент довольства. На первом проходе мы считаем статические коэффициенты для каждого, затем по графу взаимодействий передаём влияние желания и нежелания работать по этому самому графу на других сотрудников. Затем пересчитываем ещё раз уже для новых итоговых оценок у каждого. Это делает графовая нейросеть, агрегирующая особенности человека и соседей. При помощи графовых слоёв мы получаем эмбеддинг — представление каждого в векторном пространстве. Оттуда и делаем предсказание.
Получается индекс, который и является прогнозом увольнения. Мы выводим в разрезе на 1 месяц, 3 месяца и 6 месяцев. На 1 месяц предсказать сложнее всего, потому что человек долго «раскачивается». На 6 месяцев прогноз куда более точный. Речь про 70–80% точности.
Что получается
Мы знаем, с какой вероятностью вы уволитесь. Примерно, но знаем.
При увольнении сотрудника мы можем предсказать, кто будет увольняться за ним, и это поможет что-то поменять и удержать людей.
Для каждого сотрудника мы можем предположить, насколько его уход поменяет мнение других людей его графа общения — то есть сказать стоимость его увольнения, кроме прямых эффектов.
В итоге на практике:
- Мы можем предсказать, когда захочет уволиться, например, руководитель отдела. Объективно, если он уже решил, то вряд ли мы с этим что-то сделаем, но…
- Мы можем предсказать, кто уволится после этого за ним или из-за изменившихся условий — и удержать уже их. То есть остановить волну увольнений после первого.
Вообще, любое увольнение позволяет мгновенно пересчитать соседей и понять, кого после него надо удерживать. Это очень полезное прикладное применение модели.
Дашборд со скорингом есть у кадров. Кадры могут связаться с руководителем «рискового» человека и предложить какие-то меры. Где-то помогает обучение, где-то напоминают про повышение, кому-то нужен отпуск уже давно, где-то нужно поднимать зарплату и так далее.
Кстати, далеко не всегда вопрос решается деньгами.
Это ассистирующая метрика, а не повод для окончательного решения. HR-отдел считает также свои метрики, но теперь иногда поглядывает и на эту.
В перспективе такая метрика даст возможность считать HR-влияние человека на компанию (к сильному известному в сфере человеку тянутся сильные сотрудники со всего рынка, и это стоит отдельных денег), решать конфликты (с оценкой, если двое поцапались навсегда, какие последствия будет означать для графа доминирование каждого), можно собирать продуктовые команды с новыми выявленными лидерами и так далее. Неформальные лидеры важны HR для разных процессов вроде комитетов изменений: если они будут на стороне новых внедрений, то они пройдут куда более гладко.
Комментарии (11)
ermouth
21.07.2023 08:24+4Когда руководитель у нас может сам прийти к вам с повышением зарплаты
Вы не могли бы привести статистику, сколько реальных таких походов и предложений с повышением з/п имеет место быть на каждую тысячу уволившихся?
TyVik
21.07.2023 08:24Могу ответить по своему опыту. На одном месте я был тимлидом бэкенда. После определённых конфликтов с начальством решил уволиться; остальным в моём отделе повысили зарплату на 30%. Результат - после меня ушёл только один человек и то только через полгода.
Второй случай. Я был обычным разрабом. За полгода ушло 3 человека, я четвёртый. Через месяц оставшимся зарплату подняли; больше никто не ушёл.
К слову, изначально в обоих случаях зарплата всех сотрудников была более-менее в рынке.
ermouth
21.07.2023 08:24На одном месте я был тимлидом бэкенда.
Это банк был?
По моему опыту такое встречается в разных отраслях и не только в ИТ-подразделениях, но я никогда не слышал таких историй про банки.
У меня просто сложилось ощущение, что автор лукавит, вот прямо с заголовка – отсюда и вопрос.
TyVik
21.07.2023 08:24В первом случае ирландский стартап в сфере образования с офисом в Краснодаре. Во втором стартап из LA в сфере медицины.
Банки обхожу стороной :)
saboteur_kiev
21.07.2023 08:24+9А есть какие-то действия наоборот?
Например вычислили, что при увольнении определенноготоксичного/эффективногоменеджерасотрудника, шансы на увольнение его коллег резко понижаются, и таким образом тоже можно улучшить ситуацию в коллективе, даже без доплат?ermouth
21.07.2023 08:24что при увольнении определенного сотрудника, шансы на увольнение его коллег резко понижаются
Полагаю, примерно для этого и делалось, но не так, как вы думаете. Неформальных лидеров выявляют не для того, чтобы из них пестовать начальство, а для того, чтобы от них избавиться.
event1
21.07.2023 08:24В смысле, из тех, кого модель разметила на месяц вперёд подтвердилось 73% случаев (точность), при этом модель находит 40% от всех увольнений (полнота).
То есть, если модель обозначила 100 сотрудников на следующий месяц, то в реале уволятся 170, из которых 70 совпадут с предсказанием модели?
Neom1an
21.07.2023 08:24— товарищ Иванов, вы уже полгода просите о повышении зарплаты. Мы попросили нашего программиста написать программу, которая на основе анализа вашей работы выдаст решение о размере вашей зарплаты. Если программа предложит увеличить вашу зарплату, то мы увеличим ее за счет зарплаты программиста
sshmakov
Меньше встреч => меньше связей => меньше причин для увольнений
Бинго!
LuchS-lynx
Кто сказал "автоматизация"?