Привет, меня зовут Евгений Кириёк, я — наставник на курсе по HR-аналитике в Яндекс Практикуме, автор книги «HR-аналитика. Путеводитель по анализу персонала» и канала «Аналитика в HR».
Что, если я скажу вам, что существует метод HR-анализа, который способен спрогнозировать вероятность увольнения сотрудника на испытательном сроке? Мало того, этот метод позволит вам оценить качество разных источников кандидатов, а ещё выявит проблемные места в процессе адаптации, оценит эффективность подбора и даст много других выводов о жизненном цикле сотрудника в компании. И для его использования вам необязательно иметь степень по математике или разбираться в анализе данных. Он доступен всем и каждому. Заинтригованы и хотите узнать больше?
В таком случае я рад представить вам его величество График выживаемости.
График выживаемости, или график Каплана-Мейера (Kaplan-Meier plot), пришёл к нам из медицинских исследований и был разработан для оценки выживаемости пациентов в процессе лечения. Да-да, всё серьезно, врачи хотели понять, как то или иное лечение (или его отсутствие) влияет на выживаемость пациентов с течением времени. Позже этот метод стали применять в исследованиях как довольно универсальный инструмент по анализу конечных состояний процессов и вероятности их наступления.
Ниже мы научимся строить график выживаемости на базе Excel и интерпретировать результаты наблюдений. Мы сознательно не будем использовать R, Python и более сложные стат. расчеты, для того чтобы сделать инструмент доступным для практиков без знаний в анализе данных.
Так для чего он мне нужен?
Этот метод применяется для очень разных задач, вот несколько из них:
Оценка вероятности увольнения сотрудника с течением времени
Оценка эффективности процесса адаптации в компании
Оценка эффективности работы функции подбора
Оценка качества источников подбора
Расчёт средних показателей жизненного цикла сотрудника в компании и многое другое
Ладно, давайте рассказывайте
Начнём с простого. Предположим, вы хотите оценить качество работы функции подбора и адаптации. Для этого вы собрали информацию о наймах в компании за период в 3 месяца из одного источника кандидатов. При этом неважно, сколько сотрудник проработал фактически — все три месяца или один день. Получившийся массив данных представим в виде таблицы:
Пока ничего сложного: есть дата, когда сотрудник начал работать в компании, дата, когда покинул её, и количество недель, которые он отработал. Если сотрудник продолжает работать, у него не будет даты увольнения и количества отработанных недель.
Теперь начнём расчёты. Для этого рядом построим ещё одну таблицу, которая будет иметь следующие поля:
сотрудник — это имя сотрудника, который уволился в период времени t;
время (t) — это порядковый номер недели, в которую произошло увольнение;
кол-во сотрудников (n) — это количество сотрудников, которые участвуют в нашем эксперименте в момент времени t;
кол-во уволившихся (d) — это количество уволившихся сотрудников в момент времени t;
доля сотрудников, переживших момент t (ft) — это расчётная величина. Её формула: (n-d)/n;
выживаемость, S(t) — это тоже расчётная величина. Её формула: f*S(t-1).
Начнём заполнять таблицу:
В первой строке время (t) будет равно 0 — эксперимент начался, а выживаемость равна 1 (или 100%).
В первую неделю (строка 3) у нас увольняется один сотрудник. Время (t) — это порядковый номер недели, он первый. Кол-во сотрудников в этот момент (то есть на первой неделе), за которыми мы наблюдаем, — 10 человек. Уволился из них на первой неделе — 1 человек. Доля сотрудников, переживших первую неделю работы: (10 – 1)/10 = 0,9 (или 90%). Выживаемость по формуле: 0,9*1,0 = 0,9 (или 90%).
Переходим к следующему уволившемуся (Сотрудник 10) на второй неделе и заполняем по аналогии всю таблицу, то есть по всем сотрудникам, которые уволились. Те, кто не уволился и доработал до конца эксперимента — трёх месяцев наблюдений, остаются как есть, с ними мы ничего не делаем.
Фух. Вы всё ещё с нами? Отлично, самая сложная часть позади.
Теперь построим график. Выберем точечную диаграмму с прямыми отрезками. В качестве значения по оси X укажем время (t), в качестве значения по оси Y — выживаемость, S(t). А на выходе получим график выживаемости:
Как читать этот график?
Ось Y — это доля сотрудников, которые продолжают работать в компании к моменту времени t. Ось X — это время (недели). С течением времени доля сотрудников, работающих в компании, уменьшается. К седьмой неделе график обрывается — это последнее увольнение, до конца эксперимента других увольнений не было. Все оставшиеся сотрудники продолжают работу.
Как его интерпретировать?
Даже в своём исходном виде этот график дает нам несколько интересных выводов:
Половина новых сотрудников компании увольняется в течение первых 4 недель работы. Проблемы с адаптацией? Стоит разобраться и сформулировать гипотезу.
Вероятность прохождения испытательного срока составляет всего 30%. Ещё один важный вывод. А это уже повод задуматься о качестве подбора.
Доля увольнений на пятой неделе работы резко возрастает и соответствует почти половине всех доживших к этому моменту сотрудников. Видимо, на пятой неделе происходит какое-то событие, которое резко снижает вероятность прохождения срока испытания. Какое и почему? Стоит проанализировать.
Все эти инсайты позволяют корректировать работу функции подбора и адаптации и дают возможность прогнозировать вероятность увольнения сотрудника из компании на любом этапе его работы (sic!).
Это всё?
Нет, это только начало. Ведь у наших сотрудников есть огромное количество характеристик, которые их определяют (пол, возраст, источник найма, должность и пр.) Так, например, если мы распределим всех исследуемых сотрудников по источникам найма, то сможем оценить качество каждого из источников:
Теперь мы видим, что текучесть по источнику 2 в рассматриваемом периоде меньше, чем по источнику 1, а значит, источник 2 на этом отрезке времени более эффективен, чем источник 1.
Представьте, какое пространство для анализа нам это открывает. Мы можем анализировать разные категории сотрудников, сотрудников по полу и возрасту, по структурному подразделению, по результативности и прочее. А если пойти ещё дальше, то можем определять влияние тех или иных характеристик на «дожитие» сотрудников (впрочем, это уже потребует известной сноровки и владения более сложными методами анализа типа регрессии Кокса).
Наконец, если взять в качестве исследуемого периода не три месяца, а, например, три года, и посмотреть на выживаемость персонала за этот период, то вы откроете для себя массу интересных инсайтов о жизненном цикле сотрудника в компании.
Безусловно, у этого метода, как и любого другого, есть свои ограничения и особенности, которые необходимо учитывать в работе с ним. Это и особенности анализа больших массивов данных, и интерпретация данных в конце наблюдений, и специфика регрессионных моделей при анализе дожития. Но, даже не погружаясь в эти детали, график Каплана-Мейера — это крайне полезный и легкодоступный инструмент, способный существенно расширить ваши возможности по анализу персонала компании. Ещё больше инструментов и методов доступно на курсе по HR-аналитике.
Комментарии (9)
DenSigma
18.10.2024 06:49Найм - это палка о двух концах. Здесь же налицо работодательский шовинизм. Сколько работников уволились не потому, что они не смогли адаптироваться, а потому что ваша компания (команда) не прошла требованиям соискателя?
Например у вас ни копейки нет анализа уволившихся по разным командам. Это в Яндексе-то? По позициям, по офисам, по адресам расположения.
wolodik
18.10.2024 06:49Вы выяснили, что половина новых сотрудников уходит через месяц работы. Построили линейный график количества увольнений от длительности работы, где тут хоть какая-то аналитика? "Чем дольше человек работает в компании тем больше вероятность его увольнения", это прям на шнобелевскую премию тянет.
eu_key Автор
18.10.2024 06:49Здравствуйте,
аналитика начинается там, где ставят вопросы )пример, который я привел выше: есть два источника кандидата, нужно понять какой источник обеспечивает нас кандидатами с более длительным сроком работы (очень актуально, например, для масс.подбора).
Постройте два графика по каждому из источников и сравните их.
вопрос - анализ - ответ.
Pavel_nobranch
18.10.2024 06:49полгода работаю в 1с. сегодня когда тестировщик вернул задачу снова, в голове заиграла песня Разбежавшись прыгну со скалы)))
AdrianoVisoccini
18.10.2024 06:49Как спрогнозировать вероятность увольнения сотрудника
не очень понятно на каком моменте мы получаем вероятность увольнения для конкретного сотрудника. Из графика можно увидеть абстрактную вероятность увольнения любого сотрудника по любым причинам в зависимости от... срока работы? И что это даёт? Я без графика могу сказать, что с увеличением срока вероятность увольнения возрастает, при бесконечно сроке вероятность увольнения будет стремиться к бесконечности, ибо физическая смерть работника неминуемо ведет к его увольнению. Вот это аналитика
eu_key Автор
18.10.2024 06:49Здравствуйте,
если коротко - на моменте анализа графика.
Да, вы можете сказать, что с увеличением стажа работы в компании вероятность увольнения возрастает, но вы не скажете на сколько. Не определите временные интервалы в которые такой риск резко возрастает, не скажете есть ли зависимость вероятности увольнения и источника кандидата (а она есть) и пр.
Так что в общем и целом - да, вы правы. Жизнь каждого из нас рано или поздно закончится, но есть нюансы )
kinall
Как-то уж слишком похоже на зависимость числа пиратов от глобального потепления. Найти зависимость - это даже не полдела, а хорошо если четверть. Надо ещё дать гипотезу, которая её обосновывает, и эту гипотезу как-то доказать. А графиков-то настроить можно много :)
Вот! Самый важный момент и самое сильно возражнение. Начиная с какой скорости найма ваш метод начинает работать устойчиво? Если у вас приходит 1-2 сотрудника в месяц, то все теренды потеряются во флуктуациях. А если, кстати, приходит не 1-2, а 20-30, то у вас большая компания, и все эти сотрудники приходят в разные не то что отделы, а департаменты, где могут быть ооочень разные условия, и опять тренды не будут ни о чём говорить.
В общем, идея интересная, но выглядит сугубо теоретической. Сферической, так сказать, в вакууме)
NeoNN
А разве нет зависимости числа пиратов от глобального потепления? Я вот смотрел фильм, называется "Водный мир"...
eu_key Автор
Здравствуйте,
спасибо за комментарий.
безусловно построение графика - это далеко не вся работа. И она не заменяет собой необходимость работы с гипотезами, анализ, проверку стат.значимости и пр. Но задача в рамках статьи была иной - рассказать про инструмент и сделать его максимально понятным для HR-специалистов.
График работает и при количестве наймов в 10-20 человек и при количестве 10,000-20,000 человек. Но, конечно, на разных массивах данных ваши выводы будут показывать разную устойчивость, вы правы.