Привет, меня зовут Евгений Кириёк, я — наставник на курсе по HR-аналитике в Яндекс Практикуме, автор книги «HR-аналитика. Путеводитель по анализу персонала» и канала «Аналитика в HR».

Что, если я скажу вам, что существует метод HR-анализа, который способен спрогнозировать вероятность увольнения сотрудника на испытательном сроке? Мало того, этот метод позволит вам оценить качество разных источников кандидатов, а ещё выявит проблемные места в процессе адаптации, оценит эффективность подбора и даст много других выводов о жизненном цикле сотрудника в компании. И для его использования вам необязательно иметь степень по математике или разбираться в анализе данных. Он доступен всем и каждому. Заинтригованы и хотите узнать больше? 

В таком случае я рад представить вам его величество График выживаемости.

График выживаемости, или график Каплана-Мейера (Kaplan-Meier plot), пришёл к нам из медицинских исследований и был разработан для оценки выживаемости пациентов в процессе лечения. Да-да, всё серьезно, врачи хотели понять, как то или иное лечение (или его отсутствие) влияет на выживаемость пациентов с течением времени. Позже этот метод стали применять в исследованиях как довольно универсальный инструмент по анализу конечных состояний процессов и вероятности их наступления. 

Ниже мы научимся строить график выживаемости на базе Excel и интерпретировать результаты наблюдений. Мы сознательно не будем использовать R, Python и более сложные стат. расчеты, для того чтобы сделать инструмент доступным для практиков без знаний в анализе данных.

Так для чего он мне нужен?

Этот метод применяется для очень разных задач, вот несколько из них:

  1. Оценка вероятности увольнения сотрудника с течением времени

  2. Оценка эффективности процесса адаптации в компании

  3. Оценка эффективности работы функции подбора

  4. Оценка качества источников подбора

  5. Расчёт средних показателей жизненного цикла сотрудника в компании и многое другое

Ладно, давайте рассказывайте

Начнём с простого. Предположим, вы хотите оценить качество работы функции подбора и адаптации. Для этого вы собрали информацию о наймах в компании за период в 3 месяца из одного источника кандидатов. При этом неважно, сколько сотрудник проработал фактически — все три месяца или один день. Получившийся массив данных представим в виде таблицы:

Пока ничего сложного: есть дата, когда сотрудник начал работать в компании, дата, когда покинул её, и количество недель, которые он отработал. Если сотрудник продолжает работать, у него не будет даты увольнения и количества отработанных недель. 

Теперь начнём расчёты. Для этого рядом построим ещё одну таблицу, которая будет иметь следующие поля:

сотрудник — это имя сотрудника, который уволился в период времени t;

время (t) — это порядковый номер недели, в которую произошло увольнение;

кол-во сотрудников (n) — это количество сотрудников, которые участвуют в нашем эксперименте в момент времени t;

кол-во уволившихся (d) — это количество уволившихся сотрудников в момент времени t;

доля сотрудников, переживших момент t (ft) — это расчётная величина. Её формула: (n-d)/n;

выживаемость, S(t) — это тоже расчётная величина. Её формула: f*S(t-1).

Начнём заполнять таблицу:

В первой строке время (t) будет равно 0 — эксперимент начался, а выживаемость равна 1 (или 100%).

В первую неделю (строка 3) у нас увольняется один сотрудник. Время (t) — это порядковый номер недели, он первый. Кол-во сотрудников в этот момент (то есть на первой неделе), за которыми мы наблюдаем, — 10 человек. Уволился из них на первой неделе — 1 человек. Доля сотрудников, переживших первую неделю работы: (10 – 1)/10 = 0,9 (или 90%). Выживаемость по формуле: 0,9*1,0 = 0,9 (или 90%).

Переходим к следующему уволившемуся (Сотрудник 10) на второй неделе и заполняем по аналогии всю таблицу, то есть по всем сотрудникам, которые уволились. Те, кто не уволился и доработал до конца эксперимента — трёх месяцев наблюдений, остаются как есть, с ними мы ничего не делаем. 

Фух. Вы всё ещё с нами? Отлично, самая сложная часть позади.

Теперь построим график. Выберем точечную диаграмму с прямыми отрезками. В качестве значения по оси X укажем время (t), в качестве значения по оси Y — выживаемость, S(t). А на выходе получим график выживаемости:  

Как читать этот график?

Ось Y — это доля сотрудников, которые продолжают работать в компании к моменту времени t. Ось X — это время (недели). С течением времени доля сотрудников, работающих в компании, уменьшается. К седьмой неделе график обрывается — это последнее увольнение, до конца эксперимента других увольнений не было. Все оставшиеся сотрудники продолжают работу.

Как его интерпретировать?

Даже в своём исходном виде этот график дает нам несколько интересных выводов:

  1. Половина новых сотрудников компании увольняется в течение первых 4 недель работы. Проблемы с адаптацией? Стоит разобраться и сформулировать гипотезу.

  2. Вероятность прохождения испытательного срока составляет всего 30%. Ещё один важный вывод. А это уже повод задуматься о качестве подбора. 

  3. Доля увольнений на пятой неделе работы резко возрастает и соответствует почти половине всех доживших к этому моменту сотрудников. Видимо, на пятой неделе происходит какое-то событие, которое резко снижает вероятность прохождения срока испытания. Какое и почему? Стоит проанализировать.

Все эти инсайты позволяют корректировать работу функции подбора и адаптации и дают возможность прогнозировать вероятность увольнения сотрудника из компании на любом этапе его работы (sic!).

Это всё?

Нет, это только начало. Ведь у наших сотрудников есть огромное количество характеристик, которые их определяют (пол, возраст, источник найма, должность и пр.) Так, например, если мы распределим всех исследуемых сотрудников по источникам найма, то сможем оценить качество каждого из источников: 

Теперь мы видим, что текучесть по источнику 2 в рассматриваемом периоде меньше, чем по источнику 1, а значит, источник 2 на этом отрезке времени более эффективен, чем источник 1.

Представьте, какое пространство для анализа нам это открывает. Мы можем анализировать разные категории сотрудников, сотрудников по полу и возрасту, по структурному подразделению, по результативности и прочее. А если пойти ещё дальше, то можем определять влияние тех или иных характеристик на «дожитие» сотрудников (впрочем, это уже потребует известной сноровки и владения более сложными методами анализа типа регрессии Кокса).

Наконец, если взять в качестве исследуемого периода не три месяца, а, например, три года, и посмотреть на выживаемость персонала за этот период, то вы откроете для себя массу интересных инсайтов о жизненном цикле сотрудника в компании.

Безусловно, у этого метода, как и любого другого, есть свои ограничения и особенности, которые необходимо учитывать в работе с ним. Это и особенности анализа больших массивов данных, и интерпретация данных в конце наблюдений, и специфика регрессионных моделей при анализе дожития. Но, даже не погружаясь в эти детали, график Каплана-Мейера — это крайне полезный и легкодоступный инструмент, способный существенно расширить ваши возможности по анализу персонала компании. Ещё больше инструментов и методов доступно на курсе по HR-аналитике.

Комментарии (9)


  1. kinall
    18.10.2024 06:49

    если мы распределим всех исследуемых сотрудников по источникам найма, то сможем оценить качество каждого из источников

    Как-то уж слишком похоже на зависимость числа пиратов от глобального потепления. Найти зависимость - это даже не полдела, а хорошо если четверть. Надо ещё дать гипотезу, которая её обосновывает, и эту гипотезу как-то доказать. А графиков-то настроить можно много :)

    особенности анализа больших массивов данных

    Вот! Самый важный момент и самое сильно возражнение. Начиная с какой скорости найма ваш метод начинает работать устойчиво? Если у вас приходит 1-2 сотрудника в месяц, то все теренды потеряются во флуктуациях. А если, кстати, приходит не 1-2, а 20-30, то у вас большая компания, и все эти сотрудники приходят в разные не то что отделы, а департаменты, где могут быть ооочень разные условия, и опять тренды не будут ни о чём говорить.

    В общем, идея интересная, но выглядит сугубо теоретической. Сферической, так сказать, в вакууме)


    1. NeoNN
      18.10.2024 06:49

      А разве нет зависимости числа пиратов от глобального потепления? Я вот смотрел фильм, называется "Водный мир"...


    1. eu_key Автор
      18.10.2024 06:49

      Здравствуйте,

      спасибо за комментарий.

      безусловно построение графика - это далеко не вся работа. И она не заменяет собой необходимость работы с гипотезами, анализ, проверку стат.значимости и пр. Но задача в рамках статьи была иной - рассказать про инструмент и сделать его максимально понятным для HR-специалистов.

      График работает и при количестве наймов в 10-20 человек и при количестве 10,000-20,000 человек. Но, конечно, на разных массивах данных ваши выводы будут показывать разную устойчивость, вы правы.


  1. DenSigma
    18.10.2024 06:49

    Найм - это палка о двух концах. Здесь же налицо работодательский шовинизм. Сколько работников уволились не потому, что они не смогли адаптироваться, а потому что ваша компания (команда) не прошла требованиям соискателя?

    Например у вас ни копейки нет анализа уволившихся по разным командам. Это в Яндексе-то? По позициям, по офисам, по адресам расположения.


  1. wolodik
    18.10.2024 06:49

    Вы выяснили, что половина новых сотрудников уходит через месяц работы. Построили линейный график количества увольнений от длительности работы, где тут хоть какая-то аналитика? "Чем дольше человек работает в компании тем больше вероятность его увольнения", это прям на шнобелевскую премию тянет.


    1. eu_key Автор
      18.10.2024 06:49

      Здравствуйте,
      аналитика начинается там, где ставят вопросы )

      пример, который я привел выше: есть два источника кандидата, нужно понять какой источник обеспечивает нас кандидатами с более длительным сроком работы (очень актуально, например, для масс.подбора).
      Постройте два графика по каждому из источников и сравните их.
      вопрос - анализ - ответ.


  1. Pavel_nobranch
    18.10.2024 06:49

    полгода работаю в 1с. сегодня когда тестировщик вернул задачу снова, в голове заиграла песня Разбежавшись прыгну со скалы)))


  1. AdrianoVisoccini
    18.10.2024 06:49

    Как спрогнозировать вероятность увольнения сотрудника

    не очень понятно на каком моменте мы получаем вероятность увольнения для конкретного сотрудника. Из графика можно увидеть абстрактную вероятность увольнения любого сотрудника по любым причинам в зависимости от... срока работы? И что это даёт? Я без графика могу сказать, что с увеличением срока вероятность увольнения возрастает, при бесконечно сроке вероятность увольнения будет стремиться к бесконечности, ибо физическая смерть работника неминуемо ведет к его увольнению. Вот это аналитика


    1. eu_key Автор
      18.10.2024 06:49

      Здравствуйте,
      если коротко - на моменте анализа графика.
      Да, вы можете сказать, что с увеличением стажа работы в компании вероятность увольнения возрастает, но вы не скажете на сколько. Не определите временные интервалы в которые такой риск резко возрастает, не скажете есть ли зависимость вероятности увольнения и источника кандидата (а она есть) и пр.
      Так что в общем и целом - да, вы правы. Жизнь каждого из нас рано или поздно закончится, но есть нюансы )