Выгорание возникает вследствие несоответствия между целями человека и реальностью, что приводит к истощению ресурсов и снижению производительности труда.

Имея данные об отклонении ожиданий сотрудников компаний от реальности, поставим задачу спрогнозировать наличие выгорания у сотрудника. Будет предложен интерпретируемый метод машинного обучения, похожий на двухслойный персептрон, в котором все весовые коэффициенты имеют ясный смысл.


Исходные данные

Исходными данными для анализа являются обработанные результаты анкетирования сотрудников разных организаций. Выборка составляет 219 элементов, число входных признаков равно 29 – это оценки важности мероприятий сотрудниками (числа от 0 до 1), взятые со знаком плюс в случае реализации данного мероприятия в организации и со знаком минус в случае отсутствия мероприятия. Таким образом, чем выше признак, тем предположительно важнее он окажется для снижения общего уровня выгорания.

Было замечено, что при показателе выше 75 выгорание слабо сказывается на производительности труда. Поэтому приведем выходные данные к бинарным: скажем, что при показателе больше 75 выгорания нет (y = 1), а при показателе меньше 75 выгорание есть (y = 0).

Базовый метод

Проанализируем наши данные с помощью логистической регрессии. Кросс-валидация показывает среднее значение ROC-AUC-метрики 0.83, эта же метрика на итоговом тестировании составила 0.69.

Предлагаемый метод

На первом этапе находим главные компоненты исходных данных. На втором этапе производим дихотомизацию каждой главной компоненты по степени влияния на конечную точку (если компонента выше порога, то полагаем соответствующий признак равным 1, иначе 0). На третьем этапе бинаризованные данные подаются на вход логистической регрессии, прогнозирующей вероятность отнесения точки к классу «1».

Главные компоненты

Выделено 9 главных компонент со следующими долями объясненной дисперсии: 30%, 13%, 7%, 5%, 4%, 4%, 3%, 3%, 3%.

Дихотомизация

Для каждой главной компоненты находим два порога: один задает значение признака, равное 1, при значении главной компоненты выше порога, другой задает значение признака, равное 1, при значении главной компоненты ниже порога.

Все пороги находим из условия минимума энтропии. Для этого перебираем возможные значения порога, вычисляем матрицу неточности и расстояние Кульбака-Лейблера.

Итоговое прогнозирование

Обучаем модель логистической регрессии на бинарных входах. Кросс-валидация показывает среднее значение ROC-AUC-метрики 0.81, эта же метрика на итоговом тестировании составила 0.7.

Выводы

Несмотря на снижение количества признаков (18 вместо 29) и их дихотомизацию, не произошло заметного ухудшения качества модели по сравнению с базовой.

На рисунке показаны значения непрерывного показателя выгорания в зависимости от интегрального показателя (весовые коэффициенты найдены из модели множественной линейной регрессии).

Комментарии (8)


  1. FurySeer
    17.06.2024 10:05
    +5

    ИМХО: выгорание - очередной базворд, снискавший популярность, с одной стороны, среди тех, кому очень хочется показать себя деловыми и взрослыми безотносительно наличия и степени утомления/истощения, с другой - людьми, которые и вправду испытывают эмоционально-психические перегрузки, но слов, кроме "выгорел". почему-то не используют. Подчеркну, что существование такого феномена не оспариваю, однако пригораю от злоупотребления.

    Выгорание возникает вследствие несоответствия между целями человека и реальностью, что приводит к истощению ресурсов и снижению производительности труда.

    Но тут даже википедия против


    1. lapkin25 Автор
      17.06.2024 10:05

      Спасибо за комментарий. Из книги "Professional burnout: recent developments in theory and research" (1993):
      According to Maslach (1982a), "burnout is a syndrome of emotional exhaustion, depersonalization, and reduced personal accomplishment that can occur among individuals who do 'people work' of some kind" (p. 3). According to Pines and Aronson (1988), burnout is "a state of physical, emotional and mental exhaustion caused by long term involvement in situations that are emotionally demanding" (p. 9). According to Freudenberger and Richelson, this process is caused by failure to produce an expected and desired goal.
      Вообще выгорание является многомерной характеристикой.


  1. CrazyElf
    17.06.2024 10:05
    +2

    Жалко, кода нет. Столько загадочных слов, интересно как они решены кодом. Хотя бы на сколько фолдов была кросс-валидация можете сказать? )


    1. lapkin25 Автор
      17.06.2024 10:05

      Вот черновик. Фолдов 5.


      1. sunsexsurf
        17.06.2024 10:05
        +2

        коль скоро у вас есть черновик, то для вас пара предложений:
        1. оформить его в виде ноутбука в колабе (чтобы его можно было бы запустить и самому поиграться)
        2. добавить принципиальные куски кода в изначальную статью - было бы понятнее читать.


        1. lapkin25 Автор
          17.06.2024 10:05

          Хорошие идеи, но данные по выгоранию слегка не открытые. Вот если попытаться применить этот же метод, например, к данным MNIST (рукописные цифры), то интересно, какая получится точность.


  1. AndreySitaev
    17.06.2024 10:05

    "Выгорание" - дойная корова для айтишника, который накручивает свой бренд выступлениями на IT-конференциях. По первой попавшейся ссылке по запросу в Google "most popular topics on it conferences" первой в списке идет тема докладов "Mental Health and Wellness", пятой - "Productivity & WFH Work Methods Topics – Dealing with Overwhelm".

    Недавно вошел в IT, но уже хочешь выступить на конференции (на Хабре / в собственной компании)? Не знаешь, о чем написать? - пиши про выгорание.


  1. OBIEESupport
    17.06.2024 10:05

    А личики взяли спички, и к проекту подошли, исполнителей сожгли. Если по теме статьи - проект должен делиться на части, которые не могут сгорать, и не могут спалить никого вокруг. Более того, выгорание - это удел все-таки людей которые хоть как-то горят проектами. Берем исполнителей "посырее" - и костер затушен без всякого ИИ.