Рынок лимонов и барышни в мишуре

Современный найм болен экстремальным дисбалансом данных. У соискателя на руках только описания вакансий и надежда на лучшее, а у работодателя — служба безопасности, полиграф, ATS-системы и психологические тесты. Асимметрия чудовищная.

Фактически, это реализация экономической модели «Рынка лимонов» Джорджа Акерлофа в масштабе целой страны. Покупатель (соискатель) не может оценить качество товара (вакансии) до подписания оффера. Из-за этого рынок заполняется «лимонами» — предложениями, не отражающими действительность. Может, это будет "не так плохо", но точно не то.

Индустрия HR-tech работает строго в одну сторону: как «продать» кандидата.

Соискатель на рынке труда — товар с витрины, «размалёванная барышня» в мишуре. Резюме выверено, курсы пройдены, soft skills прокачаны, улыбка отрепетирована, комплименты компаниям заготовлены — всё ради того, чтобы понравиться «кавалеру».

А почему бы нам не перевернуть доску? Что там с «кавалерами»? Или мы живем в диснеевской сказке, где главное — выйти замуж (получить оффер), а то, что принц — абьюзер, замок — картонная декорация на болоте, а полцарства в ипотеке — выяснится уже после титров?

Рыночный перекос: в пылу сражения за звание «идеального кандидата» соискатель часто забывает проверить, а стоит ли сам «приз» этих усилий
Рыночный перекос: в пылу сражения за звание «идеального кандидата» соискатель часто забывает проверить, а стоит ли сам «приз» этих усилий

Я решила посмотреть на работодателей не с точки зрения эмоций, а с точки зрения данных и семантического анализа. Для валидации метода проанализировано 146 000 вакансий.

Теория: Текст как честное отражение системы

Я опиралась на три концепта теории коммуникаций:

  • Неявная культурная трансляция
    HR — невольный ретранслятор системы. Он является частью среды, частью культуры (будь то жесткая иерархия или управленческий хаос), поэтому она неизбежно просачивается в синтаксис. Вакансия превращается в честное зеркало реальности.

  • Противоречия по Бейтсону
    Когда в начале вакансии обещают «свободу и драйв», а ниже требуют отчеты каждые 15 минут — это диагноз. Руководство может видеть себя прогрессивным стартапом, а на деле строит цифровую тюрьму. Они сами в это верят, в этом и кроется настоящая беда.

  • Красивые слова вместо конкретики
    Чем меньше KPI и процессов, тем больше «уютных офисов». Избыток прилагательных — просто шумовая завеса. Система с дефицитом ресурсов или внятного управления, пытается замаскировать дыры словесным шумом.

Валидация: Кейс «Tech Startup X»

Лучший способ проверить инструмент — испытать его на себе. Я загрузила в систему вакансию своего крайне неудачного трудоустройства.

Это был мой личный «незакрытый гештальт». Перед тем как принять тот оффер, я, как продвинутый пользователь, прогнала текст через нейронки: Gemini, DeepSeek, ChatGPT. Я перестраховывалась. У всех вердикт был положительным: «Перспективное направление, амбициозные задачи, рост».

Через месяц было очень обидно. Вопрос стоял следующий: сможет ли новоиспеченный инструмент увидеть больше, чем ИИ-советчики? Увидеть то, что реально происходит внутри компании? Ну и заодно показать мне, что я не псих и этот бедлам не придумала — меня очень старались убедить, что это вообще-то норма.

Входные данные (Реальность):
Формально я выходила на позицию Product Manager. Фактически — кем угодно, ведь «всё так или иначе связано с продуктом»:

  • Операционные продажи: холодные звонки, сбор баз данных;

  • Контент и маркетинг: написание рассылок, анализ метрик сайта;

  • R&D: исследование рынка BIM-технологий;

  • Инженерная работа: задачи по Computer Vision и ML.

Вердикт алгоритма:
Система проанализировала исходный текст вакансии и выдала следующий профиль:

Рейтинг: ★☆☆☆☆ (1/5) | Статус: ? Critical Risk

 ? Вакансия-«комбайн»: Попытка совместить обязанности 3-4 разных специалистов.
 ? Риск выгорания: Объем задач математически гарантирует системные переработки.
 ? Неясность роли: Название должности не соответствует описанию задач.
 ? Размытые цели: Отсутствие оцифрованных KPI.
 ? Технологии: Подтвержденный стек (БПЛА, AI, Big Data).

«Для самых стрессоустойчивых. Подходит, если вы готовы к хаосу ради уникального опыта в портфолио. Требует предельно жестких вопросов на собеседовании»

Модель пометила это как «вакансию-комбайн». И проблема не в моей лени, а в том, что нельзя одной рукой делать холодные звонки, а другой писать код. На самом-то деле всё можно, но это неизбежно приводит к «ловушке эффективности». Я оптимизировала процессы настолько, насколько это было возможно, но человек, не знакомый со спецификой задачи, видя, что сотрудник быстро справляется, начинает считать её элементарной. Кто выдержит — тот не я.

Особенно за зарплату стажера на полставки и под соусом: «Скажи спасибо, что мы рискуем и доверяем тебе такие важные задачи». Я не выгорела. Я пошла разбираться. И в процессе выяснила, что генеральный директор сам не знает, куда движется компания, а сроки ставятся наугад. Ну а потом уже выгорела и ушла.

Парсинг смыслов: структура данных

При исследовании рынка обычно смотрят на зарплаты, заголовки и навыки. Простые ключевые слова не работают, русский язык синтетический, а контекст решает. Именно поэтому я пропустила 146 тысяч вакансий через инструмент на основе семантического анализа.

На выходе каждая вакансия превращалась в структурированный JSON-объект. Вот упрощенная структура данных, которую формирует система:

  1. Блок метаданных (meta): Базовая атрибуция вакансии: грейд (Junior/Senior), отрасль и первичная классификация.

  2. Анализ рисков (screen_1_risks): Массив выявленных флагов. Алгоритм классифицирует флаги по типамred, yellow,green, добавляя пояснения для каждого флага.

  3. Культурный профиль (screen_2_culture): Векторное распределение по модели конкурирующих ценностей (CVF). Определяется процентная доля каждого архетипа: Рынок, Иерархия, Адхократия, Клан.

  4. Индекс Токсичности (toxicity_index): Расчетный показатель. Это сумма весов всех выявленных рисков согласно иерархической модели оценки риска и п��лезности. На его основе формируется итоговый рейтинг из блока метаданных.

Полная методология и датасет лежат на GitHub.

Эволюция индекса токсичности

В контексте исследования «токсичность» — это технический термин, а не моральная оценка.
Измеряется совокупность рисков, зафиксированных в тексте (размытые роли, асимметрия ответственности, скрытые переработки).

Первое, что приходит на ум: просто просуммировать сигналы. ? Red Flag = 1.0, ? Orange Flag = 0.5. Но в этом случае мы получаем «аномалию двух горбов»: 65,6% рынка сливаются в неразличимую массу.

Аномалия невзвешенного индекса. Без весовых коэффициентов рынок выглядит как бесформенная масса. Эти пики — визуализация «серого болота», где критические проблемы теряются на фоне общей массы описаний
Аномалия невзвешенного индекса. Без весовых коэффициентов рынок выглядит как бесформенная масса. Эти пики — визуализация «серого болота», где критические проблемы теряются на фоне общей массы описаний

Чтобы увидеть реальность, мы ввели матрицу весов рисков (W_{cat} от 5 до 10 баллов):

Toxicity\_Index = \sum_{i=1}^{n} (W_{cat}^{(i)} \times S_{sev}^{(i)})

Где:

  • W_{cat} (Вес): Значимость риска (5–10 баллов).

  • S_{sev} (Тяжесть): 1.0 для красных флагов, 0.5 для рыжих.

Матрица весов (W):

Распределение весов иерархической модели оценки для различных категорий риска
Распределение весов иерархической модели оценки для различных категорий риска

График трансформируется в классическое нормальное распределение (колокол) со сдвигом в зону умеренной токсичности (медиана ~28 баллов).

Распределение взвешенного Индекса Токсичности. После применения весовой матрицы график принимает форму нормального распределения. Смещение пика вправо (медиана ~28 баллов)
Распределение взвешенного Индекса Токсичности. После применения весовой матрицы график принимает форму нормального распределения. Смещение пика вправо (медиана ~28 баллов)

Красиво, и перевести в рейтинг от 1⭐ до 5⭐ удобно. А главное — я уже дважды всё от начала до конца пересчитала, проанализировала и даже написала эту статью. Так в чем проблема? Очень умная мысль зачем-то решила посетить мою голову, и, увы, игнорировать её было невозможно.

Риски будут отличаться по значимости для каждой культуры. Что нормально для стартапа, может быть токсичным для крупной корпорации. Не учитывать культурный профиль компании было непростительной ошибкой. Теперь индекс токсичности считаем с учетом культурного типа:

Toxicity\_Index = \sum_{i=1}^{n} (W_{cat}^{(i)} \cdot S_{sev}^{(i)} \cdot M_{cult}^{(i)})

Где:

  • W_{cat} (Базовый вес): Значимость категории риска (от 5 до 10 баллов).

  • S_{sev} (Множитель тяжести): 1.0 для критических рисков (Red Flags), 0.5 для умеренных (Orange Flags).

  • M_{cult} (Культурный модификатор): Коэффициент, определяющий, как среда компании усиливает или гасит риск (от 0.7 до 1.3).

Матрица Культурного Резонанса. Тепловая карта коэффициентов
Матрица Культурного Резонанса. Тепловая карта коэффициентов

Сравним статическую оценку (розовый график) и динамическую с учетом культуры (фиолетовый):

Распределение вакансий по Индексу Токсичности (TI). Сравнение результатов статической оценки (анализ суммы взвешенных рисков в тексте) и динамической оценки, учитывающей культурный профиль компании.
Распределение вакансий по Индексу Токсичности (TI). Сравнение результатов статической оценки (анализ суммы взвешенных рисков в тексте) и динамической оценки, учитывающей культурный профиль компании.

Что мы наблюдаем:

  • Сдвиг пика вправо: Средняя вакансия на рынке токсичнее, чем кажется на первый взгляд.

  • "Геометрия" рынка: перешли от размытого холма к острому пику, появились четкие зубцы — мы увидели структуру токсичности.

  • Тяжелые хвосты: Зона экстремального риска (справа) стала более выраженной.

На основе итогового распределения строим шкалу рейтинга:

Индекс (TI)

Рейтинг

Статус

Доля

Смысл

0.0 — 15.7

⭐⭐⭐⭐⭐

Safe

10%

Элита адекватности

15.7 — 22.5

⭐⭐⭐⭐

Good

20%

Здоровая среда

22.5 — 27.8

⭐⭐⭐

Swamp

40%

Серое болото

27.8 — 32.5

⭐⭐

Grinder

20%

Риск выгорания

32.5+

Hell

10%

VETO / Ад

Максимальный индекс в датасете: 63.4 балла.

Поскольку не существует объективного эталона «идеальной» вакансии, прямое сравнение объема «плохих» и «хороших» предложений не имеет смысла. Рейтинг в данном случае — это инструмент сегментации. Мы разделяем рынок на категории, чтобы вакансии можно было сопоставлять внутри их групп или противопоставлять друг другу.

Почему это всё не столь очевидно

Возможности для такого анализа появились совсем недавно. Технологии, способные понимать контекст, стали доступны массово буквально пару лет назад.
Но идея подобного аудита разбивается о бизнес-модель. Большинство HR-сервисов работают в B2B-сегменте. Их клиент — работодатель. Метрики успеха — скорость найма и количество откликов. Компании не будут платить за инструмент, который анализирует работодателя для соискателя.

Рынку выгодно «упаковывать» кандидатов, а не проверять нанимателей.

Инструменты на основе семантического анализа не сделают рынок труда справедливым. Работодатели вдруг не станут писать правду (они и сами её часто не знают) и уж тем более не будут платить много, чтобы сотрудники работали мало. Такой инструмент не найдёт «ту самую» идеальную вакансию. Это не волшебная палочка.

Но он позволит увидеть риски, которые раньше были скрыты. В системе, где цена ошибки измеряется месяцами жизни, это достаточный аргумент, чтобы перестать верить красивым словам и начать смотреть вглубь структуры.

Комментарии (0)