Для этого исследования мы спарсили около 2000 вакансий и резюме технических директоров (CTO) в РФ. Мы выделили основные отличия вакансий от резюме и определили, какие наиболее популярные слова используются в описании навыков, должностей и обязанностей. Мы построили карту навыков этой профессии. А главное – посмотрели, как работодатели и соискатели оценивают всё это в деньгах.
В выборку попали три основные категории специалистов: IT, офисные и производственные.
Структура статьи:
Скиллы в вакансиях и резюме.
Как устроены резюме внутри?
Фундаментальная разница вакансий и резюме.
Анализ вышел очень объемным – мы сделали интерактивные таблицы, чтобы у вас была возможность изучить все данные целиком. Вдруг найдёте что-то интересное?
Красной линией через все наше исследование проходит одна мысль: насколько же велика разница между спросом и предложением.
Но самый большой вопрос – что с этим делать? – мы оставим открытым.
1. Скиллы в вакансиях и резюме
Число навыков
Навыки – это специальные чипы, которыми описывают вакансию и резюме. И тут мы сразу видим полную асимметрию в распределении.
Вакансии либо не указывают навыки вовсе, либо ограничиваются небольшим числом.
Резюме нередко забивают список навыков до максимального числа в 30 штук – больше просто не позволяет сервис. Пустой список при этом почти никто не оставляет.
Угадаете, как количество описанных навыков влияет на зарплатные ожидания?
Ответ:
Да-да, резюме с 15 и более навыками стабильно просят больше денег, чем остальные! Мы ожидали, что будет наоборот.

Содержание навыков
Здесь посмотрим на популярные навыки с обеих сторон.
Для каждого навыка приведено количество и процент от всех вакансий или резюме. Процент нам ещё пригодится в будущем, потому что дальше мы сравним важность одних тех же навыков для вакансий и резюме.
Взглянем сперва на кандидатов.

Достаточно предсказуемо, что в топе оказались скиллы для highload.
Обратите внимание: мы также выводим три наиболее популярные пары к каждому из скиллов.
Теперь посмотрим на вакансии.

В вакансиях скиллы оказались немного попроще – Python, PHP и даже 1С.
При более детальном изучении кажется, что вакансии – максимально простые и общие. А резюме намного более конкретны, написаны более профессиональным языком.
Как думаете, какие языки в вакансиях упоминают чаще всего?
Ответ:

Такого мы не ждали: до сих пор лидирует PHP. Удивительно!
Нам, конечно же, интересно сравнить резюме и вакансии между собой, чтобы выявить скиллы с наибольшим спросом. Можно найти скиллы, которые активно ищут – а еще те, за которые готовы больше платить.
Для этого нам потребуется ввести новый индекс в данные.
Индекс соответствия – это сравнение частоты упоминаний навыка между вакансиями и резюме. Сравнивается именно доля, не общее количество.
Число показывает, во сколько раз одни превосходят других. Если число положительное, то преимущество у резюме, а если отрицательное – то у вакансий. Если оно равно единице, то навык распределен равномерно.
Мы специально переворачиваем слагаемые местами и делаем отрицательные значения, чтобы было удобнее считывать.

Ну что, все привыкли смеяться над 1С, а на него огромный спрос! Только, понятное дело, этим мало кто хочет заниматься.
Соотношение зарплат – еще один полезный индекс. Он устроен почти так же, как и индекс соответствия – только говорит нам о разнице в зарплатах.
Кстати, про 1С – а что вообще значит соотношение зарплат 1.3?
В нашем наборе данных резюме просят примерно вдвое больше, чем предлагают вакансии. На этом фоне разрыв в 1.3 раза – совсем маленький. Получается, рынок готов платить за 1С даже больше, чем в нормальных условиях. Спрос подкреплен оплатой – хотя это всё ещё не помогает.
Кстати, а че там по спросу на БД? Кто наименее популярен в вакансиях?
Ответ:

Тут все логично, MySQL никому не нужен. Напомним: положительный индекс соответствия говорит о том, что этот скилл ищут реже, чем предлагают.
Предлагаемая/желаемая должность
А мы продолжаем нашу увлекательную викторину!
Какие специалисты в этом наборе представляют самый неудовлетворённый спрос? (подсказка: речь про низкий разрыв зарплат одновременно с высоким разрывом соответствия)
Ответ:
Это производственники, PHP-разработчики, 1С, а также тимлиды.
У каждой из этих групп зарплатный разрыв значительно ниже рыночного, а ищут их как минимум вдвое чаще, чем предлагают.

2. Анализ резюме
Резюме предоставляют намного больше разнообразной информации, чем вакансии. Рассмотрим их отдельно.
Пол
Как вы думаете, какую долю в этих резюме занимают женщины?
Ответ:
Меньше трёх процентов. Как думаете, почему? Пишите в комменты!
Для контекста: среди резюме маркетинговых директоров женщины были представлены почти наравне с мужчинами.
Разделение на столицы и регионы, уровень английского

Что имеем в виду?
Столицами считаются Москва и Санкт-Петербург, а Регионами – остальные города.
Уровень владения английским указан в стандартной шкале CEFR (от А1 до C2) с рядом упрощений.
Хорошо, а что по зарплате?

Что выходит?
В регионах довольно мало специалистов с хорошим английским.
В столицах же совсем наоборот: те, кто не знает английский – в меньшинстве.
При этом в регионах на зарплатные ожидания значительно влияет только уровень C, а в столицах - рост более равномерный.
Образование


Что запомним отсюда?
Приводить некоторые разбивки по образованию не имеет смысла, поскольку PHD делят набор на слишком мелкие группы
Бакалавры и специалисты без высшего образования просят почти одинаково.
Магистры уже просят заметно больше, но более образованные коллеги с PHD в среднем просят столько же – разве что с увеличенным разбросом. Ну и зачем все эти страдания тогда?
Но что там с вузами?
Данных сравнительно немного, но мы можем посмотреть, как себя оценивают выпускники разных вузов.

Стоит отметить, что система указания вузов в сервисе несовершенна, из-за чего какие-то вузы могли не попасть в список. Мы не стали тратить на это время.
Прошлые работодатели
Где же куются эти специалисты?

Главные поставщики кадров – крупные компании связи.
В топе зарплат мы видим выходцев из банковской сферы и российских бигтехов. Удивительно, но в самом топе зарплат также есть WB – буквально единственный маркетплейс в этом топе.
Хуже всего себя оценивают те, кто раньше работал в связи, либо на себя.
3. Фундаментальная разница вакансий и резюме
Где лежит водораздел между вакансиями и резюме? В начале статьи мы посмотрели на навыки, и нашли много интересного. Если кинуть взгляд на опыт работы, то сперва всё покажется не менее серьёзным, но так ли это?
Опыт работы


Работодатели смотрят на это значение как на минимальное для этой должности, а кандидаты, скорее всего, указывают весь свой опыт – включая нерелевантный.
А что по оплате?


В вакансиях почти ничего интересного, можно отметить только четкие границы между группами.
А вот в резюме картина весьма неожиданная. Специалисты с опытом от 10 лет не повышают зарплатные ожидания, а при опыте 25+ ожидание даже ниже.
До высоких зарплат в резюме могут добраться почти все, но при опыте в 6-25 лет шансы выше.
Как распределяются навыки?
Чтобы выделить группы, мы выполнили кластеризацию с помощью алгоритмов UMAP и DBSCAN. На таком графике оси носят абстрактный характер, но точки сгруппированы в понятные кластеры.
Характеристики точек следующие:
Близость – схожесть содержимого: слова чаще встречаются вместе, имеют схожий зарплатный диапазон.
Размер – частота употребления слова в вакансии/резюме.
Цвет – средняя зарплата: чем темнее – тем выше.
Группы навыков в вакансиях

На этом графике видим несколько кластеров:
Самый нижний кластер – это явно производственные директора на предприятиях. Заметим, что этот кластер сильно отделен от остальных.
Поближе:

Чуть выше – тоже производственники, но переходящие к более “офисным” навыкам.
Поближе:

В самом верху видим кластер IT. MySQL и HTML оказались за его пределами, вероятно из-за сильной корреляции с другими навыками.
Поближе:

Слева – буквально кластер 1С. С одной стороны, мы не удивлены. С другой, не ожидали, что это выйдет настолько явно.
В центре видим более общие управленческие компетенции. А чем ближе к кластеру IT, тем больше терминологии из этой сферы.
Поближе:

Тем не менее, инструменты описаны очень поверхностно. А на контрасте с навыками резюме становится очевидно: IT – это не так просто, как думают HR. Это широкое разнообразие навыков и инструментов – порой совсем нишевых – а также довольно глубокое деление на специализации.
Посмотрим же на резюме!
Группы навыков в резюме

Навыков в резюме очень много, однако алгоритм вполне логичным образом показал топологию. Самые популярные навыки, которые образуют основу пяти больших направлений, UMAP разносит по краям холста.
Начиная с левого верхнего угла, двигаемся против часовой стрелки. Под кластерами 1, 3 и 5 есть спойлеры с картинкой поближе. На кластеры 2 и 3 мы посмотрим позже, отдельно.
1. Общие компетенции:

2. Менеджмент.
3. IT-разработка.
4. Системное администрирование:

5. Управление производством:

Про менеджеров и IT хочется отдельно отметить, что их структура разветвляется и образует несколько специализаций. Посмотрим поближе на эти два направления:

В левой части – различные скиллы менеджмента, разделённые на 4 кластера. Чем дальше мы уходим вправо и вниз, тем больше видим терминов из управления IT.
В самом же IT – в правой части графика – есть пять основных групп:
справа – общие инструменты и языки программирования;
чуть левее и ниже – highload, а также немного современного JS;
ещё левее – аналитики и архитектура;
внизу – самые преданные фанаты Microsoft;
вверху – самые поверхностные скиллы из веб-программирования (кажется, такое пишут, когда сказать совсем нечего).
Некоторые кластеры собрали в себе по две специализации, но даже так между ними обычно видна довольно понятная граница.
Вместо заключения
Мы могли бы бесконечно смотреть на таблицы и рассуждать, но пора заканчивать. И вместо заключения хочется еще раз сделать акцент на двух картинках со структурой навыков. Кандидаты и работодатели ищут друг друга, и их запросы должны быть похожими – но всё-таки они безумно разные.
А пока все ищут друг друга, мы в evilUnion делаем проекты с высоким performance и классным дизайном!
Комментарии (10)
Ivan22
12.12.2024 13:24То есть реально есть CTO с навыками "Настройка ПО, сборка ПК, виндовс 7" ???????
evilUnion Автор
12.12.2024 13:24Я так понимаю это не большая группа людей, которые настраивают технику в офисе или в более простых помещениях – рестораны, клубы. Названии их резюме и вакансий называется технический директор.
Когда мне было лет 20 и я работал звукорем в клубе, у меня был бос и все его звали технический директор. Он решал все вопросы по технике. Наказывал за битые микрофоны например)
Ради интереса решили не удалять таких и оставить, чтобы посмотреть как UMAP выведет их.Вот если в таблице вывести их скиллы Ivan22
12.12.2024 13:24ну очевидно же что это не те CTO, зачем портить статистику мешая все в кучу
evilUnion Автор
12.12.2024 13:24Не могу с вами согласиться. Их мало и они не пересекаются с теми CTО о которых вы говорите. Это хорошо видно на карте, они стоят там в отдельном кластере.
Я преследовал цель исследовать всех. Вычеркивать их мне показалось не правильным, хотя мысль такая была.
andyblaster
12.12.2024 13:24Забавно, что даже на уровне технических директоров в 1Ске все равно ищут по конкретным типовым решениям от вендора (УТ, ДО, БП), а соискатели заявляются в обобщенном виде (максимум, ERP-системы). Совпадает с эмпирическим ощущением от прохождения собеседований, когда очень формально и напрямую подходят к поиску сотрудников, первичным фильтром сразу отсеивая кандидатов, у которых нет упоминания нужных решений в резюме.
Таким страдают и крупные компании, типа Яндекса, как будто прямо так сложно перестроить на месте человека с немного параллельным опытом, но внутри той же экосистемы. Почему-то мантра "не учите фреймворки, учите архитектуру" тут не работает, хотя уж для CTO это точно фундаментальная ценность.
Oldju
12.12.2024 13:24Выводы не правильные. Хотя все на виду. Кандидаты - переоценивают себя на схлопнувшемся рынке. Я чётко понимаю, что выпал из рынка с уходом Майкрософт и HP. И даже не собираюсь обратно - Линукс на массмаркете - спасибо, кушайте сами. 1С - фирмы и предприятия с ИТ отделами под экономистами. Со всеми вытекающими. Экономия на железе и оплате. Тоже спасибо, за такие деньги и такой иерархии.
sunsexsurf
12.12.2024 13:24Было бы здорово увидеть какой-то гитхаб с сырыми данными. Кстати, по визуализации вопрос: а что использовали для heatmap? Это какой-то самописный дашборд? В остальных графиках явно видится plotly.
P.S. хотел было даже вам резюме отправить, но, как понял, команда сформирвоана )
Если у вас планируются еще такие исследования - дайте знать, хотел бы поучаствовать. Умею в ML и причинно-следственные связи.evilUnion Автор
12.12.2024 13:24Да можете написать, будем иметь ввиду) у нас идей миллион)
Решили написать свою таблицу на react для сайта. Потому что plotly в веб версии очень долго грузиться. И новая таблица пригодиться нам для другого внутреннего проекта просто.
SeApps
Крутая статья
Насколько я помню, по CTO такой разбор еще не делали
evilUnion Автор
Спасибо)