Привет, Хабр! Меня зовут Ольга Матушевич, я наставница на курсе «Аналитик данных» в Практикуме. Чтобы актуализировать программы и формулировать более точные обещания относительно трудоустройства, мы исследуем как кейсы выпускников, так и ситуацию на рынке.
Я проанализировала 1 239 вакансий аналитиков данных, размещённых на сайте hh.ru с февраля по май 2024 года включительно, и хочу поделиться с вами полученными результатами.
Кого ищут?
Значительная часть вакансий называется "Data analyst" или «Аналитик данных». Но встречаются и другие формулировки. Например:
«Ведущий аналитик данных отчётности по продуктам благосостояния» (в сфере инвестиций и страхования);
«Аналитик данных в отдел планирования и прогнозирования»;
«Академический руководитель программы "Аналитик данных" в Центре непрерывного образования».
Среди вакансий встречались предложения с названием и описанием на английском языке, но таких меньшинство — всего 13 вакансий из 1 239.
Какой опыт требуют?
Распределить предложения для кандидатов по грейдам можно двумя способами: по названию вакансии или по специальному полю, где уровень опыта указывает работодатель. У каждого подхода есть ряд проблем.
Так, грейд в названии вакансии может отличаться от привычных junior, middle и senior — встречаются варианты junior (middle) или middle-senior. Или может быть разделение, например, «старший» и «ведущий». Причём количество вариантов с промежуточными грейдами слишком мало, чтобы выделять их в отдельные группы. Но и игнорировать их также невозможно.
Если ориентироваться на специальное поле, то можно столкнуться с более-менее единой градацией:
junior (без опыта);
junior+ (с опытом от одного до трёх лет);
middle (с опытом от трёх до шести лет);
senior (с опытом от шести лет).
Эта система может не совпадать с градацией в названиях вакансий. Например, большинство желающих нанять синьора не требуют от него шести лет опыта. Поэтому в распределении применялся ручной подход, при котором я старалась определить грейд по названию вакансии, а если не получалось — ориентировалась на специальное поле с уровнем опыта.
Выводы из графика:
Чаще всего работодатели готовы нанять специалистов уровня middle и junior+.
ДжуныСиньоры не нужны? Может быть, причина именно в этом, и рынку нужно не так много высококлассных специалистов. Но может, таких специалистов просто ищут не через объявления на hh.ru.Джуны всё-таки нужны. Но кандидатам с минимальным опытом уже намного легче найти работу — и выбор больше, и конкуренция ниже. Поэтому наиболее грамотная стратегия для начинающего специалиста — изо всех сил добирать этот опыт через стажировки, пет-проекты и хакатоны.
Какой график и тип занятости предлагают?
Большая часть работодателей хочет видеть сотрудника в офисе. Удалённую работу предлагают всего в 17,6% вакансий. Сменный и гибкий графики у работодателей не популярны.
Распределение зависит от грейда — чем больше опыт у специалиста, тем больше у него возможностей найти удалённую работу. Но количество офисных вакансий в любом случае преобладает.
По результатам исследования можно смело заявить, что работодатели на hh.ru почти не ищут стажёров, а также аналитиков данных на проектную или частичную занятость. Я нашла 1 215 вакансий с полной занятостью, 12 с частичной, две с проектной, а также 10 предложений стажировок.
Сколько платят?
Наиболее честный ответ на этот вопрос — я не знаю. Причина — огромное число вакансий без указанной зарплаты.
Работодатели на hh.ru могут указать зарплату в двух полях: «зарплата от» и «зарплата до». И доля пропусков в этих столбцах составила больше 80%. При таком объёме пропусков бессмысленно пытаться восстановить все отсутствующие значения.
Благодаря тому, что часть работодателей указывает обе границы заработной платы, а часть — только одну из границ, удалось восстановить часть значений. Коэффициент корреляции Спирмена значений «зарплата от» и «зарплата до» равен 0,93. Грубо говоря, это значит, что ряду вакансий с нижней границей в 50 000 рублей будет соответствовать одинаковая верхняя граница, допустим, в 70 000 рублей (данные взяты исключительно для примера). Такая сильная корреляция позволила использовать метод линейной регрессии для восстановления части пропусков — и подставлять условные 70 000 рублей в вакансии со значением «зарплаты от» в 50 000 рублей и без значения «зарплата до». После применения метода линейной регрессии долю пропусков в обоих столбцах удалось сократить до 76,84%.
Затем я рассчитала средние зарплаты (далее — просто зарплаты) по вакансиям по формуле:
Средняя зарплата = («зарплата от» + «зарплата до») ÷ 2 |
Минимальная зарплата равна 26 000 рублей — грусть, тоска, печаль. Радует, что такие «щедрые» предложения единичны. Медианная зарплата — 110 000 рублей, средняя — 130 000 рублей.
Максимальная зарплата — 420 000 рублей. Платить «в среднем» именно столько обещает фандрайзинговая платформа Fundraise Up своему будущему Data Analyst (middle/senior). Зарплата указана в долларах и была переведена в рубли по актуальному на момент выгрузки курсу. Печалит, что такие предложения не просто единичны — для рынка они являются выбросами.
А как зарплата зависит от грейда?
Во-первых, чем выше грейд, тем реже в вакансиях встречается указание зарплаты. Мы более-менее понимаем, сколько платят джуниорам, но почти не видим зарплату синьоров, особенно учитывая малое число вакансий для старших специалистов в исходных данных.
Во-вторых, зарплата с ростом грейда увеличивается. Если медианная зарплата джуниора — 73 000 рублей, то у джуниора+ — уже 101 000 рублей, а у мидла — 177 000 рублей. Медианная зарплата синьора рассчитана как 240 000 рублей. Хочу ещё раз подчеркнуть, что эти цифры являются весьма условными, так как большая часть вакансий размещена без указания заработной платы.
Где нанимают?
В нашем датасете есть вакансии из 64 городов России.
Большая часть рабочих мест находится в Москве. Вторым по количеству вакансий городом является Санкт-Петербург. Количество вакансий в каждом из остальных городов незначительно.
Кто нанимает?
В нашу выборку вошли вакансии от 561 работодателя. Ниже можно увидеть вакансии от 12 работодателей с наибольшим количеством вакансий.
Впереди всех с 13% от общего количества вакансий находится не IT-компания, а банк — IT-компаний в принципе почти нет в топе. Единственное исключение — Т1 с 14 вакансиями. Яндекс с девятью вакансиями в рейтинг не попал. Вывод: аналитики данных сейчас нужны не только и не столько в IT-компаниях. Их активно нанимают банки, маркетплейсы, государственные и муниципальные организации, розничный ритейл и компании из других секторов экономики.
Какие навыки наиболее востребованы?
Для выявления самых востребованных навыков я учитывала содержимое как поля «Ключевые навыки», так и описания вакансии в целом. Получился такой рейтинг наиболее часто упоминаемых скилов.
Посмотрим на результаты повнимательней.
В битве Python и R уверенно побеждает… SQL. Уточню, что знанием языка R интересовались в 10 вакансиях. Чтобы конкретизировать требование SQL, я отдельно проанализировала частоту упоминания СУБД и получила следующие результаты.
СУБД |
Количество упоминаний |
Без уточнения |
545 |
PostgreSQL |
195 |
MS SQL |
101 |
Oracle |
95 |
My SQL |
34 |
NoSQL |
10 |
Остальные СУБД упоминаются менее 10 раз каждая.
Как мы видим, сумма упоминаний SQL во всех вариантах совершенно не равна 680 упоминаниям из графика выше. Значит, часть работодателей, даже указывающих конкретный вид СУБД, считают это просто уточнением и готовы рассматривать кандидатов с опытом работы в других СУБД. Если говорить о самых популярных СУБД, которые используют язык SQL, то это PostgreSQL и MS SQL.
Говоря о Python, стоит обсудить наиболее востребованные библиотеки.
Библиотека |
Количество упоминаний |
pandas |
217 |
numpy |
178 |
matplotlib |
73 |
scipy |
53 |
seaborn |
50 |
plotly |
35 |
pytorch |
24 |
tensorflow |
23 |
requests |
13 |
flask |
11 |
Все остальные библиотеки требовались менее чем в 10 вакансиях.
Посмотрим внимательно на навык создания дашбордов. Работодатели чаще всего конкретизируют, в какой именно программе придётся работать кандидату.
ПО |
Количество упоминаний |
Power BI |
368 |
Tableau |
194 |
QlikView |
76 |
Yandex DataLens |
73 |
Google Data Studio |
17 |
Возможно, из-за блокировки части инструментов этот список изменится в ближайшем будущем.
Следующую строчку по хардскилам делят Microsoft Excel и Google Таблицы. Если сравнивать их между собой, то Excel встречается в вакансиях чаще — 179 упоминаний против 26 у Google Таблиц. Также упоминаются конкретные инструменты и подходы: сводные таблицы — 33 раза, VBA — 19 раз и ВПР — 10 раз.
Пункт «Математика» из списка навыков также можно конкретизировать по числу упоминаний в вакансиях.
Область математики |
Количество упоминаний |
Математическая статистика |
123 |
Математический анализ |
37 |
Математическое моделирование |
14 |
Отдельно можно разобрать группу soft skills — вот какие «мягкие» навыки требуют работодатели чаще всего.
Софтскил |
Количество упоминаний |
Аналитическое мышление |
398 |
Умение работать с большим объёмом информации |
134 |
Навык коммуникации |
108 |
Проактивность |
27 |
Навык деловой коммуникации |
20 |
Навык ведения переговоров |
13 |
Креативность |
10 |
Умение принимать решения |
10 |
В целом можно сказать, что работодатели не выдвигают в вакансиях обширного списка требуемых «мягких» навыков.
Остальные навыки из числа самых востребованных не являются «укрупнёнными» — и потому их невозможно разобрать на составные части.
Как различаются требования к навыкам в зависимости от грейда?
Проанализируем количество навыков, указанных работодателями.
График медианного количества требуемых навыков для каждого грейда получился довольно скучный — все требуют от четырёх до шести навыков. Никаких сверхвысоких требований для синьоров не обнаружено.
Средние значения для грейдов также колеблются в диапазоне четырёх–семи навыков. Наибольшая вариативность в количестве требуемых навыков у вакансий для джуниоров+ — от одного до 34. Но это связано не с реальным количеством требований, а со степенью подробности описания навыков. Например, в списке можно указать просто Python, а можно расписать, знание каких именно библиотек Python требуется. И тогда каждая библиотека будет считаться отдельным навыком.
Небольшой практический совет — кажется, не зря в одной заблокированной на территории Российской Федерации социальной сети для установления профессиональных контактов предлагают указать пять ключевых навыков. Это правило можно перенять и в резюме, ограничиваясь четырьмя–шестью навыками.
Рассмотрим списки скилов для разных грейдов подробнее. Последовательность тех или иных навыков может отличаться, но сам набор в зависимости от уровня опыта обычно не меняется.
Что можно увидеть на графиках:
Python, SQL, умение строить дашборды, знание Git и математики, а также софтскилы всегда крайне востребованы.
Джуниорам важно знать Excel. С ростом грейда актуальность этого навыка падает.
Начиная с грейда джуниор+ от кандидатов ожидают умения работать с Airflow.
Подводим итоги. Как аналитику данных искать работу и развиваться в профессии?
В заключение хочется дать рекомендации по поиску работы для специалистов всех грейдов.
Универсальный совет
Указывайте в резюме четыре–шесть ключевых навыков.
Советы для джуниоров
В первую очередь учите SQL (лучше PostgreSQL или MS SQL) и Excel. К счастью, оба этих навыка можно освоить за пару месяцев и иногда даже на бесплатных курсах. Либо в начале длинных (от полугода) платных курсов. Только за их знание вас могут нанять — хотя выбор вакансий будет довольно узким.
Освоив SQL с Excel и начав рассылать резюме, вы можете приступить к изучению Python и BI-систем (лучше начать с Power BI или Tableau) для построения дашбордов. Это сильно расширит количество подходящих вакансий.
Переезжайте в Москву. Или в Питер. Удалённую работу вам будет сложно найти, а большинство вакансий в офисе сосредоточено именно в этих городах. Да, я понимаю, что соотношение количества соискателей к количеству вакансий важнее просто количества вакансий. Но если в вашем городе количество предложений для джунов равно нулю, стоит задуматься о переезде.
Развивайте аналитическое мышление и навык коммуникации. Что бы это ни значило.
Повышайте свой грейд. Хотя бы до джуниора+. Для этого выполняйте пет-проекты, участвуйте в хакатонах и стажировках.
Изучайте математику. В первую очередь математическую статистику и математический анализ.
Советы для джуниоров+
Сконцентрируйтесь на изучении Python — теперь он для вас важнее, чем Excel.
Продолжайте развивать свои навыки в BI-системах и SQL.
Помните, что «мягкие» навыки для вас всё ещё важны.
Начните изучать теорию по базам данных. Просто писать запросы уже недостаточно.
Если уж вы целый год отработали аналитиком, можете смело писать в резюме, что знаете Confluence.
Советы для мидлов
Советы на этом уровне перестают быть простыми. Самое главное — вам нужно решить, хотите ли вы и дальше быть аналитиком данных или уйти в смежную сферу. Если вы всё ещё хотите развиваться в профессии, то развивайте навыки, которые требуют в вакансиях для синьоров.
Даже если вы остаётесь аналитиком данных, скорее всего, вам всё равно придётся начать изучать смежные области. Для этого вы можете разобраться в основах машинного обучения или изучить элементы бизнес-анализа, чтобы эффективнее интерпретировать результаты и предлагать ценные инсайты для бизнеса. Будет полезно пройти курс по алгоритмам — требования к знанию Python на этом и следующем уровне существенно повышаются.
На этом уровне сложно построить универсальную программу обучения, поэтому присмотритесь к небольшим курсам — индивидуальная комбинация из нескольких программ будет полезнее, чем одна, но универсальная.
Советы для синьоров
Вы уже синьоры, что вам можно посоветовать? Продолжайте делать то, что делали, — у вас здорово получается.
Комментарии (2)
Merkan
05.06.2024 07:30Нраица, как хх.ру в график работы ставит "Удаленная работа" рядом с полным рабочим днем, частичной занятостью и т.д. Ну и автора это не смутило. :)
sshmakov
Сразу видно, когда профессиональный аналитик данных анализирует данные вакансий. Отделила мух от котлет.