Привет, Хабр! Наша прошлая статья, в которой мы анализировали рынок вакансий и зарплат профессии «аналитик данных», была очень тепло встречена. Поэтому мы решили продолжить. Встречайте обзор российского рынка профессии дата-сайентиста.

Дата-сайентист — одна из самых быстрорастущих специальностей XXI века. По прогнозам компании Frost & Sullivan, рынок аналитики больших данных в ближайшие 10 лет будет расти в среднем на 35,9 % в год. 

В этой статье мы рассмотрим, сколько денег может получать дата-сайентист (спойлер: очень много), какие требования чаще всего есть в вакансиях, как прийти в DS и куда развиваться. Готовы? Поехали!





Кто такой дата-сайентист


Дата-сайентист занимается анализом массивов данных — Big Data. С помощью математического анализа и выявления закономерностей в данных специалист по Data Science создаёт модели для решения конкретных бизнес-задач или проблем.

По сути профессия дата-сайентист тесно связана с аналитик данных (Data Analyst или DA) и инженер данных (Data Engineer или DE). Настолько тесно, что в большинстве продуктовых компаний их вообще не разделяют. И специалист по Data Science часто берёт на себя обязанности DA и DE.

Но работа с Big Data все же имеет свою специфику и особенности. Распределение рабочего времени дата-сайентистов можно выразить диаграммой:


Машинное обучение — важная часть профессии дата-сайентиста. Нейросети становятся всё более популярными для анализа массивов данных, поэтому специалист должен уметь работать с ними.

Одной из главных целей является достижение бизнес-результата. Ведь именно с помощью Data Science разрабатываются прогнозирующие модели. Например, поведение пользователей в сети, курсов валют, стоимости акций и многое, многое другое. Именно дата-сайентисты разработали алгоритмы рекомендаций в YouTube и улучшают систему поисковой выдачи Google.

Что требуют работодатели от дата-сайентиста


Мы проанализировали свыше 400 вакансий на позицию дата-сайентиста, открытых в октябре-ноябре 2020 года.

Четкая граница между специальностями дата-сайентист, аналитика данных и инженера данных существует только у IT-компаний и крупных корпораций с большими IT-отделами. Поэтому в вакансиях дата-сайентистов часто попадаются задачи, которые больше соответствуют аналитику или инженеру данных.



В ходе анализа вакансий мы выделили ряд умений и навыков, которые работодатели чаще всего запрашивают у соискателей.

Для начала разберемся с хард-скилами


Высокие математические навыки. Высшая математика, теория вероятностей, математическая и прикладная статистика — это мастхэв для специалиста по анализу Big Data. Свыше 60 % вакансий прямо указывают на необходимость хорошей математической подготовки или же требуют диплом бакалавра или магистра университета по специальности математика, инженерия или информационные технологии. 

Python и библиотеки для анализа данных и машинного обучения. Python указан в 81 % вакансий. Также чаще всего работодатели требуют знание специальных библиотек: TensorFlow, Keras, PyTorch, LightGBM, NumPy, SciPy, Pandas, sklearn. 

В примерно трети вакансий работодатели указывают знание Python и/или R. Но конкретно R (без Python) запрашивают нечасто — всего 12 вакансий из 400. Другие ЯП требуются примерно в 3 % случаев. 

SQL. Базы данных — это основа работы DS. Поэтому навыки работы с реляционными базами нужны в более чем 73 % вакансий. NoSQL базы менее популярны — они нужны менее чем в 10 % случаев. 

Особняком стоит Excel. Он хоть и не входит в стек обязательных навыков, но некоторые компании выстраивают аналитику массивов данных именно в нем. Почему так — не ясно. Возможно, они просто путают функции аналитика данных и дата-сайентиста. 

Системы визуализации данных. Специалисту по обработке массивов данных важно не только создавать работающие модели и прогнозы, но и уметь представить это руководству. Желательно наглядно и максимально простым языком. Большинство компаний (55 %) просто указывают «системы визуализации данных» — для них абсолютно не принципиально, какими именно будет владеть соискатель. Но среди наиболее популярных всего три — Tableau, Metabase и Power BI.

Machine learning и Deep learning. Машинное обучение и глубокое обучение важны. Почти 40 % компаний отдельно подчёркивают, что соискателю нужно хотя бы в общих чертах понимать, как всё это работает и как использовать это в бизнесе.

Многие компании отмечают необходимость знания технического английского с уровнем не ниже Intermediate. Разговорные навыки зачастую не нужны, но вот техническую документацию почитывать придётся. Тем более что практически все новые разработки в Data Science выходят на английском, поэтому его нужно понимать хотя бы на среднем уровне. 

По хард-скиллам в целом это всё. Ну или почти всё, потому что другие варианты встречаются менее чем в 10 % вакансий.

Софт скилы


В целом они вполне ожидаемые. Вот наиболее распространённые из тех, которые запрашивают компании:

  • Аналитический склад ума;
  • Высокие коммуникативные навыки;
  • Способность проявлять инициативу;
  • Внимательность к деталям;
  • Ответственность и самостоятельность;
  • Многозадачность.

Зарплата и плюшки для Data Scientist


Теперь самое волнующее — зарплата и бонусы. По состоянию на 13.11.2020, в России открыто 325 вакансий на позицию Data Scientist. Из них 175 — в Москве (54 %), 54 — в Санкт-Петербурге (16 %). Остальные 30 % примерно равномерно распределены по региональных центрах.

Важно! Многие компании предлагают удалённую работу с зачислением в штат. В условиях карантина это выгодно. То есть при желании можно без проблем найти вакансию Junior Data Scientist в Москве, но при этом находясь в Воронеже или в Твери.

Правда, Middle и Senior специалисты чаще нужны оффлайн. Они получают больший уровень ответственности, поэтому компании всё еще предпочитают работать с ними в офисе.

Абсолютное большинство вакансий размещают IT-компании (78 %). Также дата-сайентисты нужны в банковской сфере (10 %) и образовательных проектах (8 %). Остальные отрасли занимают не более 4 % вакансий.

Основная проблема выборки — очень небольшое количество компаний указывают зарплатную вилку. Или хотя бы как-то ориентируют соискателя на уровень материальной компенсации.

Только 20 % компаний открыто указывают уровень зарплаты. Остальные же довольствуются расплывчатыми формулировками вроде «зарплата по рынку» или «обсуждается на собеседовании».

В открытых вакансиях уровень оплаты очень даже приличный. В Москве специалист с опытом в DS около 2лет может рассчитывать на среднюю зарплату около 200 000.

Senior Data Scientist с опытом от 5лет и широким стеком компетенций в крупных компаниях может получать до 500 000 рублей в месяц. И это не шутка. Такие вакансии есть и на них вполне себе нанимают людей.

А молодой Junior без опыта или с опытом до года может рассчитывать на зарплату до 100 000.

Дополнительные плюшки тоже довольно серьёзные. Стандартные «кофе-чай-печеньки» мы учитывать не будем — они есть почти в каждой вакансии.

Многие компании помимо онлайн-работы предлагают еще и гибкий рабочий график. Возможность дальнейшего обучения и повышения квалификации за счёт компании тоже популярна — примерно треть компаний согласна поддерживать сотрудника, если тот хочет развиваться в специальности.

Самым ценным бонусом, по нашему мнению, можно считать ДМС. Практически все крупные компании предлагают полную медицинскую страховку, а многие включают в неё и стоматологию. Московская медицина дорогая, поэтому лечение по страховке в хороших клиниках — это прекрасный бонус сотрудникам компании.



Питерский уровень зарплат немного отстаёт от московского. В северной столице Junior Data Scientist может рассчитывать на зарплату от 45 000 рублей. Максимум для специалиста без опыта или с опытом меньше года — 90 000 рублей. Тем не менее таких вакансий — единицы.

В среднем специалист с нормальным багажом знаний и опытом от 2 лет получает зарплату примерно 150 000 рублей. Но ведущие дата-сайентисты и тимлиды — это отдельная категория. Зарплата там такая же, как и в Москве, — доходит вплоть до 500 000 рублей в месяц.

Дополнительные плюшки почти одинаковые с московскими, разве что полную медицинскую страховку предлагают значительно меньшее количество компаний. Хотя чисто субъективно — нетривиальных и интересных бонусов больше.

Одни предлагают ежедневный турнир в дартс в обеденное время, другие — PlayStation, третьи — коллективные развлечения и разнообразный тимбилдинг.

Ситуация в других регионах России значительно хуже. И уровень зарплат разительно отличается от московских и даже питерских.

Неопытный специалист может рассчитывать на зарплату от 20 000 до 40 000 рублей. При этом на таких вакансиях сильнее всего смазаны границы профессий. Часто под названием вакансии «Data Scientist» ищут аналитика-эникейщика, который будет анализировать сразу все данные в компании. Некоторые HR-ы даже умудряются выставлять вакансии вроде «Разработчик Python — Data Scientist». Эдакий «мастер на все руки» в аналитике, и не только.

В целом же специалист с опытом может рассчитывать на зарплату примерно 100 000–120 000 рублей. Максимальная ставка в региональных центрах — 180 000 рублей. И таких вакансий — реально единицы.

Откуда прийти в профессию и куда расти аналитику массивов данных


Дата-сайентист действительно нуждается в хорошей математической подготовке. Он работает со сложными математическими моделями, поэтому хотя бы средний уровень высшей математики, теории вероятностей и статистики должен быть обязательно.

Это — одна из главных причин, почему лишь немногие специалисты попадают в сферу Data Science с нуля. Подтянуть необходимый математический базис можно и без университетской подготовки, но это сложно.

Чаще всего в Data Science уходят из аналитики данных. Data Analyst уже обладает практически всеми необходимым компетенциями и знанием специальных инструментов. Ему нужно подтянуть только математику и более прикладные области вроде машинного и глубокого обучения.

Python-разработчику тоже открыта дорога в Data Science. Большинство компаний требуют именно знания Python как ЯП для аналитики. Если есть хоть какая-нибудь математическая подготовка и знание SQL — вообще прекрасно.



Сейчас вся сфера Data Science находится в стадии активного роста, поэтому перспективы прекрасные. Профессионал высокого уровня может расти как вертикально, так и горизонтально. То есть можно вырасти в главу отдела Data Science, который, по сути, является вице-президентом компании, — его влияние на стратегическое планирование всей деятельности просто огромно. Или же можно попробовать себя практически в любой другой отрасли аналитики — бизнес-аналитика, продуктовая аналитика, аналитика программного обеспечения, системная аналитика.

Некоторые дата-сайентисты уходят назад в разработку на Python, но таких не слишком много. Можно попробовать и более интересные варианты — например, архитектура искусственного интеллекта для компьютерных игр. Возможностей хватает — проверьте сами:

image



Рекомендуемые статьи