Академия больших данных MADE и HeadHunter опубликовали совместное исследование «Портрет российского Data Scientist» со статистикой вакансий для специалистов этой профессии в 2015?2019 годы.

Судя по цифрам, рынок переживает настоящий бум. В 2018 году количество вакансий с упоминанием специальности data scientist выросло в семь раз по сравнению с 2015 годом, а вакансий с ключевыми словами machine learning — в пять раз. В интернет-компаниях и IT дата-сайентистам предлагают медианную зарплату 145 000 руб., а в в сфере услуг для бизнеса — 170 000 руб. В последнем случае речь идёт об анализе больших массивов данных, в том числе алгоритмами машинного обучения, чтобы выявить полезные для бизнеса закономерности, которые не очевидны для человеческого мозга.

На диаграмме выше показаны ключевые навыки, указанные в резюме специалистов по данным. Всего проанализировано 5500 вакансий и 8000 релевантных резюме и из общей базы 36,2 млн резюме.

Навыки


Среди ключевых навыков специалисты по Data Science указывают в резюме следующее:

  • Python (74%)
  • SQL (45%)
  • Git (25%)
  • Data Analysis (24%)
  • Data Mining (22%)

Те специалисты, которые в резюме пишут о своей экспертизе в машинном обучении, также упоминают владение Linux и C++.

Самые популярные языки программирования:
  • Python
  • C++
  • Java
  • C#
  • JavaScript

Дефицит специалистов


Специалисты по машинному обучению в дефиците – всего три резюме на одну вакансию. У специалистов по данным ситуация чуть лучше: в среднем, шесть резюме на вакансию, рассказал представитель HeadHunter. По его словам, вакансия не считается дефицитной, если на неё приходится восемь и более резюме.

Традиционно новые профессии сначала осваивают мужчины, а за ними приходят женщины. Сейчас 81% дата-сайентистов — мужчины. Больше половины соискателей — специалисты в возрасте 25-34 лет. Интересно, что среди женщин-соискателей почти 40% — это молодые девушки в возрасте 18-24 лет.

Старше 45 лет кандидатов на рынке практически нет (всего 3%). Эксперты считают, что соискатели с большим опытом работы реже размещают свои резюме на крупных поисковых ресурсах и чаще находят работу по рекомендациям. Но и количественно их тоже меньше.



Больше половины вакансий (60%) и соискателей (64%) находятся в Москве. Специалисты востребованы также в Санкт-Петербурге и Татарстане (3% и 8%). Доля остальных регионов по специалистам не превышает 4%, а по вакансиям — 2% от общего количества.

«Дата-сайентисты занимают особое положение на рынке труда в сфере IT, благодаря неизменно растущему спросу со стороны компаний-работодателей, — говорит Мария Игнатова, руководитель Службы исследований компании HeadHunter. — Именно поэтому они стали объектом нашего совместного с Академией больших данных MADE исследования. В нём мы постарались рассмотреть эту профессию с разных фокусов, в том числе по востребованности, навыкам, образованию, чтобы составить максимально объективный портрет российского дата-сайентиста и привлечь в эту профобласть как можно больше талантливой молодёжи. Более того, результаты нашего анализа станут полезным референсом для корпоративных образовательных платформ, таких как Школа программистов hh.ru и Академия больших данных MADE, в подготовке специалистов на основе реальных требований и задач бизнеса».

Спрос на специалистов по данным растёт в банках, торговле, телекоммуникациях. Например, в Ozon отдел Data Science в 2018–2019 гг. расширился втрое, подтвердил руководитель направления Data Science в Ozon Ксения Бокша.

В электронной коммерции анализ данных напрямую связан с прибылью, а результат применения алгоритмов можно измерить непосредственно в долларах (или рублях) сразу после внедрения с помощью A/B-тестирования. Ozon применяет машинное обучение для системы персональных рекомендаций и при сборе заказов в логистическом центре, а аналитику данных — в закупках. Стоимость ошибки в 1% при ассортименте в 2,5 млн товарных наименований может обойтись компании в 10 млн руб., говорит Букша.

«Ведомости» также приводят примеры использования data science в других отраслях:

  • Операторы связи. В «Мегафоне» анализом данных занимается около 200 человек. За два с половиной года команда выросла в несколько раз. Она занимается оптимизацией тарифов, определяет оптимальное расположение магазинов, прогнозирует товарные запасы и т. д.
  • Банки. «Тинькофф» рассказал, что у них с клиентами общается чатбот, который помогает экономить до 50 млн руб. в месяц на зарплате ставших ненужными специалистов из службы поддержки. Бот самостоятельно обслуживает 30% обращений клиентов в чате и помогает операторам с остальными 70% запросов.

    Банк ВТБ тоже с начала года активно ищет и нанимает специалистов в области машинного обучения и аналитики данных.

Например, в Mail.ru Group такие специалисты нужны везде, где требуется обрабатывать текстовые данные, картинки, видео, заниматься синтезом и анализом речи — в почтовых и облачных сервисах, социальных сетях, играх, электронной коммерции, рассказал в комментарии «Ведомостям» вице-президент Mail.ru Group по персоналу и образовательным программам Дмитрий Смыслов. Число таких сотрудников за последние два года в компании выросло почти втрое, а за восемь месяцев 2019 г. компания наняла примерно столько же специалистов по анализу данных, сколько за весь 2018 год.

Эта статистика подтверждается цифрами из исследования: действительно, в первом полугодии 2019 года спрос на специалистов по Data Science составил 65% от спроса за весь 2018 год.



Представитель Huawei тоже сказал, что за 2018 год и в особенности 2019 году потребность в специалистах по анализу данных возросла практически вдвое. В ближайшее время Huawei планирует почти вчетверо увеличить персонал российских центров исследований и разработок. Сейчас у Huawei два российских R&D-центра: в Москве (400 человек) и Санкт-Петербурге (150 человек). До конца года Huawei планирует открыть три новых R&D-центра и нанять в них 500 инженеров. В течение ближайших пяти лет штат увеличится ещё более чем на 1000 сотрудников. Это и понятно, ведь Huawei пытается плотно интегрироваться в российскую экономику: например, недавно стало известно, что Huawei станет поставщиком проекта российской государственной облачной платформы, рассматривая возможность выпускать серверы с российскими процессорами «Эльбрус» на российской ОС, чтобы участвовать в гостендерах как «российский производитель».

Высшее образование и курсы


У 90% специалистов по данным высшее образование. Большинство из них учились в одном из следующих вузов:

  • МГТУ им.Н.Э. Баумана;
  • МГУ им. М.В. Ломоносова;
  • МФТИ;
  • НИУ ВШЭ;
  • СПбГУ;
  • Финансовый университет при Правительстве РФ;
  • НГУ;
  • КФУ.

К этим же вузам лояльно относятся и работодатели.

43% специалистов отметили, что вдобавок получили хотя бы одно дополнительное образование. Чаще всего в резюме упоминаются онлайн-курсы по машинному обучению и анализ данных на Coursera.

Курсы нужно выбирать аккуратно. Не везде можно получить качественное образование. На волне дефицита IT-специалистов и относительно больших зарплат предприниматели пытаются заработать на стремлении граждан получить образование. По недавнему опросу РОЦИТ, обучающие онлайн-курсы вошли в топ-3 самых востребованных у россиян интернет-сервисов после госуслуг и продажи и доставки лекарств. Однако на отечественном рынке мало серьёзных игроков, а сомнительных тренеров и коучей появляется всё больше: «Как добросовестные, так и недобросовестные тренеры прибегают к распространённому маркетинговому инструменту — воронке продаж. Клиентам сначала предлагают какой-то бесплатный продукт, например, PDF-книгу или участие в вебинаре, затем дешевый курс в пределах 300–500 рублей, затем основной продукт. Пользователь делает один шаг за другим, пока не дойдет до покупки. Многие называют этот способ манипуляцией, но он становится таким же привычным, как, к примеру, нативная и таргетированная реклама».

Такое мошенничество наиболее распространено в бизнес-тренингах. Всё-таки в области data science гораздо труднее продать убедительную «фальшивку». Впрочем, и здесь некоторые используют манипулятивные воронки продаж, приглашая аудиторию сначала на бесплатные вебинары, затем дешёвый курс, а уже потом предлагая основной продукт.

Корпоративные программы обучения


Чтобы восполнить дефицит кадров, многие компании открывают программы обучения для собственных сотрудников и «школы» для новых кандидатов. Они фактически сами выращивают специалистов для себя. Например, «Вымпелком» запустил проект «Лаборатория Big Data» и готовит магистрантов в области программирования и анализа больших данных вместе с тремя крупными техническими вузами в Новосибирске, а также сотрудничает с вузами Москвы. Сотрудники «Вымпелкома» могут изучать анализ больших данных в корпоративном университете.

«Большие данные рассматриваются как важнейшее сырьё XXI века. Ископаемые и нефть были стратегическим сырьём XX века, в XXI веке, их место будет занято технологиями Big Data», — говорится на сайте обучающего центра.

Ozon открыл вечерние курсы по анализу данных, на которых преподают сотрудники Ozon: в этом году принято 78 студентов.

У Samsung есть собственный научно-исследовательский центр в России. Каждый год компания организует летнюю школу AI Bootcamp по байесовским методам глубинного обучения. Первая летняя школа была организована в 2018 году, под руководством специалистов московского Центра искусственного интеллекта Samsung студенты изучали основные аспекты построения нейросетей, познакомились с решением задач компьютерного зрения: сегментации, локализации и увеличения разрешения растровых изображений.

С этого года Samsung Research Russia начала выпуск бесплатных образовательных онлайн курсов: первый курс «Нейронные сети и компьютерное зрение» набрал за два месяца более 11 тысяч слушателей.

Ну а лидером в области обучения специалистов Big Data считается «Яндекс», где с 2007 года работает Школа анализа данных. Представители компании говорят, что в ближайшие три года она подготовит ещё около 600 экспертов в данной области.



В Школу анализа данных поступают старшекурсники, выпускники и аспиранты МГУ, МФТИ, ВШЭ, ИТМО, СПбГУ, УрФУ, НГУ и других вузов. Два года они изучают предметы, которые обычно не входят в университетские программы, хотя пользуются огромным спросом в науке и разных отраслях, где уже применяются наукоёмкие информационные технологии. Все преподаватели ШАД работают в IT-индустрии или занимаются современной наукой.

Похоже, что бум на рынке вакансий data science только начинается.

Комментарии (21)


  1. kdmitrii
    26.09.2019 10:02
    +3

    Из 100% "специалистов" по анализу данных есть навык Data Analysis только у 24. Это прямо очень хорошо показывает, что из себя представляет отрасль.


    1. Alert123
      26.09.2019 10:32

      дата-саентологи


    1. orange82
      26.09.2019 11:05
      -1

      Где вы выцепили фразу «по анализу данных»?

      Среди ключевых навыков специалисты по Data Science указывают


      1. sergof
        26.09.2019 11:20

        del. ошибся постом, извиняюсь.


    1. aPoStAI
      26.09.2019 11:05
      +1

      Если посмотреть на резюме Java программистов, то выяснится, что очень мало у кого есть навык «уверенный пользователь ПК». Это прямо очень хорошо показывает, что из себя представляет отрасль.


      1. kdmitrii
        26.09.2019 15:13

        А из чего следует, что программист JAVA — уверенный пользователь ПК?
        Еесли взять резюме программиста JAVA то в навыках там в ~100% случаем есть JAVA.


      1. Kanut
        26.09.2019 16:09

        Хм, а что много программистов себе действительно пишут такое в резюме?


        1. aPoStAI
          26.09.2019 16:21

          Думаю, что только если больше нечего написать. В Data Science обычно Data Analysis как-то сам собой подразумевается, а в навыках указывают скилы, которые помогают в этом.


      1. tymanst
        26.09.2019 17:47
        +1

        Вот-вот, если так придираться, то и гитом получается умеют пользоваться всего-лишь 25%)


  1. saag
    26.09.2019 10:48

    Внезапно, после вступления в действие закона Яровой…


  1. DataProger
    26.09.2019 14:17

    Data Science — это, конечно, хорошо. Но те дата-сатанисты, которых я знал сидели в уголочке, всех оскорбляли и хихикали над теми, кто ещё не в курсе, что такое нейронные сети и машинное обучение. Очень надеюсь, что они не все такие.

    И, вообще, как-то многовато хайпа вокруг этой темы. Чего стоят одни стартапы:

    Wall Street Journal: ИИ-стартап оказался подделкой, вместо машины код пишут люди

    Половина стартапов с ИИ на самом деле не используют искусственный интеллект

    Ложнопромышленный комплекс фальшивого искусственного интеллекта

    Нейронные сети — это замечательная вещь, но не надо описывать её как магию какую-то.


  1. Berd90
    26.09.2019 14:27

    Возникло ощущение, что эту статью я уже читал на прошлой неделе на другом ресурсе.

    В ведомостях 2 дня назад была 1 в 1 статья, с точностью до буквы, но где-то ещё раньше читал — найти не могу…


  1. killik
    26.09.2019 14:28

    Самое интересное — 36 млн резюме на хидхантере. Я может и не очень силен в бигдатасаенс, но это больше половины всех доступных трудовых ресурсов РФ. Великоват осетр, похоже.


    1. Old_Chroft
      26.09.2019 15:19

      hh.ru позволяет создать несколько резюме под разные «специализации».


      1. DataProger
        26.09.2019 15:44

        Да, но в статье говорится, что специалистов наоборот не хватает. Да и сколько резюме может человек создать? Два, три? У нас всего в сумме вместе с детьми, пенсионерами, инвалидами и заключёнными около 146 миллионов. Как из них может получиться 36 млн резюме дата-сатанистов?


        1. A114n
          26.09.2019 15:53

          Для этого нужно открыть несколько резюме и посмотреть, как именно они выглядят.
          Или просто узнать по какому критерию относят резюме к той или иной специализации.


    1. A114n
      26.09.2019 17:30

      На диаграмме выше показаны ключевые навыки, указанные в резюме специалистов по данным. Всего проанализировано 5500 вакансий и 8000 релевантных резюме и из общей базы 36,2 млн резюме.

      36 млн это общая база. Все резюме которые есть на ХХ по всем специальностям.


  1. Dimtry44
    26.09.2019 16:32

    В «Мегафоне» анализом данных занимается около 200 человек. За два с половиной года команда выросла в несколько раз. Она занимается оптимизацией тарифов, определяет оптимальное расположение магазинов, прогнозирует товарные запасы и т. д.
    Всем перечисленным занимается 10 человек, а оставшиеся 190 занимаются главным вопросом стоящим перед ОПСОС-ами, как на… ь пользователя.


    1. DataProger
      26.09.2019 16:35

      Ну, если формально подходить, то даже секретарша, составляющая какой-нибудь отчёт в Excel может сойти за аналитика данных. Данные-то анализирует :)


  1. CyberAP
    27.09.2019 04:46

    В 2018 году количество вакансий с упоминанием специальности data scientist выросло в семь раз по сравнению с 2015 годом, а вакансий с ключевыми словами machine learning — в пять раз.

    Это может быть запросто вызвано эффектом базы.


  1. ideological
    27.09.2019 16:31

    Почти все вакансии по DataScience на hh.ru — липовые. Они висят просто так, для занятости HR-отдела. Некоторые не просматривают отклики вообще, а некоторые могут даже выслать тестовое задание или провести встречу и игнорить потом.
    Даже должностей таких нигде нет. Компании нанимают аналитиков (для BI систем, часто низкооплачиваемых) или программистов, но никак не datascientist'ов.
    Нет никаких тысяч свободных высокооплачиваемых вакансий сразу после недельного курса по python — всё враки.
    Меня возможно заминусуют, но это правда.