Всемирный экономический форум в своем прогнозе самых востребованных профессий до 2025 года поставил Data Analysts & Scientists на первое место рейтинга. За последние три года в России число вакансий в этой сфере выросло в 4 раза. Мы видим, что поток желающих получать образование в DA/DS постоянно растет. Успех трудоустройства напрямую зависит от того, насколько знания кандидата отвечают актуальным требованиям работодателей. И математика – важнейшая часть этих требований. Мы выяснили, знания по каким именно темам математики и в каком формате проверяют на собеседованиях, а также – зависят ли требования по математике от грейда и нужно ли высшее образование, чтобы пройти отбор.

Команда исследователей Яндекс Практикума направления анализа данных провела качественное исследование среди нанимающих менеджеров и руководителей компаний разного уровня. В серии глубинных интервью принял участие 31 респондент: 20 из сферы DA и 11 – DS. Среди них представители корпораций – Яндекс, Ozon.Fintech, X5 Group; российской сети гипермаркетов «Лента»; средних и малых компаний – среди которых MyShop, Bolt; а также двух стартапов.

Цель исследования – составить подробный срез требований работодателей к кандидатам DA и DS по математике. Перед проведением интервью команда сформулировала четыре гипотезы. Они отражают сложившиеся в отрасли убеждения о требованиях по математике и наиболее часто возникающих ситуациях при отборе кандидатов в DA/DS. В итоге одни гипотезы подтвердились, другие – были частично или полностью опровергнуты. Расскажем о них подробнее. Также в конце нашего исследования вы сможете найти таблицу с подробным списком тем и частотой их проверки в ходе собеседований.

Подтвержденные гипотезы

Гипотеза 1: Набор математических знаний и навыков для джунов и миддлов не отличается критично. Отличается формат задач и кейсов, которые им нужно решать на собеседованиях.

Подавляющее число респондентов –  81% – не разделяет требования по математическим компетенциям к кандидатам в зависимости от грейда. Однако чем выше уровень позиции кандидата, тем меньше ему встретится абстрактных задач или теоретических вопросов. Иными словами, разница заключается в формате проверки знаний. 

Так, от джунов DA/DS ждут хорошего знания статистики, линейной алгебры и математического анализа на уровне 1-2 курса университета. Кандидат должен разбираться в теоретических понятиях и областях применения того или иного метода. А от миддлов DA/DS – умения применять математические знания на реальных задачах, определять самый подходящий математический метод для предложенного кейса. 

Рассмотрим на примере. Так, джунов просят посчитать вероятность того, что человек болен, если тест на какую-то болезнь положителен. Даны: доля больных людей в популяции; вероятность, что тест покажет положительный результат, если человек болен; вероятность ложноположительного теста. Кандидат сам должен догадаться, что это задача на теорему Байеса, и посчитать всё верно по формуле. На уровне миддл и выше чаще дают примеры из рабочей области.

Вадим Кохтев, тимлид команды ML-инженеров, Яндекс Недвижимость:
«Без математики легко стать заложником инструментов. Не получится пойти вширь или вглубь, чтобы сказать, почему тот или иной инструмент не работает».

Алексей Казюлин, руководитель отдела аналитики, Яндекс Лавка:
«Запустить «модель из коробки» может любой, вопросы возникают в краевых вещах –  нужно понимать принципы того, как работают процессы. Для этого придется конвертировать их в математику. Поэтому во многих компаниях нужен тервер, комбинаторика и алгоритмы, это входит в собеседования».

В целом, работает правило: чем выше грейд, тем больше будет бизнес-кейсов из реальной практики. Миддлам DA и DS нередко предлагают на собеседовании задачи на принятие решений и оценку идеи внедрения улучшения в продукт или алгоритм. Кандидату нужно самому уточнить контекст, придумать метрики и стратегию оценки проекта и принятия решений. Чем самостоятельнее и убедительнее рассуждения кандидата, чем структурированнее его  знания, тем более высокий грейд он может получить.

Гипотеза 2: От DS работодатели в основном ожидают знания линейной алгебры, математического анализа и математической статистики.

Исследование показало, что кандидатам в DS действительно важны знания математической статистики. Вероятность встретиться на собеседовании с кейсами про среднее, моду, дисперсию, распределения – 85%. Но набор тем будет меньше, чем у DA. Также, как и предполагалось, работодатели ждут хорошего знания линейной алгебры в 70% случаев. 

Кроме того, для DS не менее важны знания из области математического анализа. Вероятность получить задачу на понимание градиентного спуска достигает 67%. Например, джуну могут дать график нарисованной на листе параболы хвостами вверх и попросить описать, как с помощью градиентного спуска найти минимум функции. Если кандидат знает про алгоритмы с разными размерами шага градиентного спуска – это будет плюсом.

Дмитрий Кондратьев, тимлид DS, Bolt (ex-senior DS, Яндекс):
«Математика – хорошая тренировка мозга. Как растут мышцы, так растет и мыслительная способность.  Эти ресурсы можно переключить на решение самых разных задач. В DS мы пишем программы, которые принимают решения, что, соответственно, влияет на деньги компании. Если ты не знаешь, как и что работает «под капотом», то отдаешь решения компании на откуп черной коробке. Знание инструментария помогает эффективно работать».

Сергей Виноградов, руководитель службы ML и DA в финансовых сервисах, Яндекс:
«Понимание математических принципов при работе в DS помогает избавиться от иллюзий и избежать ошибок».

Специалисту любого уровня DS могут задать вопрос, как решается какая-либо проблема необучаемости модели. Чем более кандидат осведомлён о всевозможных проблемах в применении машинного обучения, тем меньше вероятность потери времени в его будущей самостоятельной работе (*подробный список математических тем с вероятностью их встретить на собеседовании в DS – в конце текста в виде таблицы). 

Частично подтвержденные и неподтвержденные гипотезы

Гипотеза 3: На собеседованиях DA задачи по математике ограничиваются  математической статистикой. 

В соответствии с результатами исследования, для дата-аналитика критически важно понимание среднего, моды, дисперсии, видов распределений. Кандидаты должны разбираться в математике, которая стоит за A/B-тестами, быть на «ты» со статистическими критериями и ситуациями, в которых их нужно применять. Вероятность встретить вопросы и кейсы с этими понятиями на собеседовании DA близка к 100%.

Однако, как показало исследование, требования по математике не исчерпываются статистикой. Например, с вероятностью в 27% аналитикам на собеседовании может встретиться и кейс с линейной регрессией, и вопросы на понимание основ линейной алгебры. Некоторые респонденты отметили, что не задают вопросы из этой области аналитикам, но считают ее неотъемлемой частью математической культуры (*подробный список математических тем с вероятностью их встретить на собеседовании в DA – в конце текста в виде таблицы). 

Аня Чувилина, лид DE (ранее лид DA), Яндекс Практикум:
«Можно устроиться в компанию аналитиком без серьезной базы знаний в математике, но вот расти в профессии скорее всего не получится. Довольно быстро такому кандидату станет скучно, но другие задачи ему поручать не будут в силу отсутствия необходимой базы. На старте карьеры достаточно знать, что такое средняя и медиана, но если есть амбиции и хочется расти – нужно серьезно  работать над математикой». 

Алексей Малинский, тимлид аналитики, Авито:
«Аналитика – это ключ к принятию наиболее верных решений бизнесом. Любой аналитик должен хорошо понимать, какой результат/отклонение мы можем декларировать с определенной уверенностью. В отдельных отраслях только математика поможет добиться кратного увеличения метрик. От своих аналитиков мы требуем универсальности».

По словам некоторых респондентов, на собеседованиях они спрашивают у джунов DA, что такое статистическая значимость, альфа-уровень значимости, p-value и доверительный интервал, а также о том, как эти понятия связаны друг с другом.

Гипотеза 4: У сеньоров DA/DS не проверяют математику при найме.

Как выяснилось, это не так. Математические навыки у сеньоров проверяют 87% работодателей. Требования в этом отношении примерно такие же, что и в случае с кандидатами других грейдов. Только 19% собеседников сказали о том, что сеньор DA/DS должен обладать более глубокими математическими знаниями, чем джуны и миддлы. 

Элен Теванян, руководитель направления алгоритмического анализа в X5 Group:
«Перефразирую цитату: «Математика причиняет боль. Одно из двух – можно или от нее спрятаться, или извлечь пользу». Рано или поздно все пробелы в математике приходится восполнять, чтобы заниматься не только однотипными рутинными задачами, но и отвечать на сложные вопросы (например, оценить дизайн эксперимента) или выходить из нетривиальных рабочих ситуаций (как сократить время эксперимента)».

Филипп Ульянкин, сеньор-аналитик, Яндекс Такси:
«Полезно понимать те концепции, которые предлагает математика. Если ты понял, как работает проверка гипотез – у тебя в голове открывается «чакра», которая позволяет смотреть на другие проблемы и решать задачи оригинальнее. Для меня вся эта математика – способ мыслить, способ понимать мир вокруг себя. Когда человек хорошо знает линейную алгебру и математический анализ, то начинает генерировать идеи тогда, когда у других они заканчиваются». 

Сеньорам действительно не задают вопросов «по учебнику». От них ждут умения формализовывать бизнес-задачи в математические; навыка поиска информации при встрече с незнакомой задачей. Соискатель должен продемонстрировать широту компетенций, которая позволяет изучить необходимые материалы и применить их к кейсу.

О роли высшего образования в DA/DS

Более 80% респондентов готовы рассматривать кандидатов без профильного ВО, каждый второй – выпускников курсов. Для них важен предыдущий релевантный опыт специалиста и то, как он покажет себя в процессе отбора.

Марк Сысоев, руководитель департамента аналитики, Яндекс Практикум:
«Можно прекрасно раскрываться в индустрии без технического ВО, но математику знать нужно. Допустим, аналитик строит модель для скоринга – потребуются знания матстатистики, чтобы подбирать нужные статистические критерии качества модели. Хорошо, если кандидат может использовать математику для перевода изменения тех или иных параметров в деньги, чтобы объяснить, почему компания начала зарабатывать больше. Ну и конечно, почти всегда аналитику необходимо хорошо разбираться в процентах и пропорциях».

Александр Толмачёв, Head of Analytics в Ozon.Fintech, автор курсов в Яндекс Практикуме:
«Необходимость = однозначно определяющая характеристика. 

Обязательности иметь высшее образование при трудоустройстве на DA/DS нет, также нужно учитывать, что высшее образование бывает разное — техническое или гуманитарное. Можно рассматривать это как влияющий фактор, но не определяющий. Гораздо больше на успех трудоустройства специалиста влияет его опыт: если аналитик в резюме дает ссылку на репозиторий в GitHub со своими проектами, автоматически становится более интересным кандидатом. 

Однако высшее образование дает хороший фундамент — способность самостоятельно решать проблемы, добиваться нужного результата, быть целеустремленным. Иначе говоря — высшее образование учит правильно мыслить — это важно».

Алексей Макаров, руководитель сопровождения и фидбэка в направлении анализа данных, Яндекс Практикум:
«
Главное для кандидата – больше моделировать на практике. Учить не через абстракции в вакууме, а через соприкосновение с данными. Решать задачи прикладным методом, а не академическим. Это полезный навык, чтобы не отрываться от земли».

Важный момент: чем выше уровень позиции, на которую собеседуется кандидат, тем меньше обращают внимание на высшее образование, а больше – на опыт и портфолио. Так как у джунов опыта меньше, без профильного ВО им сложнее доказать свои навыки. Скорее всего, у таких кандидатов будут спрашивать теоретические вопросы и определения. Так нанимающие менеджеры стараются определить потенциал и уровень знаний соискателя.

Между размером компании и требованиями к образованию нет никакой зависимости. Иными словами, нельзя сказать, что корпорации чаще нанимают специалистов с дипломами профильного вуза, а небольшой бизнес не обращает на них никакого внимания (или наоборот). Скорее, критерий формируется лично нанимающим менеджером и может быть связан с текущими задачами команды, сложностью продукта, ресурсами на обучение новичков и т.д. 

Заключение

Глубокие знания по математике – важнейшая часть компетенций в DA и DS. От дата-сайентистов их ждет подавляющее количество работодателей, которые прямо связывают уровень математического мышления кандидата с его ценностью для компании. Что касается аналитиков, то на старте им меньше нужны линейная алгебра и математический анализ, но это сильно сужает дальнейшие карьерные перспективы: меньше возможностей для роста, меньше шансов попасть в корпорацию, где ценится математический склад ума и разносторонняя подготовка, которая впоследствии позволяет задействовать весь потенциал сотрудника. 

Арам Малхасян, руководитель отдела аналитики онлайн-сервисов «Ленты»:
«Математика аналитику точно нужна – она структурирует ход мыслей, а системный и структурный подход к задачам – ключевой навык любого аналитика. В ходе разбора доказательств математических утверждений развивается логика, критическое мышление, что помогает в принятии уже бизнесовых решений.Со знанием математики получается сильно проще моделировать процессы и делать выводы, как эти процессы будут развиваться».

Анна Папета, тимлид DS, My shop:
«Математику нужно учить затем, что она ум в порядок приводит – сказал Ломоносов, и я с ним абсолютно согласна».


Исследование доказало, что требования к соискателям по математике не зависят от грейда, хотя формат проверки знаний и отличается. Таким образом, любому кандидату, который хочет быть конкурентоспособным на рынке труда, необходимо работать над этой областью знаний. Тем более, что сегодня такую возможность дают курсы, которые позволяют заниматься в комфортном ритме и совмещать обучение с текущей работой.

Например, курс «Математика для анализа данных» на Яндекс Практикум не привязан к расписанию, и его прохождение занимает в среднем 4 месяца. За это время студенты могут погрузиться в линейную алгебру и математический анализ, разобраться в теории вероятностей, решить тысячу реально встречающихся практических задач и бизнес-кейсов, подготовиться к собеседованиям с помощью симулятора. 

*Таблица с подробным списком тем и частотой их проверки в ходе собеседований.
Это качественное исследование и выборка не велика, поэтому доверительные интервалы такие большие.

Над исследованием работала команда направления анализа данных в Яндекс Практикуме:
Александра Амбражейчик (продуктовый исследователь)
Антон Моргунов (продуктовый исследователь) 
Ирина Ефимова (руководитель продуктовых исследований)
Татьяна Григорович (продуктовый менеджер курса «Математика для анализа данных»)

Комментарии (5)


  1. Tyusha
    02.11.2022 22:55
    +3

    Чтобы продемонстрировать математические навыки, соответствующие двум курсам университета, надо эти два курса обучения и закончить. Матан, линейка, теорвер, дискран, стохи и вычматы за 4 месяца по вечерам после работы?! Ну-ну.


    1. Alex_the_student
      03.11.2022 17:57

      а если учесть качество курсов яндекса, которое активно обсуждалось в прошлых постах, становится понятно, что это очередной развод на деньги некогда хорошей компании


    1. DarthVictor
      04.11.2022 12:00

      По месяцу на сессию. В принципе это вполне соответствует режиму обучения тех, кто на 3-4 курсе не брал отпуск на сессию.


    1. Aleshonne
      04.11.2022 13:00

      Учитывая, что на курсах по математике обычно почти всё даётся без доказательств, а также отсутствие нагрузки от прочих предметов (всё же в универе не только математику преподают), даже за 2 месяца пройти такой курс вполне реально, если каждый день ему 3-5 часов посвящать.


  1. bestsalut
    05.11.2022 11:38

    Всемирный экономический форум в своем прогнозе самых востребованных профессий до 2025 года поставил Data Analysts & Scientists на первое место рейтинга

    В тексте по ссылке сказано про "growing job demand" - растущий спрос на работу, а не про самые востребованные профессии.