Ксения Суворова, директор по развитию Фонтанки.ру, и Андрей Мирошниченко, координатор офлайн-программы «Data Scientist», специально для блога Нетологии рассказали о профессии Data Scientist со стороны работодателя: какие специалисты требуются рынку, каких компетенций от них ждут и как происходит найм на работу.
Сейчас всё сложилось таким образом, как когда-то история с продакт- и проджект-менеджментом: специалисты есть на рынке, у них уже достаточно устоявшаяся рыночная стоимость, существуют вакансии, но при этом не каждый знает, кто это такой и зачем этот человек вообще нужен бизнесу. Поэтому мы решили поговорить с компанией «Авито», HR-агентством «Spice IT» и компанией Storia.me, чтобы понять, каково развитие профессии на самом деле.
«Потребность в специалистах data science очень велика и в дальнейшем будет только расти. Однако, возможностей для обучения тоже много: любой человек, который понимает, что ему не хватает академического образования, может пройти курсы и получить необходимую базу.
Вопрос, скорее, в том, кто и почему приходит в профессию. На собеседовании соискатели говорят, что интересуются машинным обучением, а когда начинаешь спрашивать почему, отвечают: «Это модно». И всё. Понимания, как применить знания, нет.
А в бизнесе все не так. Здесь есть задача, для которой необходимо найти оптимальный метод решения. Специфика в том, чтобы это решение было практически реализуемо. И это, наверное, основная проблема, с которой мы сталкиваемся при отборе людей.
Скиллы можно разделить на хард и софт. Что касается хард: образование обязательно математическое. Специалист должен понимать, как работают математические модели.
Базовые навыки проверяем на тестовом задании. Департамент большой, он состоит из нескольких отделов, поддерживающих разные системы. Поэтому в каждом отделе разработан собственный кейс, максимально приближенный к тому, чем предстоит заниматься в будущем. При решении такого кейса навыки кандидата становятся очевидны. После этого мы смотрим код и решаем, кого пригласить на встречу.
Про софт-скиллз. Это часть, на которую мы обязательно обращаем внимание при личном общении с кандидатом. Так как специалисты по data science задействованы в кроссфункциональных проектах, для нас очень важно, чтобы человек разделял ценности компании, мог работать в команде и выстраивать коммуникацию с коллегами».
«Вакансий Data Scientist все больше и больше. Данные — самый ценный на рынке продукт. Спада в ближайшее время не будет. Специалистов уже не хватает, особенно если речь идет о таких вакансиях, как Head of Predictive Analytics или Lead/Chief data scientist. Кандидаты заняты на серьезных проектах и не хотят бросать начатое. Плюс эти позиции подразумевают наличие специальных качеств, необходимых той или иной компании. Со стажерами и джунами проще: data science начинает набирать обороты, и многие рады попробовать свои силы в этой сфере.
«В Storia в один период было два специалиста по работе с большими данным. Мы нанимали их под конкретные задачи: нужно было работать с предиктивным анализом в целях улучшения маркетинговых показателей и исправлять ситуацию с высоким churn rate. Кроме этого, мы хотели построить собственную рекомендательную систему внутри площадки, не беря для этого готовое решение.
Работа с большими данными может быть полезна и для UX, и для разработки, и для маркетинга. Нужно смотреть, действительно ли необходим специалист такого формата.
Я бы сказала, что будущее действительно за работой с большими данными, но с некоторыми оговорками. Мало получить данные, надо еще понять, как их можно использовать. Специалисты по работе с данными могут заниматься многими задачами, но обычно они все-таки необходимы именно для большой компании — там для них есть и задачи, и бюджеты.
Для больших компаний в условиях остановившегося роста специалист в data science — это возможность найти новый путь развития, путь привлечения платежеспособных клиентов. Работа с Big Data — это не то, что способен сделать человек, потому что наш мозг просто не в состоянии обработать такое количество данных.
Сейчас только вырабатывается понимание необходимых компетенций и образ специалиста по работе с большими данными. Слишком уж новое это направление для российского рынка и наших реалий. У нас к остальным-то специалистам не всегда правильно сформулированы требования, что уж говорить о Data Scientist.
Кроме того, надо понимать, что работа с большими данными дает результат только в долгосрочной перспективе и не решает вопросы, которые должны быть решены сегодня или завтра. К примеру, вы планируете редизайн через год, и вы хотите сделать полноценный дружелюбный интерфейс. В этом случае вы нанимаете специалиста по работе с большими данными, он проводит A\B-тесты и предиктивный анализ. Такие данные более точные, поскольку это машинное обучение, которое не допускает ошибок. И еще это более грамотные и широкие возможности для рекламных компаний, целевой аудитории и ее анализа».
Курсы «Нетологии» по теме:
Сейчас всё сложилось таким образом, как когда-то история с продакт- и проджект-менеджментом: специалисты есть на рынке, у них уже достаточно устоявшаяся рыночная стоимость, существуют вакансии, но при этом не каждый знает, кто это такой и зачем этот человек вообще нужен бизнесу. Поэтому мы решили поговорить с компанией «Авито», HR-агентством «Spice IT» и компанией Storia.me, чтобы понять, каково развитие профессии на самом деле.
Взгляд компании Avito с позиции прямого нанимателя — рассказывает Александра Головина
«Потребность в специалистах data science очень велика и в дальнейшем будет только расти. Однако, возможностей для обучения тоже много: любой человек, который понимает, что ему не хватает академического образования, может пройти курсы и получить необходимую базу.
Вопрос, скорее, в том, кто и почему приходит в профессию. На собеседовании соискатели говорят, что интересуются машинным обучением, а когда начинаешь спрашивать почему, отвечают: «Это модно». И всё. Понимания, как применить знания, нет.
А в бизнесе все не так. Здесь есть задача, для которой необходимо найти оптимальный метод решения. Специфика в том, чтобы это решение было практически реализуемо. И это, наверное, основная проблема, с которой мы сталкиваемся при отборе людей.
Некоторые соискатели считают, что достаточно придумать красивый алгоритм, а то, что его нельзя будет нигде применить — дело десятое.Экспертизу, в свою очередь, можно разделить. Есть люди, которые проработали в близкой нам сфере — классифайдах и IT. Они прекрасно понимают, где и как применять знания. Люди, которые приходят из другой сферы — из банков, вчерашние выпускники или проработавшие в лаборатории — в этом плане проигрывают, но для нас это не показатель. Они уходят в deep learning, глубинные сети, пытаются найти что-то посложнее. Хотя на самом деле модель, которая будет работать, может быть намного проще.
Скиллы можно разделить на хард и софт. Что касается хард: образование обязательно математическое. Специалист должен понимать, как работают математические модели.
Приходят к нам, как правило, из ведущих вузов: МФТИ, ВШЭ, МГУ. Среди выпускников последнего в шутку даже идет соревнование, кого в компании больше — окончивших мехмат или ВМК.Также есть условное разделение на продуктовых аналитиков и ML-аналитиков. Задача первых — искать возможность улучшения продукта, генерируя гипотезы о возможных проблемах пользователей и способах их быстрого решения, а вторые автоматизируют решения, найденные продуктовыми аналитиками, и задачи с помощью различных ML-методов: персональные рекомендации, ценообразование и так далее.
Базовые навыки проверяем на тестовом задании. Департамент большой, он состоит из нескольких отделов, поддерживающих разные системы. Поэтому в каждом отделе разработан собственный кейс, максимально приближенный к тому, чем предстоит заниматься в будущем. При решении такого кейса навыки кандидата становятся очевидны. После этого мы смотрим код и решаем, кого пригласить на встречу.
Про софт-скиллз. Это часть, на которую мы обязательно обращаем внимание при личном общении с кандидатом. Так как специалисты по data science задействованы в кроссфункциональных проектах, для нас очень важно, чтобы человек разделял ценности компании, мог работать в команде и выстраивать коммуникацию с коллегами».
Spice IT — с позиции HR-агентства
«Вакансий Data Scientist все больше и больше. Данные — самый ценный на рынке продукт. Спада в ближайшее время не будет. Специалистов уже не хватает, особенно если речь идет о таких вакансиях, как Head of Predictive Analytics или Lead/Chief data scientist. Кандидаты заняты на серьезных проектах и не хотят бросать начатое. Плюс эти позиции подразумевают наличие специальных качеств, необходимых той или иной компании. Со стажерами и джунами проще: data science начинает набирать обороты, и многие рады попробовать свои силы в этой сфере.
Профессиональные компетенции зависят от требований, выставляемых компанией-заказчиком. Из основного можно выделить: R, Python, Machine Learning, базы данных, такие как MSSQL, MySQL, Postgresql. Кандидаты на позицию Data Scientists должны хорошо разбираться в математике, статистике и программировании.Вакансии, где soft skills — одно из ключевых требований, встречаются достаточно редко, если это не руководящая позиция. В связи с тем, что сильных специалистов на рынке пока не очень много, упор идет именно на техническую составляющую.
Конечно, многим компаниям хотелось бы видеть в своих рядах специалистов с проактивной позицией, подготавливающих презентации, составляющих красивые отчеты и умеющих наладить контакт с коллегами и руководством, но, повторюсь, на практике большинство клиентов поступаются этими требованиями, предпочитая коммуникабельности хороший технический опыт.При этом компании готовы обучать, принимая кандидатов в качестве стажеров или младших аналитиков. Готовы смотреть ребят, которые ведут проекты на фрилансе или делают что-то для себя с целью получения опыта. У нас в работе вакансии разного уровня, где нужны специалисты с минимальным опытом или сильным техническим. Вариантов масса, каждому можно что-то подобрать.
Опыт работы с Data Scientist экс-директора по маркетингу Storia.me — Алины Гашинской
«В Storia в один период было два специалиста по работе с большими данным. Мы нанимали их под конкретные задачи: нужно было работать с предиктивным анализом в целях улучшения маркетинговых показателей и исправлять ситуацию с высоким churn rate. Кроме этого, мы хотели построить собственную рекомендательную систему внутри площадки, не беря для этого готовое решение.
Мне кажется, Data Scientist должен уметь работать под задачи продукта, но без базовых навыков, конечно же, никуда. Языки для сбора данных, запросов, обработки информации, работе с базами данных, определенные знания в статистике — этот пул навыков на выходе применятся под конкретную задачу, и в любой ситуации Data Scientist должен понимать, каким образом он будет решать ту или иную проблему.Не имеет смысла нанимать специалиста по работе с большими данными для того, чтобы он просто сидел в офисе — это будет достаточно дорого. Выгоднее нанимать проектно в случае отсутствия стороннего решения или если продукт нуждается во внутренней разработке.
Работа с большими данными может быть полезна и для UX, и для разработки, и для маркетинга. Нужно смотреть, действительно ли необходим специалист такого формата.
Я бы сказала, что будущее действительно за работой с большими данными, но с некоторыми оговорками. Мало получить данные, надо еще понять, как их можно использовать. Специалисты по работе с данными могут заниматься многими задачами, но обычно они все-таки необходимы именно для большой компании — там для них есть и задачи, и бюджеты.
Для больших компаний в условиях остановившегося роста специалист в data science — это возможность найти новый путь развития, путь привлечения платежеспособных клиентов. Работа с Big Data — это не то, что способен сделать человек, потому что наш мозг просто не в состоянии обработать такое количество данных.
Сейчас только вырабатывается понимание необходимых компетенций и образ специалиста по работе с большими данными. Слишком уж новое это направление для российского рынка и наших реалий. У нас к остальным-то специалистам не всегда правильно сформулированы требования, что уж говорить о Data Scientist.
Кроме того, надо понимать, что работа с большими данными дает результат только в долгосрочной перспективе и не решает вопросы, которые должны быть решены сегодня или завтра. К примеру, вы планируете редизайн через год, и вы хотите сделать полноценный дружелюбный интерфейс. В этом случае вы нанимаете специалиста по работе с большими данными, он проводит A\B-тесты и предиктивный анализ. Такие данные более точные, поскольку это машинное обучение, которое не допускает ошибок. И еще это более грамотные и широкие возможности для рекламных компаний, целевой аудитории и ее анализа».
Советы, которые может дать работодатель специалисту в области больших данных
- Курсы, конечно, нужны. Но они должны наслаиваться на знание языков программирования: R или Python.
- Без понимания принципов машинного обучения — никуда.
- Математика и статистика должны быть вашими друзьями.
- Данные — это цифры, числа, математический анализ. Поэтому сделайте их своими богами.
- Мало знать теорию, надо понимать практическую составляющую. Идти работать в бизнес и думать, что там необходим ангельский горн данных — ошибка. Там необходимо решение конкретной задачи.
- В России большие данные — это, прежде всего, аналитика. Поэтому если вы хотите заниматься чем-то иным, тогда искать работу придется дольше.
- Вам может попасться «тугой» работодатель, который сам слабо будет понимать роль Data Science — это нормально. Вы не маркетолог, не трафик-менеджер, и даже не аналитик, вы — это нечто большее.
- Задача любого Data Scientist — обработать данные и предоставить результат. С помощью ваших знаний и навыков по миру летают беспилотники, скоро будут ездить такси и машины без управления человеком, работают нейронные сети, обрабатываются миллионы рекламных кампаний в Гугле и Яндексе. Вы — бесценны, но всё имеет свою цену и имя ей — зарплата. Цените себя и успехов вам.
Полное интервью с Авито и Spice IT о специалистах Data Scientist читайте в нашем следующем материале.
От редакции
Курсы «Нетологии» по теме:
- очный курс «Data Scientist»;
- онлайн-программа «Big Data: основы работы с большими массивами данных».
opanas
Спасибо за материал, познавательно. Могу посоветовать еще 2 статьи:
— Должность Data Scientist / Machine Learning Engineer
— Продуктовый аналитик: задачи и обязанности
blognetology Автор
Спасибо! Отличные статьи