[Перевод. Источник: www.linkedin.com/pulse/why-so-many-fake-data-scientist-bernard-marr Why So Many ‘Fake’ Data Scientists?]

Вы заметили, что подобно поганками после дождя, появилась огромная масса людей, называющих себя «специалистами по анализу данных»? И ваш сосед, и смазливая тёлка, с которой вы бухали на вечеринке и даже ваш знакомый бухгалтер — все вдруг сменили название профессии в визитке!


Множество людей, вдруг стали называть себя «специалистами по анализу данных», повинуясь последнему писку моды. Harvard Business Review даже назвал профессию «специалист по анализу данных» самой сексуальной профессией XXI века.
В реальности же у огромного количества людей, называющих себя «специалистами по анализу данных», отсутствую знания, умения и навыки, которые бы я ожидал увидеть, если бы нанимал такого специалиста.

Я вижу, что огромное количество людей, знающих о технологиях обработки больших данных и о языках программирования чуть меньше, чем ничего, называют себя «специалистами по анализу данных».

К липовым специалистам по анализу данных можно отнести и людей, которые неплохо зная программирование, не владеют предметной областью, не имеют аналитических способностей и общей креативностью, так необходимой настоящему специалисту по анализу данных.

Одна сторона медали состоит в том, что когда есть большой спрос на специалистов по анализу данных, а их недостаточно, то планка требований падает и ряды пополняют малоквалифицированные (а то и вовсе неквалифицированные) специалисты.

Другая сторона медали в том, что роль специалиста по анализу данных часто не понимается как внутри области, так и в отдельно взятой компании. Специалистами по анализу данных называют всех — начиная от инженера по данным (специалиста, отвечающего за разработку программного обеспечения, которое будет собирать и хранить данные, в оригинале data engineer), и заканчивая статистиками, которые механически выполняют расчёты.

Настоящий специалист по анализу данных представляет собой нечто, намного большее. По опыту работы, на мой взгляд такой специалист обладает следующими качествами:

  • Мультидисциплинарность. Я видел много компаний, которые ставили необходимым условием для кандидатов наличие учёной степени, однако, в действительности, отличными специалистами по анализу данных становились люди и не имеющие таковой.
  • Искушённость в вопросах бизнеса. Если кандидат не имеет опыта работы в бизнесе, то ему (ей) необходим напарник, имеющий такой опыт, дабы компенсировать этот пробел в познаниях.
  • Владение аналитическими способностями. Настоящий специалист по анализу данных должен, естественно, быть хорошим аналитиком (уметь видеть проблему целиком и расчленять её на составляющие)
  • Владение средствами визуальной коммуникации.
    Построить график или диаграмму может каждый. Хороший специалист по анализу данных может строить такие представления данных в графической форме, что они будут поняты широкой аудитории.
  • Широкие познания в программировании. Специалист по анализу данных должен отлично владеть Hadoop, Java, Python и т. д. Если кандидат не является специалистом в этих областях, то он должен работать в паре с тем, кто это знает.
  • Способность к творческому поиску, являющаяся жизненно необходимой для любого настоящего специалиста по анализу данных. Настоящий специалист по анализу данных для ответа на поставленные вопросы должен уметь выходить за рамки предоставленных ему компанией данных — и даже ставить новые вопросы.
  • Способность извлечь из данных новые, нетривиальные факты. Тот, кто просто описал данные — статистик, а не специалист по анализу данных.

И, наконец, как ни странно это звучит, хороший специалист по анализу данных — это хороший рассказчик, который способен доказать компании, что данные и их обработка действительно представляют ценность для неё.

Если вы сможете найти кандидата со всеми вышеперечисленными качествами — или, хотя бы, с большинством из них и с возможностью и желанием расти — тогда вы нашли кого-то, кто сможет принести реальную пользу для вашей компании.

Однако, не требуя от кандидата обладания вышеперечисленных характеристик, вы рискуете нарваться на самозванца, который желает прокатиться на раздутом пузыре под названием «Data Science», пока он не лопнет.

Комментарии (18)