Ежегодно Kaggle проводит опрос среди специалистов по анализу данных, и объявляет конкурс на поиск инсайтов из полученных данных. В этом году в опросе участвовало 19717 человек со всего мира. В статье рассматриваются лучшие обзоры и решения Kaggle ML & DS Survey 2019.
![](https://habrastorage.org/webt/_-/km/3x/_-km3xotp8zhyomc4ghjx2w0iiy.png)
Рисунок 1. Распределение опрошенных специалистов по странам.
Как видно из инфографики, больше всего специалистов в США и Индии.
Data Science стал редкой возможностью хорошего заработка в бедных странах, что и вызвало такую популярность в Индии.
![](https://habrastorage.org/webt/ah/sd/fs/ahsdfswn_7zoqoxzgak8cezcuzo.png)
Рисунок 2. Распределение по полу и по странам
Но разработчики из России занимают гордое четвертое место по численности, хотя доля женщин уступает ряду стран западной Европы.
![](https://habrastorage.org/webt/wi/fl/fl/wiflfl4ydvno-1rpd5lrno3dmwi.png)
Рисунок 3. Распределение по возрасту
Мода распределения приходится на 25-29 лет. Хайп, зародившийся несколько лет назад, вовлек недавних выпускников в область DS.
![](https://habrastorage.org/webt/wg/be/2p/wgbe2pfgnwrqcwssxlax5ecz654.png)
Мужчины и женщины при этом показывают одинаковое распределение по возрасту.
![](https://habrastorage.org/webt/9j/vf/ly/9jvflyxrekflqijb89vnpz4dkha.png)
А вот распределение в Индии принципиально отличается от США. Преобладают молодые специалисты, студенческого возраста.
![](https://habrastorage.org/webt/qd/fn/tu/qdfntuiqpsmp9hluwrujrd-l7ao.png)
Самые высокие доходы у разработчиков из США и западной Европы и явно коррелируют со уровнем дохода по странам. Доходы российских специалистов ниже в 5-10 раз.
![](https://habrastorage.org/webt/di/o7/q7/dio7q7h0me7qoagwg5ajaxnshua.png)
США – 140 000$ в год
Великобритания – 80 000$ в год.
Россия — 20 000$ в год.
И это похоже на правду, т.к. специалисты в нашей команде DATA4 зарабатывают немногим больше суммы из опроса.
![](https://habrastorage.org/webt/pq/ka/8k/pqka8kvpxayfuraymvtover6yfi.png)
Чтобы получать больше медианной зарплаты, потребуется минимум 5 лет опыта программирования и 2-3 лет работы с ML.
![](https://habrastorage.org/webt/n5/b3/rm/n5b3rmx8c6kusz1y7gnjvpqmogu.png)
Распределение по величине компаний, в которых работают специалисты по анализу данных, показывает, что большинство рабочих мест приходится либо на стартапы, либо на корпорации. В среднем бизнесе ловить нечего.
![](https://habrastorage.org/webt/ta/ne/wp/tanewpfdyncda7qpvk_09c7ohzg.png)
Большинство специалистов начали программировать одновременно с занятием ML, или перешли из других областей разработки.
![](https://habrastorage.org/webt/nb/cd/6k/nbcd6k0xn-pxwpygmil2zg9jomi.png)
Разработчики из России становятся старше, и переходят на следующие уровни образования.
![](https://habrastorage.org/webt/zf/fn/yd/zffnydem9rjikrtpesfpc5ojcb8.png)
![](https://habrastorage.org/webt/vh/j0/mj/vhj0mjjxte19ry45rcovxr6w-ow.png)
Образование и возраст влияют на источники получения информации.
![](https://habrastorage.org/webt/bt/gq/6r/btgq6rw38fox7bigcjshlacljj4.png)
В странах с развитой экономикой (США, Европа) научная степень влияет на уровень зарплаты. В остальном мире разница не статистически значима.
![](https://habrastorage.org/webt/ag/pi/lv/agpilvqfwdphzohgd_iyyqvib2s.png)
Быть Data Scientist и Data Engineer, выгоднее, чем аналитиком или статистиком.
![](https://habrastorage.org/webt/j1/rd/hr/j1rdhrp_k138anhobdjd0dfwzkg.png)
И напоследок, тепловая карта по заработным платам в странах мира. Можно посмотреть, где потеплее, и взять билет, пока в России зима!
В следующих статьях рассмотрим интересные соревнования и наборы данных с Kaggle. Пишите в комментариях о каких соревнованиях написать в будущих материалах.
![](https://habrastorage.org/webt/_-/km/3x/_-km3xotp8zhyomc4ghjx2w0iiy.png)
Рисунок 1. Распределение опрошенных специалистов по странам.
Как видно из инфографики, больше всего специалистов в США и Индии.
Data Science стал редкой возможностью хорошего заработка в бедных странах, что и вызвало такую популярность в Индии.
![](https://habrastorage.org/webt/ah/sd/fs/ahsdfswn_7zoqoxzgak8cezcuzo.png)
Рисунок 2. Распределение по полу и по странам
Но разработчики из России занимают гордое четвертое место по численности, хотя доля женщин уступает ряду стран западной Европы.
![](https://habrastorage.org/webt/wi/fl/fl/wiflfl4ydvno-1rpd5lrno3dmwi.png)
Рисунок 3. Распределение по возрасту
Мода распределения приходится на 25-29 лет. Хайп, зародившийся несколько лет назад, вовлек недавних выпускников в область DS.
![](https://habrastorage.org/webt/wg/be/2p/wgbe2pfgnwrqcwssxlax5ecz654.png)
Мужчины и женщины при этом показывают одинаковое распределение по возрасту.
![](https://habrastorage.org/webt/9j/vf/ly/9jvflyxrekflqijb89vnpz4dkha.png)
А вот распределение в Индии принципиально отличается от США. Преобладают молодые специалисты, студенческого возраста.
![](https://habrastorage.org/webt/qd/fn/tu/qdfntuiqpsmp9hluwrujrd-l7ao.png)
Самые высокие доходы у разработчиков из США и западной Европы и явно коррелируют со уровнем дохода по странам. Доходы российских специалистов ниже в 5-10 раз.
![](https://habrastorage.org/webt/di/o7/q7/dio7q7h0me7qoagwg5ajaxnshua.png)
США – 140 000$ в год
Великобритания – 80 000$ в год.
Россия — 20 000$ в год.
И это похоже на правду, т.к. специалисты в нашей команде DATA4 зарабатывают немногим больше суммы из опроса.
![](https://habrastorage.org/webt/pq/ka/8k/pqka8kvpxayfuraymvtover6yfi.png)
Чтобы получать больше медианной зарплаты, потребуется минимум 5 лет опыта программирования и 2-3 лет работы с ML.
![](https://habrastorage.org/webt/n5/b3/rm/n5b3rmx8c6kusz1y7gnjvpqmogu.png)
Распределение по величине компаний, в которых работают специалисты по анализу данных, показывает, что большинство рабочих мест приходится либо на стартапы, либо на корпорации. В среднем бизнесе ловить нечего.
![](https://habrastorage.org/webt/ta/ne/wp/tanewpfdyncda7qpvk_09c7ohzg.png)
Большинство специалистов начали программировать одновременно с занятием ML, или перешли из других областей разработки.
![](https://habrastorage.org/webt/nb/cd/6k/nbcd6k0xn-pxwpygmil2zg9jomi.png)
Разработчики из России становятся старше, и переходят на следующие уровни образования.
![](https://habrastorage.org/webt/zf/fn/yd/zffnydem9rjikrtpesfpc5ojcb8.png)
![](https://habrastorage.org/webt/vh/j0/mj/vhj0mjjxte19ry45rcovxr6w-ow.png)
Образование и возраст влияют на источники получения информации.
![](https://habrastorage.org/webt/bt/gq/6r/btgq6rw38fox7bigcjshlacljj4.png)
В странах с развитой экономикой (США, Европа) научная степень влияет на уровень зарплаты. В остальном мире разница не статистически значима.
![](https://habrastorage.org/webt/ag/pi/lv/agpilvqfwdphzohgd_iyyqvib2s.png)
Быть Data Scientist и Data Engineer, выгоднее, чем аналитиком или статистиком.
![](https://habrastorage.org/webt/j1/rd/hr/j1rdhrp_k138anhobdjd0dfwzkg.png)
И напоследок, тепловая карта по заработным платам в странах мира. Можно посмотреть, где потеплее, и взять билет, пока в России зима!
В следующих статьях рассмотрим интересные соревнования и наборы данных с Kaggle. Пишите в комментариях о каких соревнованиях написать в будущих материалах.
Matshishkapeu
На картинке с зарплатами прямо радостно за датасатанистов из Бангладеш, которые оставили позади полевропы и корейцев с японцами. Надо в скорости ждать постов о том, как собрав кошку и пожитки народ потянулся в Дакку.
kirillkosolapov Автор
Возможно, там всего несколько респондентов ответили, и назвали «оптимистичные» цифры. Т.к. данные из опроса, есть вероятность искажения реальной картины.