Резюме видео
Рынок дата-инженеров
В своих видео и статьях я ни раз говорил о важности данных, не только потому что я работаю дата-инженером, но и также потому что все привыкли работать с данными.
Также стоит сказать, что в связи с событиями 22-го года часть западных компаний ушла от нас: Oracle, MSSQL, AWS и другие
Но так как компании привыкли работать с данными и понимают их ценность им понадобились дата-инженеры, поэтому спрос на дата-инженеров в течение года не спадал ни на день.
Вилки выросли, запросы конечно тоже выросли, но всё равно вакансий было много и было из чего выбирать.
Менторство
Я занимаюсь менторством, поэтому если вам необходима консультация по дата-инженерии или по рынку данных, то смотрите ссылку внизу.
Также хотел сказать, что когда работал с разными ребятами, то они находили свои работы на хорошие офферы в течение недели-двух, потому что рынок горит и всем нужны дата-инженеры.
Необходимость дата-инженеров
Как я сказал в самом начале дата-инженеры сейчас на коне и всем нужны, давайте кратко разберем почему и под какие задачи:
У компании была развёрнута инфраструктура от Oracle, MSSQL (не важно) и нужно мигрировать на российские аналоги или open source.
Понимание работы инфраструктуры и потоков данных в целом. Ранее можно было некоторые проблемы решить "закидав" их деньгами, а сейчас это тяжелее, потому что услуги стали дороже или приходится разворачиваться на своих ресурсах и поэтому качественная проработка доставки данных очень важна.
Подключение опять же российских аналогов. Ранее маркетинг собирался условно через AppsFlyer, а теперь через другие инструменты, ввиду чего подходы к сбору, очистке, трансформациям изменились.
Сервисные и продуктовые компании стали востребованнее из-за ухода конкурентов и поэтому нужно масштабироваться, чтобы оказывать услуги компаниям и не потерять рынок.
Ну и также не стоит забывать, что в целом начали появляться новые компании, которые с самого начала хотят собирать данные и работать с ними.
Текущий стек для дата-инженера
В целом, стек особо не поменялся, а если говорить точнее, то не поменялись принципы технологий и инструментов.
Как был в приоритете open source так и остался, но всё равно есть некоторые изменения:
Ушли облака (AWS, Azure, GCP) и их инфраструктура, поэтому нужно использовать то, что давно на рынке: GreenPlum, ClickHouse, S3 и его аналоги
ClickHouse он мне кажется приобрёл ещё один виток популярности, потому что отвечает на многие потребности бизнеса из-за своей архитектуры и также является условно бесплатным.
GreenPlum, с ним конечно сейчас есть трудности, потому что он ушёл из Open Source, но GreenPlum версии 6 ещё доступен для установки. Но в тоже время это некий риск, который компании сейчас учитывают.
-
Весь дата-инженерный Open Source получил распространение и развитие:
Apache Airflow
Apache Kafka
Apache Iceberg
ClickHouse
S3 Minio
и другие инструменты
Также стоит оговориться, что компании стали аккуратнее с западными сервисами,
которые доступны в России. Часть из них ещё можно использовать в России, но всегда есть какой-то запасной аэродром, поэтому задача дата-инженеров прорабатывать такие архитектуры, которые позволят быстро и безболезненно переехать с одного сервиса на другой.
Собесы сломаны
Я сбился со счёту сколько сам прошёл собеседований и сколько собеседований прошли мои ребята.
Но скажу одно – собеседования сломаны.
Вне зависимости от позиции: junior, middle, senior или выше вас всё равно спросят какие-то базовые вещи:
Что такое индексы в БД.
Что такое GIL в Python.
И так далее
Есть компании, которые вовсе не умеют проводить собеседования. Они спрашивают алгоритмы, а сами не пишут никаких сервисов или используют какой-нибудь фреймворк, который даже не предполагает использования алгоритмов.
На рынке собеседований очень мало хороших примеров, на 100 собеседований найдётся 1-2 примера, когда общение задаётся и интересные вопросы появляются.
Я бы выделил четыре вида собеседований:
Вопрос-ответ. Вам задают вопрос и вы отвечаете, довольно простой вид собеседования со всех сторон. Довольно просто подготовиться и можно быстро найти работу.
Разбор какого-то кейса или технологии, если у вас есть пересечения. Условно вы можете всё интервью общаться про ClickHouse, про его кишки, про движки, распределение данных и прочее.
Несколько этапов в собеседовании. На первой встрече софты, потом дата-дизайн, потом алгоритмы, потом лайв-кодинг на sql и потом может быть общение с командой. Количество этапов и их разнообразие зависит только от нанимающей стороны.
Этот вид собеседований я называю – "общение на высокие темы". Вы общаетесь про ваш опыт, про ваши кейсы, про ваши технологии, тут могут быть разные вопросы про технологии, решения и про общий кругозор, что есть рядом с данными. Можно сказать, что это полноценное знакомство. Тут сразу проверяется ваша адекватность, ваши навыки, ваши рассуждения и прочее. Для меня это наиболее предпочтительные интервью, потому что ты не зажат в рамки, а можешь напрямую пообщаться с бизнесом
Стоит сразу отметить, что все собеседования – это субъективная оценка. Даже если вы ответите на 100% всех вопросов идеально вас всё равно могут не взять, потому что потому.
На самом деле решение принимает нанимающая сторона и поэтому вам не стоит отчаиваться, если вас не взяли. Просто идите дальше.
Зарплатный рынок дата-инженеров
Если говорить про зарплаты дата-инженеров, то сейчас можно найти хорошее предложение. Я бы ориентировался на такое:
junior 100+, 140 (верхняя граница)
middle 220-270+, 300 (верхняя граница)
senior 300+, (верхней границы нет, ну почти. Я бы сказал что 600к на руки – это потолок)
t-уровень 500+, (верхней границы нет, ну почти. Я бы сказал что 700к на руки – это потолок)
Если опять же судить по HH, то по поиску "data engineer":
Если посмотреть на getmatch в категории "Data Engineering":
Если смотреть специализированные каналы в tg по поиску работы, то можно найти разные предложения:
Также стоит обратить внимание, что не все вакансии публикуются и вы их не найдете в интернете, но если ваше резюме опубликовано, то HR вас сами найдут и вы уже можете узнавать по вилке, условиям и прочему.
Вот примеры моего общения с HR:
Дата-инженерные офферы
Мои офферы:
Оффер 530к (gross):
Оффер 420к (gross):
Оффер 379к (gross):
Офферы ребят:
Прогнозы
Понятное дело, что делать прогнозы – это дело не благодарное, но хотел бы немного порассуждать
Я буду делать референс на что говорил ранее в пункте "Необходимость дата-инженеров":
Кто решил переходить с западного софта на open source или российские аналоги продолжат это делать, поэтому спрос тут не пройдет.
Кому нужна оптимизация не закончатся. Поэтому вне зависимости от тенденций рынка оптимизация затрат на обслуживание дата-платформы будет востребована.
Интеграция новых источников, улучшение интеграций, а также их поддержка также останется. Потому что источники тоже развиваются и улучшаются и нужно держать всё в актуальном состоянии. Не получится один раз подключить какой-то API и жить на нём вечно.
Если обобщить вышесказанное, то рынок аутсорса для интеграций, создания, поддержки и прочего не схлопнется и там будет работа
Новые компании всегда будут появляться и тенденция на данные останется, поэтому тут тоже рынок будет расти.
Также если вам необходима консультация/менторство/мок-собеседование и другие вопросы по дата-инженерии, то вы можете обращаться ко мне. Все контакты указаны по ссылке.
kracko23
Собесы однозначно сломаны, потому что меня, как Дата-аналитика спрашивали тоже самое:
Что такое индексы в БД и оптимизация
Что такое GIL в Python
Что такое ООП
Что знаю про архитектуру БД
А потом приходишь работать, а там надо soft skills и сделать дашборд, как таблица в эксель)