Привет! Меня зовут Роман Ленц, в Первой грузовой компании (ПГК) я занимаюсь анализом данных и машинным обучением в рамках проекта «Цифровой вагон», подробнее о котором рассказано здесь. Еще 3 года назад я работал инженером-конструктором в зарубежной строительной компании. Почему я решил кардинально поменять свою карьерную траекторию, почему выбрал именно Data Science, и как я к этому пришёл? Поделюсь опытом, который, возможно, окажется полезным для молодых специалистов, ищущих «работу мечты». Тем, кто задумался о смене профессии, думаю, информация тоже будет полезна.

Я получил высшее образование за границей. После окончания вуза устроился на работу в московское представительство иностранной строительной компании. Мы занимались проектированием объектов по всему миру, но на российском рынке количество заказов постепенно снижалось: стоимость услуг была слишком высокой для местных клиентов. Стало очевидно, что скоро придется искать другую работу. Именно тогда я задумался о том, чтобы сменить карьерную траекторию.

Не скажу, что выбрал Data Science совсем случайно. Как у инженера у меня был сильный математический бэкграунд, я был знаком с основами некоторых языков программирования, разбирался в работе с данными. Меня привлекали области, где можно применить эти навыки и знания, поэтому направление Data Science показалось мне интересным вариантом для более глубокого погружения.

Определившись, я стал постепенно вспоминать основы математики, линейной алгебры, статистики, теории вероятности. Параллельно начал проходить профильные курсы на крупных онлайн-платформах – DataCamp, Stepik, Яндекс.Практикум и других.

Вот несколько практических советов, которые, как мне кажется, помогли совершить переход в новую для меня область деятельности. Конечно, мотивация, вера в себя, стремление к поставленной цели – это, наверное, хорошо, но без конкретных действий не добиться конечного результата. Итак, поехали!

Участие в хакатонах по машинному обучению

От знаний к практике. Участвуя в хакатонах, я учился применять все полученные знания на онлайн курсах на решении прикладных задач. Самая  популярная площадка для проведения соревнований по машинному обучению, которой мне приходилось пользоваться в поисках проводимых мероприятий, –  Kaggle.com, но вообще-то подобных площадок довольно много. Есть и российские аналоги, например, ребята из Boosters.pro организовывают и проводят крутые чемпионаты для крупных российских компаний.

Хакатоны дают выход на реальные задачи от реальных компаний, в том числе лидеров рынка. Компании часто бывают заинтересованы не только в перспективных и интересных решениях от участников, но и в найме персонала, поэтому есть шанс сразу же после завершения соревнований получить приглашение на собеседование или оффер. Кроме того, благодаря участию в решении таких задач вы не просто «прокачиваете» свои навыки, но и начинаете лучше понимать, что нужно и важно для компаний конкретных отраслей. Если это банк, то ожидайте задачи на кредитный скоринг, для тяжелой промышленности — это оптимизационные задачи, а в ритейле - прогнозирование спроса и промо. Это будет вашим преимуществом во время собеседований.

Другой важный плюс хакатонов – общение и погружение в профессиональную среду. На специализированных площадках можно не просто найти объявления о предстоящих мероприятиях, но и партнеров для участия в них. Конечно, топовые участники не горят желанием заполучить в свою команду новичка. Вам в любом случае придется начинать с чистого листа и делать себе имя в этой среде с нуля, но за это время вы успеете обзавестись разными контактами, которые могут пригодиться в будущем. Более того, после окончания чемпионатов участники делятся своими решениями, где всегда можно найти много нового для себя, как в написании кода, так и самого подхода к решению задачи.

Работа с ментором

Мне повезло: у меня был опытный приятель из Data Science, который на определенном этапе стал моим ментором. Он много рассказывал о специфике работы, из чего она состоит, какие проекты реализовываются и какие компании активно внедряют машинное обучение в свои процессы. Кстати, в хакатонах мы тоже иногда участвовали в паре. Я мог не знать некоторые нюансы, но благодаря совместной работе получал огромный опыт. 

Если такого друга-ментора у вас нет, отчаиваться не стоит. У Data Scientists и всех причастных к этой сфере разработчиков есть свое довольно живое комьюнити на 60 тысяч человек в Slack, которое так и называется – Open Data Science. Здесь есть и те, кто только интересуется этой сферой и делает первые шаги, и уже продвинутые специалисты. Смотрите здесь анонсы мероприятий, связанных с машинным обучением, актуальные вакансии, обсуждайте свои задачи или проекты, узнавайте об очных или онлайн митапах, которые проводятся время от времени. На сайте сообщества можно посмотреть открытые обучающие курсы, соревнования и различные проекты, в которых можно принять участие.

Практика и прокачка soft skills

Еще одним важным аспектом перехода в DS являются те soft skills, на «прокачивание» которых будущий специалист должен обратить особое внимание. Понятно, что в части базовых навыков важны математическая подготовка, знание алгоритмов машинного обучения, статистики и теория вероятности. Но не менее важный навык – умение общаться с заказчиком, услышать его потребности, убедить его, не нагружая сложными математическими формулировками.

Почему важно уметь разговаривать на бизнес-языке? Часто бывает, что можно потратить много времени на разработку суперсложной модели, которая не будет работать в реальной жизни. Ведь зачастую задачу можно решить не только с помощью сложных алгоритмов машинного обучения, нейронных сетей, но и при помощи простых эвристик, которые основаны на определённой бизнес-логике. И часто ожидаемый результат можно получить без использования сложных алгоритмов. Именно этот навык общения на бизнес-языке, приобретенный мной «в прошлой жизни», оказался крайне полезен и в новой профессии.

В числе других важных soft skills, которые кажутся мне важными, – умение строить работу в команде. Налаживание правильного взаимодействия в коллективе и эффективный процесс распределения задач и ролей – навык, ценность которого трудно преувеличить.

Добавил бы я к этому и умение быстро принимать решения. Этот навык тоже пришел ко мне в годы работы в строительной отрасли. Срок любого проекта ограничен и запросы от заказчика часто меняются, это надо всегда иметь ввиду. Поэтому умение быстро понять и оценить потребность бизнеса – важная компетенция для любого DS специалиста. 

Ходите на интервью

Хотелось бы добавить ещё один важный этап - интервью, который многие игнорируют или зачастую просто боятся. При самостоятельном освоении материала по машинному обучению, статистике, больших данных и т.д., а особенно при прочтении различных статей на форумах, вам часто будет приходить в голову мысль: «А почему так много нужно знать?».  Именно большой поток информации при прохождении курсов может отпугнуть тех, кто хочет войти в DS. Но нужно понимать, что есть довольно большой разброс желаемых требований к кандидатам в зависимости от того, чем компания занимается и её уровня технологической «зрелости». В одной компании вам нужно знать всё о компьютерном зрении и NLP, а в другой достаточно будет знать основы классического машинного обучения и немного статистики. Поэтому ходите на интервью как можно чаще и практикуйтесь. Только так вы сможете понять, что от вас ожидают работодатели и где стоит подтянуть свои знания. В этой сфере всё стремительно меняется, нужно всегда быть в теме лучших практик на рынке, и об этом вы больше всего узнаете от ваших потенциальных работодателей.

Буду рад, если кому-то помог решиться на первые шаги в Data Science. Верьте в себя и не бойтесь круто изменить судьбу.

Комментарии (4)


  1. yoda776
    14.06.2022 15:00
    +1

    я стал постепенно вспоминать основы математики, линейной алгебры, статистики, теории вероятности

    Было бы неплохо озвучить список математических дисциплин, которые нужно знать, а еще лучше список литературы.


    1. RLents Автор
      14.06.2022 16:48
      +4

      Список математических дисциплин и литературы следующий:

      1. Линейная алгебра:

      Онлайн-курс «Линейная алгебра» на Stepik (https://stepik.org/course/2461/promo?search=1111440525);

      «Введение в алгебру», А.И. Кострикин.

      1. Математический анализ:

      Онлайн-курс от Khan Academy (https://www.khanacademy.org/math/calculus-1);

      Онлайн-курс «Введение в математический анализ» на Stepik (https://stepik.org/course/95/promo?search=1111429900).

      1. Теория вероятностей и математическая статистика (от простого к более продвинутому):

      «Статистика и котики», Владимир Савельев;

      Онлайн курс «Основы статистики» от Анатолия Карпова на Stepik (https://stepik.org/course/76/promo);

      «Теория вероятностей и математическая статистика», В. Е. Гмурман.


    1. ChoyoChagas
      16.06.2022 11:22

      Было бы неплохо озвучить список математических дисциплин, которые нужно знать, а еще лучше список литературы.

      Список материалов для cамостоятельного изучения от@ChoyoChagas:


      1. RLents Автор
        17.06.2022 10:28

        Спасибо за комментарий. У вас хорошая подборка материала по теме :)