Меня зовут Павел Куницын, я работаю в Первой грузовой компании (ПГК) главным специалистом по анализу данных и машинному обучению. Недавно опубликовал пост на Kaggle с рекомендациями для тех, кто хочет перейти в Data Science, не имея релевантного опыта. Он оказался интересным сообществу, и я решил подготовить специально для вас расширенную версию публикации – дополнить важной информацией, рекомендациями.
Здесь я не напишу список онлайн-платформ с курсами по Data Science. Об этом писали уже много раз, а расскажу о том, как нужно учиться. У меня есть список правил, которых придерживаюсь сам, когда хочу развить свои профессиональные навыки в какой-то новой сфере. Используйте их не только при изучении Data Science, но и других областей.
1. Сформулируйте для себя конечную цель
Вы можете прийти в Data Science по разным причинам: от интереса к новой сфере до желания устроиться на высокооплачиваемую работу. Возможно, вы — руководитель проекта, и ваша цель – получить краткое представление о том, какие этапы включают в себя проекты по машинному обучению (ML), чтобы сделать общение со своей командой эффективнее. Или, может быть, вы аналитик, и ваша цель – получить новые технические навыки? А, может быть, ваша нынешняя работа никак не связана со статистикой или разработкой, вы никогда не писали код, но хотели бы научиться. Тогда целью может быть получение всех необходимых для этого знаний.
Для достижения каждой из перечисленных целей требуются разные стратегии и разное количество времени, поэтому формулируйте их четко. Чтобы правильно сформулировать свою цель, спросите себя:
Как работа в Data Science повлияет на качество моей жизни?
Какие возможности я получу, освоив Data Science?
Что я уже знаю о Data Science?
Как мне отслеживать свой прогресс в освоении новой профессии?
Изучение Data Science – это моя конечная или промежуточная цель?
Ответы на эти вопросы помогут вам встать на правильный путь в обучении и достаточно быстро получить необходимые навыки.
2. Прогресс на дальней дистанции важнее быстрых побед
Опыт показывает, что профессионал должен постоянно работать над собой. Однако, когда вы пытаетесь получить как можно больше знаний за минимум времени, то рискуете перегореть. Большинству людей трудно вырабатывать полезные ежедневные привычки. Сколько раз вы сдавались при попытке создать свой распорядок дня? Основная причина в том, что изменения всем нам даются нелегко.
Это также касается получения новых знаний в области машинного обучения. Когда мы заняты повседневными делами, работой, заниматься регулярно очень сложно. Пропустив занятие, легко разочароваться в себе из-за отклонения от намеченного плана. Поэтому не усложняйте то, что и так не очень легко усвоить, и занимайтесь в удобное для себя время.
Я бы также рекомендовал вам оценить приблизительный объем учебного материала, прежде чем погружаться в него. Обычно онлайн-курсы разбиты на модули. Вы можете заранее ознакомиться с их планом и решить, в какие дни будете заниматься.
3. Определитесь, что вам интересно
Если вы новичок в Data Science, то вас ждет много тем для изучения: линейные модели, ансамбли, глубокое обучение, снижение размерности, кластеризация... Чтобы определиться, на чем сосредоточиться, пройдите курс для начинающих. Как правило, в нем есть основы по всем ключевым темам. Так вы получите общее представление о том, что такое Data Science, и сможете определиться с тем, что вас привлекает больше. Такая стратегия поможет вам стать профессионалом быстрее, так как внимание будет сосредоточено на одной предметной области.
4. Отслеживайте свой прогресс
Лучшая мотивация в работе — это ее видимые результаты. Ничто так не вдохновляет, как ощущение того, что вы перешли на новый уровень знаний и умений. Решайте аналогичные задачи по машинному обучению регулярно. Допустим, вы построили свою первую регрессионную модель на табличных данных. Теперь попробуйте построить еще одну на другом датасете. В конце концов, вы начнете замечать, что этапы исследования, обработки данных и построения модели даются легче. Результат должен быть заметен. Всегда ищите свидетельства прогресса, чтобы они мотивировали вас на дальнейший рост.
5. Пробуйте свои силы в решении реальных задач
В самом начале своей карьеры в Data Science я часто упускал из виду, что изучаю чужие работы, но не пишу свой собственный код. Не повторяйте эту ошибку. Для начала подойдет набор данных Titanic, но после того, как вы приобретете базовые навыки, переходите к более актуальным задачам. Это поможет вам создать портфолио реальных проектов, что очень ценится работодателями. Так вы покажете, что принесете пользу компании.
Например, один из проектов, который я создал во время обучения с помощью фреймворков Gensim и Streamlit – обрабатывал отзывы о гостиницах и рекомендовал лучшие из них. Я сделал его, чтобы помочь знакомой найти отель, который бы соответствовал ее пожеланиям. Ищите вдохновение для творчества и делайте процесс обучения интересным.
Заключение
Изучать Data Science непросто, однако, с точки зрения подхода к обучению, эта задача похожа на другие, поэтому вы можете применить лучшие практики из других областей. Я постарался дать универсальные рекомендации, которые помогут вам добиться высоких результатов и достичь поставленных целей. Надеюсь, мои советы помогут вам усовершенствовать стратегию персонального развития. Может быть, у вас есть свои рекомендации? Буду рад, если поделитесь в комментариях.
Cost_Estimator
У вас в облаке нет слова Statistics. Это облако, похоже, испорчено, заменить бы.
kunitsynpv Автор
Добрый день! Слово в облаке есть, но, возможно, стоило сделать его больше. Математическая статистика, действительно, играет ключевую роль в нашем деле. Спасибо, что обратили внимание!
sharptop
Есть же - от большого слова data правее последней а, третье слово в верхнем ряду
Cost_Estimator
Спасибо, только с вашей подсказки и смог увидеть.