Если вы начинающий специалист и ищете работу, скорее всего, вы уже знаете, что при трудоустройстве требуют не только резюме и сопроводительное письмо. Очень часто просят показать какие-то реальные рабочие кейсы. Но где брать кейсы, если опыта мало?
Наставники курса «Аналитик данных» расскажут, как находить проекты для портфолио аналитикам, дата-сайентистам и вообще всем, кто связан с датой. В этой статье читайте:
Пет-проекты: что они значат для работодателей
Идеи проектов и где искать вдохновение
Проекты на стыке экспертиз: о микроскопах и птичках
Совет: когда начинать проект, чтобы себя не подвести
Презентация проекта: базовая гигиена
Дополнительные материалы
Пет-проекты: что это и зачем они нужны
Пет-проекты — это проекты, которыми разработчики, аналитики, дата-сайентисты занимаются во внерабочее время для собственного удовольствия.
Зачастую такие проекты начинают, чтобы реализовать какую-то идею. Эта идея может быть вообще не связана с основной работой, либо это что-то, что на работе не является приоритетом. В рамках проекта можно применить новые технологии и стеки, которые хочешь освоить.
Пет-проекты помогают разобраться в темах, которые были непонятны во время обучения. Если сразу работать над коммерческим проектом, это рискованно и сложно. Если же создавать что-то только для себя, то у вас не будет каких-то критических дедлайнов или требований от клиента. Это такая безопасная среда, в которой вы сами обнаруживаете пробелы в своих знаниях и их закрываете.
Каждый пет-проект действительно ценен для работодателя. Обычно эйчарам прилетает пара сотен практически одинаковых откликов, а зацепиться в них не за что, если говорить о новичках только с учебным опытом.
Если у соискателя есть какой-то проект — неважно, коммерческий он или нет, — сразу ясно, что человек замотивирован, ему интересно развиваться в этой области. Он сам что-то делал, дополнительно изучал, прилагал усилия, чтобы добавить проект в портфолио.
Идеи проектов для аналитиков и дата-сайентистов
Необязательно придумывать что-то совершенно уникальное — обычно работодателям всё равно, насколько инновационные проекты у соискателей. Достаточно сделать проект на совесть и показать свои умения.
Визуализация данных из открытых источников. Это один из хороших вариантов для аналитиков. Источники могут быть любые, по которым можно посмотреть аналитику каких-то данных: государственные выгрузки, здравоохранение или ещё что-нибудь — их довольно много. В этих данных нужно выделить закономерности и отобразить их в виде графиков, диаграмм или дашборда.
Переосмысление учебных проектов. Если человек заканчивал курс, скорее всего, у него уже есть учебные проекты. Он может посмотреть, какие задачи он решал, какие скилы применял, и попытаться воспроизвести что-то похожее.
Парсинг данных любого сайта. С этого могут начать дата-сайентисты: например, можно сделать свой парсер вакансий с HH, LinkedIn или Habr.Career — откуда угодно. Для него же можно добавить дашборд, чтобы парсер не только качал актуальные вакансии, но и показывал аналитику: какое количество вакансий есть для джунов, какие стеки популярны.
Телеграм-бот или приложение. Необязательно создавать проект, который напрямую связан с анализом данных. Можно написать телеграм-бота или небольшое приложение на Python. Такой проект не покажет навыки по Data Science или аналитике, зато с его помощью можно прокачать технические скилы.
Если начинающий специалист может сам организовать проект, задеплоить его, найти инфраструктуру и так далее — это тоже очень важно. Это значит, что новичка не придётся обучать этим техническим деталям. Работодатели это ценят.
Не бойтесь заимствовать идеи. Поищите в интернете уже реализованные проекты и попробуйте сделать нечто похожее — результат у вас получится свой. Условно, если кто-то написал картину, это не значит, что вам не следует писать картины. |
Проекты на стыке Data Science и другой экспертизы
Классные проекты рождаются на стыке Data Science и текущей деятельности человека или его предыдущего опыта. Если у вас есть доменная экспертиза, используйте её в свою пользу.
Если вы работаете в чём-то связанном с экономикой, вы можете проанализировать некие экономические показатели, построить экономические модели. Если вы инженер и работаете на производстве, можно подумать про обработку сигналов или изображений, классификацию чего-то.
Несколько конкретных примеров:
Один из наших студентов занимался оптовым ритейлом. Он сделал приложение, которое парсит цены конкурентов и анализирует состояние рынка. Своим решением он сократил момент от изменения на рынке до принятия решений буквально до дня.
Был интересный проект у студента, который работал в исследовательском институте. Он придумал способ, как анализировать снимки с электронного микроскопа с помощью системы компьютерного зрения.
Одна из студенток с нуля разработала приложение, которое по фотографии птицы позволяет определить её вид. Студентка самостоятельно собирала датасет, потому что готового не было, — это тоже важный этап, который здорово бы пройти каждому.
Советы по созданию пет-проекта
Лучше не начинать делать пет-проект до конца обучения. Обычно, если человек идёт на обучение, у него уже есть своя жизнь и работа, а учёба — это уже вторая смена. Если запараллелить ещё и создание пет-проекта — будет сложно.
Сначала стоит прокачаться, получить необходимые знания и навыки, подготовиться к созданию проекта и поиску работы. Если у вас недостаточно навыков, скорее всего, вы быстро потеряете мотивацию и решите не завершать проект. В общем, незачем распылять свои ресурсы на всё сразу — разумнее действовать очерёдно.
В идеале начинать работу над проектом лучше с сокурсниками и наставником. Сокурсники обладают разными навыками, из них может получиться большая классная команда. Наставник поможет декомпозировать задачи, дать советы по реализации, посмотреть код.
Если вы чувствуете, что у вас недостаточно навыков для серьёзных проектов, — это на самом деле классный момент. Вы уже отловили, что вам чего-то не хватает, теперь можно потратить несколько дней на проблемную тему — так вы начнёте разбираться чуть больше. Через ещё две недели, вероятно, полностью закроете этот пробел.
Публикация пет-проекта
Все проекты в первую очередь публикуются на GitHub’е. Лучше всего придерживаться стандартной структуры и разложить все файлы по папкам. Посмотрите для примера любые успешные репозитории с большим количеством звёздочек.
Можно и продумать структуру самостоятельно. Скорее всего, через несколько дней работы над каким-то проектом структура сама к вам придёт: например, вы поймете, что что-то лежит неудобно или что-то приходится часто открывать.
Обязательно правильно оформите файл README. Опишите в нём, что вы делаете, как это делаете и какие у вас получаются результаты. Этот файл, который отображается на главной странице репозитория, — это визитка вашего проекта. Всегда приятно зайти на профиль разработчика или дата-сайентиста, у которого файлы README в красивом состоянии, правильно оформлены. Это показывает, что у потенциального сотрудника есть культура разработки и культура проведения исследований.
Ещё свои результаты можно показать с помощью веб-приложения. Это может быть простейшее приложение, куда пользователь вводит некие данные и получает ответ. Например, пользователь получает какую-то информацию по запросу или обработанную фотографию, которую он загрузил.
Получается, вдобавок к статичному коду в репозитории или дашборду (его можно опубликовать, например, на Yandex DataLens) вы можете добавить приложение или телеграм-бота. Это дополнительный плюсик в вашу пользу, когда работодатель увидит, что вы и на это способны.
Материалы для самостоятельного изучения
Kaggle — это бесплатный сервис, который позволяет участвовать в соревнованиях для аналитиков, общаться с дата-сайентистами, изучать машинное обучение и просто вдохновляться. Многие компании обращают внимание на место соискателя в пользовательском рейтинге, поэтому ссылку на Kaggle часто добавляют в резюме.
Data Science Pet Projects. FAQ — подробная статья о пет-проектах для дата-сайентистов из блога крупнейшего русскоязычного Data Science сообщества.
С чего начать изучение анализа данных и где найти идеи для первых проектов — статья в блоге Практикума. В ней мы рассказываем, какие источники использовать при изучении анализа данных, как развиваться в аналитике и сколько можно зарабатывать.