Обучение в Яндекс.Практикуме закончилось, получен сертификат и можно подвести итоги по обучению.
Так же, после первой статьи, у многих возникли дополнительные вопросы, поэтому хотелось и на них ответить и показать немного практики. Кейсов освоено достаточно много, поэтому в рамках одной статьи все охватить не получится.
Хочу описать в первую очередь то, что произошло в обучении после написания первой статьи. То, что хотелось бы описать отдельно.
Во-первых,
самым сложным лично для меня оказался курс «Автоматизация» — об автоматизации процессов анализа данных (скрипты, дашборды и т.д.), качество учебного материала оказалось совершенно не при чем.
Это были чисто технические сбои из разряда — «я, что-то нажала и все погасло» :)
(несовместимость версий ПО, проблемы с оборудованием), вызвали нарушение сроков выполнения работы. Еще оказалось, что практически не имела опыта работы с командной строкой, но пришлось срочно научиться…
В рамках этой темы, получили опыт работы на виртуальной машине в Яндекс.Облаке:
Сервис предоставляет масштабируемые вычислительные мощности для размещения, тестирования и прототипирования ваших проектов. Вы сами определяете число ядер, объём памяти, размер и количество дисков, а также выбираете операционную систему и зону доступности виртуальной машины. Управлять виртуальными машинами можно через консоль, командную строку (CLI), API или SDK.
Во-вторых,
произвел впечатление курс с заманчивым названием «Прогнозы и предсказания» (машинное обучение). Он оказался очень важен, аналитик обязательно должен иметь представление о машинном обучении, хотя это уже больше относится к Data Science. Скажу сразу, что мне идея внедрения, полученных аналитических выводов, сразу же на практике, понравилась, так как люблю полный цикл работы и чем меньше разделение процессов, тем более качественный результат получается (есть, правда, в этом и свои сложности).
Курс состоит из 3-х больших блоков:
- задачи машинного обучения в бизнесе,
- алгоритмы машинного обучения,
- процесс решения задач машинного обучения.
В-третьих,
выпускной проект проходил в Яндекс.Трекере – системе управления задачами и процессами для того, чтобы студенты погрузились в рабочий процесс, как в настоящей компании.
Каждый студент выполнял свой проект и присылал отчеты в Трекер, так же приходили и неожиданные задачи. Это был интересный опыт, но сложно было оценить временной дедлайн в реальных компаниях (за какое время обычно, в жизни делается тот или иной проект).
И последнее задание на взаимную проверку в Peergrade — это онлайн-платформа для проведения сеансов обратной связи со студентами. Там мы оценивали одно из заданий друг друга по проекту.
В-четвертых,
очень понравилась программа трудоустройства. Ты можешь быть хорошим специалистом, но совершенно не понимать, что нужно сделать, чтобы правильно и адекватно подать себя. Мне казалось, что имея на руках портфолио, с готовыми работами, работодатель все посмотрит, мы побеседуем, и процесс сократится для всех, но оказалось, что проекты никто и не смотрит. В большинстве случаев, все начинается с HR-отдела и поэтому у Вас должно быть нормальное резюме и сопроводительное письмо, да и много других тонкостей. Поэтому, неожиданно для меня, эта программа оказалась крайне полезна.
Выводы
Готовым специалистом на выходе Вы будете, если у Вас есть опыт работы в определенной сфере, где Вы сможете не только применить изученные инструменты, но и суметь интерпретировать полученный результат, а в идеале, еще и внедрить его.
Яндекс.Практикум даст Вам только инструменты для анализа, и изучить инструменты с нуля Вы действительно сможете (например окончив школу), но интерпретировать результат вряд ли, для этого существует профильное образование или опыт работы в определенной сфере.
В нашей стране, Практикум работает немного на опережение, так как оказалось, что по очень многим вакансиям вам понадобится Excel в совершенстве :). Видимо, работодатели с трудом, переходят на другие инструменты работы с данными.
Напомню, что наш поток был первым, и я понимала, что обязательно будут какие-либо технические трудности и разработчики курса, тоже будут в какой-то степени учиться на нас.
Главным минусом, для меня стал «человеческий фактор». Позднее, разбирая свои сданные проекты, обнаружила несколько ошибок, на которые преподаватели должны мне были указать. И вообще, чувствовалось, что преподавателям не хватает времени на проверку, списываю все это на новый продукт и этот вопрос вполне решаем. Тем более, что ребята делающие курс ну очень стараются сделать суперпродукт, например тема «Прогнозы и предсказания» была полностью обновлена и стала намного понятнее и полнее. Прохожу ее заново.
Так же были противоречия в рекомендациях по применению некоторых методов от разных преподавателей, различные точки зрения.
Изучаемые инструменты
(о чем лучше иметь представление до начала занятий, чтобы сэкономить время, особенно если Вы параллельно работаете):
- Python, лучше если Вы будете иметь представление о языке до начала занятий. Есть вводный курс, но не помешали бы и другие ознакомительные тоже;
- Jupyter Notebook, тоже лучше почитать перед началом занятий;
- SQL, требуется почти везде, все необходимое для начала работы точно было дано, теперь это вопрос практики;
- статистический анализ, настоятельно рекомендую перед началом пройти «Основы статистики» на Степике с Анатолием Карповым,
если не знаете совсем, то и во время прохождения темы «Статистический анализ данных» снова кратко просмотреть. Когда дойдете до темы «Прогнозы и предсказания» не помешает и «Основы статистики. Часть 2 и 3.» того же автора пройти и тогда будет более целостная картина.
Эти методы представлены довольно пОлно:
- инструменты для анализа бизнес-показателей (метрики и воронки, когортный анализ, юнит-экономика, пользовательские метрики);
- инструменты проверки гипотез, проектирование экспериментов (А/В-тестирование);
- инструменты презентации результатов аналитического исследования, визуализации (графики, презентации, отчеты);
- автоматизация процессов анализа данных (потоковые аналитические решения, регистрация событий в логах, создание регулярных отчетов, дашбордов, мониторинг событий, работа с облачными сервисами);
- машинное обучение, sklearn (предобработка, построение моделей, классификация, выбор лучшей модели), но все же это довольно краткий курс, и желающим работать в данной сфере, понадобится более продвинутый курс, например от того же Яндекса
А так же, если это было давно или Вы вообще ничего не знаете про теорию вероятностей, посмотрите хотя бы уроки от GetAClass вначале по комбинаторике, затем по теории вероятностей.
О необходимости английского языка говорить излишне.
Во второй части статьи, покажу применение на практике, полученных знаний для исследовательского анализа: рекламной кампании в Яндекс.Директ, заходов на сайт, выявления возможного фрода. На данных собранных за 6,5 лет.
qant
У многих возникли вопросы… Зашёл на предыдущую статью… А там 0 комментариев…
fenikx
вопросы, думаю, могли быть и в личку)
oneSmilla Автор
В личку и в Телеграм.