Первая статья здесь.

Обучение в Яндекс.Практикуме закончилось, получен сертификат и можно подвести итоги по обучению.


Так же, после первой статьи, у многих возникли дополнительные вопросы, поэтому хотелось и на них ответить и показать немного практики. Кейсов освоено достаточно много, поэтому в рамках одной статьи все охватить не получится.

Хочу описать в первую очередь то, что произошло в обучении после написания первой статьи. То, что хотелось бы описать отдельно.

Во-первых,


самым сложным лично для меня оказался курс «Автоматизация» — об автоматизации процессов анализа данных (скрипты, дашборды и т.д.), качество учебного материала оказалось совершенно не при чем.

Это были чисто технические сбои из разряда — «я, что-то нажала и все погасло» :)
(несовместимость версий ПО, проблемы с оборудованием), вызвали нарушение сроков выполнения работы. Еще оказалось, что практически не имела опыта работы с командной строкой, но пришлось срочно научиться…


В рамках этой темы, получили опыт работы на виртуальной машине в Яндекс.Облаке:

Сервис предоставляет масштабируемые вычислительные мощности для размещения, тестирования и прототипирования ваших проектов. Вы сами определяете число ядер, объём памяти, размер и количество дисков, а также выбираете операционную систему и зону доступности виртуальной машины. Управлять виртуальными машинами можно через консоль, командную строку (CLI), API или SDK.


Во-вторых,


произвел впечатление курс с заманчивым названием «Прогнозы и предсказания» (машинное обучение). Он оказался очень важен, аналитик обязательно должен иметь представление о машинном обучении, хотя это уже больше относится к Data Science. Скажу сразу, что мне идея внедрения, полученных аналитических выводов, сразу же на практике, понравилась, так как люблю полный цикл работы и чем меньше разделение процессов, тем более качественный результат получается (есть, правда, в этом и свои сложности).

Курс состоит из 3-х больших блоков:

  • задачи машинного обучения в бизнесе,
  • алгоритмы машинного обучения,
  • процесс решения задач машинного обучения.

В-третьих,


выпускной проект проходил в Яндекс.Трекере – системе управления задачами и процессами для того, чтобы студенты погрузились в рабочий процесс, как в настоящей компании.


Каждый студент выполнял свой проект и присылал отчеты в Трекер, так же приходили и неожиданные задачи. Это был интересный опыт, но сложно было оценить временной дедлайн в реальных компаниях (за какое время обычно, в жизни делается тот или иной проект).

И последнее задание на взаимную проверку в Peergrade — это онлайн-платформа для проведения сеансов обратной связи со студентами. Там мы оценивали одно из заданий друг друга по проекту.

В-четвертых,


очень понравилась программа трудоустройства. Ты можешь быть хорошим специалистом, но совершенно не понимать, что нужно сделать, чтобы правильно и адекватно подать себя. Мне казалось, что имея на руках портфолио, с готовыми работами, работодатель все посмотрит, мы побеседуем, и процесс сократится для всех, но оказалось, что проекты никто и не смотрит. В большинстве случаев, все начинается с HR-отдела и поэтому у Вас должно быть нормальное резюме и сопроводительное письмо, да и много других тонкостей. Поэтому, неожиданно для меня, эта программа оказалась крайне полезна.

Выводы


Готовым специалистом на выходе Вы будете, если у Вас есть опыт работы в определенной сфере, где Вы сможете не только применить изученные инструменты, но и суметь интерпретировать полученный результат, а в идеале, еще и внедрить его.

Яндекс.Практикум даст Вам только инструменты для анализа, и изучить инструменты с нуля Вы действительно сможете (например окончив школу), но интерпретировать результат вряд ли, для этого существует профильное образование или опыт работы в определенной сфере.


В нашей стране, Практикум работает немного на опережение, так как оказалось, что по очень многим вакансиям вам понадобится Excel в совершенстве :). Видимо, работодатели с трудом, переходят на другие инструменты работы с данными.

Напомню, что наш поток был первым, и я понимала, что обязательно будут какие-либо технические трудности и разработчики курса, тоже будут в какой-то степени учиться на нас.

Главным минусом, для меня стал «человеческий фактор». Позднее, разбирая свои сданные проекты, обнаружила несколько ошибок, на которые преподаватели должны мне были указать. И вообще, чувствовалось, что преподавателям не хватает времени на проверку, списываю все это на новый продукт и этот вопрос вполне решаем. Тем более, что ребята делающие курс ну очень стараются сделать суперпродукт, например тема «Прогнозы и предсказания» была полностью обновлена и стала намного понятнее и полнее. Прохожу ее заново.

Так же были противоречия в рекомендациях по применению некоторых методов от разных преподавателей, различные точки зрения.

Изучаемые инструменты


(о чем лучше иметь представление до начала занятий, чтобы сэкономить время, особенно если Вы параллельно работаете):

  • Python, лучше если Вы будете иметь представление о языке до начала занятий. Есть вводный курс, но не помешали бы и другие ознакомительные тоже;
  • Jupyter Notebook, тоже лучше почитать перед началом занятий;
  • SQL, требуется почти везде, все необходимое для начала работы точно было дано, теперь это вопрос практики;
  • статистический анализ, настоятельно рекомендую перед началом пройти «Основы статистики» на Степике с Анатолием Карповым,


    если не знаете совсем, то и во время прохождения темы «Статистический анализ данных» снова кратко просмотреть. Когда дойдете до темы «Прогнозы и предсказания» не помешает и «Основы статистики. Часть 2 и 3.» того же автора пройти и тогда будет более целостная картина.

Эти методы представлены довольно пОлно:

  • инструменты для анализа бизнес-показателей (метрики и воронки, когортный анализ, юнит-экономика, пользовательские метрики);
  • инструменты проверки гипотез, проектирование экспериментов (А/В-тестирование);
  • инструменты презентации результатов аналитического исследования, визуализации (графики, презентации, отчеты);
  • автоматизация процессов анализа данных (потоковые аналитические решения, регистрация событий в логах, создание регулярных отчетов, дашбордов, мониторинг событий, работа с облачными сервисами);
  • машинное обучение, sklearn (предобработка, построение моделей, классификация, выбор лучшей модели), но все же это довольно краткий курс, и желающим работать в данной сфере, понадобится более продвинутый курс, например от того же Яндекса

А так же, если это было давно или Вы вообще ничего не знаете про теорию вероятностей, посмотрите хотя бы уроки от GetAClass вначале по комбинаторике, затем по теории вероятностей.

О необходимости английского языка говорить излишне.

Во второй части статьи, покажу применение на практике, полученных знаний для исследовательского анализа: рекламной кампании в Яндекс.Директ, заходов на сайт, выявления возможного фрода. На данных собранных за 6,5 лет.