Привет, читатель! Меня зовут Артём Сайгин, я веду телеграм канал Growth lab, в котором делюсь опытом роста IT-продуктов.
Я искренне считаю, что математическая статистика должна стать базовым навыком каждого маркетолога и продакта. Сейчас, к сожалению, это не так. Поэтому и написал «путеводитель» по статистике, для тех, кому тяжело подступиться к изучению данного раздела математики и, тем более, сделать его «навыком».
Все представленные ниже материалы основаны на моём опыте изучения математической статистики.
Дисклеймер: Уточню, что статья рассчитана на пользователей начального и среднего уровня, если у вас уровень знания статистики выше среднего, возможно, моя работа будет для вас не столь полезна.
Книги
Можно последовать такому алгоритму (я по нему и проходил обучение): прочитать первые две книги из списка ниже, потом перейти к первым трём курсам (последовательно их пройти), после прохождения курсов вернуться к чтению и уже параллельно читать и изучать курсы.
«Голая статистика. Самая интересная книга о самой скучной науке» Чарльз Уилан — мой интерес к статистике возник после прочтения именно этой книги. Книга фокусируется на логическом понимании мат. статистики без формул и углублений в теорию. Рекомендую для тех, кто только начинает погружаться в данную область.
«Статистика и котики» Савельев Владимир — небольшая и простая книга, поясняющая самые базовые вещи в иллюстрациях. Подойдет, чтобы освежить когда-то давно изученный материал и терминологию, но не более.
«Медико-биологическая статистика» Стентон Гланц — книга посерьёзнее предыдущих, в ней подробно, но при этом доступно и с примерами доносится информация про математическую статистику. Считаю книгу must-read.
«Статистика для всех» Сара Бослаф — не настолько простая книга, как может показаться из названия. На самом деле книга отлично структурирует и закрепляет знания в мат. статистике.
«Практическая статистика для специалистов Data Science» Брюс Питер — книга с упором на практикующих DS, подойдёт, чтобы подтянуть знания в области ML: деревья, бустинг и др.
«Доверительное А/В-тестирование. Практическое руководство по контролируемым экспериментам» Р. Кохави — название книги говорит само за себя, а написал её небезызвестный Рон Кохави.
«Теория вероятностей и математическая статистика» Гмурман В. Е. — отличная книга для предметного изучения мат.статистики: обилие формул, разделы, посвящённые теории вероятностей, случайным функциям, цепям Маркова и т.д. Но поставил книгу в самый конец, т.к сложность книги может отбить интерес (как это обычно бывает в вузах).
OpenIntro Statistics — это даже не книга, а целый онлайн-портал с книгами и лекциями в области статистики и математики. Тут вы найдёте много интересного.
Курсы
Именно в такой последовательности стоит проходить курсы (кроме самого последнего), так как пропуск одного из них усложнит прохождение последующих.
«Основы статистики» курс Bioinformatics Institute.
«Анализ данных в R» курс Bioinformatics Institute.
«Основы статистики. Часть 2» курс Bioinformatics Institute.
«Анализ данных в R. Часть 2» курс Bioinformatics Institute.
«Основы статистики. Часть 3» курс Bioinformatics Institute.
«Введение в Data Science и машинное обучение» курс Bioinformatics Institute — четвёртая часть курса «Основы статистики».
«Теория вероятностей» курс CS центр — математическая статистика тесно связана с теорией вероятностей, и поэтому рекомендую пройти и этот курс.
«Математическая статистика» курс CS центр — структурируем и закрепляем знания.
«Статистика в клинических исследованиях» курс на stepik — курс-исключение, его можно проходить как в самом конце, так и в самом начале изучения. Мне он понравился из-за структуры, курс небольшой и отлично подходит для того, чтобы освежить в памяти пройденный материал.
Блоги
Книги и курсы сформируют каркас базового знания мат. статистики, а чтение статей поможет находиться в контексте.
FlowingData — блог с фокусом на визуализацию данных от PhD in statistics.
Simply Statistics — простым языком о сложном, блог ведут три профессора биостатистики.
Gregory Gundersen — понятно доносит теорию многих (как известных, так и не очень) алгоритмов. Есть разбивка на топики: Statistical modeling, ML, Markov chain Monte Carlo и т.д.
Darren Wilkinson's — блог ведёт профессор статистики из Durham University.
R-bloggers — это блог-агрегатор, который предоставляет площадку для блоггеров пишущих на R.
Блог expf — telegram канал про эксперименты, статистику и анализ данных.
Data Science by ODS.ai — telegram канал для DS (и не только), где пишут про AI, ML, математическую статистику и т.д.
Заключение
Буду очень рад, если кому-то моя статья поможет, и маркетологов, практикующих мат. статистику станет больше. Если вы будете один из них — свяжитесь со мной ;)
Также буду признателен, если вы поделитесь своими полезными материалами по математической статистике в комментариях.