Теорию вероятностей спрашивают и на собеседованиях, и на экзаменах, также она является фундаментом для многих методов машинного обучения. По моим наблюдениям студентам явно не хватает того курса теор вера, который есть в ВУЗах, чтобы научиться решать основные задачи — необходимы дополнительные материалы. В этой статье хотел бы поделиться моими самыми любимыми материалами и источниками для освоения теории вероятностей, имея за плечами крепкую школьную базу и скромные навыки в математическом анализе и линейной алгебре.
Первые шаги
Любой курс по теории вероятностей начинается с освоения классической вероятности. Вспомним определение вероятности, которое еще давали в школе:
То есть вероятность события А- это нужно количество удачных исходов (|A|) поделить на количество всех исходов ().
Например, задача: подбрасывается игральный шестигранный кубик d6, какова вероятность, что выпадет честное число? Конечно, ответ 1/2, ибо всего вариантов , а удачных вариантов |A = {2, 4, 6}| = 3. Итого 3/6 = 1/2.
В более сложных задачах на классическую вероятность вся сложность состоит в том, чтобы посчитать количество исходов. Здесь нужно знать комбинаторику. Для ее освоения советую Ленинградские математические кружки: главы Комбинаторика-1 и Комбинаторика-2. Пособие легендарное, написано для детей, понятным языком, очень много примеров и задач для самостоятельного решения. Кстати, материал классический и решения всех задач или их аналогов можно найти на форумах в интернете, чтобы себя проверить!
Если хотите глубже разобрать какую-то тему из Комбинаторики или освоить такие важные темы как "Формула включений и исключений", которые очень часто встречаются на собеседовании, то советую Виленкина. Книга большая, очень много разных сюжетов, для первого прочтения после ЛКМ советую лишь главу 3 и главу 4.
Сразу предупреждаю, что темы очень глубокие и осваивать их можно до бесконечности. Например, я как преподаватель сам возвращаюсь к ним и постоянно открываю для себя что-то новое. Мне кажется это просто бездонная бочка, поэтому советую вам действовать так: прочитать один параграф, понять общую идею, что-то порешать и переходить к следующему параграфу, при необходимости возвращаться к старым параграфам.
После освоения комбинаторики советую освоиться с суммированием, которое часто встречается в дискретной вероятности: суммы в вероятностях и математических ожиданиях.
Например, как посчитать, чему равно математическое ожидание геометрического распределения? Напомним, что случайная величина геометрически распределена, если . Как такое сделать смотрите вот этот ролик Михаила Абрамовича.
На самом деле кроме прошлого ролика и вот этого ролика, вам еще нужно вспомнить из школы чему равна сумма арифметическое и геометрической прогрессии. Далее самым оптимальным вариантом, как мне кажется, будет открыть задачник Алфутовой и решать задачи из 11 главы. Главное не стесняйтесь гуглить, товарищи! Предложенные задачи не рассчитаны на долгую медитацию. Если задач не получается в течение минут 5-15, то ее смело стоит гуглить, спрашивать у знакомых, спрашивать на формах и чатах, а потом просто решить аналогичную задачу на закрепление.
Дискретная теория вероятностей
Здесь очень советую курс Сердобольской на физфаке МГУ: он фундаментален, при этом абстрактные понятия как мера, интеграл Лебега, которые сильно расстраивают новичков, встречаются очень редко. Лекции с теорией здесь, семинары с примерами решения задач здесь. По ссылкам есть как и печатный конспект в pdf, так и записи живых занятий.
Конечно, без практики освоить материал невозможно, поэтому советую задачник Кочеткова, где много задач с интересным сюжетом (а не только ящики и шары). Также перед задачами приведена теоретическая справка и примеры решения стандартных задач.
Для любителей пожестче советую задачник Севастьянова, особенно убойной мне кажется подборка задач по условной вероятности, после этой подборки проблем точно не возникнет.
По моему опыту и опыту моих учеников для 95% карьерных собеседований хватает классической вероятности, условной вероятности, геометрической вероятности, что-то знать про дискретные и непрерывные случайные величины (как считать мат ожидание, дисперсию, что такое мода, медиана). Для экзаменов в магистратуру, ШАД и олимпиад нужно двигаться дальше!
Непрерывная теория вероятностей
Первым делом стоит освоить или повторить математический анализ, самое основное: как исследовать функцию с помощью производной, как взять интеграл. Для многомерных задач нужно освоить или повторить многомерные интегралы. Для этого советую замечательные семинары Скубачевского из МФТИ, где разобраны все стандартные задачи, а вся необходимая теория рассматривается на конкретных примеров. Для практики и отработки советую серию задачников Виноградовой, где кроме задач как всегда приведена необходимая теоретическая справка и примеры решения задач.
Параллельно с этим можно осваивать уже упомянутые выше семинары и лекции Сердобольской по непрерывной вероятности. Конечно, материал непростой, очень много деталей, которые трудно уместить в курс на 13 семинаров. Наверняка, вам будет не хватать примеров решения задач, поэтому могу посоветовать "Книжечку для экономистов", где также есть и теория, и разборы задач, и задачи для самостоятельного решения. Какие-то моменты освещены подробней или под другими углами, нежели у Сердобольской. Также там есть классный раздел по математической статистики, которого с лихвой хватит для собеседований и понимания фундамента машинного обучения. Еще мне нравится курс от CS: часть 1 и часть 2, который отлично подходит для структурирования материала, чтобы привести все знания в порядок, а также расширить их новыми примерами и сюжетами, единственное там мало практики. Для расширения горизонтов также советую семинары Шкляева, которые ведутся на мехмате МГУ для будущих математиков, поэтому без предыдущей подготовки может быть нелегко!
Задачники советую те же самые, которые советовал по дискретной вероятности.
Олимпиадный уровень
Здесь хотел бы посоветовать материалы для любителей нестандартных задач и для тех, кто готовиться к олимпиадам, магистратурам, ШАДам. Самое очевидное начать просто с разбора вариантов прошлых лет. Например, здесь собраны часть вариантов первого этапа в ШАД, а здесь часть вариантов второго этапа. Аналогично варианты олимпиад "Я - профессионал", "Высшая лига", "Колмогоровская олимпиада", "Заочная олимпиада по теории вероятностей" можно найти на официальных сайтах. Также олимпиады по математики проводит почти любая кафедра по математике, сборники прошлых лет здесь.
Еще советую два пособия на английском для тех, кто готовится к собеседованиям на позицию Quantative Resercher: один и два. В эту тему есть всякие подборки задач, составленные энтузиастами, самая известная: культурный код. Или например сборная солянка задач с зачетов мехмата легендарного Кондратенко, то есть зачеты настолько интересные, что студенты не поленились затехать условия и решения. Мне же очень нравятся заметки с семинаров, очень качественно составлена подборка.
Заключение
Надеюсь каждый читатель откроет для себя новый и интересный материал, а если не нашли среди предложенных свой любимый, то прошу вас поделиться им в комментариях: мне как практикующему преподавателю будет очень приятно добавить его в свою коллекцию.
ChePeter
Нужно ещё упомянуть применимость этих теорем. Собственно математика нужна только узким спецам, а так нужна прикладная математика.
Нужно уметь правильно прикладывать математику. Например пишете про теорвер и исходы испытаний. Для электронов верно, для одинаковых монеток, снарядов, моторов и т.д. может и сгодится, если доказать/допустить, что они одинаковые. Но в общем виде не применимо, особенно для людей.
"Сто рыжих и усатых пришли и купили ... " тогда стопервый купит с вероятностью 99 - это типичная ошибка бездумного применения математики.
А вот про это ни слова. И для применения линейной алгебры нужно евклидово пространство, и для градиента нужна мера и 0 в исследуемом пространстве.
А вот это всё почему-то скрывают якобы гуры и курсисты ( да и не только ) начинают ваять всякую чушь
avost
Интересно, а вы это откуда взяли? Всё ровно наоборот, на первом же занятии по теорверу рассказывают, что 100 "решек" подряд не только не гарантирует 101-ю "решку", но и вообще никак не влияет на вероятность её появления. Вы где теорвер изучали? :)
Но статистика с людьми всё же работает и неплохо.
Ага. И те, что что-то применяют в неевклидовых пространствах прекрасно об этом знают. А остальным не особо нужно, тк они применяют её в пространстве и на масштабах с большой точностью совпадающем с евклидовым, естественной мерой и очевидным нулём :)
Божечки! Неужели, это заговор?!?
PS. На самом деле, как раз естественников очень хорошо учат границам применимости. Другому полюсу - чистым математикам оно не особо нужно. А вот с прикладниками сложнее - их, вроде, должны этому учить, но меня, например (как раз примата) практически не учили. Я-то перед этим естественными науками позанимался и был хорошо знаком что значат и зачем нужны начальные и граничные условия, а вот мои соученики, кажется, как услышали, так и забыли про это. Именно границы применимости, конечно, понимают. Любая математическая теорема начитается с границ применимости. А вот как это на физический мир перенести - тут бывает проблемка.
А с теорвером есть другая проблемка - без всех этих интегралов Лебега, сигма-алгебр и прочего функана, теорвер выглядит как магия в которой из ниоткуда взялось большинство понятий и формул. В принципе, для физиков такой курс, видимо, привычен - законы физики также взялись "из тонкого воздуха", а вот с точки зрения математики, чтобы понять что происходит, надо лезть в функциональный анализ.