Вспомним некоторые определения математической статистики
Пусть задано вероятностное пространство .
Определение 1:
Случайной величиной , принимающей значения в множестве c -алгеброй подмножеств называется любая -измеримая функция , то есть выполняется условие .
Определение 2:
Выборочное пространство — это пространство всех возможных значений наблюдения или выборки вместе с -алгеброй измеримых подмножеств этого пространства.
Обозначение: .
Определённые на вероятностном пространстве случайные величины порождают на пространстве вероятностные меры На выборочном пространстве определяются не одна вероятностная мера, а конечное или бесконечное семейство вероятностных мер.
В задачах математической статистики известно семейство вероятностных мер , определённых на выборочном пространстве, и требуется по выборке определить, какой из вероятностных мер этого семейства соответствует выборка.
Определение 3:
Статистическая модель — совокупность, состоящая из выборочного пространства и семейства определённых на нём вероятностных мер.
Обозначение: , где .
Пусть и — выборочное пространство.
Выборку можно рассматривать, как совокупность действительных чисел. Припишем каждому элементу выборки вероятность, равную .
Пусть
Определение 4:
Эмпирическим распределением, построенным по выборке X, называется вероятностная мера :
То есть — отношение числа элементов выборки, которые принадлежат , к общему числу элементов выборки: .
Определение 5:
Выборочным моментом порядка называется — выборочное среднее.
Определение 6:
Выборочный центральный момент порядка определяется равенством — выборочная дисперсия.
В машинном обучении многие задачи заключаются в том, чтобы по имеющимся данным научиться подбирать параметр , который наилучшим образом описывает эти данные. В математической статистике для решения подобной задачи часто используют метод максимального правдоподобия.
В реальной жизни часто распределение ошибок имеет нормальное распределение. Для некоторого обоснования приведём формулировку центральной предельной теоремы.
Теорема 1 (ЦПТ):
Если случайные величины — независимы, одинаково распределены, математическое ожидание , дисперсия , то
Ниже сформулируем метод максимального правдоподобия и рассмотрим его работу на примере семейства нормальных распределений.
Метод максимального правдоподобия
Пусть для статистической модели выполнены два условия:
- если , то ;
- существует такая мера на , относительно которой для любой меры , , существует плотность , то есть .
Определение 7:
Оценкой максимального правдоподобия (о.м.п) параметра называется построенное по эмпирической мере , соответствующей выборке , значение , при котором достигается
Определение 8:
Функция , как функция от , называется функцией правдоподобия, а функция — логарифмическая функция правдоподобия.
Эти функции достигают максимума при одних и тех же значениях , так как — монотонная возрастающая функция.
Пример:
— семейство нормальных распределений с плотностями . По выборке Получили оценки для математического ожидания и дисперсии.
Если внимательно посмотреть на формулу можно сделать вывод, что функция принимает своё максимальное значение, когда минимальна. В задачах машинного обучения часто используют метод наименьших квадратов, в котором минимизируют сумму квадратов отклонений предсказанных значений от истинных.
Список используемой литературы:
- Конспект лекций по математической статистике, автор неизвестен;
- «Глубокое обучение. Погружение в мир нейронных сетей», С. Никуленко, А. Кадурин, Е. Архангельская, ПИТЕР, 2018.
robomakerr
А без формул то же самое можете?