Замечательный метод МНК появился в недрах астрономии (точной науки), здесь мы покажем как можно существенно улучшить его оценки в гуманитарных (неточных) науках.

Сперва приведем реальный пример, демонстрацию способа уточнения МНК. Летом 2024 года я вычислил курс доллара в Казахстане на полгода вперед. И написал об этом статью здесь же - (все даты реальные, я не хакер, Хабр взломать не смогу:-)).

Этот прогноз сбылся, вот график курса тенге за второе полугодие 2024 года:

График курса тенге
График курса тенге

Как нетрудно заметить график линейный, как и написано в той статье. Отметим что эту статью я показывал разным СМИ в Казахстане, экономистам, отправлял в министерство. Для того чтобы Казахстан не тратил на валютные интервенции столь значительные суммы. Но везде на меня смотрели как на дурака. Вы что? Какие 530? Наши эксперты говорят о 480 тг за доллар. Откуда такая цифра?

Эконометрика и алхимия

В физике есть множество линейных уравнении, равенств. Закон Гука (F = k*l), сила тяжести (F = m*g), формула силы (F = m*a), формула массы и энергии (E = m*c2) и так далее. И отсюда легко выводятся линейные регрессионные зависимости (при обработке данных).

Например, если мы захотим найти коэфициент растяжения k для пружины то возьмем динамометр и линейку. Соберем данные в таблицу и получим хорошую оценку k с помощью МНК.

В экономике нет линейных зависимостей. В экономике в целом вообще нет никаких точных зависимостей в виде формул. Нельзя сказать что инфляция и ВВП зависят по такой то формуле, а цена на золото и хлеб по такой-то формуле. Нет формул вообще! Нет и уравнении, в отличие от физики и химии. Где их полно.

Есть модели. Но это не одно и то же. Ведь моделей много. И по ним связи получатся разные. И опять же нет одной единственной модели. Которая была бы принята всеми и давала бы хорошие оценки.

Поэтому когда экономисты говорят что величина x и y связана линейной (или не линейной) регрессионной зависимостью в экономических исследованиях то опираются на график. Типа вот здесь похоже на линейную зависимость, давайте сделаем линейную регрессию. Такой способ не является таким же легитимным как если бы мы имели дело с точным физическим законом. Если бы мы имели точную формулу в основании.

Что делать?

Здесь нужно отметить что в гуманитархных науках есть одно большое преймущество перед физикой, мы знаем мотивы людей!

Мы знаем как себя поведут богачи во время кризиса (крупные компании обычно сразу же уволняют людей в самом начале кризиса), мы знаем что почти любой бизнесмен хочет давать как можно меньше зарплаты, мы все это знаем...

И применяя это можем угадывать временные, мимолетные зависимости. Как говорят в экономике причино-следственные зависимости. Простой пример, летом этого года была засуха в нескольких районах РФ где выращивают гречку. И как следствие ее цена повысилась 3,3% за год. Вот здесь про это написано - https://agrotime.info/rossijanam-rasskazali-budet-li-deficit-grechki-iz-za-padenija-urozhaja/.

То есть засуха порождает повышение цены. Точно также как и собрания ОПЕК+ то снижают, то поднимают цены на нефть (с появлением электромобилей нефть стала той областью откуда нужно быстро смыться, со словами мама!). Или например если новый iPhone выйдет супер класным, мощным и более продаваемым чем ожидалось ранее, то вырастут ли акции Apple? С началом пандемии все начали общаться по Zoom. Как вы думаете выросли ли его акции от этого? В 2024 году Илон Маск агитировал за Дональда Трампа (а сейчас наверное сидит и думает, вот облом), вознося его до небес, и как следствие акции Тесла выросли.

Ну и совсем простой пример циклон. Циклон это большая воздушная масса движущаяся по планете и которая может быстро изменить погоду в вашем регионе.

Если такой циклон дойдет до вашего города станет ли у вас холоднее?
Если такой циклон дойдет до вашего города станет ли у вас холоднее?

В прогнозах погоды постоянно говорят например так, воздушные массы пришедшие из Сибири понизили температуру воздуха в Астане, а летом воздушные массы пришедшие из Иранского нагорья или из Средней Азии увеличили температуру до рекордных значении:

Теплые воздушные массы согревают холодную погоду Астаны
Теплые воздушные массы согревают холодную погоду Астаны

Если пришли теплые воздушные массы то температура повышается, если холодные то понижается. Все очень просто! Это элементарная математика. (про применение данного метода в метеороголии смотрите здесь - https://bolzhau.com/@about)

Или совсем другой пример. Допустим у нас имеются весы. Такие на которые стоят и они показывают ваш вес. Пружинные. Здесь классический случай МНК. В жаркую погоду пружина расстягивается а в холодную сжимается. И отсюда можно понять что ошибки измерения будут идти в сторону повышения в холодную погоду и иметь свойство снижатся в теплую погоду.

Онлайн демонстация метода

Для наглядности мы создали простой калькулятор - https://tendey.kz/esepteu.html. Вводим значения a, x1, x2, x3, q1, q2, q3 и жмем на кнопку:

Улучшаем оценку МНК
Улучшаем оценку МНК

Здесь снизу стоит оценка по МНК: y = 3,5*x + 5,33 (конечно же мы знаем что для МНК данных недостаточно, и здесь нарушаются условия его применения, ведь ошибка должна иметь нулевое математическое ожидание, просто иногда других данных и нету). Выше стоят 3 <= a и 4 <= a это интервальные оценки которые мы получили на основе направления изменения q. Из 3 <= a и 4 <= a получаем 4 <= a. Как это по русский называется правильнее, по казахский қиылысуы? Сечение или пересечение? Кажется пересечение. То есть искомый параметр должен быть больше 4 или ему равным.

a* = 5,79 это оценка по минимуму суммы квадратов yi - axi, конечно же нужно брать сумму квадратов yi - axi - b при 4 <= a. Просто этот минимум считается проще. А того посчитаем в Вольфрам Альфа:

Вычиляем с помощью Вольфрам Альфа
Вычиляем с помощью Вольфрам Альфа

Вот ссылка на результаты - https://www.wolframalpha.com/input?i=extrema+[%2F%2Fmath%3A(16+-+3a+-+b)^2+%2B+(12+-+2a+-+b)^2+%2B+(9+-+a+-+b)^2%2F%2F]+subject+to+[%2F%2Fmath%3A4+<%3D+a%2F%2F]++

Еще проще взять просто граничное значение (хотя не понятно будет что взять если границ будет две).

А как все это получилось?

Мы в этом калькуляторе взяли зависимость: y = ax + q

Саму q определили так: q = b + e

То есть ку это постоянный коэфициент в регрессии плюс ошибка измерения (белый шум):

Ку это все!
Ку это все!

А как мы узнаем что Ку стал больше или меньше? Элементарно Ватсон! Как мы узнали это по нагретой пружине, по событиям его вызывающим. Причем нам совсем не нужно само значение Ку. Нам достаточно знать только его направление изменения. То есть вырос ли он или снизился.

В примере сверху q1 больше q2 а q3 меньше q2. Это дают нам такие неравенства:

q1 >= q2

9 - a - b >= 12 - 2*a - b

a >= 3

q3 <= q2

16 - 3*a - b <= 12 - 2*a - b

4 <= a

Вы можете попробовать дать другие значения a, x, q в калькулторе https://tendey.kz/esepteu.html и посмотреть на результаты.

В другой Галактике

Если вы поймете данный метод то наверное заметите что он совсем не опирается на классическую статистику. Он сам по себе. Он совсем не имеет никакой связи со статистикой и случайными величинами имеющими функцию распределения.

Это не другая планета, это другая галактика. Галактика где все зависит от событии. Это применение МНК в других обстоятельствах. Причем все может изменится кардинально, до неузнаваемости. Как это иногда бывает в экономике и в жизни.

В более общем виде (не объязательно в линейных регрессионных зависимостях) мы имеем функционал отображения определенный на гладких многообразиях (по казахский көпбейне, на русском кажется так переводится) который меняется от событии:

F = F(A), где А это событие

Причем нашим являются те и только те случаи когда мы знаем как меняются уравнения или неравенства от событии понятным нам образом. Допустим доллар подскочил и выросла квартплата это наш случай, если от взрыва что то поменялось в ракете и не понятно как это отразилось на ее скорости, то это не наш случай.

В нашем случае коэффициенты в уравнениях и неравенствах должны меняться понятным нам образом и мы должны иметь возможность от этого получить больше информации.

Если вкратце то мы вместо МНК где минимизируются суммы квадратов минимизируем ту же сумму только с ограничениями. То есть вместо безусловного (шартсыз) получили условный (шартты) экстремум.

А как находить неравенства? Ну здесь все просто. Нужно знать как влияет тот или иной фактор на исследуемые вещи.

Комментарии (0)