О том, как правильно понимать определитель матрицы / forpes.ru

Главная
О том, как правильно понимать определитель матрицы

О том, как правильно понимать определитель матрицы +21

01.10.2021 17:49

araik1 32 12000 Источник

Помните байку про интеграл, который пригодился в жизни? Так вот, у определителя тоже есть замечательное применение - пугать детей формулой Лейбница. А давайте даже перепишем ее куда-нибудь в середину, чтобы всем было хорошо видно.

$\det A = \sum_{\sigma \in S_n} \operatorname{sgn(\sigma)}\prod_{i = 1}^na_{i\sigma(i)}$

Расшифровывается это дело следующим образом: если у нас есть матрица

$A = \begin{pmatrix} a_{11} & ... & a_{1n}\\ ... & & ... \\ a_{n1} & ... & a_{nn} \end{pmatrix}$

над некоторым полем $\operatorname{F}$ , то определителем этой матрицы называют сумму всевозможных произведений, состоящих из $\operatorname{n}$ элементов этой матрицы, взятых по одному из каждой строки и из каждого столбца, причем каждое произведение входит в эту сумму с тем знаком, который имеет соответствующая перестановка индексов этих элементов в этом произведении.

Возникает естественный вопрос: зачем нужна такая навороченная конструкция. Можно конечно сказать, что смысл проявится позже, пока просто запомните и не задавайте лишние вопросы и т.д., но если быть откровенным, то стоит признать - такое определение определителя не мотивировано ничем. А между прочим именно оно является самым общеизвестным.

Другой способ введения определителя связан с его характеристическим свойством. Напомним, полилинейной формой называется функция $f:V_1 \times ... \times V_m \to F$ , определенная на декартовом произведении некоторых векторных пространств V_i (заданных над одним и тем же полем), принимающая значения в поле и линейная по каждому аргументу: $f(\vec{v_1}, ... ,\vec{v_i} + \vec{v_j} ,... ,\vec{v_m}) = f(\vec{v_1}, ... ,\vec{v_i} ,... ,\vec{v_m}) + f(\vec{v_1}, ... , \vec{v_j} ,... ,\vec{v_m})$ $f(\vec{v_1}, ... ,\lambda \vec{v_i} ,... ,\vec{v_m}) = \lambda f(\vec{v_1}, ... ,\vec{v_i} ,... ,\vec{v_m})$ . Форма называется кососимметрической, если при инверсии любых двух (не обязательно соседних) аргументов она меняет знак.

С кососимметричностью есть одна небольшая проблема. Возьмем для определенности обычное поле $\mathbb{R}$ действительных чисел и рассмотрим какую-нибудь -местную кососимметрическую формунад ним. Посмотрим, чему может быть равно $f(\vec{v_1}, ... ,\vec{v_i} ,..., \vec{v_i}, ... \vec{v_m})$ , т.е. чему может равняться эта форма на наборе векторов, содержащем 2 равных вектора. При инверсии этих двух векторов форма с одной стороны не меняется, а с другой стороны, меняет знак. Единственное действительное число, не меняющееся при изменении знака - это ноль. Зададимся теперь вопросом, а будет ли справедливым это свойство (равенство формы нулю на наборе, содержащем пару равных векторов) в случае произвольного поля. Если a = -a , то a + a = 0 , следовательно a(1+1) = 0 . Т.к. в полях нету делителей нуля, то в случае поля характеристики $\ne$ 2 получаем, что a = 0 . Но что будет в случае, если характеристика равна 2? А будет то, что из равенства a = -a не следует, что a = 0 . В самом деле, возьмем поле $\mathbb{F_2}$ вычетов по модулю 2 (2 простое число, так что это действительно поле, а не просто кольцо). В этом поле единица обратна сама себе (т.к. $1 + 1 = 2 \equiv 0 (\operatorname{mod 2})$ ), т.е. 1 = -1 . Вместе с этим единица, очевидно, не равна нулю (это свойство выполняется в любом поле наряду с тем фактом, что в любом же поле всегда существуют ноль и единица; требование нетривиальности кольца входит в определение поля). Предыдущие рассуждения показывают, что из "наивной" кососимметричности (определение которой написано выше) в случае поля характеристики 2 еще не вытекает равенство нулю соответствующей формы на наборе, содержащем равные вектора.

Можно конечно всюду далее рассматривать исключительно поля характеристики $\ne$ 2 и пользоваться "слабым" определением кососимметричности, а можно поступить умнее и немного усилить определение кососимметричности специально для полей характеристики 2 так, чтобы обычная кососимметричность следовала из "сильной". Для этого достаточно потребовать 2 вещи: во-первых, форма должна быть полилинейна, а во-вторых она должна принимать значение ноль всегда, когда среди ее аргументов есть равные. Свойство, которое вытекало из "наивной" кососимметричности для полей характеристики $\ne$ 2 само теперь является составной частью определения кососимметричности (правда только для полей характеристики 2).

Доказательство

Из полилинейности и равенства формы нулю на строках с равными аргументами следует, что если к одному вектору прибавить другой, умноженный на число, то значение формы не изменится. При умножении какого-либо вектора на число $\ne$ 0 сама форма умножается на это число (в частности, если обратить знак какого-либо вектора из набора, то знак самой формы тоже поменяется.

Произвести инверсию векторов в наборе аргументов можно с помощью преобразований этих двух типов. И если внимательно проследить цепочку преобразований, то в конце концов окажется, что форма поменяла знак.

Далее под кососимметричностью будем понимать кососимметричность в "сильном" смысле.

Определение

Определитель матриц- это единственная кососимметрическая полилинейная форма строк матрицы, нормированная единицей на единичном наборе векторов.

Надо сказать, это не самое плохое определение. Но и оно не лишено недостатков. Основные вопросы здесь возникают по поводу кососимметричности. В первую очередь непонятно, почему это свойство вообще важно. Ну меняет функция знак при перестановке двух аргументов и пусть меняет, почему мы так стремимся исследовать именно это свойство, а не какое-нибудь другое. Но здесь все еще хуже. Мы хотим, чтобы форма еще и принимала нулевое значение на наборе, содержащем равные вектора. И в некотором смысле для нас это даже важнее самой кососимметричности, раз мы стали подгонять определение последней под выполнение этого свойства. Все эти экзерсизы с характеристиками выглядят довольно искусственно.

Критикуешь - предлагай

В действительности есть очень простой и естественный пусть построения определителя, при котором все эти вопросы отпадают сами собой. И я постараюсь по возможности максимально последовательно описать этот способ.

Начнем с некоторых предварительных замечаний. Основным объектом изучения линейной алгебры являются конечномерные векторные пространства. Неформально говоря, на любое - мерное векторное пространство над полемможно смотреть как на "координатное" пространство F^n , состоящее из упорядоченных наборов длины элементов поля. Более строго, пусть у нас есть- мерное векторное пространство над полем . Выбор (упорядоченного) базиса $(\vec{e_1}, ... , \vec{e_n})$ этого пространства индуцирует изоморфизм $I : V \to F^n$ , ставящий в соответствие каждому вектору $\vec{v} \in V, \vec{v} = \lambda_1\vec{e_1}+ ... +\lambda_n\vec{e_n}$ набор $(\lambda_1, ... ,\lambda_n) \in F^n$ его координат в базисе $(\vec{e_1}, ... , \vec{e_n})$ . Таким образом, во всех дальнейших построениях речь пойдет по большей части про вектора координатного пространства.

Очевидно, некоторый набор $(\vec{v_1}, ... , \vec{v_n})$ векторов пространства является линейно (не)зависимым, тогда и только тогда, когда соответствующий ему набор векторов пространства F^n будет линейно (не)зависимым.

Свойство линейной зависимости/независимости действительно очень важно. Дело в том, что система из n>1 векторов пространства будет линейно зависимой тогда и только тогда, когда найдется вектор в этой системе, который можно линейно выразить через остальные.

Довольно естественным выглядит желание иметь некоторую функцию- индикатор линейной зависимости векторов. Учитывая, что любое векторное пространство "оцифровывается" своим координатным пространством, достаточно иметь такую функцию, определенную на декартовом произведениикопий пространства F^n и принимающую значения в поле. Таким образом, мы предъявляем к функциивсего лишь 2 очень естественных требования:

Полилинейность.
Она должна принимать нулевое значение на любой линейно зависимой системе векторов.

На аргументы этой функции удобно смотреть как на строки матрицы

$A = \begin{pmatrix} a_{11} & ... & a_{1n}\\ ... & & ... \\ a_{n1} & ... & a_{nn} \end{pmatrix} = \begin{bmatrix} \vec{v_1}\\ ...\\ \vec{v_n} \end{bmatrix}$

Заметим, на данном этапе мы еще даже не знаем, существует ли такая функция или нет. Но мы можем в предположении ее существования посмотреть на ее поведение.

$D(\vec{v_1}, ... ,\vec{v_i} ,..., \vec{v_i}, ... \vec{v_n}) = 0$ . Действительно, строка аргументов, содержащая пару равных значений, очевидно, линейно зависима, а значит функциябудет принимать на ней нулевое значение.
кососимметрична (в любом смысле, учитывая полилинейность + п.1). Доказательство абсолютно аналогично тому, которое находится выше под спойлером.
Рассмотрим, чему равнана некотором наборе строк $(\vec{v_1}, ... ,\vec{v_n})$ :

$D(\vec{v_1}, ... ,\vec{v_n})= D(a_{11}\vec{e_1} + ... + a_{1n}\vec{e_n}, ... , a_{n1}\vec{e_1} + ... + a_{nn}\vec{e_n}) =$ $= \sum_{\sigma \in S_n}a_{1\sigma(1)}\cdot ... \cdot a_{n\sigma(n)}\cdot D(\vec{e_{\sigma(1)}}, .... , \vec{e_{\sigma(n)}}) =$ $=\sum_{\sigma \in S_n}\operatorname{sgn}(\sigma)\cdot a_{1\sigma(1)}\cdot ... \cdot a_{n\sigma(n)}\cdot D(\vec{e_1}, .... , \vec{e_n})$

Здесь мы просто выразили векторы $\vec{v_i}$ через единичные, затем по полилинейности получили сумму по всем упорядоченным наборам соответствующих произведений, выкинули из них те, которые содержат повторяющиеся аргументы (тем самым получив сумму по всем перестановкам), а затем применили обратные перестановки к единичным векторам.

Смотрим на последнюю строчку в получившейся формуле и видим множитель $D(\vec{e_1}, ... , \vec{e_n})$ . Чтобы упростить формулу и не таскать лишний множитель, добавим к тем 2 требованиям к функциитретье требование: $D(\vec{e_1}, ... , \vec{e_n}) = 1$ .

Таким образом, если интересующая нас функциясуществует, то она имеет вид:

$D(\vec{v_1}, ... ,\vec{v_n})= \sum_{\sigma \in S_n} \operatorname{sgn}(\sigma) \cdot a_{1\sigma(1)} \cdot ... \cdot a_{n\sigma(n)} = \sum_{\sigma \in S_n} \operatorname{sgn(\sigma)}\prod_{i = 1}^na_{i\sigma(i)}$

Нарисовалась знакомая нам формула Лейбница. Самое замечательное то, что в ней нет свободных переменных, а это значит, что мы бесплатно получили единственность интересующей нас функции.

Осталось лишь доказать существование. Капитан намекает, что для этого достаточно взять ту функцию, которая у нас получилась.

А дальше дело техники. Проверяем, что получили мы действительно, что хотели и даже больше. Полученную функцию называем определителем и спокойно приступаем к доказательству основных его свойств.

Комментарии (32)

victor_1212
01.10.2021 18:20
#23544424
>Она должна принимать нулевое значение на любой линейно зависимой системе векторов.

n - мерный объем например, которому определитель равен с точностью до коэффицента, так нас в детстве учили :)
1. araik1 Автор
  01.10.2021 19:57
  #23544778
  С точностью до знака, если быть точнее. Я решил не рассматривать этот случай, т.к. он слишком частный: работает только для $\mathbb{R}^n$ . Если у нас векторное пространство над произвольным полем, то никакого естественного определения объема нету.
  1. victor_1212
    01.10.2021 20:22
    #23544888
    >С точностью до знака, если быть точнее
    
    вы вероятно знакомы только с положительными коэффициентами пропорциональности?
    
    >Если у нас векторное пространство над произвольным полем,
    
    если матрица с коэффициентами из произвольного поля, определитель по-прежнему полезен?
    
    серьезно, я просто не в курсе, супер давно учился :)
    
    araik1 Автор
    01.10.2021 21:38
    #23545194
    вы вероятно знакомы только с положительными коэффициентами пропорциональности?
    
    Вот есть у нас параллелепипед, натянутый на вектора из $\mathbb{R}^3$ . Будем рассматривать координаты этих векторов в положительно ориентированном ортонормированном единичном базисе. Составим матрицу из этих координат. Тогда определитель этой матрицы в точности равен ориентированному объему этого параллелепипеда (это можно принять и за определение, но, как я уже выше написал, такое определение очень частное и не слишком идейное). Ориентированный объем - это просто объем, но со знаком. Знак плюс, если тройка векторов ориентирована положительно и минус, если отрицательно. Т.е. определитель равен объему этого параллелограмма с точностью до знака.
    
    если матрица с коэффициентами из произвольного поля, определитель по-прежнему полезен?
    
    Конечно. Статья в том числе и об этом. Геометрическая интерпретация определителя - это конечно важная вещь, но на мой взгляд об определителе как раз стоит думать лучше в ключе индикатора линейной зависимости векторов, а не в ключе ориентированного объема.
    
    vanxant
    01.10.2021 22:55
    #23545388
    Всегда был уверен, что определитель равен квадрату объема. Похоже, ОТО мозги выело.
    
    victor_1212
    02.10.2021 00:08
    #23545592
    ну или объем образа единичного куба при понятно каком преобразовании,
    
    без разницы,
    
    по поводу моего вопроса "матрица с коэффициентами из произвольного поля, определитель по-прежнему полезен? " вы что-нибудь можете сказать?
    (чистое любопытство, типа почему не отложилось в памяти)
    
    Sergey_Kovalenko
    02.10.2021 12:16
    #23546348
    Наверное все также позволяет решать общей формулой линейные уравнения в этих полях, исследовать размерности пространств решений и ядра?
    
    victor_1212
    02.10.2021 18:57
    #23547118
    имеет смысл, а линейные уравнения с коэффициентами из произвольного поля (не R или C) где-нибудь востребованы?
    
    Sergey_Kovalenko
    02.10.2021 19:04
    #23547132
    +1
    С конечными полями вычетов многочленов многое что связано (коды, исправляющие ошибки, например). Я не совсем разбираюсь в теории чисел, но если такие здесь есть, то они наверняка что-нибудь ответят.
    
    victor_1212
    02.10.2021 23:34
    #23547778
    спасибо!

PerseforeComplete
01.10.2021 18:32
#23544474
Всегда было интересно - эта вот большая "П" как произведение - это общепризнанное в мире обозначение произведения? Или это только в русском так потому что первая буква слова "произведение"?
1. slepmog
  01.10.2021 19:04
  #23544610
  +1
  https://ru.wikipedia.org/wiki/%D0%9F%D0%B8_(%D0%B1%D1%83%D0%BA%D0%B2%D0%B0)
  1. PerseforeComplete
    01.10.2021 19:34
    #23544704
    Ага, в разделе умножения на англ вики она тоже фигурирует, значит общепризнана
1. dom1n1k
  01.10.2021 20:35
  #23544940
  +10
  Дело в том, что это не кириллическая буква, а греческая.
  1. tyomitch
    02.10.2021 15:52
    #23546810
    +2
    Тем удивительнее, что в греческом слове «произведение» (γινόμενο) её нет.
    
    rafuck
    03.10.2021 00:08
    #23547842
    +1
    πολλαπλασιασμός (умножение, распространение)

Fodin
01.10.2021 20:06
#23544812
+6
Как правильно понимать детерминант (и вообще линейную алгебру), правильно рассказано вот тут: https://www.youtube.com/watch?v=Ip3X9LOh2dk
1. dmagin
  01.10.2021 23:42
  #23545526
  +1
  Ну и чего там правильного? Там же просто геометрическая интерпретация показана. Это лишь частный случай одного из использований. А люди подумают, что определители - это что-то сугубо векторное.
  
  Определитель - одна из скалярных характеристик квадратной матрицы. Интерпретация зависит от того, что матрица содержит. Абстрактно да - характеризует линейную независимость набора объектов, отношения между которыми отражают значения матрицы. Любых объектов, а не только векторов. Можно оценивать независимость яблок, груш и бананов, если приспичит.
  1. Fodin
    02.10.2021 05:58
    #23545912
    +2
    Там правильно показана геометрическая интерпретация. Ну, и вообще не вижу ничего плохого в том, чтобы представлять матрицу набором векторов. Все яблоки, груши и бананы по итогу придется преобразовать в векторы (матрицы единичной "ширины"), прежде чем оценивать. Векторы, как и вообще математика - абстракция над реальными объектами.
    
    Вот мне, напрочь забывшему уже линейную алгебру, прямо сейчас, после вспоминания о том, что детерминант - это площадь, объем и т.д., совершенно очевидно, что в случае линейной зависимости векторов детерминант будет равен нулю.
    
    Популяризовать науку, чтобы она была понятна - великое дело. То, что люди подумают - хорошо уже, что подумали.
    
    dmagin
    02.10.2021 10:44
    #23546184
    Да, сам канал крутой, кто ж спорит. Но все же векторы и элементы - не одно и то же. У яблок направления нет. Математики навязывают "векторное пространство". А мир вокруг - он скорее аффинный.
    
    dmagin
    03.10.2021 22:42
    #23549842
    +2
    Чтобы конкретизировать, приведу пример из близкой к ИТ теории графов. Сложность графа (количество возможных остовных деревьев) равно детерминанту минора его лапласиана. Это комбинаторная характеристика, а не геометрическая (впрочем, они связаны).
1. mvakhmenin
  07.10.2021 12:46
  #23564026
  Спасибо! это было очень круто. Может быть, для крутых математиков это действительно не интересно, но для тех, кто после школы математики не касался, а сейчас необходимо как-то во все это влезать, это вообще супер!

aamonster
01.10.2021 23:27
#23545486
Кому как удобно понимать... Лично мне проще как произведение собственных чисел.

dmagin
01.10.2021 23:53
#23545548
+3
По мне сложновато как-то, перебор специфических терминов без расшифровки. Про внешнее произведение вообще не упомянуто. Зачем маяться с кососимметрическими формами, когда внешнее произведение позволяет все упростить, в том числе и понимание сути определителей.
1. victor_1212
  02.10.2021 00:11
  #23545610
  спасибо, что-то теплое шевельнулось в груди, супер давно писал курсовую каким-то боком с формами и внешними произведениями :)
1. araik1 Автор
  02.10.2021 01:06
  #23545734
  внешнее произведение позволяет все упростить
  
  Да, внешняя алгебра замечательная! Полностью с Вами согласен. Я думал об этом, но решил остановиться на том, что есть. Кстати, прочитал Вашу статью про внешнюю алгебру (пока только 1-ую часть), раз есть такая возможность, поблагодарю Вас здесь. Интересно.

Megakazbek
02.10.2021 02:15
#23545838
+1
Ну на мой взгляд, требования к "индикатору независимости" выглядят совершенно неестественно. Раз это индикатор - значит он должен быть равен 1, если векторы независимы и 0, если зависимы. Или, скажем, если у одной матрицы определитель 1, а у другой - 2, то значит второй набор векторов в два раза более линейно независим? То, что мы искали индикатор бинарного свойства, а у нас получилось сразу произвольное число - тоже не так уж и естественно. А ещё, получается, что мы можем величину этого числа просто отбросить и превратить в настоящий индикатор, выдающий либо 0, либо 1. Тогда исходная задача найти этот индикатор будет решена ещё лучше, только вот пользы от него окажется куда меньше, чем от настоящего определителя.

Есть способы задать определитель, у которых меньше таких проблем - например, ориентированный объём параллелограмма, образованного векторами. То, что он равен нулю в случае зависимых векторов - это просто бесплатный побочный эффект этой конструкции.
1. northzen
  03.10.2021 00:28
  #23547866
  А что вам не нравится? Берете и делите на норму и получаете ваш прекрасный 1.
  Вы же понимаете, что с вашими требованиями "или 0, или 1" никаких приятных свойств, связанных с полилинейностью не будет.
  То, что мы искали индикатор, а получили число -- вполне естественно. Возьмите тот же "индикатор" перпендикулярности -- скалярное произведение (это, конечно, большая натяжка, но все же).
  Возьмите простой слой сверточной сети, где за линейным преобразованием идет нелинейная функция активации.
  1. Megakazbek
    03.10.2021 15:00
    #23548858
    То и не нравится, что ни определитель, ни скалярное произведение не являются индикаторами. Индикаторы из них можно сконструировать по признаку равенства их нулю, но сами по себе эти числа обладают более широким смыслом, который мы не найдём, если посчитаем, что ничего кроме признака линейной независимости или перпендикулярности нас не интересует.

teleport_future
02.10.2021 11:59
#23546310
+2
Почему то в институте на 2-м курсе преподают именно так как вы написали (ну ни чего не понятно, просто мутное объяснение и ровно такое же понимание и усвоение материала). Ни все же физмат закончили, а только потом пошли учиться на инженера и слушать такие объяснения как у вас? Надо как то проще объяснять.

nuclight
02.10.2021 16:43
#23546898
+5
Начал читать… понял, что первый курс за два десятилетия вылетел из головы начисто. Ну и главный вопрос, поставленный в начале — а каков же смысл понятия — остался таки за кадром. Лишь в комментах в ветке про яблоки-груши чуть приоткрыли суть.

Haif
04.10.2021 01:06
#23550046
А что все-таки значит "правильно" в заголовке статьи? Разве понимать определитель как произведение собственных значений матрицы не всегда верно? Например, если мы имеем дело уже не с обычными матрицами, а с дифференциальными операторами (обычная тема в функциональных интегралах квантовой теории поля), то это, лично на мой взгляд, самое здравое определение (правда ещё есть формула log det M = tr log M, которой часто пользуются, но сейчас не об этом). Такое определение инвариантно относительно выбора базиса, как и должно быть, и единственно. Или я что-то опускаю?

О том, как правильно понимать определитель матрицы +21

Критикуешь - предлагай

Комментарии (32)

araik1 Автор

araik1 Автор

araik1 Автор