Помните байку про интеграл, который пригодился в жизни? Так вот, у определителя тоже есть замечательное применение - пугать детей формулой Лейбница. А давайте даже перепишем ее куда-нибудь в середину, чтобы всем было хорошо видно.

\det A = \sum_{\sigma \in S_n} \operatorname{sgn(\sigma)}\prod_{i = 1}^na_{i\sigma(i)}

Расшифровывается это дело следующим образом: если у нас есть матрица

A = \begin{pmatrix}  a_{11} & ... & a_{1n}\\   ... &  & ... \\  a_{n1} & ... & a_{nn} \end{pmatrix}

над некоторым полем \operatorname{F}, то определителем этой матрицы называют сумму всевозможных произведений, состоящих из\operatorname{n}элементов этой матрицы, взятых по одному из каждой строки и из каждого столбца, причем каждое произведение входит в эту сумму с тем знаком, который имеет соответствующая перестановка индексов этих элементов в этом произведении.

Возникает естественный вопрос: зачем нужна такая навороченная конструкция. Можно конечно сказать, что смысл проявится позже, пока просто запомните и не задавайте лишние вопросы и т.д., но если быть откровенным, то стоит признать - такое определение определителя не мотивировано ничем. А между прочим именно оно является самым общеизвестным.

Другой способ введения определителя связан с его характеристическим свойством. Напомним, полилинейной формой называется функция f:V_1 \times ... \times V_m \to F, определенная на декартовом произведении некоторых векторных пространств V_i(заданных над одним и тем же полемF), принимающая значения в поле Fи линейная по каждому аргументу: f(\vec{v_1}, ... ,\vec{v_i} + \vec{v_j} ,... ,\vec{v_m}) = f(\vec{v_1}, ... ,\vec{v_i}  ,... ,\vec{v_m}) + f(\vec{v_1}, ... , \vec{v_j} ,... ,\vec{v_m})f(\vec{v_1}, ... ,\lambda \vec{v_i} ,... ,\vec{v_m}) = \lambda f(\vec{v_1}, ... ,\vec{v_i}  ,... ,\vec{v_m}). Форма называется кососимметрической, если при инверсии любых двух (не обязательно соседних) аргументов она меняет знак.

С кососимметричностью есть одна небольшая проблема. Возьмем для определенности обычное поле \mathbb{R}действительных чисел и рассмотрим какую-нибудь m-местную кососимметрическую формуfнад ним. Посмотрим, чему может быть равно f(\vec{v_1}, ... ,\vec{v_i} ,..., \vec{v_i}, ... \vec{v_m}), т.е. чему может равняться эта форма на наборе векторов, содержащем 2 равных вектора. При инверсии этих двух векторов форма с одной стороны не меняется, а с другой стороны, меняет знак. Единственное действительное число, не меняющееся при изменении знака - это ноль. Зададимся теперь вопросом, а будет ли справедливым это свойство (равенство формы нулю на наборе, содержащем пару равных векторов) в случае произвольного поля. Если a = -a, то a + a = 0, следовательно a(1+1) = 0. Т.к. в полях нету делителей нуля, то в случае поля характеристики \ne 2 получаем, что a = 0. Но что будет в случае, если характеристика равна 2? А будет то, что из равенства a = -aне следует, что a = 0. В самом деле, возьмем поле \mathbb{F_2} вычетов по модулю 2 (2 простое число, так что это действительно поле, а не просто кольцо). В этом поле единица обратна сама себе (т.к. 1 + 1 = 2 \equiv 0 (\operatorname{mod 2})), т.е. 1 = -1. Вместе с этим единица, очевидно, не равна нулю (это свойство выполняется в любом поле наряду с тем фактом, что в любом же поле всегда существуют ноль и единица; требование нетривиальности кольца входит в определение поля). Предыдущие рассуждения показывают, что из "наивной" кососимметричности (определение которой написано выше) в случае поля характеристики 2 еще не вытекает равенство нулю соответствующей формы на наборе, содержащем равные вектора.

Можно конечно всюду далее рассматривать исключительно поля характеристики \ne2 и пользоваться "слабым" определением кососимметричности, а можно поступить умнее и немного усилить определение кососимметричности специально для полей характеристики 2 так, чтобы обычная кососимметричность следовала из "сильной". Для этого достаточно потребовать 2 вещи: во-первых, форма должна быть полилинейна, а во-вторых она должна принимать значение ноль всегда, когда среди ее аргументов есть равные. Свойство, которое вытекало из "наивной" кососимметричности для полей характеристики \ne2 само теперь является составной частью определения кососимметричности (правда только для полей характеристики 2).

Доказательство

Из полилинейности и равенства формы нулю на строках с равными аргументами следует, что если к одному вектору прибавить другой, умноженный на число, то значение формы не изменится. При умножении какого-либо вектора на число \ne0 сама форма умножается на это число (в частности, если обратить знак какого-либо вектора из набора, то знак самой формы тоже поменяется.

Произвести инверсию векторов в наборе аргументов можно с помощью преобразований этих двух типов. И если внимательно проследить цепочку преобразований, то в конце концов окажется, что форма поменяла знак.

Далее под кососимметричностью будем понимать кососимметричность в "сильном" смысле.

Определение

Определитель матрицA- это единственная кососимметрическая полилинейная форма строк матрицы, нормированная единицей на единичном наборе векторов.

Надо сказать, это не самое плохое определение. Но и оно не лишено недостатков. Основные вопросы здесь возникают по поводу кососимметричности. В первую очередь непонятно, почему это свойство вообще важно. Ну меняет функция знак при перестановке двух аргументов и пусть меняет, почему мы так стремимся исследовать именно это свойство, а не какое-нибудь другое. Но здесь все еще хуже. Мы хотим, чтобы форма еще и принимала нулевое значение на наборе, содержащем равные вектора. И в некотором смысле для нас это даже важнее самой кососимметричности, раз мы стали подгонять определение последней под выполнение этого свойства. Все эти экзерсизы с характеристиками выглядят довольно искусственно.

Критикуешь - предлагай

В действительности есть очень простой и естественный пусть построения определителя, при котором все эти вопросы отпадают сами собой. И я постараюсь по возможности максимально последовательно описать этот способ.

Начнем с некоторых предварительных замечаний. Основным объектом изучения линейной алгебры являются конечномерные векторные пространства. Неформально говоря, на любое n- мерное векторное пространство над полемFможно смотреть как на "координатное" пространствоF^n, состоящее из упорядоченных наборов длины n элементов поляF. Более строго, пусть у нас естьn- мерное векторное пространство Vнад полем F. Выбор (упорядоченного) базиса (\vec{e_1}, ... , \vec{e_n})этого пространства индуцирует изоморфизм I : V \to F^n, ставящий в соответствие каждому вектору \vec{v} \in V, \vec{v} = \lambda_1\vec{e_1}+ ... +\lambda_n\vec{e_n}набор (\lambda_1, ... ,\lambda_n) \in F^nего координат в базисе (\vec{e_1}, ... , \vec{e_n}). Таким образом, во всех дальнейших построениях речь пойдет по большей части про вектора координатного пространства.

Очевидно, некоторый набор (\vec{v_1}, ... , \vec{v_n})векторов пространства Vявляется линейно (не)зависимым, тогда и только тогда, когда соответствующий ему набор векторов пространства F^nбудет линейно (не)зависимым.

Свойство линейной зависимости/независимости действительно очень важно. Дело в том, что система из n>1векторов пространства Vбудет линейно зависимой тогда и только тогда, когда найдется вектор в этой системе, который можно линейно выразить через остальные.

Довольно естественным выглядит желание иметь некоторую функциюD- индикатор линейной зависимости векторов. Учитывая, что любое векторное пространство "оцифровывается" своим координатным пространством, достаточно иметь такую функцию, определенную на декартовом произведенииnкопий пространстваF^nи принимающую значения в полеF. Таким образом, мы предъявляем к функцииDвсего лишь 2 очень естественных требования:

  1. Полилинейность.

  2. Она должна принимать нулевое значение на любой линейно зависимой системе векторов.

На аргументы этой функции удобно смотреть как на строки матрицы

A = \begin{pmatrix}  a_{11} & ... & a_{1n}\\   ... &  & ... \\  a_{n1} & ... & a_{nn} \end{pmatrix} = \begin{bmatrix} \vec{v_1}\\ ...\\ \vec{v_n}   \end{bmatrix}

Заметим, на данном этапе мы еще даже не знаем, существует ли такая функция или нет. Но мы можем в предположении ее существования посмотреть на ее поведение.

  1. D(\vec{v_1}, ... ,\vec{v_i} ,..., \vec{v_i}, ... \vec{v_n}) = 0. Действительно, строка аргументов, содержащая пару равных значений, очевидно, линейно зависима, а значит функцияDбудет принимать на ней нулевое значение.

  2. Dкососимметрична (в любом смысле, учитывая полилинейность + п.1). Доказательство абсолютно аналогично тому, которое находится выше под спойлером.

  3. Рассмотрим, чему равнаDна некотором наборе строк (\vec{v_1}, ... ,\vec{v_n}):

D(\vec{v_1}, ... ,\vec{v_n})= D(a_{11}\vec{e_1} + ... + a_{1n}\vec{e_n}, ... , a_{n1}\vec{e_1} + ... + a_{nn}\vec{e_n}) == \sum_{\sigma \in S_n}a_{1\sigma(1)}\cdot ... \cdot a_{n\sigma(n)}\cdot D(\vec{e_{\sigma(1)}}, .... , \vec{e_{\sigma(n)}}) = =\sum_{\sigma \in S_n}\operatorname{sgn}(\sigma)\cdot a_{1\sigma(1)}\cdot ... \cdot a_{n\sigma(n)}\cdot D(\vec{e_1}, .... , \vec{e_n})

Здесь мы просто выразили векторы \vec{v_i}через единичные, затем по полилинейности получили сумму по всем упорядоченным наборам соответствующих произведений, выкинули из них те, которые содержат повторяющиеся аргументы (тем самым получив сумму по всем перестановкам), а затем применили обратные перестановки к единичным векторам.

Смотрим на последнюю строчку в получившейся формуле и видим множитель D(\vec{e_1}, ... , \vec{e_n}). Чтобы упростить формулу и не таскать лишний множитель, добавим к тем 2 требованиям к функцииDтретье требование: D(\vec{e_1}, ... , \vec{e_n}) = 1.

Таким образом, если интересующая нас функцияDсуществует, то она имеет вид:

D(\vec{v_1}, ... ,\vec{v_n})= \sum_{\sigma \in S_n} \operatorname{sgn}(\sigma) \cdot a_{1\sigma(1)} \cdot  ... \cdot a_{n\sigma(n)} = \sum_{\sigma \in S_n} \operatorname{sgn(\sigma)}\prod_{i = 1}^na_{i\sigma(i)}

Нарисовалась знакомая нам формула Лейбница. Самое замечательное то, что в ней нет свободных переменных, а это значит, что мы бесплатно получили единственность интересующей нас функции.

Осталось лишь доказать существование. Капитан намекает, что для этого достаточно взять ту функцию, которая у нас получилась.

А дальше дело техники. Проверяем, что получили мы действительно, что хотели и даже больше. Полученную функцию называем определителем и спокойно приступаем к доказательству основных его свойств.

Комментарии (32)


  1. victor_1212
    01.10.2021 18:20

    >Она должна принимать нулевое значение на любой линейно зависимой системе векторов.

    n - мерный объем например, которому определитель равен с точностью до коэффицента, так нас в детстве учили :)


    1. araik1 Автор
      01.10.2021 19:57

      С точностью до знака, если быть точнее. Я решил не рассматривать этот случай, т.к. он слишком частный: работает только для \mathbb{R}^n. Если у нас векторное пространство над произвольным полем, то никакого естественного определения объема нету.


      1. victor_1212
        01.10.2021 20:22

        >С точностью до знака, если быть точнее

        вы вероятно знакомы только с положительными коэффициентами пропорциональности?

        >Если у нас векторное пространство над произвольным полем,

        если матрица с коэффициентами из произвольного поля, определитель по-прежнему полезен?

        серьезно, я просто не в курсе, супер давно учился :)


        1. araik1 Автор
          01.10.2021 21:38

          вы вероятно знакомы только с положительными коэффициентами пропорциональности?

          Вот есть у нас параллелепипед, натянутый на вектора из \mathbb{R}^3. Будем рассматривать координаты этих векторов в положительно ориентированном ортонормированном единичном базисе. Составим матрицу из этих координат. Тогда определитель этой матрицы в точности равен ориентированному объему этого параллелепипеда (это можно принять и за определение, но, как я уже выше написал, такое определение очень частное и не слишком идейное). Ориентированный объем - это просто объем, но со знаком. Знак плюс, если тройка векторов ориентирована положительно и минус, если отрицательно. Т.е. определитель равен объему этого параллелограмма с точностью до знака.

          если матрица с коэффициентами из произвольного поля, определитель по-прежнему полезен?

          Конечно. Статья в том числе и об этом. Геометрическая интерпретация определителя - это конечно важная вещь, но на мой взгляд об определителе как раз стоит думать лучше в ключе индикатора линейной зависимости векторов, а не в ключе ориентированного объема.


          1. vanxant
            01.10.2021 22:55

            Всегда был уверен, что определитель равен квадрату объема. Похоже, ОТО мозги выело.


          1. victor_1212
            02.10.2021 00:08

            ну или объем образа единичного куба при понятно каком преобразовании,

            без разницы,

            по поводу моего вопроса "матрица с коэффициентами из произвольного поля, определитель по-прежнему полезен? " вы что-нибудь можете сказать?
            (чистое любопытство, типа почему не отложилось в памяти)


            1. Sergey_Kovalenko
              02.10.2021 12:16

              Наверное все также позволяет решать общей формулой линейные уравнения в этих полях, исследовать размерности пространств решений и ядра?


              1. victor_1212
                02.10.2021 18:57

                имеет смысл, а линейные уравнения с коэффициентами из произвольного поля (не R или C) где-нибудь востребованы?


                1. Sergey_Kovalenko
                  02.10.2021 19:04
                  +1

                  С конечными полями вычетов многочленов многое что связано (коды, исправляющие ошибки, например). Я не совсем разбираюсь в теории чисел, но если такие здесь есть, то они наверняка что-нибудь ответят.


                  1. victor_1212
                    02.10.2021 23:34

                    спасибо!


  1. PerseforeComplete
    01.10.2021 18:32

    Всегда было интересно - эта вот большая "П" как произведение - это общепризнанное в мире обозначение произведения? Или это только в русском так потому что первая буква слова "произведение"?


    1. slepmog
      01.10.2021 19:04
      +1

      1. PerseforeComplete
        01.10.2021 19:34

        Ага, в разделе умножения на англ вики она тоже фигурирует, значит общепризнана


    1. dom1n1k
      01.10.2021 20:35
      +10

      Дело в том, что это не кириллическая буква, а греческая.


      1. tyomitch
        02.10.2021 15:52
        +2

        Тем удивительнее, что в греческом слове «произведение» (γινόμενο) её нет.


        1. rafuck
          03.10.2021 00:08
          +1

          πολλαπλασιασμός (умножение, распространение)


  1. Fodin
    01.10.2021 20:06
    +6

    Как правильно понимать детерминант (и вообще линейную алгебру), правильно рассказано вот тут: https://www.youtube.com/watch?v=Ip3X9LOh2dk


    1. dmagin
      01.10.2021 23:42
      +1

      Ну и чего там правильного? Там же просто геометрическая интерпретация показана. Это лишь частный случай одного из использований. А люди подумают, что определители - это что-то сугубо векторное.

      Определитель - одна из скалярных характеристик квадратной матрицы. Интерпретация зависит от того, что матрица содержит. Абстрактно да - характеризует линейную независимость набора объектов, отношения между которыми отражают значения матрицы. Любых объектов, а не только векторов. Можно оценивать независимость яблок, груш и бананов, если приспичит.


      1. Fodin
        02.10.2021 05:58
        +2

        Там правильно показана геометрическая интерпретация. Ну, и вообще не вижу ничего плохого в том, чтобы представлять матрицу набором векторов. Все яблоки, груши и бананы по итогу придется преобразовать в векторы (матрицы единичной "ширины"), прежде чем оценивать. Векторы, как и вообще математика - абстракция над реальными объектами.

        Вот мне, напрочь забывшему уже линейную алгебру, прямо сейчас, после вспоминания о том, что детерминант - это площадь, объем и т.д., совершенно очевидно, что в случае линейной зависимости векторов детерминант будет равен нулю.

        Популяризовать науку, чтобы она была понятна - великое дело. То, что люди подумают - хорошо уже, что подумали.


        1. dmagin
          02.10.2021 10:44

          Да, сам канал крутой, кто ж спорит. Но все же векторы и элементы - не одно и то же. У яблок направления нет. Математики навязывают "векторное пространство". А мир вокруг - он скорее аффинный.


        1. dmagin
          03.10.2021 22:42
          +2

          Чтобы конкретизировать, приведу пример из близкой к ИТ теории графов. Сложность графа (количество возможных остовных деревьев) равно детерминанту минора его лапласиана. Это комбинаторная характеристика, а не геометрическая (впрочем, они связаны).


    1. mvakhmenin
      07.10.2021 12:46

      Спасибо! это было очень круто. Может быть, для крутых математиков это действительно не интересно, но для тех, кто после школы математики не касался, а сейчас необходимо как-то во все это влезать, это вообще супер!


  1. aamonster
    01.10.2021 23:27

    Кому как удобно понимать... Лично мне проще как произведение собственных чисел.


  1. dmagin
    01.10.2021 23:53
    +3

    По мне сложновато как-то, перебор специфических терминов без расшифровки. Про внешнее произведение вообще не упомянуто. Зачем маяться с кососимметрическими формами, когда внешнее произведение позволяет все упростить, в том числе и понимание сути определителей.


    1. victor_1212
      02.10.2021 00:11

      спасибо, что-то теплое шевельнулось в груди, супер давно писал курсовую каким-то боком с формами и внешними произведениями :)


    1. araik1 Автор
      02.10.2021 01:06

      внешнее произведение позволяет все упростить

      Да, внешняя алгебра замечательная! Полностью с Вами согласен. Я думал об этом, но решил остановиться на том, что есть. Кстати, прочитал Вашу статью про внешнюю алгебру (пока только 1-ую часть), раз есть такая возможность, поблагодарю Вас здесь. Интересно.


  1. Megakazbek
    02.10.2021 02:15
    +1

    Ну на мой взгляд, требования к "индикатору независимости" выглядят совершенно неестественно. Раз это индикатор - значит он должен быть равен 1, если векторы независимы и 0, если зависимы. Или, скажем, если у одной матрицы определитель 1, а у другой - 2, то значит второй набор векторов в два раза более линейно независим? То, что мы искали индикатор бинарного свойства, а у нас получилось сразу произвольное число - тоже не так уж и естественно. А ещё, получается, что мы можем величину этого числа просто отбросить и превратить в настоящий индикатор, выдающий либо 0, либо 1. Тогда исходная задача найти этот индикатор будет решена ещё лучше, только вот пользы от него окажется куда меньше, чем от настоящего определителя.

    Есть способы задать определитель, у которых меньше таких проблем - например, ориентированный объём параллелограмма, образованного векторами. То, что он равен нулю в случае зависимых векторов - это просто бесплатный побочный эффект этой конструкции.


    1. northzen
      03.10.2021 00:28

      А что вам не нравится? Берете и делите на норму и получаете ваш прекрасный 1.
      Вы же понимаете, что с вашими требованиями "или 0, или 1" никаких приятных свойств, связанных с полилинейностью не будет.
      То, что мы искали индикатор, а получили число -- вполне естественно. Возьмите тот же "индикатор" перпендикулярности -- скалярное произведение (это, конечно, большая натяжка, но все же).
      Возьмите простой слой сверточной сети, где за линейным преобразованием идет нелинейная функция активации.


      1. Megakazbek
        03.10.2021 15:00

        То и не нравится, что ни определитель, ни скалярное произведение не являются индикаторами. Индикаторы из них можно сконструировать по признаку равенства их нулю, но сами по себе эти числа обладают более широким смыслом, который мы не найдём, если посчитаем, что ничего кроме признака линейной независимости или перпендикулярности нас не интересует.


  1. teleport_future
    02.10.2021 11:59
    +2

    Почему то в институте на 2-м курсе преподают именно так как вы написали (ну ни чего не понятно, просто мутное объяснение и ровно такое же понимание и усвоение материала). Ни все же физмат закончили, а только потом пошли учиться на инженера и слушать такие объяснения как у вас? Надо как то проще объяснять.


  1. nuclight
    02.10.2021 16:43
    +5

    Начал читать… понял, что первый курс за два десятилетия вылетел из головы начисто. Ну и главный вопрос, поставленный в начале — а каков же смысл понятия — остался таки за кадром. Лишь в комментах в ветке про яблоки-груши чуть приоткрыли суть.


  1. Haif
    04.10.2021 01:06

    А что все-таки значит "правильно" в заголовке статьи? Разве понимать определитель как произведение собственных значений матрицы не всегда верно? Например, если мы имеем дело уже не с обычными матрицами, а с дифференциальными операторами (обычная тема в функциональных интегралах квантовой теории поля), то это, лично на мой взгляд, самое здравое определение (правда ещё есть формула log det M = tr log M, которой часто пользуются, но сейчас не об этом). Такое определение инвариантно относительно выбора базиса, как и должно быть, и единственно. Или я что-то опускаю?