Аффинное преобразование обычно задается матрицей и вектором трансляции и действует на вектор?аргумент по формуле
Впрочем, можно обойтись и без , если воспользоваться аугментированной матрицей и однородными координатами для аргумента (как хорошо известно пользователям OpenGL). Однако оказывается, кроме этих форм записи можно ещё использовать детерминант особой матрицы, в которой содержатся как координаты аргумента, так и параметры, задающие преобразование. Дело в том, что детерминант обладает свойством линейности по элементам любой своей строки или столбца и это позволяет использовать его для представления аффинных преобразований. Вот, собственно, как можно выразить действие аффинного преобразования на произвольный вектор :
Не спешите убегать в ужасе — во?первых, здесь записано преобразование, действующее на пространствах произвольной размерности (отсюда так много всего), а во?вторых, хотя формула и выглядит громоздко, но просто запоминается и используется. Для начала, я выделю логически связанные элементы рамками и цветом
Итак, мы видим, что действие любого аффинного преобразования на вектор можно представить как отношение двух детерминантов, при чем вектор?аргумент входит только в верхний, а нижний — это просто константа, зависящая только от параметров.
Выделенный синим цветом вектор — это аргумент, вектор на который действует аффинное преобразование .
Здесь и далее нижние индексы обозначают компоненту вектора. В верхней матрице компоненты занимают почти весь первый столбец, кроме них в этом столбце только ноль (сверху) и единица (снизу). Все остальные элементы в матрице — это векторы?параметры (нумеруются верхним индексом, взятым в скобки чтоб не перепутать со степенью) и единицы в последней строке. Параметры выделяют среди множества всех аффинных преобразований то, которое нам нужно. Удобство и красота формулы в том, что смысл этих параметров очень прост: они задают аффинное преобразование, которое переводит векторы в . Поэтому векторы , мы будем называть «входными» (в матрице они обведены прямоугольниками) — каждый из них покомпонентно записан в своём столбце, снизу дописывается единица. Сверху же записываются «выходные» параметры (выделены красным цветом) , но теперь уже не покомпонентно, а как цельная сущность.
Если кого?то удивляет такая запись, то вспомните о векторном произведении
где была очень похожая структура и первую строку точно так же занимали векторы. При этом необязательно, чтобы размерности векторов и совпадали. Все детерминанты считаются как обычно и допускают обычные «трюки», например, к любому столбцу можно прибавить другой столбец.
С нижней матрицей всё предельно просто — она получается из верхней вычёркиванием первой строки и первого столбца. Недостаток (1) в том, что приходится считать детерминанты, однако если эту рутинную задачу переложить на компьютер, то окажется, что человеку останется лишь правильно заполнить матрицы числами из его задачи. При этом с помощью одной формулы можно решить довольно много распространенных на практике задач:
- нахождение аффинного преобразования по точкам;
- расчёт барицентрических координат;
- полилинейную интерполяцию;
- задачи на линейные преобразования (без трансляции):
Аффинное преобразование по трем точкам на плоскости
Под действием неизвестного аффинного преобразования три точки на плоскости перешли в другие три точки. Найдем это аффинное преобразование.
Для определенности, пусть наши входные точки
а результатом действия преобразования стали точки
Найдем аффинное преобразование .
На самом деле, решать эту задачу можно по?разному: с помощью системы линейных уравнений, барицентрических координат… но мы пойдем своим путем. Думаю, по использованным обозначениям Вы догадываетесь к чему я клоню: берём уравнение (1) для размерности и подставляем в качестве входных параметров, а — в качестве выходных
а дальше остается лишь посчитать детерминанты
Намётанный глаз легко обнаружит здесь поворот на и трансляцию на .
Когда формула применима?
Входные и выходные векторы могут иметь разную размерность — формула применима для аффинных преобразований, действующих на пространствах любой размерности. Впрочем, входных точек должно быть достаточно и они не должны «слипаться»: если аффинное преобразование действует из -мерного пространства — точки должны образовывать невырожденный симплекс из точки. Если это условие не выполнено, то однозначно восстановить преобразование невозможно (никаким методом вообще, не только этим) — формула предупредит об этом нулём в знаменателе.
Зачем восстанавливать аффинные преобразования программисту?
Часто нужно найти преобразование между двумя картинками (для расчёта положения камеры, например). Если у нас найдётся несколько надёжных особых точек (фич) на этих изображениях, ну или просто не хочется начинать сразу с ранзаков и борьбы с аутлаерами, то вполне можно использовать эту формулу.
Еще один пример — текстурирование. Вырезать треугольник из текстуры и натянуть на треугольник где?нибудь на плоскости или в пространстве — типичная задача на применение аффинного преобразования к точкам из пространства текстуры, переводящее их в пространство, где «живут модели». И довольно часто нам легко указать каким точкам на текстуре соответствуют вершины треугольника модели, но вот установить куда переходят неугловые точки может потребовать некоторых размышлений. С этой же формулой достаточно просто вставить числа в правильные ячейки и будет вот такая красота.
Из того, с чем приходилось лично сталкиваться: нейросеть выдаёт координаты углов маркера и мы хотим «дополнить реальность» виртуальным объектом, который располагается на маркере.
Очевидно, при перемещении маркера объект должен повторять все его движения. И тут формула (1) как нельзя кстати — она нам поможет передвинуть объект вслед за маркером.
Или вот еще пример: нужно запрограммировать вращение различных объектов на сцене с помощью инструмента «гизмо». Для этого мы должны уметь вращать выбранную модель вокруг трех осей параллельных осям координат и проходящих через центр объекта. На картинке показан случай вращения модели вокруг оси параллельной .
В конечном итоге всё сводится к двумерной задаче о вращении вокруг произвольной точки. Давайте даже решим её для какого?то простого случая, скажем, поворота на против часовой стрелки вокруг (общий случай решается так же, просто не хочется загромождать выкладки синусами?косинусами). Конечно, можно пойти путём самурая и перемножить три матрицы (трансляция точки вращения в ноль, собственно вращение и трансляция назад), а можно и так — найти координаты любых трёх точек до и после вращения и воспользоваться формулой. Первая точка находится легко — мы и так знаем, что переходит в себя. Давайте рассмотрим точку на единичку правее, для неё верно . Ну и ещё одну на единичку ниже, тут очевидно, что . Дальше всё просто
Барицентрические координаты
Разложим верхний детерминант (1) по первой строке согласно правилу Лапласа. Ясно, что в результате мы получим некоторую взвешенную сумму векторов . Оказывается, что коэффициентами в этой сумме служат барицентрические координаты аргумента по отношению к симплексу, заданному (за доказательствами смотреть в [1]). Если нас интересуют только барицентрические координаты точки, можно схитрить и заполнить первую строку единичными ортами — после вычисления детерминантов мы получим вектор, чьи компоненты совпадают с барицентрическими координатами . Графически такое преобразование , переводящее точку в пространство её барицентрических координат, будет выглядеть следующим образом
Давайте опробуем этот «рецепт» на практике. Задача: найти барицентрические координаты точки по отношению к заданному треугольнику. Пусть для определённости это будет точка , а в качестве вершин треугольника возьмём
Дело за малым — взять (1) для , правильно расположить там данные задачи и посчитать детерминанты
Вот и решение: барицентрическими координатами по отношению к заданному треугольнику есть , и . В программировании расчёт барицентрических координат часто возникает в контексте проверки, находится ли точка внутри симплекса (тогда все барицентрические координаты больше ноля и меньше единицы), а также для различных интерполяций, о которых сейчас пойдёт речь.
Заметьте, формула (1) обладает приятной двойственностью: если разложить детерминант по первому столбцу — получим стандартную запись для аффинной функции, а если по первой строке — аффинную комбинацию выходных векторов.
Полилинейная интерполяция
Итак, мы обнаружили, что аффинное преобразование взвешивает выходные векторы с коэффициентами, равными барицентрическим координатам аргумента. Естественно воспользоваться этим свойством для полилинейной интерполяции.
Интерполяция цвета
Для примера, давайте просчитаем стандартный GL?ный «привет мир» — раскрашенный треугольник. Конечно, OpenGL прекрасно умеет интерполировать цвета и тоже делает это с помощью барицентрических координат, но сегодня мы это сделаем сами.
Задача: в вершинах треугольника заданы цвета, произвести интерполяцию цвета внутри треугольника. Для определённости, пусть вершины нашего треугольника имеют координаты
Припишем им цвета: жёлтый, циан и маджента
Тройки чисел — это RGB?компоненты цвета. Возьмём (1) и правильно расставим входные данные
Здесь компоненты указывают как закрасить точку в терминах RGB. Давайте посмотрим, что вышло.
Можно сказать, мы только что произвели аффинное преобразование двумерного пространства картинки в трехмерное пространство цветов (RGB).
Интерполяция нормалей (шейдинг Фонга)
Мы можем вкладывать самый разный смысл в векторы, которые мы интерполируем, в том числе это могут быть векторы нормалей. Более того, именно так и делается шейдинг Фонга (Phong shading), только после интерполяции векторы нужно нормировать. Для чего нужна такая интерполяция хорошо иллюстрирует следующее изображение (взятое из Википедии commons.wikimedia.org/w/index.php?curid=1556366).
Приводить расчёты, я думаю, уже не стоит — все детали рассмотрены в [2], а вот картинку с результатом я покажу.
Векторы на ней не единичные и для использования в шейдинге Фонга должны быть сначала отнормированы, к тому же, для наглядности, они направлены в очень разные стороны, что редко бывает на практике.
Найти плоскость по трем точкам
Рассмотрим еще один необычный пример применения аффинного преобразования.
Даны три точки
Найдём уравнение проходящей через них плоскости в виде . И сделаем это с помощью аффинных преобразований: известно ведь, что они переводят плоскости в плоскости. Для начала спроектируем все точки на плоскость , что несложно. А теперь установим аффинное преобразование, которое переводит проекции точек в изначальные трехмерные точки
и которое «подхватит» вместе с точками и всю плоскость да так, что после преобразования она будет проходить через интересующие нас точки.
Как обычно, мы лишь должны распределить числа по элементам матриц
Перепишем последнее выражение в привычном виде
и нарисуем что вышло.
Линейные преобразования
Несмотря на всю практическую важность аффинных преобразований, чаще приходится иметь дело с линейными. Конечно, линейные преобразования — частный случай аффинных, оставляющие на месте точку . Это позволяет немного упростить формулу (ведь один из столбцов будет состоять почти из одних нулей и по нему можно разложить детерминант)
Как видим, из формулы пропала последняя строчка с единицами и один столбец. Этот результат вполне согласуется с нашими представлениями, что для задания линейного преобразования достаточно указать его действие на линейно независимых элементах.
Линейное преобразование по трем точкам
Давайте решим задачу, чтобы увидеть как всё работает. Задача: известно, что под действием некоторого линейного преобразования
Найдём это линейное преобразование.
Берём упрощённую формулу и ставим правильные числа на правильные места:
Готово!
Нахождение обратного преобразования
Напомню, что матрица линейного преобразования
содержит в своих столбцах образы единичных векторов:
Итак, действуя матрицей на орты, мы получаем её столбцы. А что можно сказать об обратном преобразовании (допустим, оно существует)? Оно все делает «наоборот»:
Постойте?ка, ведь мы только что нашли образы трёх точек под действием линейного преобразования — достаточно, чтоб восстановить само преобразование!
где , и .
Не будем себя ограничивать трехмерным пространством и перепишем предыдущую формулу в более общем виде
Как видим, надо приписать к матрице слева колонку с компонентами вектора?аргумента, сверху — строчку с координатными векторами, а дальше дело только за умением брать детерминанты.
Задача на обратное преобразование
Давайте опробуем приведённый метод на практике. Задача: обратить матрицу
Воспользуемся (2) для
Сразу видно, что
Правило Крамера в одну формулу
Ещё со школы мы сталкиваемся с уравнениями вида
Если матрица невырожденная, то решение можно записать в виде
Хм… не в предыдущем ли разделе я видел такое же выражение, только вместо стояла другая буква? Воспользуемся им.
Это не что иное как правило Крамера. В этом легко убедиться, разложив детерминант по первой строке: вычисление как раз предполагает, что мы вычеркнем столбец с , а с ним и ?й столбец матрицы . Теперь если переставить столбец на место удалённого, то мы как раз и получим правило «вставить столбец на место ?го столбца и найти детерминант». И да, со знаками всё хорошо: одни мы генерируем при разложении по строке, а другие при перестановке — в результате они друг друга компенсируют.
Присмотревшись к полученному уравнению, можно заметить его схожесть с уравнением для нахождения барицентрических координат: решение системы линейных уравнений— это нахождение барицентрических координат точки по отношению к симплексу, одна из вершин которого , а остальные задаются столбцами матрицы .
Решение системы линейных уравнений
Решим систему линейных уравнений
В матричной форме она выглядит так
Используем полученную формулу
откуда ответ , и .
Преобразование координат вектора при смене базиса
Предположим, что мы выбрали новый базис (перешли к другой системе координат). Известно, что новые координаты векторов выражаются через старые линейно. Поэтому неудивительно, что мы можем использовать наш инструментарий для смены базиса. Как это сделать, я покажу на примере.
Итак, пускай мы перешли от стандартного базиса к базису, состоящему из векторов
В старом базисе задан вектор . Найдём координаты этого вектора в новом базисе. В новой координатной системе векторы нового базиса станут ортами и будут иметь координаты
здесь и далее штрихи возле столбцов означают, что координаты в них относятся к новому базису. Несложно догадаться, что линейное преобразование, которое переводит
также нужным образом преобразует координаты нашего вектора. Осталось только применить формулу
Решение задачи привычным образом требует обращения матрицы (которое, впрочем, также в основном состоит из вычисления детерминантов) и умножения
Мы лишь упаковали эти шаги в одну формулу.
Почему формула работает для обратных задач?
Эффективность формулы в решении обратных задач объясняется тем, что выполняется следующее равенство (доказательство есть в [1])
$
Таким образом, формула прячет в себе обратную матрицу и умножение на еще одну матрицу в придачу. Это выражение и есть стандартное решение задачи нахождения линейного преобразования по точкам. Заметьте, что делая вторую матрицу в произведении единичной, мы получим просто обратную матрицу. С ее помощью решается система линейных уравнений и задачи, которые к ней сводятся: нахождение барицентрических координат, интерполяция полиномами Лагранжа, и т.д. Однако, представление в виде произведения двух матриц, не даёт нам получить те самые «два взгляда», связанные с разложением по первой строке и по первому столбцу.
Интерполяция Лагранжа и ее свойства
Напомню, что интерполяция Лагранжа — это нахождение полинома наименьшей степени проходящего через точки , , , . Не то чтобы это была распространённая в программистской практике задача, но всё равно давайте ее рассмотрим.
Как связаны полиномы и линейные преобразования?
Дело в том, что полином
можно рассматривать как линейное преобразование, которое отображает вектор в . Значит задача интерполяции точек , , , сводится к нахождению такого линейного преобразования, что
а это мы делать умеем. Подставим правильные буквы в правильные ячейки и получим формулу
Доказательство, что это будет именно полином Лагранжа (а не чей?то другой), можно посмотреть в [1]. Кстати, выражение в знаменателе — это определитель Вандермонда. Зная это и разложив детерминант в числителе по первой строке, придем к более привычной формуле для полинома Лагранжа.
Задача на полином Лагранжа
Сложно ли этим пользоваться? Давайте попробуем силы на задаче: найти полином Лагранжа, проходящий через точки , и .
Подставим эти точки в формулу
На графике всё будет выглядеть так.
Свойства полинома Лагранжа
Разложив верхний детерминант по первой строке и первому столбцу, мы взглянем на полином Лагранжа с двух разных сторон. В первом случае получим классическую формулу из Википедии, а во втором — запись полинома в виде суммы одночленов , где
А ещё мы теперь можем сравнительно просто доказывать довольно замысловатые утверждения. Например, в [2] в одну строчку доказывается, что сумма базисных полиномов Лагранжа равна единице и что полином Лагранжа, интерполирующий , , , имеет в нуле значение . Ну и не Лагранжем единым — подобный подход можно применить к интерполяции синусами?косинусами или какими?то другими функциями.
Заключение
Спасибо всем, кто дочитал до конца. В этой статье мы решали стандартные задачи с помощью одной нестандартной формулы. Мне она понравилась тем, что, во?первых, показывает, что аффинные(линейные) преобразования, барицентрические координаты, интерполяция и даже полиномы Лагранжа тесно связаны. Ведь когда решения задач записываются единообразно, мысль об их сродстве возникает сама собой. Во?вторых, большую часть времени мы просто расставляли входные данные в правильные ячейки без дополнительных преобразований.
Задачи, которые мы рассматривали, можно решить и вполне привычными методами. Однако, для задач небольшой размерности или учебных задач формула может быть полезной. Кроме того, мне она кажется красивой.
Список литературы
[1] Beginner's guide to mapping simplexes affinely
[2] Workbook on mapping simplexes affinely
Комментарии (12)
dmagin
12.08.2019 16:19Когда вы пишите «вектор», — вы что имеете ввиду? Набор чисел или разность точек аффинного пространства (как вектор трансляции, например)? Барицентрические координаты у вас приведены для точек, а в тексте везде про векторы.
И еще. Как вы объясняете (или интерпретируете) наличие строки из единиц в матрицах аффинных преобразований?frobeniusfg Автор
12.08.2019 18:221) Я работал в векторных (не аффинных) пространствах и мыслил векторы как их элементы (то есть первый подход). Понимаю, что барицентрические координаты можно определять уже для точек аффиного пространства, а в векторных пространствах точек как таковых нет. Я действительно, неформально обошелся с точками и векторами, зачастую заменяя точки на координаты векторов, которые на них указывают.
2) Я думаю, можно стать на проективную точку зрения — считать что векторы заданы в плоскости w=1 в пространстве размерности на 1 больше и считать что мы находим линейное преобразование там. Вообще, формула имеет проективный привкус. Например, можно избавиться от знаменателя (и минуса перед детерминантом), если ввести однородные координаты (с 1 в качестве последней) для выходных векторов.
netricks
12.08.2019 17:00Вопрос: «Аффинное преобразование по трем точкам на плоскости»
А почему получается, что для выполнения алгоритма нужны три точки, Ведь для восстановления преобразования достаточно двух? Что будет, если выходной треугольник, который я задам будет неравен/неподобен входному?frobeniusfg Автор
12.08.2019 17:401) Для восстановления двумерного аффинного (не линейного) преобразования понадобятся три точки. Ведь мы хотим найти четыре числа в матрице 2x2 и вектор трансляции (еще два числа) — итого шесть чисел. Для этого нужно 6 уравнений. Поэтому мы должны знать, куда перешли три точки, так как каждая точка имеет две координаты и даст два уравнения. И всего их будет как раз шесть.
2) Выходной треугольник может быть совсем непохож на входной. Он может даже «жить» в другом пространстве (например, цветовом). Аффинное преобразование так исказит входное пространство, что два треугольника совпадут. Картинка с Леной показывает, что выходный треугольник (крайний слева) вовсе не подобен входному (крайний справа).netricks
12.08.2019 17:45А, вот в чем дело… Я перепутал афинное преобразование с более узким классом преобразований.
user_man
13.08.2019 12:40Чем отличается вектор-аргумент от вектора-параметра? Если не до конца понятно, то добавлю — аргумент и параметр — синонимы, что делает масло масляным (а названия — бессмысленными).
Определитель — это число. То есть в вашей формуле имеет место деление двух чисел, с получением на выходе, очевидно, тоже числа. При этом в самом начале речь идёт о векторах. Отсюда вывод — надо пояснять детали.
Математики вообще не склонны к обсуждению деталей, мол умный студент всё сам за них додумает, но это неправильно, это убивает интерес у тех, кто видит несколько вариантов объяснения деталей, ну а городить свою теорию вокруг каждого варианта — нет времени. При этом все мы знаем, что правильный вариант — один, поэтому огород вокруг всех остальных вариантов — часто просто банальное (и безжалостное) убийство времени изучающего по вине преподавателя. И да, обучающихся много, в сумме они убивают гигантское время, а всё потому, что преподавателю лень расписывать детали (на что требуется минимальное время).
Так что будьте внимательны к деталям, не ленитесь повторять всё то, что вам самому кажется очевидным, и даже то, о чём вы уже написали, потому что к моменту чтения следующей темы читатель часто забывает почти всё о предыдущей.
Аналогия с компьютером — он не будет работать, если вы ему не объясните всё до мелочей. А вот студент умнее, да, он иногда будет работать без объяснения мелочей, только все остальные сразу убегут от вашего предмета, да и умные убьют гораздо больше времени на обучение.
Хотя само желание что-то пояснить популярно — приветствуется.frobeniusfg Автор
13.08.2019 19:281) Между параметрами и аргументами(переменными) есть разница. Формула (1) в самом общем виде задаёт целое семейство (параметризованное) аффинных преобразований и как раз параметры определяют, какое конкретно преобразование мы хотим выбрать, а аргумент — вектор, на который мы этим готовым преобразованием действуем. То, что они входят в формулу симметрично, не должно скрывать, что концепутально у них разный смысл.
2) Матрица в числителе в своей первой строке содержит векторы, что приводит к тому, что её детерминант тоже вектор. Тогда как в знаменателе действительно будет число. Это необычная конструкция и я писал, что это напоминает выражение для векторного произведения — там в результате взятия детерминанта тоже будет вектор. Я также упомянул, что такие детерминанты можно брать с помощью обычных правил и показал это на примерах. Вполне естественно, что наша формула выдает именно вектор, ведь аффинное преобразование действуя на вектор возвращает вектор (так что всё сходится). Да что там, в детерминанты можно не только вектора, но и дифференциальные операторы запихивать (оператор Гамильтона).
3) На мой взгляд, математики крайне внимательны к деталям. Однако, в научно-популярных статьях некритические детали допустимо скрывать, чтобы не перегрузить читателя. Однако, я дал ссылку на статью, где все изложено более строго.
Chuvi
Я уже, вроде, писал про сплошные инлайны в формулах.
https://habrastorage.org/webt/ve/n8/dr/ven8drivvm3btotlxuposdwwtsc.png
frobeniusfg Автор
Извините за неудобства. Это моя первая статься на Хабре. Буду фиксить.