Как работает перспектива в изображениях? / forpes.ru

Главная
Как работает перспектива в изображениях?

Как работает перспектива в изображениях? +50

17.03.2022 11:12

PatientZero 24 9700 Источник

«Линза доминировала уже шесть сотен лет и я считаю, что изображениям пора отходить от неё. Если это произойдёт, может случиться что-то чудесное». — Дэвид Хокни, 2022 год

У вас когда-нибудь было такое: вы фотографируете какую-то далёкую сцену, а на фото она выглядит слишком маленькой по сравнению с её окружениями?

Комикс Мег Адамс

В этом посте мы поговорим о том, как возникает это явление, и что мы с ним можем сделать.

Я всегда считал, что линейная перспектива — это правильный способ реализации перспективы. На курсах изобразительного искусства меня научили двухточечной и трёхточечной перспективе, а также рассказали об их развитии в эпоху Возрождения; на курсах компьютерной графики я узнал о модели камеры-обскуры и о том, как потребительские камеры обычно используют объективы для аппроксимации камер-обскур. Эти методы построения линейной перспективы должны сделать картинку такой, как будто мы смотрим на неё через окно. Если расположить один глаз в одной конкретной точке перед изображениями, то это будет походить на взгляд через окно, по крайней мере, с точки зрения геометрии сцены.

Часто в культуре изобразительного искусства и компьютерной графики художники делают нечто, отличающееся от строгого следования правилам линейной перспективы, создают «отклонения от стандартной перспективы». Нелинейные перспективы, использующие другие правила проецирования 3D-фигур в 2D считаются художественным выбором, формой творческого самовыражения, а линейная перспектива отражает «объективную» реальность. Фотография создаёт убедительные иллюзии; люди говорят, что фотография фиксирует реальность.

Создание собственных картин привело меня к пониманию того, насколько ошибочны эти воззрения. Нет такого понятия, как правильная перспектива; все варианты перспективы имеют свои преимущества и недостатки. Невозможно точно отобразить всё из 3D-пространства на 2D-изображении, поэтому художникам нужно делать выбор, и линейная перспектива — лишь один из вариантов.

Я начал сомневаться в перспективе, сравнивая мои картины с фотографиями, сделанными в то же время. это сравнение часто меня удивляло.

Например, вот картина, которую я набросал зимним днём в Сиэтле:

Я думал, что это довольно неплохой рисунок моста «Аврора». В то же время я сделал быстрый снимок, чтобы иметь его при себе на случай, если я захочу продолжить работу над картиной. Позже, когда я посмотрел на фото, формы выглядели сильно иначе:

И здание на переднем плане, и дальняя опора моста казались куда больше на моём рисунке, чем они были на фото, а многие другие объекты потерялись на рисунке.

Первым делом я раскритиковал рисунок. Я нарисовал мост недостаточно длинным или не нарисовал все детали канала.

Но потом я также заметил, что камера склонна делать удалённые объекты слишком мелкими. В поездке с другом в город Эстергом я восхитился огромной церковью на холме, высившейся над нами. Тем не менее, сделанное мной фото выглядело так:

Позже я нарисовал по фотографии рисунок, лучше отразивший мои воспоминания о том, насколько была велика эта церковь:

Заметив однажды этот эффект, я вижу его теперь каждый раз, когда делаю широкоугольный снимок объёмного пространства: на фото далёкие объекты выглядят слишком мелким по сравнению с тем, какими они выглядели в реальной жизни. На моих рисунках эти объекты оказывались гораздо больше.

Вы можете проверить это самостоятельно. Находясь в большом открытом пространстве, посмотрите, допустим, на большое здание в отдалении, и сделайте снимок, охватывающий всю сцену: не только здание, но и улицы рядом с вами. Выглядит ли здание на фото таким же большим, как и в реальной жизни? Вероятнее всего, здание выглядит как небольшая часть фотографии, а не возвышается над окружающими его объектами. Разумеется, здание можно увеличить, но тогда у вас будет только фотография этого здания, а не окружающего его мира.

Для меня удивительно то, что после того, как сделал снимок, я инстинктивно принимаю фото как объективную реальность. В случае несоответствия между фото и моим рисунком я считаю, что ошибочен рисунок. И только если я нахожусь в самом пространстве физически, сравнивая фото и реальную жизнь я вижу, насколько фото отличается от реальности.

Кстати, существует много теорий о том, почему Луна выглядит такой маленькой, когда её снимают: например, преломление в атмосфере, но в случае фотографий я думаю, что это ещё один пример того же эффекта: в линейной перспективе далёкие объекты, на которых мы фокусируемся, выглядят слишком маленькими, а большинство наших повседневных фотографий основывается на линейной перспективе.

Естественная перспектива

Замечали ли это явление другие люди? Я помню, что Роб Пепперелл упоминал что-то подобное при нашей встрече в этом году. В его статьях описывается именно то явление, свидетелем которого я стал.

Вот картина, которую он нарисовал, чтобы запечатлеть ощущения от взгляда на мир в определённом месте, когда один глаз фиксирован в единственном направлении:

«Self View With Feet After Mach», Роб Пепперелл, 2013 год

Здесь в первую очередь нужно заметить то, что объекты в центре изображения выглядят самыми большими. При взгляде на объект кажется, что он доминирует в восприятии человека и почему-то кажется самым крупным.

(Источником вдохновения для Роба стал похожий рисунок философа 19-го века Эрнста Маха.)

А теперь сравните картину с двумя фотографиями, сделанными Робом: на одной увеличенное изображение его ног, на другой — широкоугольный снимок. На фото с зумом нет визуального контекста по сторонам, а на широкоугольном кадре его ноги гораздо меньше:

Похоже, здесь есть какой-то парадокс. С одной стороны, мы не воспринимаем объект в центре нашего поля зрения физически крупнее, чем когда он находится в периферическом зрении. Однако на рисунке он почему-то должен быть крупнее, чем окружающие его объекты. Можно предположить, что это связано с тем, что в центре зрения у нас гораздо больше визуальных рецепторов. Как будто мы видим гораздо больше деталей в центре зрения, поэтому ожидаем, что это передаст и изображение.

В своих последующих статьях Роб и его коллеги показали, насколько распространено подобное расширение. Например, вот картина «High Street, Oxford», Тёрнера и фотография с того же места, сделанная 200 лет спустя:

Картина Джозефа Тёрнера «High Street, Oxford», 1810 год и фотография Хай-стрит Дэвида Фишера, 2015 год

Обратите внимание, насколько крупнее башни выглядят на картине. (Фото подвергли цифровой обработке, чтобы башня Карфакс была видима на расстоянии.)

Роб и его коллега Алистер Бёрли разработали методику, симулирующую это расширение, назвав её «естественной перспективой». Мне кажется, естественная перспектива может лучше передавать то, что мы ощущаем в сцене, если смотрим в её центр. Они развили эту методику в виде 3D-рендерера.

Однако естественная перспектива не является «правильной» перспективой. Как и все остальные системы перспективы, она имеет свои достоинства и недостатки. В частности, изображение выглядит искажённым: линии, которые должны быть прямыми, искривлены, а в линейной перспективе прямые линии сохраняются.

Что если истинной перспективы не существует?

Однако по-настоящему изменило моё понимание перспективы статья «On Right and Wrong Drawings», первым автором которой указан Ян Кендеринк. Как и в случае со многими другими статьями Кендеринка, сначала она показалась мне сбивающей с толку, но когда я вернулся к ней позже, она открыла мне глаза.

В этой статье говорится, что художники почти никогда не используют «правильную» линейную перспективу, и используются примеры из предыдущих статей Роба: «первоначальный энтузиазм среди итальянских художников пятнадцатого века, вызванный опубликованными недавно методиками, ослабился после осознания того, что для устранения визуальных странностей требуются ситуативные изменения». В ней упоминаются мастера 19-го века Тёрнер и Констебл, которые были знатоками перспективы (Тёрнер даже её преподавал), однако ни один из них не следовал линейной перспективе в своих пейзажах, а Тёрнер подробно рассказывал о проблемах линейной перспективы.

За долгую историю изобразительных искусств художники разработали широкий круг подходов к перспективе, от ортографических проекций в древних гобеленах и иероглифах до прерывистой перспективы в некоторых китайских картинах на свитках и более свободных перспектив в современном искусстве; их активным сторонником является Хокни.

Во-вторых, авторы статьи указывают на то, что зрители почти всегда рассматривают картины с «неправильной» точки. Фундаментом линейной перспективы является мысль о том, что зритель должен находиться в фокусом центре изображения, чтобы видеть его правильно. Если смотреть на изображение с линейной перспективой из фокусного центра, это будет похоже на взгляд в окно — Леонардо да Винчи писал, что изображения с линейной перспективой нужно рассматривать только из фокусного центра. Однако в реальности мы этого не делаем. Большинство создаваемых нами фотографий должно рассматриваться одним глазом с расстояния в несколько сантиметров от страницы. Люди в художественных галереях ходят и рассматривают картины под всевозможными углами. (Многие исследователи субъективного восприятия утверждали, что зрители мысленно вносят коррективы при просмотре фотографии из «неверной» позиции, но я не нашёл достаточно убедительных доказательств этого, так что не буду углубляться.)

Наконец, Кендеринк указал на то, что выбор проекции заключается в выборе из множества различных задач и ограничений. В статье обсуждаются параметрические альтернативы, в основном стереографическая проекция Гельмгольца; на мой взгляд, это самое слабое место статьи, потому что авторы, очевидно, были незнакомы с более глубокими исследованиями этой темы в сфере компьютерной графики и компьютерного зрения, о которых я расскажу в конце этого поста.

Но есть определённые правила

Существует множество способов создания изображений, и ни один из них не является единственно «правильным».

Тем не менее, мы всё равно чувствительны к тому, как работает перспектива. Например, посмотрите, как в начале 2020 года использовалась съёмка телевиком, чтобы создать впечатление, что открытые пространства переполнены и люди не соблюдают социальную дистанцию.

На самом деле, проницательная статья Купера и с соавторами показала, что при отсутствии других подсказок мы склонны интерпретировать фотографии так, как будто смотрим на них с правильного фокусного расстояния. Из-за этого фотографии, сделанные с чрезмерными фокусными расстояниями, выглядят искажёнными:

Вот серия снимков одного человека, сделанная одновременно с увеличением фокусного расстояния и отдалением от него:

Фотографии одного человека с разными фокусными расстояниями из статьи Cooper et al.

Если вы не знаете этого человека, то на фотографиях он выглядит как четыре разных человека. Портрет, сделанный с «правильным» фокусным расстоянием обычно выглядит наиболее привлекательным. Одно из исследований показало, что эти различия влияют на то, как зрители воспринимают личность фотографируемого человека: лица, сфотографированные с ближнего расстояния, кажутся более «доброжелательными», сделанные на большем расстоянии кажутся более «впечатляющими», а сделанные со среднего расстояния кажутся более привлекательными.

Существуют программные алгоритмы, специально разработанные для коррекции селфи с этой целью.

Эти наблюдения означают, что перспектива не полностью произвольна и не имеет правил. Художники могут рисовать что угодно, но разные рисунки создают разное впечатление, а некоторые рисунки могут сильно сбивать с толку. Выбор перспективы — это компромисс: например, между желанием сфокусироваться на некоторых объектах по сравнению с другими и задачей сохранения прямых линий.

Вычислительная фотография для нелинейной перспективы

Вдохновлённые различными видами систем перспектив в искусстве, исследователи компьютерной графики и зрения разработали множество видов нелинейных перспектив. Для меня новаторской (хоть и не первой) статьёй в этой области стала статья Роба Кэрролла и других авторов. В этой статье приводится два важных тезиса. Во-первых, нам не нужно искать единую параметрическую проекцию, как это делали предыдущие авторы, а воспринимать перспективу как искажение изображения. Во-вторых, поскольку при выборе перспективной проекции приходится искать компромисс между несовместимыми задачами, искажение можно сформулировать как нелинейную оптимизацию. Вот пример, демонстрирующий разные широкоугольные проекции одной комнаты:

Различные проекции одной сцены из статьи Carroll et al.

Обратите внимание, насколько искажена широкоугольная линейная перспектива (верхнее левое изображение). Стереографическое изображение и изображение в проекции Меркатора не сохраняют прямые линии, а в методике Кэрролла нет ни той, ни другой проблемы. Более новый метод в некоторых случаях автоматизирует решение этих проблем.

Во многих других чудесных статьях предлагаются различные виды нелинейных перспектив, вдохновлённые художниками, в том числе методики, вдохновлённые портретами Возрождения в полный рост, кубизмом, де Кирико, «соединениями» Дэвида Хокни и многими другими. А у многих вычислительных методик нет традиционных аналогов:

Циклографические изображения Зейтца и Кима

Как сделать отдалённые объекты большими, как на моём рисунке моста «Аврора»? Один из способов, решающих эту задачу — Computational Zoom:

Computational Zoom имеет недостаток: необходимо сделать множество фотографий и разных точек, и в это время объект должен стоять неподвижно.

В новой статье, первым автором которой является Шон Лю, мы совместно с Манишем Агравала, Стивом Диверди разработали методику под названием ZoomShop, работающую по одной фотографии:

Картина в целом

Фотография не всевидяща в смысле того, что видит глаз. Наше бинокулярное зрение является состоянием непрерывной переменчивости, а камера фиксирует навсегда … единственное, изолированное состояние момента. Кроме того, мы используем объективы разного фокусного расстояния, чтобы намеренно преувеличить видимое, и мы часто «избыточно корректируем» цвет по той же самой причине. При печати мы сохраняем наше преднамеренное искажение факта … — Эдвард Вестон, 1932 год.

Теории восприятия и фотографии часто склонны к подходу «всё или ничего». Или линейная перспектива и камера верны, и камеры не лгут. Или объективной реальности нет и всё придумано. Очевидно, что реальность гораздо сложнее. В наших художественных работах используются всевозможные сложные нелинейные структуры, и наш мозг способен понять и интерпретировать их. Ещё сильнее запутывает то, что, по некоторым свидетельствам, люди с сильно отличающимся культурным наследием могут иметь в некоторых случаях очень разное восприятие перспективы. Понимание того, как и почему перспектива работает — это сложная задача (над которой как раз тружусь я), как и разработка нового ПО, позволяющего изображениям легко передавать то, что мы хотим передать.

Комментарии (24)

gatoazul
17.03.2022 11:25
#24174615
+3
К сожалению, иностранный автор не упоминает пионерские работы академика Раушенбаха, посвященные воспринимаемой глазом перспективе и ее отличиям от линейной.

https://epizodsspace.airbase.ru/bibl/raush/prostranstva/Rauschenbach_Prostranstvennye postroeniya_v_zhivopisi_1980.pdf
1. Portnov
  17.03.2022 15:49
  #24175689
  Также замечу - там даже прямо формулы есть, как считать "более правильную" перспективу. (точнее, там говорится, что совсем правильно сделать нельзя, но также говорится, как сделать более правильно, чем линейное приближение). В наш век "вычислительной фотографии", наверное, уже можно встроить эти формулы в камеру или в плагин к фотошопу... Там, конечно, участвуют переменные типа "реальный размер объекта" — но их уже, по-моему, можно при помощи существующих технологий "компьютерного зрения" вычислить.
  1. Soukhinov
    18.03.2022 17:17
    #24179557
    +1
    Я знаком с этой книгой. Встроить формулы в камеру невозможно — не существует изображения, которое передаст то, как человек воспринимает мир. Соответственно, невозможно «поправить» фотографию.
    
    Рассмотрим, например, фотографию с церковью. Мы воспринимаем церковь большой, но на фото она маленькая. Допустим, вблизи были два столба, и церковь была видна как раз между столбами. Человек одновременно воспринимает церковь огромной и видит её находящейся между столбами. Изобразить на фото это невозможно.
    
    Другой пример: допустим, на фото две церкви. И они воспринимаются огромными. И в то же время легко умещаются «на конце» моста. Если мы начнём их увеличивать, то «в дальней части» фотографии две церкви просто не вместятся.
    
    Все эти формулы можно применить, только если есть отдельные, никак не связанные объекты — когда пространством между ними можно пожертвовать, изменяя их размеры с целью манипуляции восприятием.

aamonster
17.03.2022 11:29
#24174629
+7
Есть чувство, что всё, что автору надо – это сместить "камеру" подальше себе за спину (и снимать, соответственно, более длиннофокусным объективом). Возможно, даже куда-то, куда реальную камеру разместить нельзя (за стену комнаты, например).
Действительно экзотические варианты, не укладывающиеся в линейную перспективу (fish eye, панорамы) или выворачивающие её наизнанку (обратная перспектива) – всё-таки достаточно непривычны.
1. gatoazul
  17.03.2022 11:39
  #24174675
  Просто оцените взглядом высоту гор на местности и потом посмотрите на них же на экране фотоаппарата. Глаз+мозг НЕ работают в линейной перспективе. Система зрения увеличивает объекты, которые считает более важными.
  1. aamonster
    17.03.2022 12:07
    #24174791
    +3
    На картине я вижу, что горы заметно крупнее (относительно моста). Уносим фотоаппарат вдвое дальше от моста – и вроде получаем тот же результат. Аналогично для рисунка с церковью. Для рисунка с ногами, судя по всему, камера должна быть где-то за головой, и кадр соответственно кропнут.
    Я не исключаю, что где-то для комфортного просмотра надо уйти от линейной перспективы, но в этих трёх примерах я вижу лишь смещение "наблюдателя" дальше от объектов (и зум, чтобы в кадре было то, что нужно).
    
    Система зрения увеличивает объекты, которые считает более важными.
    
    Да, и в принципе это может быть сделано на картине (а ещё их можно сделать более яркими, более насыщенными, более резкими) – но, вообще-то, при разглядывании картины/фотографии с правильной дистанции система зрения должна точно так же увеличивать объекты на ней.
    
    gatoazul
    17.03.2022 12:11
    #24174807
    при разглядывании картины/фотографии с правильной дистанции система зрения должна точно так же увеличивать объекты на ней.
    
    Этого явно не происходит. Зрение не считает плоскую картинку настоящим изображением.
    
    Bedal
    17.03.2022 15:02
    #24175549
    +4
    великое множество оптических иллюзий с Вами не согласится. И зрители, ломанувшиеся из зала на показе «Прибытие поезда на вокзал Ла-Сьота», тоже вряд ли согласились бы.
  1. ABOMETP
    18.03.2022 12:11
    #24178359
    глаза - это выросты мозга, потому и чтобы понять другого человека мы смотрим в глаза
1. Wizard_of_light
  17.03.2022 12:15
  #24174829
  Не сработает - с увеличением будет другое поле обзора. Тут нужно какое-то нелинейное наложение двух кадров - с длиннофокусного для центральных объектов и с широкоугольного по краям.
  1. PereslavlFoto
    17.03.2022 13:26
    #24175145
    Правильнее сказать, нужен снимок, собранный из нескольких снимков, сделанных длиннофокусным объективом. Действительно, поле обзора у телеобъектива уменьшено, поэтому надо расширить его соседними кадрами. Вот тогда всё будет хорошо.
1. Soukhinov
  18.03.2022 17:24
  #24179591
  +1
  Наверняка. Видим из глаз, но воспринимаем «от третьего лица». И чем больше масштаб местности, в которой находится человек, тем «дальше отодвигается камера».
  
  И ведь мы действительно воспринимаем то, что сзади. Хотя бы на уровне памяти — когда идём вперёд, помним то, что видели ранее. А если не идём, то можем головой покрутить и посмотреть.
  1. aamonster
    18.03.2022 19:25
    #24179857
    Да, то, что вне поля зрения – интересно. Но, кажется, это вообще не ложится ни на какую проекцию, тут разве что по принципу "карта – это не территория", создать какой-то способ отображения и приучить мозг его воспринимать (привыкли же мы смотреть развёрнутые в полосу панорамы и кадры, снятые fish eye – хотя в природе такой картинки не бывает).

Cyrus
17.03.2022 11:59
#24174769
+1
Еще есть чувство, что восприятие и коррекция перспективы должна зависить от размеров изображения.

Находясь на выставке фотографий, начиная с какого-то размера фото мозг выполняет ту же коррекцию. На иллюстрациях к статье мы смотрим на изображение с малым угловым размером и чем меньше изображение, тем больше требуется «компрессировать» перспективу.

PereslavlFoto
17.03.2022 13:24
#24175129
+2
фотографии, сделанные с чрезмерными фокусными расстояниями, выглядят искажёнными

К сожалению, автор статьи не читал советских учебников по фотографии, где всё это было разжёвано в деталях.

Микулин, Виктор Петрович. 25 уроков фотографии.

Бунимович, Давид Захарович. Практическая фотография.
1. amarao
  17.03.2022 15:50
  #24175695
  +1
  Я тоже хотел напомнить про нормальный объектив, но статья пишется для читателя, а не отчитывается обо всём, что знает автор. Если дальше читать, становится ясным, что он выходит куда дальше, чем до вывода "снимайте на теле".
1. vmir88
  18.03.2022 10:42
  #24177967
  А объясните по существу в чём автор не прав, что в этой статье противоречит данным из этих советских учебников.
  1. PereslavlFoto
    18.03.2022 13:45
    #24178831
    Автор убеждённо порицает широкоугольные объективы, не задумываясь о том, что есть и другие.

Spaceoddity
17.03.2022 14:00
#24175259
+4
Фокусное расстояние объектива не искажает перспективу. На передачу перспективы влияет только точка съёмки.
1. Soukhinov
  18.03.2022 17:21
  #24179583
  +1
  Да. Там ещё такая кривая фраза написана: «Портрет, сделанный с «правильным» фокусным расстоянием обычно выглядит наиболее привлекательным.»
  
  Хотя надо было бы сказать «снятый с правильного расстояния».
1. aamonster
  18.03.2022 19:28
  #24179867
  При одинаковом занимающем кадр объекте дистанция съёмки и ЭФР однозначно определяют друг друга.

koreychenko
17.03.2022 14:51
#24175499
+6
Никак не отражено то, что мозг собирает картину по кусочкам (читать саккады). Это такой эволюционный костыль, потому что в центре кадра детали есть, а чуть дальше к краям детализация зрения заметно снижается. На уровне каждого "снимка" восприятие для отдельного кусочка может изменяться. Именно поэтому в человеческом зрении HDR реализован "из коробки" с огромным динамическим диапазоном, а в фотоаппарате надо делать несколько снимков и объединять их с помощью хитрого алгоритма и всё равно получается не так, как в жизни.
Если продолжать про саккады, то получается, что угловая величина кадра, когда ты смотришь строго по центру меньше, чем итоговая угловая величина собранной картинки (глаза крутятся же в разные стороны). Я думаю это во многом объясняет то, почему объекты в центре воспринимаются крупнее.
1. ABOMETP
  18.03.2022 12:21
  #24178409
  если откинуть что у человека два глаза, то современные фотоаппараты используют самодельный разум, что в принципе те же саккады, даже в рав преобразуется не та картинка что спроецированна оптикой на матрицу, а некий суп из смеси сигналогв неоднородных сенсоров после неоднородных светофильтров, приправленную инженерными коррекциями при проектировании и производстве, и всё это ещё и под влиянием вкуса потребителей, ибо на продажу а не для документальной съёмки. это как на, например, жёстком диске, вы же понимаете что на самом носителе нет той информации что вы считываете с него =)
1. vvzvlad
  18.03.2022 17:47
  #24179651
  Именно поэтому в человеческом зрении HDR реализован «из коробки» с огромным динамическим диапазоном,
  
  Нет, не поэтому. И динамический диапазон глаза не такой уж и огромный, если не учитывать темновую адаптацию и сужение/расширение зрачка.