Всем привет! На связи снова Егор Ершов, руководитель группы «Цветовая вычислительная фотография» в AIRI и заведующий сектором репродукции и синтеза цвета ИППИ РАН. Это вторая статья из длинного цикла, которая, фактически, является конспектом лекций курса по алгоритмам вычислительной фотографии, которые я читаю для студентов МФТИ и ВШЭ.

В первой статье я ввёл читателя в проблему воспроизведения цвета, а также рассказал про первую математическую модель формирования изображения. На этот раз мы поговорим про формализацию цвета с технической точки зрения и связанные с этим стандарты.

Неизбежная сюръекция

В прошлый раз мы остановились на том, как устроена первая модель формирования изображения, которая связывает спектральные свойства объектов сцены и освещающих их источников излучения с откликом светочувствительных колбочек в нашем глазу. Этот отклик описывается трёхмерным вектором, который мы называем тристимулом или просто стимулом.

Такая модель действительно даёт некоторую надежду формализовать понятие цвета и превратить его из субъективной характеристики в объективную. Но пока её, к сожалению, недостаточно.

Представим себе следующий мысленный эксперимент. Допустим, у нас есть зелёная капуста. И допустим, мы сделали и распечатали суперкачественную фотографию этой капусты — настолько хорошую, что глаз не может отличить их, если мы поставим кочан рядом с фотографией. Но если мы засунем поверхность капусты и фотобумаги в спектрометр, вы выясним, что спектры у них, вообще говоря, очень сильно отличаются.

M. Brown — Understanding color and your camera. London Imaging Meeting. 2020
M. Brown — Understanding color and your camera. London Imaging Meeting. 2020

Выходит, можно найти как минимум два разных спектра, которые будут приводить к одному и тому же цвету или тристимулу. Такие спектры в науке принято называть метамерными спектрами. Их в общем случае бесконечно много, и, если посмотреть на это с точки зрения математики, это не очень‑то удивительно, поскольку спектральное пространство бесконечномерно (по крайней мере, пока мы не пытаемся его дискретизировать). Размерность же цветового зрения человека со здоровой зрительной системой равна трём, а, значит, такая проекция неизбежно будет сюръективна.

Этот факт означает, что в вопросе количественного описания цвета мы не сможем обойтись одними лишь спектральными приборами — частью нашей измерительной установки неизбежно будет человек. Нам важно оценить характеристики человеческого глаза, которые он использует для проекции из пространства спектров в пространство стимулов. Для нас это означает, что экспериментов на людях в колориметрии не избежать, потому она и считается разделом психофизиологии.

Именно так развивалась эта наука с самого начала. Благодаря этим опытам, мы выяснили, что есть люди с нормальным зрением, есть дихроматы, протаномалы и другие формы дальтонизма. Мы также узнали на этом пути, что цветовосприятие людей, принадлежащих к разным культурам и разным возрастам, имеет свои аспекты и особенности.

На плечах гигантов

Оглядываясь назад, нельзя не упомянуть таких людей, как Томас Юнг, Иоганн фон Гёте, Герман Грассман, Джеймс Максвелл и Николай Нюберг. Мне особенно приятно упоминать Нюберга — он основал цветовую школу нашего института и внес существенный вклад в развитие колориметрии и цветовой репродукции в нашей стране.

В ходе своих исследований эти учёные установили довольно много знаний о зрительной системе человека, имея под рукой весьма примитивные средства исследования этого феномена. В частности, уже в середине XVIII века Герман Грассман понимал, что наше зрение является трёхмерным, хотя никаких возможностей анатомически исследовать глаза у него не было.

Вместо этого он зажигал свечи, ставил перед ними разные фильтры и смотрел, как цвета складываются на белой стене. Наблюдая за смешением цветов, он сформулировал несколько важных законов, которые актуальны в нашей науке и сейчас. В частности, закон о сложении цветов, который гласит, что любой цвет можно представить как сумму трёх. Или закон о непрерывности цветов: если мы берем некоторый цвет, формирующийся как сумму нескольких других, и плавно начинаем менять один из них, то и итоговый также меняется плавно.

Кроме того, мы должны быть благодарны Джеймсу Максвеллу за его знаменитую юлу. Он предложил разделить диск юлы на несколько секторов, каждый из которых покрашен в свой цвет. Максвелл показал, что, если достаточно быстро ее раскрутить, то мы будем наблюдать что‑то совершенно иное. В частности, если нанести на диск два цвета и сильно раскрутить её, то человеческий глаз сможет наблюдать результат их смешивания. А если три одинаковых сектора были покрашены в равной степени в синий, зеленый и красный, то при раскручивании получается серый цвет (посмотреть на это можно, например, здесь). Таким путём Максвелл обнаружил аддитивную природу цветов.

Диск Максвелла, созданный в 1855 году, до сих пор бережно хранится в Кавендишской лаборатории в Кэмбридже
Диск Максвелла, созданный в 1855 году, до сих пор бережно хранится в Кавендишской лаборатории в Кэмбридже

Сегодня мы знаем, что существует предельная частота, с которой зрительная система может воспринимать любые циклические процессы. Это знание используется при подборе частоты обновления мониторов, видеорядов и тому подобного. Убедиться в этом можно, наблюдая за колесом, которое вращается с ускорением. Начиная с определённого момента, наши глаза не способны уловить вращение целиком, и создается иллюзия, что колесо вращается в обратном направлении.

На этом и основан принцип действия юлы Максвелла: за один такт работы нашей зрительной системы к нам в глаз попадает свет от разных участков диска, причём иногда по несколько раз. Поэтому все цвета смешиваются, а результат такого смешения визуально размазывается по всему диску.

Кстати говоря, на этом же принципе сейчас и устроено большинство мониторов. Немногие знают, но повсеместно распространенные 8-битные мониторы часто являются лишь 6-битными, но с очень большой частотой. Благодаря высокой скорости работы, они успевают показывать еще и набор промежуточных интенсивностей, за счет чего разрядность эффективно повышается. Этот же приём активно пользуют для оптимизации энергопотребления в современных устройствах, а также чтобы спрятать артефакты сжатия видеопоследовательностей.

Эксперименты на людях

Но вернёмся к экспериментам на людях. Впервые подобные опыты спроектировали и провели в начале прошлого века — примерно тогда же, когда появились первые представления о механизме формирования цвета.

Испытатель задавал некоторый тестовый цвет, а наблюдателю предлагалось распоряжаться интенсивностью света от ламп других трех цветов — синего, зеленого и красного. Освещение было устроено таким образом, что тестовый стимул занимал одну половину зрительного поля, например, левую, а наблюдателю можно было настраивать правую. Задача наблюдателя заключалась в том, чтобы, используя свои рычажки, выровнять цвет левого и правого полуполей. Как только результат достигнут, тестовому стимулу ставится в соответствие численное значение, взятое на основании положения трёх рычажков.

https://www.oceanopticsbook.info/view/photometry-and-visibility/chromaticity

Именно такой принцип лежит в основе всех колориметрических измерений даже в наши дни. Исследователи пробовали самые различные вариации: описание словами, выставление рейтингов, сопоставление с какими‑нибудь шкалами — всё это работает гораздо менее стабильно и воспроизводимо, чем попарное выравнивание.

Иногда, правда, принцип выравнивания полуполей заменяют фликерингом, то есть техникой, когда стимулы раз в некоторое время меняются местами, что воспринимается как мерцание. Идея метода в том, что при определённой частоте (около 15–20 Гц) эффект мерцания может исчезнуть, если стимулы референсного и тестового полей близки по яркости, даже если они обладают разным цветом. Задача испытуемого в этом случае сводится к устранению мерцания путём управления яркостью. Такой тип исследований особенно актуален для исследования цветовосприятия на периферии, где пространственное разрешение зрительной системы вносит значительные искажения в измерения.

В начале прошлого века фликеринг позволил сравнить яркостное восприятие света на разных длинах волн с помощью установки узкополосных светофильтров. Оказалось, что соответствующие соотношения довольно устойчивые от опыта к опыту среди самых разных людей. Это позволило ввести более или менее универсальный стандарт чувствительности человеческого зрения с помощью кривой видности, которую в качестве эталона утвердила Международная комиссия по освещению в 1924 году.

Кривая чувствительности (в относительных единицах) для дневного (красная линия) и ночного (синяя линия) зрения. HHahn / wikimedia.org
Кривая чувствительности (в относительных единицах) для дневного (красная линия) и ночного (синяя линия) зрения. HHahn / wikimedia.org

У кривой для дневного зрения пик располагается на длине волны 555 нанометров, что где‑то в районе зеленого цвета. На краях видимого диапазона — в районе красного и синего, — напротив, имеют место заметные спады чувствительности. Это довольно полезное знание на практике, когда возникает задача сделать цветные объекты более заметными. Например, по этой причине задние номера автомобилей в Великобритании имеют жёлтый цвет на пару к передним белым.

Другое применение такого знания — энергоэффективность. Когда вы проектируете дисплеи, вы можете рассчитывать, что для создания яркого зелёного пикселя нужно меньше энергии, чем для синего или красного.

CIE RGB

Эксперименты с парой полуполей используются и в колориметрии, чтобы оцифровывать цвета. Экспериментатор выставляет на одну половину свет, прошедший через какой‑то узкополосный фильтр, в то время как наблюдателю предлагается выровнять цвет второго поля с помощью всё той же регулировки рычажков.

M. Brown — Understanding color and your camera. London Imaging Meeting. 2020
M. Brown — Understanding color and your camera. London Imaging Meeting. 2020

Примечательно, что такие испытания проводят с областью зрения в 2 градуса. Это связано с плотностью распределения колбочек по сетчатке глаза, так как известно, что их максимальная концентрация и равномерность достигается в макуле — области на заднем полюсе глазного яблока. Таким образом экспериментаторы устраняют эффекты неравномерности светочувствительных рецепторов. Выбор двух градусов вдохновлен ещё и тем, что на рабочем расстоянии в 60 сантиметров диаметр поля составляет 2 сантиметра, что легко контролировать.

Иногда, кстати, бывает так, что испытуемый не всегда может выровнять цвет, сколько бы он не крутил свои рычажки. В этом случае установку немного меняют: красная лампа теперь освещает не правое поле, а левое — и тогда задача решается, с той лишь разницей, что в данном случае ненулевое значение на красном рычажке считается отрицательным.

M. Brown — Understanding color and your camera. London Imaging Meeting. 2020
M. Brown — Understanding color and your camera. London Imaging Meeting. 2020

Почему так происходит — станет понятно позже. Для нас в данный момент важно, что такие опыты ставят в соответствие одной длине волны три значения регуляторов, одно из которых может быть отрицательным. Впервые такие измерения провели Райт и Гилд, заложив фундамент стандарта CIE RGB 1931 года. Впоследствии этот опыт был неоднократно повторён с теми же результатами.

Функции цветового соответствия, построенные по результатам экспериментов Райта и Гайда. PAR / wikimedia.org
Функции цветового соответствия, построенные по результатам экспериментов Райта и Гайда. PAR / wikimedia.org

Любопытный факт: суммарно эти исследователи измерили всего 17 человек, и все они были британцами среднего возраста. Более того, Райт работал на одной экспериментальной установке, а Гилд работал на другой. Первый, если я не ошибаюсь, измерил 10 человек, а второй — 7. Но, сложив эти измерения, обработав их и надлежащим образом оформив, они доказали мировому научному сообществу, что так делать можно.

Французским стандартом CIE RGB 1931 мы пользуемся до сих пор, включая производные от него стандарты вроде sRGB. Это означает, что на 80 процентов цифрового контента мы смотрим глазами семнадцати британцев прошлого века!

Таким образом, любому спектру можно сопоставить три числа. Для этого нужно вычислить свёртку спектра с каждой из RGB‑функций соответствия. Однако, есть подход и поудобнее.

CIE XYZ

Отрицательное значение красной функции означает, что с помощью трёх ламп мы не можем воспроизвести стимул, соответствующий некоторому диапазону спектральных цветов. С отрицательными значениями работать не очень неудобно в том числе и потому, что в перспективе их хорошо бы логарифмировать. Чтобы решить эту проблему, Райт и Гилд предложили подвергнуть функции некоторым линейным преобразованиям, которые бы гарантировали положительность для любой длины волны:

Таким образом на свет появился стандарт CIE XYZ, а новые функции соответствия приняли следующий вид:

Функции цветового соответствия цветов стандартного наблюдателя CIE XYZ. PAR, Phrood / wikimedia.org
Функции цветового соответствия цветов стандартного наблюдателя CIE XYZ. PAR, Phrood / wikimedia.org

Итак, допустим мы прошлись по всему видимому диапазону и с помощью описанного выше способа показали стандартному наблюдателю все спектральные цвета. Какой след эта траектория оставит в трёхмерном XYZ‑пространстве?

Сложность ответа на этот вопрос заключается в том, что каждому цвету при этом на самом деле соответствует не точка, а луч, исходящий из начала координат. Упрощённо говоря, точки на этих лучах будут отличаться яркостью, поэтому здесь правильнее говорить про конус, а не про траекторию. Поэтому, чтобы нивелировать влияние энергетических характеристик этот конус рассекают плоскостью, которая задаётся уравнением x+y+z = 1:

Чёрная линия на этом рисунке называется спектральным локусом, потому что там содержатся все спектральные цвета. Неспектральные цвета находятся в пределах его выпуклой оболочки. Если глянуть на получившуюся фигуру со стороны оси Z, то мы увидим многим довольно хорошо знакомые очертания — так называемый цветовой треугольник.

Цветовой треугольник. Как по мне, так он больше похож на подкову, но слово «треугольник» уже прочно тут закрепилось. Чёрной линией обозначены цвета, которые имеют планковские источники различной температуры.
Цветовой треугольник. Как по мне, так он больше похож на подкову, но слово «треугольник» уже прочно тут закрепилось. Чёрной линией обозначены цвета, которые имеют планковские источники различной температуры.

Из этого рисунка хорошо видно все преимущества стандартного наблюдателя CIE XYZ 1931. Все точки цветового треугольника все лежат в положительном квадранте плоскости XY — и это очень удобно. Нанометровая шкала, на которой отложены все спектральные цвета, изящно окаймляет треугольник. Не все воспринимаемые нами цвета — чистые, и они так же легко располагаются в пределах треугольника: розовый, пурпурный, голубой и даже белый — всех их мы сможем получить только в результате смешения.

Но есть и ещё одно неочевидное, но очень важное свойство стандартного наблюдателя — его треугольник выпуклый. Мы можем провести аналогичное построение, но не с глазами 17 британцев, а с любым цифровым сенсором, и в большинстве случаев фигура не получится выпуклой.

Что это означает? Вспомните аналитическую геометрию: если точка расположена на выпуклой границе, её никак нельзя представить через линейную комбинацию других точек фигуры. А если точка «погружена» в фигуру, то число таких комбинаций, вообще говоря, бесконечно большое. На практике это означает, что в таком сенсоре чисто спектральному цвету найдется метамерный ему неспектральный цвет.

Есть мнение, что такое необычное свойство треугольника CIE XYZ является скорее результатом обработки данных перед построением стандарта. Действительно, если оно верно, то отсюда следует удивительный и нетривиальный вывод: человек может идеально идентифицировать некоторые чистые спектральные цвета, хотя с эволюционной точки зрения это звучит контринтуитивно.


Итак, теперь у нас есть инструмент, чтобы каждому спектру ставить в соответствие некоторый цвет, и, кажется, проблема колометрии решена! Но давайте не будем спешить.

На самом деле восприятие через тристимулы — это лишь первичная реакции нашего зрения на наблюдаемое излучение. Однако на этом процесс нашего цветовосприятия и обработки того, что мы пронаблюдали, не заканчивается.

Как вы, наверное, сами замечали, под разными освещениями можно наблюдать один и тот же объект совсем по‑разному. Иногда мы гарантированно знаем, что, независимо от освещения, белый лист — белый, а зеленая трава — зеленая. Но, вместе с тем, существует множество различных цветовых иллюзий, в которых контекст драматически меняет кажущийся цвет объекта: достаточно вспомнить нашумевшее 10 лет назад то ли золотое, то ли синее платье.

Это значит, что нам следует продолжать разбираться в проблеме цветовосприятия. Но сделаем мы это уже в следующий раз.

Выражаю отдельную благодарность Майклу Брауну за ценные материалы, показанные на London imaging meeting, а также Марату Хамадееву за вдумчивую и бережную проработку текста статьи.

Комментарии (6)


  1. Jijiki
    06.06.2025 11:45

    вообще странно, но юла вроде не отражает всю суть контекста, но я не ученый, она показывает только конец действия так сказать смешанные цвета и всё, чтобы сделать юлу надо уметь определять цвета, может оно и так пускай, не буду спорить, но я чото машинально вспомнил , вот изза этого наверно и приведена только юла я думаю в експерименте


  1. DimPal
    06.06.2025 11:45

    С колесом бред написан, эффект вращения в оратную сторону связан только с видео обуродованием - с дискретностью скорости смены кадров и короткой выдержкой. Если смотреть вживую, колесо ни когда не будет вращаться в другую сторону.


    1. alivedsn
      06.06.2025 11:45

      На самом деле это "стробоскопический" эффект, и его можно наблюдать и без видеооборудования. Хорошо он заметен при освещении, например, лампочкой накаливания (которая заметно мерцает с частотой 100 Гц), а ещё лучше с некоторыми устаревшими лампами дневного света. За счёт их мерцания вращение колеса может выглядеть очень даже стробоскопично. Мало того, даже при обычном солнечном освещении можно иногда на мгновение подловить этот эффект (видимо, за счёт постоянного непроизвольного движения наших глаз, постоянно сканирующих пространство). Надо сказать, что частота восприятия 15-16 Гц вообще характерна для нервных окончаний человека (зрительных, с также слуховых - 16 Гц обычно считается нижней границей восприятия звука, более низкие частоты воспринимаются как отдельные толчки, а не слитный звук). В своё время это определило частоту кадров в кинематографии (24 кадра/с, запас в 1,5 раза от нижней границы). А вот на краях поля зрения быстродействие нервной системы в 2-3 раза выше, поэтому в классическом кинематографе появился обтюратор (который принудительно утраивает, до 72 Гц, частоту мельканий на экране). Обтюратор позволил снизить утомляемость зрителя, убрав видимое мелькание. При этом увеличение частоты съемки свыше 24 кадров/с и по сей день нецелесообразно, т.к. человеку и этого достаточно для целостного восприятия (и все боевики с быстрым движением мы так и смотрим, привет геймерам). Хотя на самом деле существуют известные эффекты "кинематографического движения", устранение которых потребовало бы увеличения кадровой частоты. Но уж больно они мало на что влияют в реальном кино.


      1. dyadyaSerezha
        06.06.2025 11:45

        Обтюратор появился для затемнения момента перемещения плёнки на следующий кадр и больше ни для чего. Это уже потом в него добавили 1 или 2 холостые лопасти для снижения мерцания.

        И увеличение частоты съёмки кино до 48 и 60 к/с очень сильно видно глазом и воспринимается как неестественное, так что не надо про "больно мало на что влияют" - глаз прекрасно отличает 24 к/с от 48 или 60.


    1. dyadyaSerezha
      06.06.2025 11:45

      С колесом бред написан

      Согласен. Странно такое читать от препода в известных универах. Эх, не тот нынче препод пошел, не тот... (с)


  1. dyadyaSerezha
    06.06.2025 11:45

    Размерность же цветового зрения человека со здоровой зрительной системой равна трём, а, значит, такая проекция неизбежно будет сюръективна

    Хорошо, мы нашли разные варианты спектра для зелёной капусты, которые дают одинаковый стимул. То есть, наше оборудование не идеальное, поменяло оригинальный спектр, но зрительное восприятие то же. Но это только для зелёной капусты. Если мы применим то же искажение/преобразование спектра в результате съёмки объекта другой палитры цветов, стимул будет сильно отличаться и мы тут же увидим разницу. Поэтому, несмотря на лимитированную размерность зрения человека, задача для фото/видеотехники всегда одна - максимально приблизить итоговый спектр к оригинальному, чтобы при любом цветовом спектре объекта стимул был близок к оригинальному. То есть, сюръекция зрения никак не влияет на математику или технику фото/видео. Не должна влиять.

    Другое дело, как вместить гигантский динамический диапазон реального мира в прокрустово ложе RGB и других вариантов или в фотобумагу, Вот тут уже нужна математика с учётом зрения человека.