В отличие от многих существ, обитающих по соседству с нами на планете Земля, наш вид богат национальностями, культурами, языками и обычаями. Несмотря на принадлежность к одному виду, люди из разных уголков планеты обладают множеством отличий, одним из которых является язык. Внутри любого вида существует потребность обмениваться информацией. Методов реализации этой потребности достаточно много: запахи, цвета, движения, звуки и т.д. Человек больше всего полагается на вербальный метод коммуникации, в результате чего за долгие годы эволюции и развития нашей цивилизации образовалось множество языковых групп и отдельных языков. Другими словами, человек обладает очень разнообразным ассортиментом вербальных инструментов, которые, по идее, должны в равной степени точно описывать те или иные предметы и события. Однако структура языка может сильно отличаться между языковыми группами. Ученые из Пенсильванского университета (США) выяснили, что словесное описание индивидуальных цветов сильно отличается между разными нациями (т.е. между языками), но вот группировка цветов по категориям демонстрирует общие черты. Какую роль в этом играют коммуникативные потребности, как фрукты повлияли на словесное описание цветов, чем разные народы отличаются, и что между ними общего, когда речь идет о цветах? Об этом мы узнаем из доклада ученых. Поехали.

Основа исследования


Сказать, что на Земле много языков, значит не сказать ничего. По данным Ethnologue насчитывается 7139 языков из 142 языковых групп (алфавитный перечень языков Земли можно посмотреть тут). Конечно, одни языки более распространены, чем другие, но такое разнообразие все же поражает.

В процессе изучения какого-либо языка мы, как правило, начинаем с основ: цифры до 10, формы, цвета, предметы одежды и т.д. Порой слово из родного языка (например, украинский «квадрат») будет выглядеть и/или звучать практически так же и на изучаемом языке (русский «квадрат» или испанский «cuadrado»). В противном случае отличия могут быть весьма разительные: английский «square» и чешский «čtverec». При этом нам всегда будет ясно одно — каким бы языком не описывали квадрат, мы знаем, что это геометрическая фигура, у которой все стороны и углы (90°) равны. Другими словами, объект остается тем же, независимо от языка его описывающего.

С цветами все обстоит немного сложнее. Даже внутри одного языка могут возникнуть трудности с пониманием, когда один человек видит и называет розовый, а другой считает цвет коралловым. Если же собеседники относятся к разным языковым группам, то вероятность различий в описании цвета возрастает в разы.

В 1969 году Брент Берлин и Пол Кей провели масштабное исследование, результаты которого они описывают в своем труде «Basic color terms: their universality and evolution». Они исследовали, как цвета обозначены лексически в 130 языках, используя стандартизированный набор цветовых стимулов ().


Изображение №1

Они обнаружили, что словари цветов из независимых лингвистических групп обладают удивительно схожим разделением цветового спектра. В языках с двумя основными цветовыми категориями одна обычно описывает белый + теплые цвета (красный / желтый), а другая — черный + холодные (зеленый / синий). Если же категорий три, то разделение следующее: белый, красный/желтый и черный/зеленый/синий. Языки с еще более обширным цветовым словарем остаются в значительной степени предсказуемыми в том, как они делят спектр воспринимаемых цветов (1B) на дискретные термины.

Чтобы иметь возможность говорить о цветах, язык должен представлять огромный спектр цветов, воспринимаемых человеком, с помощью сравнительно небольшого набора цветовых терминов.

Теория сжатия наименования цветов объясняет разделение цветов на термины, основываясь на психофизике человеческого восприятия цвета и полезности/необходимости ссылаться на разные цвета. Другими словами, если в жизни какой-то группы не участвует салатовый цвет, то и слово для него придумывать не нужно, а можно отнести его к зеленому.

Люди, несмотря на генетическую разницу спектральной чувствительности фоторецепторов, разницу в пропорциях колбочек и палочек и даже разницу в возрасте, воспринимают цвета достаточно однородно, т.е. их суждения о цвете не имеют явно выраженных отличий, несмотря на физиологические отличия между индивидуумами.

Наличие общей для всех людей психофизики восприятия обеспечивает общую метрику цветового сходства и общие ограничения гаммы воспринимаемых цветов, каждый из которых вносит свой вклад в общие схемы формирования цветовых обозначений в разных языках.

Недавние исследования показали, что цветовые термины, как правило, отражают, насколько часто человеку нужно ссылаться на разные цвета. Оказалось, что теплые тона (красный / желтый) встречаются чаще, чем холодные (синий / зеленый).

Общие коммуникативные потребности также могут объяснить сходство в лингвистическом группировании цветов у разных языковых групп. Примером таких потребностей является описание съедобных/несъедобных фруктов или опасных/неопасных животных среди древних людей. Если перефразировать, древний человек понимал, что красный фрукт будет спелым, вкусным и питательным, а зеленый — нет. Следовательно, лингвистически была потребность описать этот цвет, дабы поделиться информацией с сородичами без потребности таскать с собой красный фрукт для референса («вот, ешьте только такие, как у меня в руках»).

Другим (утрированным) примером лингвистической потребности могут быть компьютеры. В нашем современном обществе они повсюду, а вот у какого-то племени, обитающего в джунглях Амазонки, компьютеров нет, а потому и нет слова, их описывающего. Проблема в том, что оценивать лингвистическую потребность весьма сложно, особенно в рамках классификации цветов.

Посему ученые решили создать свой алгоритм сжатия наименований цветов, не ссылаясь на ранее разработанные методики расчета коммуникативных потребностей.

Результаты исследования


Первым делом в создании алгоритма была использована модель сжатия, позволяющая найти эффективный алгоритм удаления избыточности из набора данных. В модели сжатия цвет в наборе всех воспринимаемых цветов (x ∈ X) должен быть передан слушателю с некоторой вероятностью p(x). Говорящий не может быть бесконечно точным, обращаясь к x, и вместо этого должен использовать термин x̂ из своего общего цветового словаря X̂. Многие цвета в X соответствуют одному и тому же термину, поэтому слушатель, слышащий x̂, не будет точно знать, на какой цвет x ссылается говорящий.

Затем название цвета сводится к следующей проблеме: как сопоставить цвет и термин цвета? По мнению ученых, ответ на этот вопрос помогает получить теория скорости-искажения*.
Теория скорости-искажения* — определяет минимальное количества битов на символ, измеряемого скоростью R, которое должно передаваться по каналу, так что источник (входной сигнал) может быть приблизительно восстановлен в приемнике (выходной сигнал) без превышения ожидаемого искажения (D).
Сопоставление цветов с ограниченным набором терминов обязательно вносит неточность или «искажение» в коммуникацию. Величина искажения зависит от ожиданий слушателя относительно того, на какой цвет (x) ссылается говорящий, когда произносит термин (x̂). Согласно вышеописанной теории, сопоставление цветов и терминов позволяет слушателю собрать как можно больше информации о цвете x из термина x̂ (1C).

Каждый цвет (x ∈ X) идентифицируется уникальной позицией, обозначенной x, в перцептуально (с точки зрения восприятия) однородном цветовом пространстве. Координаты, соответствующие цветному термину x̂, задаются его центроидом: средневзвешенным значением всех цветов, которые говорящий ассоциирует с этим термином:



Искажение, возникающее, когда говорящий использует x̂ для обозначения x, представляет собой евклидово расстояние между x и xˆ в цветовой модели CIELab, обозначаемого как d(x | | xˆ).

Интуитивно понятно, что цвета, близкие к xˆ, с большей вероятностью будут присвоены термину x̂ (1C), а центроид минимизирует среднее искажение всех точек, назначенных этому члену, т.е.:



Математика сжатия обеспечивает оптимальные способы представления информации для заданного уровня допустимого искажения. Размер сжатого представления (X̂) измеряется количеством информации, которое оно сохраняет о несжатом источнике (X), заданном взаимной информацией I(X; X̂).

Термины представляют цвета, определяя вероятность использования определенного термина (x̂ ∈ X̂) для обозначения определенного цвета (x ∈ X).

Теория скорости-искажения обеспечивает эффективное сопоставление цветов с терминами, которое зависит от трех аспектов:

  • функция искажения в цветовом пространстве;
  • степень искажения, допускаемого языком;
  • вероятность p (x) того, что на каждый цвет необходимо ссылаться во время общения (коммуникативная потребность).

По данным предыдущих работ крайне сложно вывести общие коммуникативные потребности, ибо они дают весьма противоречивые результаты. Посему необходимо было вывести новый алгоритм коммуникативных потребностей:




Созданный алгоритм определяет коммуникативные потребности языка на основе знания центроидов, связанных с его цветовыми терминами. В труде Берлина и Кея были измерены «фокусные цвета» каждого цветового термина, путем опроса участников, которые должны были выбрать из стимулов Манселла () «лучший пример» этого термина. Следовательно, измеренные фокусные (фокальные) цвета фактически являются центроидами для каждого термина.


Изображение №2

В результате разработанный метод показал разительные отличия в нужде говорить о различных областях цветового пространства (). Из предполагаемых коммуникативных потребностей, усредненных по всем 130 языкам (как и в труде Берлина и Кея), некоторые цвета (например, ярко-желтый и красный) выражены в 36 раз сильнее других (например, синие/зеленые пастельные и коричневые). Одно только это наблюдение уже сильно расходится с выводами, сделанными в предыдущих исследованиях, где предполагалось наличие равномерного распределения потребностей, а название цвета приписывалось только участку цветового пространства.

Если же учесть неоднородность коммуникативных потребностей (2B), то точность предсказания цветовой терминологии языка существенно повышается. Предсказанные фокусные точки не только лучше согласуются с эмпирическими данными при учете неоднородных потребностей, но и дают лучшее разделение цветов на дискретные элементы ().


Изображение №3

Далее ученые смогли сделать выводы о коммуникативных потребностях и спрогнозировать цветовые термины, используя данные первого из двух экспериментов в WCS (World Color Survey — исследование, начатое в 70-ых после работы Берлина и Кея), где измерялись основные (фокусные) цвета (3A).

Почти для всех проанализированных языков из WCS (n = 110) карты цветовых терминов, предсказанные теорией скорости-искажения, значительно улучшаются (на 84%) с учетом неоднородных коммуникативных потребностей (3B). Лишь около 15% языков показали незначительное улучшение либо его отсутствие. Существенное улучшение предсказанных карт терминов можно отнести как к универсальным моделям коммуникативных потребностей, общих для разных языков, так и к языковым вариациям потребностей ().


Изображение №4

Ученые заявляют, что они могут интерпретировать предполагаемые коммуникативные потребности в цветах, сравнивая их с тем, что известно о цветах заметных объектов.

Ранее уже отмечалось, что существует определенная тенденция уменьшения коммуникативной потребности от теплых к холодным цветам (4A), связанная с частотой цветов, которые появляются в объектах переднего плана.

Анализ показал, что такая тенденция действительно есть, по крайней мере, среди цветов в среднем диапазоне яркости (строки C–H на 4C). Однако коммуникативная потребность намного сложнее, чем модель теплых/холодных цветов на объектах переднего плана. Зеленовато-синие или синие, а также коричневые/зеленые пастельные используются реже, чем, например, темно-зеленый или темно-синий. Более того, темные цвета в целом (например, строки I и J на ​​4C) показывают относительно высокую коммуникативную потребность по сравнению с их частотой в объектах переднего плана на изображениях (4B).

Дополнительно было проведено сравнение коммуникативных потребностей со спектральными измерениями незрелых и спелых фруктов в рационе приматов, которые обладают трехцветным зрением и спектральной чувствительностью, аналогичной человеческой. При проецировании этих данных на WCS схему незрелые, среднеспелые и спелые плоды заняли отдельные области перцептивного цветового пространства (4C), соответствующие низким, средним и высоким значениям предполагаемой коммуникативной потребности соответственно (4D).

Следовательно, данный анализ подтверждает теорию о том, что общие коммуникативные потребности в человеческих культурах больше подчеркивают цвета важных объектов (в данном случае пища), независимо от культуры, языка или региона обитания.


Изображение №5

Тем не менее языки могут значительно отличаться по своим коммуникативным потребностям в разных частях цветового пространства (5A). К примеру, в языке Waorani (Эквадор) более выражен белый и синий цвет, а вот желтый и зеленый выражены слабо, если сравнивать с другими языками. В языке Martu-Wangka (Австралия) куда сильнее представлен розовый, красный и светло-зеленый, которым уступают синий и темно-пурпурный (5A).

Далее ученые определили, как различия в языковом происхождении, географическом положении и местной биогеографии (5B) связаны с различиями в коммуникативных потребностях. Данный анализ (для разных пар языков) позволил определить следующее: принадлежат ли они к одной лингвистической семье; какова геодезическая дистанция между группами носителей языка; принадлежат ли языковые группы к одному и тому же «экорегиону» (т.е. показатель биогеографии).

Хотя языковые различия в значительной степени идиосинкразические, было обнаружено небольшое (но вполне измеримое) влияние расстояния и биогеографии на коммуникативные потребности (5C). В частности, увеличение геодезического расстояния между языковыми сообществами в 10 раз снижает среднее сходство их коммуникативных потребностей, а проживание в одном экорегионе увеличивает среднее сходство в 8 раз. Эти данные предполагают, что словари языков адаптированы к местному контексту языковых групп.

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых и дополнительные материалы к нему.

Эпилог


В данном труде ученые попытались ответить на вопрос — какие цвета в каких языковых группах встречаются чаще, а какие реже. В результате был разработан алгоритм, способный рассчитать коммуникативные потребности разных языковых групп по отношению к тому или иному цвету.

Алгоритм установил, что коммуникативные потребности в цветовых терминах в разных культурах действительно разные. Но самое любопытное, что почти во всех языках большее внимание уделяется теплым цветам (красный, желтый). Это наблюдение дополнительно подтвердило теорию о том, что степень внимания к цвету в лингвистике коррелирует со степенью зрелости плодов, произрастающих в данном регионе. Другими словами, тысячи лет тому назад древние люди обнаружили, что фрукты более теплых тонов вкуснее, полезнее и питательнее, а фрукты холодных тонов лучше не есть. В результате начали появляться лингвистические термины, описывающие цвет таких фруктов. Это и стало общим корнем для коммуникативной потребности в теплых цветах, представленной в самых разных языках планеты.

Подобные выводы были сделаны еще в 1969, когда Берлин и Кей провели колоссальный труд по сбору данных из 130 языковых групп, представив им 330 цветов. Конечно, лингвистически термины отличались, но вот то, как люди из разных языковых групп группировали цвета, было невообразимо. Проще говоря, когда просили объединить цвета в категорию «самые красные», то люди из разных культур объединяли практически одинаковые цвета. Рассмотренный нами сегодня труд дал математичсекие доказательства этих эмпирических наблюдений.

Мы можем иметь разное этническое происхождение, цвет кожи или язык, но физиология остается одинаковой, несмотря на эти отличия. То же самое можно сказать и про растения. Независимо от региона произрастания, многие виды растений плодоносят, ибо это эффективный метод распространения семян. Цвет плодов должен привлекать внимание потенциальных переносчиков, среди которых были и древние люди, и есть мы сейчас.

Анализ данных с помощью разработанного алгоритма показал, что есть не только сходства в коммуникативных потребностях в, к примеру, красных и желтых оттенках, но и различия. В некоторых регионах больше внимания с точки зрения лингвистики уделялось синему цвету, а зеленый мог практически отсутствовать. Что, опять же, было связано с регионом обитания языковой группы, то есть с окружающей биогеографией.

Авторы исследования говорят, что их труд может помочь в понимании того, о чем говорили люди тысячи лет тому назад. По их мнению, можно даже связать определенные исторические события с изменениями коммуникативной потребности в определенных цветах. Подобное исследование потребует немало сил, времени и терпения, но ученые уверены в его успешности. Нам же будет крайне интересно узнать, какие секреты нашего прошлого могут раскрыть банальные разговоры о цветах.

Благодарю за внимание, оставайтесь любопытствующими и хорошей всем рабочей недели, ребята :)

Немного рекламы


Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Комментарии (0)