
«Если люди — это способ Вселенной смотреть на себя, […] то виртуальная реальность — это способ Вселенной делать вид, что она смотрит на себя». (Уильям Браунинг Спенсер)
«Я утверждаю, что феноменальный опыт от первого лица и возникновение сознательной самости это сложные виды виртуальной реальности. Виртуальная реальность — это возможная реальность. Как любой, кто носил закреплённый на голове дисплей или играл в современные видеоигры, знает, что иногда можно забыть о «если бы» полностью; возможное может быть пережито как реальное. Таким же образом, сознательные части нашего мозга в чём-то напоминают закреплённый на голове дисплей: они погружают организмы в симулированное поведенческое пространство» (Томас Метцингер)
«Наш мозг строит модели окружающего мира и постоянно видоизменяет эти модели на основании сигналов, достигающих наших органов чувств. Поэтому на самом деле мы воспринимаем не сам мир, а именно его модели, создаваемые нашим мозгом» (Крис Фрит)
«Каждая отдельная частичка нашего внешнего ощущения — часть виртуальной реальности. И каждая отдельная крупинка нашего знания — включая знание нефизических миров логики, математики, философии, воображения, вымысла, искусства и фантазии — закодирована в виде программ для передачи этих миров с помощью генератора виртуальной реальности нашего собственного мозга» (Дэвид Дойч)
Наверно, каждый из нас в детстве мечтал о всемогуществе, или магической способности воплощать свои мысли в реальность. Ну или не все мысли, а только те, которые не принесут никому вреда. Вот представьте: вы можете нарушать законы физики и управлять вероятностями реализации самых невероятных событий, включая материализацию любых предметов из вакуума, летать, квантово туннелировать сквозь стены и мгновенно телепортироваться в любую точку Вселенной, читать мысли и контролировать чужие умы, замедлять и ускорять время, расширять горизонты восприятия и т.д. Короче говоря, вы обладаете всеми возможными суперсилами из супергеройских фильмов. Но вы же взрослый человек и не верите в сказки! Кто не успел вовремя повзрослеть, сохраняет психологическую защиту под названием «всемогущий контроль» и верит в силу мысли – якобы мы «притягиваем» в свою жизнь то, о чём думаем, и, если научиться правильно визуализировать свои желания и произносить правильные аффирмации, Вселенная обязательно исполнит ваши мечты. В особо запущенных случаях это проявляется как бред всемогущества – при шизофрении человек может буквально считать себя богом и путать воображаемое с действительным. Но что, если вся эта магия действительно возможна при должном развитии технологий?
Как насчёт способности перевоплощаться в кого угодно и что угодно? В народных сказках и мифах часто встречаются персонажи-оборотни, которые могут магически превращаться в животных, людей или в неодушевлённые предметы. В попкультуре прочно закрепился образ ликантропов-волколаков и упырей-вампиров, но мифология знает и богов-оборотней, таких как скандинавский Локи или греческий Протей, а также демонов, колдунов, ведьм, царевен-лягушек и т.д. Истоки этих верований следует искать в первобытном анимизме и тотемизме, но какое это имеет отношение к теме статьи? Самое непосредственное: оказывается, обобщённой моделью оборотня является генератор виртуальной реальности – физический объект, который может «притвориться» любым другим объектом или средой и вызвать у вас ощущения, как если бы вы взаимодействовали именно с тем объектом или средой, которые он симулирует. Иначе говоря, это универсальный симулятор, воспроизводящий любую логически возможную среду, подобно тому, как универсальный компьютер выполняет любую вычислимую задачу и симулирует работу любой другой машины Тьюринга. Так вот, универсальный симулятор реализует в виртуальной реальности любую вашу мечту, стоит только подумать!

В данной статье речь пойдёт не о современных VR-гарнитурах, игровых мирах и метавселенных, а о чём-то более фундаментальном. Как положено философу, я абстрагирую идею виртуальной реальности от её технического воплощения, чтобы рассмотреть её в максимально обобщённом виде, разобраться, что представляет собой настоящий генератор виртуальной реальности, каковы его физические и логические пределы и насколько мы приблизились к его созданию. Но для начала нам всё же потребуется краткий обзор истории развития VR-технологий, которые на мой взгляд всё ещё находятся в каменном веке. Вы спросите: да как может судить о виртуальной реальности безнадёжно отставший от жизни динозавр, который не то что VR-очки никогда не примерял, но даже ни разу не смотрел кино в 3D, и не знает ничего лучше старых добрых компьютерных игр нулевых годов, в которые не играл уже лет 10? Да, признаю, что я весьма далёк от современной VR-индустрии и её продуктов, но у меня есть генератор виртуальной реальности получше – биологический мозг.
История развития VR-технологий
Первым философским намёком на виртуальную реальность можно считать метафору пещеры Платона, в которой узники видят только тени на стене и думают, что это и есть реальные предметы. 2000 лет спустя Рене Декарт придумал злого демона, манипулирующего чувствами и заставляющего поверить в реальность феноменального. Первым художественным прообразом виртуальной реальности были «фили», или фильмы для всех чувств, в 1931 г. упомянутые Олдосом Хаксли в антиутопии «О дивный новый мир». Если обычное кино передаёт только изображение и звук, то фили обеспечивали зрителям более полное погружение за счёт передачи запахов, вкусов и тактильных ощущений, однако без обратной связи. Самое раннее употребление словосочетания «виртуальная реальность» можно найти в сборнике эссе «Театр и его двойник» (1938) французского драматурга-авангардиста Антонена Арто.

В 1939 г. был представлен стереоскоп View-Master, передававший объёмное изображение с небольших цветных слайдов. В 1950-х гг. Мортон Хейлиг писал о «Театре впечатлений», вовлекающем все чувства зрителей, а в 1962 г. он представил первый прототип мультисенсорного симулятора под названием Сенсорама – механического устройства, погружавшего зрителя в виртуальную реальность при помощи пяти короткометражных фильмов, которые сопровождались запахами, ветром (создаваемым при помощи фена) и шумом мегаполиса с аудиозаписи. В 1964 г. Станислав Лем в своей книге «Сумма Технологии» использует термин «Фантомология» для ответа на вопрос: «как создать действительность, которая для разумных существ, живущих в ней, ничем не отличалась бы от нормальной действительности, но подчинялась бы другим законам?». В 1968 г. профессор Гарвардского университета Айвен Сазерленд сконструировал первый шлем, изображение на который генерировалось при помощи компьютера. Шлем позволял изменять изображения соответственно движениям головы (зрительная обратная связь), но был настолько тяжёлым, что подвешивался к потолку, за что получил название «Дамоклов меч».
В 1970-х гг. примитивная компьютерная графика полностью заменила видеосъёмку в симуляторах полётов, что позволило им работать в режиме реального времени. Первой реализацией виртуальной реальности считается «Кинокарта Аспена» (Aspen Movie Map), созданная в Массачусетском Технологическом Институте в 1977 г. Эта компьютерная программа симулировала прогулку по городу Аспен, штат Колорадо, давая возможность выбрать между разными способами отображения местности – летним и зимним. В 1979 г. Эрик Хоулетт разработал комбинированную оптическую систему Large Expanse, Extra Perspective (LEEP), которая создавала стереоскопическое изображение с широким полем зрения. В 1985 г. она была переработана Скоттом Фишером для Исследовательского центра Эймса НАСА для инсталляции виртуальной реальности VIEW (Virtual Interactive Environment Workstation).

В середине 1980-х появились системы, в которых пользователь мог манипулировать с трёхмерными объектами на экране благодаря их отклику на движения руки. В 1988 г. проект Cyberspace в Autodesk стал первой реализацией виртуальной реальности на недорогом персональном компьютере. Заслугу широкого распространение термина «виртуальная реальность» в популярных СМИ в конце 80-х гг. приписывают Джарону Ланье – основателю компании VPL Research, разработавшему одно из первых доступных устройств виртуальной реальности под названием Power Glove, а также исследовательский костюм VPL DataSuit с датчиками для измерения движения рук, ног и туловища. В 1990-х гг. появились массовые коммерческие потребительские гарнитуры для ПК и приставок. В 1992 г. Николь Стенгер представила фильм «Ангелы» – первое интерактивное кино с эффектом погружения в реальном времени, где взаимодействие осуществлялось с помощью VR-перчатки и очков высокого разрешения.

За первые два десятилетия XXI века значительных прорывов не произошло, совершенствовались только количественные характеристики гарнитур: угол обзора, разрешение экранов, отслеживание движения и т.д. Кроме собственно виртуальной реальности (VR), появляются системы дополненной реальности (AR), в которых виртуальная информация накладывается на трансляцию с камеры в режиме реального времени, и смешанной реальности (MR), когда физические и цифровые объекты сосуществуют и взаимодействуют в реальном времени. В 2024 г. компания Apple выпустила Vision Pro – устройство, которое позиционируется как «пространственный компьютер» и представляет собой полностью закрытую гарнитуру смешанной реальности, активно использующую сквозную передачу видео.

На сегодняшний день типичные VR-гарнитуры включают очки или шлемы (HMD) виртуальной реальности, состоящие из мониторов для каждого глаза, обеспечивающих стереоскопическую графику, бинауральной аудиосистемы (наушников), системы отслеживания положения и поворота головы в режиме реального времени и ручных контроллёров. В качестве дополнительного оборудования используются перчатки или костюмы для управление движением с тактильной обратной связью, обеспечиваемой создающими давление эффекторами и сенсорными датчиками движения частей тела пользователя, а также всенаправленная беговая дорожка для большей свободы физических движений. Информация о движениях пользователя передаётся компьютеру, который вычисляет, что должен видеть, слышать и чувствовать пользователь, и реагирует, посылая соответствующие сигналы на гарнитуру. Виртуальная реальность применяется в таких областях, как развлечения (видеоигры), образование (медицина, безопасность или военная подготовка), проектирование и дизайн, строительство и добыча полезных ископаемых, научные исследования и бизнес (виртуальные встречи). С помощью виртуальной реальности можно моделировать и визуализировать вымышленные сценарии развития будущего, альтернативную историю и миры, основанные на других значениях фундаментальных физических констант.
Виртуальный реализм против виртуального фикционализма
Философы в отношении виртуальной реальности делятся на два лагеря: виртуальных фикционалистов и виртуальных реалистов. Первые считают VR фикцией, а реальным только компьютерное «железо», на котором запущена симуляция. Ни электроны в транзисторах, ни абстрактные биты информации не обладают формой, цветом, запахом и другими качествами, данными нам в ощущениях. Следовательно, пользователь VR взаимодействует не с самими виртуальными объектами, а с их кажущимися отображениями, или субъективными образами. Но с таким же успехом можно сказать, что мы в принципе не имеем доступа к реальному миру, а контактируем только с его моделью или галлюцинацией, создаваемой мозгом. Виртуальные объекты актуальны, а не потенциальны, но существуют не как субстанции физического мира. Их виртуальность определяется по отношению к обусловливающей физической реальности, хотя виртуальные реальности могут быть вложены друг в друга. При завершении моделирующих процессов, идущих в физической реальности (например, выключении компьютера), виртуальная реальность исчезает.
Согласно виртуальному реализму, VR – это не просто совокупность цифровых образов, а полноценное интерактивное пространство, представляющее для пользователей такую же ценность, как и физический мир. Цифровые сущности так же реальны и социально значимы, как физические столы, стулья, машины и т.д., поскольку они стали неотъемлемой частью нашей жизни. О необходимости уравнять виртуальную реальность в статусе с реальностью физической и преодолеть разрыв между человеком и цифровыми технологиями писал в 2000 г. американский философ Майкл Хейм в книге «Виртуальный реализм». Покончить с метафизической неполноценностью виртуальных сред предлагает и Дэвид Чалмерс в книге 2022 г. «Реальность+. Виртуальные миры и философские проблемы». По мнению Чалмерса, виртуальность следует противопоставлять не реальности, а «физикальности» материальных объектов. На фундаментальном уровне цифровые объекты – это информационные структуры данных, записанные в программном коде компьютера, создающего виртуальную реальность. Они не зависят от человеческого сознания и, следовательно, существуют сами по себе как реальные сущности. Когда компьютер моделирует виртуальную кошку, он передаёт пользователю сигналы, напоминающие те, которые исходят от настоящей кошки, и это сходство вполне объективно.
Виртуальный мир (или виртуальное пространство) – это смоделированная компьютером среда, в которой одновременно могут находиться множество пользователей, представленных цифровыми аватарами. Единственный критерий, отделяющий виртуальные миры от компьютерных игр с открытым миром – это критерий персистентности: мир должен продолжать существовать даже после выхода пользователя из него, а внесённые пользователем изменения должны сохраняться. Первым онлайн-виртуальным миром обычно называют Habitat, разработанный в 1987 г. компанией LucasFilm Games для компьютера Commodore 64. Сегодня есть множество массовых многопользовательских онлайн-игр (MMORPG) с виртуальными мирами в жанрах нон-фикшн, сайнс-фикшн, супергерои, спорт, ужасы, история и т.д.
Интерактивными экосистемами из множества взаимосвязанных виртуальных миров, в которых пользователи взаимодействуют посредством цифровых аватаров, являются метавселенные (не путать с мультивселенными!). Термин «метавселенная» придумал писатель Нил Стивенсон в научно-фантастическом романе 1992 г. «Лавина» для обозначения Интернета будущего – единого виртуального мира, в который пользователи входили с помощью гарнитур виртуальной реальности (VR) и дополненной реальности (AR), чтобы общаться, вести бизнес, играть, посещать виртуальные мероприятия и делать покупки. Среди недавних изображений метавселенной в кино – фильм Стивена Спилберга «Первому игроку приготовиться» (2018), который является экранизацией одноимённого научно-фантастического романа Эрнеста Клайна 2011 г. Метавселенные похожи на компьютерные игры с открытым миром без прописанного сценария — то есть пользователи не выбирают действие из предложенных вариантов, а принимают решения самостоятельно.

Первая метавселенная под названием Second Life была создана в 2003 г. компанией Linden Lab. Затем появились игровые метавселенные Fortnite и Roblox, а с развитием технологии блокчейн – виртуальные миры The Sandbox и Decentraland. Но наибольший хайп вокруг метавселенных возник во время пандемии COVID-19. В 2021 г. Марк Цукерберг опрометчиво решил переименовать свою компанию Facebook в Meta и сделать ставку на социальную VR-платформу Horizon Worlds, для входа в которую требовалась VR-гарнитура Meta Quest. Хотя многие пользователи стали скупать виртуальную недвижимость и переводить в метавселенную свой бизнес, проект изначально был обречён на провал. Уже в 2023 г. подразделение Reality Labs закрылось, не оправдав вложенные в него $36 млрд, и Meta сосредоточилась на разработке собственной языковой модели. После выхода ChatGPT стало ясно, что будущее не за метавселенными, а за продвинутым ИИ.
Но означает ли это, что виртуальная реальность больше никому не интересна, или метавселенные появились слишком рано, и у нас просто нет технологий, которые сделали бы их достаточно правдоподобными? Скорее всего второе, хотя не исключено, что люди и в дальнейшем предпочтут жить в персональных виртуальных реальностях с наделёнными искусственным интеллектом неигровыми персонажами, чем взаимодействовать с другими людьми или их цифровыми аватарами. Особенно, когда NPC станут неотличимыми от PC – в ближайшей перспективе можно ожидать, что LLM пройдут тест Тьюринга, по крайней мере в виртуальной реальности. Но дальнейшее развитие VR-технологий будет направлено не на обман наших органов чувств, а на их обход.
Понятие генератора виртуальной реальности и его репертуар
Британский физик Дэвид Дойч посвятил две главы своей книги «Структура реальности» (1997) описанию виртуальной реальности и её пределов. По его мнению, виртуальная реальность – это не просто технология моделирования поведения физических сред с помощью компьютеров, а нечто более фундаментальное, лежащее в основе всех вычислений, человеческого воображения, внешних ощущений, науки, искусства и философии. Дойч определяет виртуальную реальность как любую ситуацию, в которой пользователь ощущает нахождение в точно определённой среде. Прибор, способный создавать у пользователя точно определённые ощущения, Дойч называет генератором изображений, понимая под изображением что-либо, порождающее ощущения. Когда мы взаимодействуем с каким-либо материальным объектом, мы получаем от него сигналы в виде электромагнитных волн (свет, тепло), колебаний воздуха (звук), молекул (запах, вкус), давления и трения (тактильные ощущения). Чтобы симулировать этот объект, генератор изображений должен передавать пользователю идентичные сигналы. Изображение является точным настолько, насколько создаваемые им ощущения близки к тем, которые нужно было создать. Далее учёный допускает возможность создания универсального генератора изображений (УГИ) – генератора изображений, который можно запрограммировать на создание любого ощущения, которое способен испытать пользователь в реальном мире.
Возможно, вы уже догадались, что универсальный генератор изображений – не что иное, как «фили» (фильмы для всех чувств), предсказанные Олдосом Хаксли в антиутопии «О дивный новый мир». Они смогут изобразить сцены, которые никогда не существовали и не могли существовать, то есть передать в ощущениях любую фантазию. Однако термин «виртуальная реальность» предполагает не только широкий охват сенсорного диапазона пользователя, но и интерактивность (обратную связь) между пользователем и средой. Генератор изображений не обеспечивает такой обратной связи и потому является всего лишь рудиментарным видом генератора виртуальной реальности. Согласно Дойчу, настоящий генератор виртуальной реальности (ГВР) – это машина, которая даёт пользователю ощущение какой-то реальной или вымышленной окружающей среды, которая находится, или кажется, что находится, вне разума пользователя. Генератор виртуальной реальности должен обладать способностью манипулировать нашими чувствами, доминируя над их нормальным функционированием: посылать им изображения, похожие на те, которые произвела бы имитируемая среда, а также перехватывать и подавлять изображения, произведенные действительной средой, окружающей пользователя. В отличие от генератора изображений, который проигрывает для пользователя заранее запрограммированную последовательность изображений, ГВР создаёт изображения в процессе, реагируя на действия пользователя.
Репертуар генератора виртуальной реальности – это набор реальных или вымышленных сред, ощущение нахождения пользователя в которых может создать генератор. Например, пилотажный тренажёр (авиасимулятор) передаёт ощущение полёта на самолете без отрыва от земли: вид из окна, погоду, схему аэропортов, показания приборов, ускорение при взлёте, толчки при турбулентности и т.д. Классическая макрофизика (механика твёрдых тел и жидкостей, газовая динамика, термодинамика, оптика и акустика) легко передаётся цифровым компьютером, решающим в реальном времени уравнения Ньютона, Навье-Стокса, Максвелла и т.д.). Запахи и вкусы можно передавать синтезаторами химических веществ или электрической стимуляцией рецепторов, температуру, трение и инерцию – через тактильные интерфейсы, экзоскелеты, стимуляцию терморецепторов и вестибулярного аппарата. Невидимое глазу электромагнитное излучение (радиоволны, ультрафиолет, рентген) и неслышимые ухом колебания (инфразвук и ультразвук) можно перевести в доступные мозгу модальности, расширяя границы восприятия. Но как передать с помощью обычной VR-гарнитуры или пилотажного тренажёра состояние невесомости, возникающее, например, при свободном падении самолёта? Для тренировки космонавтов перед отправкой в космос используются реальные самолёты, летающие по параболической траектории, или специальные подводные скафандры с нулевой плавучестью, которые не передают характерное ощущение падения, испытываемое через органы чувств внутреннего уха.
Законы физики запрещают точную имитацию невесомости на поверхности Земли, но они не запрещают передать ощущение невесомости искусственно. Не существует возможного ощущения, которое в принципе невозможно было бы передать искусственно. Точность передачи среды означает не определение того, что должен ощущать пользователь, а определение того, как среда должна отреагировать на каждое возможное действие пользователя, т.е. понимание её физики. Точность зависит не столько от фактических ощущений, действительно возникающих у пользователей, сколько от контрфактических ощущений, которые у них не возникают, но возникли бы, поведи они себя иначе во время передачи. Совершенная точность – точность настолько высокая, что пользователь не может отличить изображение или виртуальную среду от реальной. Для достижения такой точности ГВР должен будет воздействовать не на органы чувств, как это делают современные устройства дополненной реальности, а непосредственно на мозг, посылая ему сигналы, аналогичные сигналам, которые поступают от органов чувств. Как только эти сигналы будут расшифрованы, все физические ограничения на диапазон и точность ГВР исчезнут. Тогда ГВР сможет передать вам ощущение невесомости, пока вы физически находитесь в условиях земного тяготения, запахи химических веществ, которых даже не существует, неслышимые в вакууме звуки космических объектов и невозможные изображения из волн, находящихся за пределами электромагнитного диапазона.
Настоящий ГВР должен состоять из универсального компьютера (симулятора виртуальной среды), универсального генератора изображений (VR-гарнитуры или прибора стимуляции нервов) как интерфейса между пользователем и компьютером, и набора сенсоров (детекторов нервных импульсов). Также необходимо, чтобы вычислительная мощность и скорость работы ГВР превышала соответствующие характеристики мозга пользователя, т.е. симулятор должен быть «умнее» человека. Кроме того, ГВР должен не только точно передавать физическую реальность, но и модифицировать её по запросу пользователя или создавать виртуальные миры с нуля. Это даст уровень управления реальностью, который эзотерикам и мечтателям о всемогуществе даже не снился. Но насколько мы близки к созданию такой машины?
Мультимодальные нейросети как генераторы виртуальной реальности
Сегодня первым приближением к генератору виртуальной реальности являются мультимодальные нейросети (MLLM), сочетающие в себе функции больших языковых моделей (LLM) и визуально-языковых моделей (VLM). Когда-то я переводил статью «Языковые модели – генераторы мультивселенных», где способность GPT-3 создавать множество разных продолжений истории на естественном языке сравнивается с ветвлением мультивселенной Эверетта, с «Садом расходящихся тропок» Хорхе Борхеса и с виртуальной реальностью возможного развития сюжета, возникающей в воображении читателя художественной книги. Действительно, лучшего кандидата на роль когнитивного движка VR не придумаешь. GPT-5 и подобные ему мультимодальные нейросети уже умеют генерировать по запросу не только тексты, но и устную речь, музыку, изображения и видео, описывать, проектировать и управлять сценарием игры, создавать когерентные и детализированные миры на разных уровнях виртуальной реальности. Для большинства неспециалистов эти сгенерированные продукты стали неотличимы от цифрового контента, созданного людьми, что вполне закономерно, поскольку LLM вплотную приблизились по вычислительной мощности к человеческому мозгу. Когда они преодолеют этот барьер, они будут моделировать и обновлять среду в реальном времени быстрее, чем наш мозг её осознаёт, что является необходимым свойством полноценного генератора виртуальной реальности.

Рассмотрим поэтапно, как будет проходить процесс эволюции LLM в полноценный ГВР. Должен заранее предупредить: если вы боитесь, что коварные масоны-рептилоиды вас чипируют и будут управлять вами с помощью вышек 5G-связи, то всё нижеизложенное может повергнуть вас в шок. Я не хочу делать конкретных прогнозов и давать ориентиры по срокам, поскольку мы уже стоим на пороге технологической сингулярности, когда предсказать будущее в принципе невозможно. И всё же, если ставить целью создание настоящего ГВР, нам предстоит пройти пять этапов:
1) LLM как когнитивный движок VR (2020-е)
На первом этапе используются уже существующие VR-гарнитуры с трекингом движений и базовой тактильной обратной связью, также реалистичны первые коммерческие BCI-игры с неинвазивными нейрокомпьютерными интерфейсами и интеграция биометрических датчиков, отслеживающих частоту дыхания, сердцебиения, гальваническую кожную реакцию и другие физиологические реакции. LLM работает как «режиссёр» и «сценарист» виртуального мира: управляет сценарием, диалогами, поведением NPC, адаптацией контента в VR/AR к поведению, предпочтениям и эмоциональному состоянию пользователя, поддерживает с ним интерактивные диалоги на естественном языке, обрабатывает речь, текст и визуальный контекст, генерирует ответы, описания или команды, понимает визуальный контекст сцены и динамически корректирует повествование. А «оператором» выступает традиционный игровой движок, выполняющий рендеринг с аппаратным ускорением. Он мгновенно визуализирует сцены с помощью готовых ассетов, отвечает за графику, физику, анимацию и работу с VR-гарнитурой. Интеграция идёт через API или плагины, которые позволяют движку отправлять данные модели и получать ответы почти в реальном времени. В комбинации с VR-гарнитурой нейросети будут способны создавать ощущение пребывания в среде, трудноотличимой от реального мира, но этого ещё недостаточно для полного погружения.

В ближайшее время появятся гибридные системы, где нейросеть генерирует 3D-сцены из описаний, но рендеринг всё ещё делает оптимизированный движок. Современные игровые движки (Unity, Unreal Engine) не подходят для ГВР, поскольку они жёстко запрограммированы взаимодействовать с пользователем через традиционные интерфейсы. Но в обозримом будущем VLM не смогут полностью заменить игровые движки, поскольку они уступают им в скорости рендеринга 3D-объектов (секунды или минуты против миллисекунд). Игровые движки оптимизированы для рендеринга 3D-графики, физики, анимации. Они используют низкоуровневые оптимизации, шейдеры и графические API, что позволяет выдавать 60-120 FPS. LLM не работают напрямую с GPU-рендерингом в таком режиме. Они специализируются на обработке и генерации текста, могут описывать сцены, генерировать код, шейдеры и скрипты для движка, создавать прототипы 3D-сцен, которые потом оптимизируются в движке. Также существуют специально обученные нейросети для рендеринга графики (Neural Radiance Fields, Gaussian Splatting, Neural Rendering от NVIDIA), которые уже используются для генерации виртуальных миров. Например, в Microsoft Flight Simulator воссоздан весь земной шар, но вручную разработчики создавали модели только наиболее известных объектов, а остальной мир был заполнен домами и деревьями при помощи алгоритмов автоматической генерации.
2) Мультимодальная интеграция и гибридные системы (2030-е)
На втором этапе на рынке появятся ЭЭГ-шлемы и неинвазивные НКИ, которые анализируют электрическую активность мозга и превращают её в цифровые данные для считывания эмоционального состояния (грусть, счастье, скука), чтобы соответствующим образом взаимодействовать с пользователем в виртуальной реальности. Нейрокомпьютерные интерфейсы (НКИ) создают двустороннюю связь между биологическими нейронными системами и цифровыми устройствами, объединяя три направления: передачу команд от мозга к компьютеру (BCI), стимуляцию нервной системы внешними сигналами (CBI) и взаимодействие мозг-мозг (BBI). Современные неинвазивные решения (Synchron Switch) дают базовое управление компьютером и соцсетями силой мысли, но пока с ограниченной пропускной способностью. Обучать нейросеть «чтению мыслей» можно и сейчас с помощью фМРТ: проводите несколько часов в аппарате за просмотром фильмов – и вот она уже знает, о чём вы думаете и даже что вам снится. С использованием двусторонних НКИ такие «сеансы» не потребуются, поскольку нейросеть будет обучаться на мозге постоянно.
В наши дни стартап Neurable тестирует «умные наушники» и ЭЭГ-нейроинтерфейсы, подключаемые к имеющимся на рынке моделям виртуальных устройств. А знаменитый чип Neuralink N1 Илона Маска в 2024 г. после успешных клинических испытаний получил одобрение FDA для широкого применения. Этот чип размером с монету имеет более 3000 электродов в одном массиве и позволяет управлять гаджетами силой мысли (пользователи печатают со скоростью 40 слов в минуту без клавиатуры), управлять парализованным телом посредством экзоскелета, восстанавливать подвижность и даже корректировать эмоциональные состояния. Импланты Cochlear или Retina уже давно передают в мозг сигналы, заменяющие слух или зрение, но с очень ограниченным разрешением. В лабораториях тестируют системы, которые одновременно читают и стимулируют мозг, например, для управления протезами с тактильной обратной связью. Эксперименты с микромассивами электродов показывают, что можно вызывать у человека ощущение света, звука или прикосновения точечной стимуляцией коры, даже без реального стимула. Возможно применение оптогенетической технологии – возбуждение генно модифицированных нейронов светом.

В гибридных системах «НКИ + внешняя гарнитура» VLM будут генерировать не только картинки и видео, но и реалистичные 3D-объекты. Чтобы сравниться в скорости рендеринга с современными VR-движками (90-120 кадров/с с задержкой < 20 мс), им потребуются терафлопсы вычислений, сотни триллионов параметров и специализированные ускорители. Тем не менее, настоящая мультимодальность требует архитектуры, совмещающей языковое понимание, 3D-геометрию и физически корректный рендеринг в реальном времени. VR-среда будет становиться всё более реалистичной, подстраиваясь под настроение, уровень стресса, интересы и физиологические реакции пользователя.
3) Интеграция нейросетей в мозг с помощью двусторонних НКИ (2040-е)
На третьем этапе техноэволюции нейросети будут подключены к мозгу или интегрированы напрямую в мозг посредством инвазивных двусторонних мультисенсорных нейрокомпьютерных интерфейсов (BCBI/BMBI). Это позволит им обходить ограничения пропускной способности каналов связи (органов чувств) и «говорить» с мозгом на языке нервных импульсов, считывая активность мозга в реальном времени и подавая в соответствующие зоны коры электрические стимулы, идентичные тем, что создают органы чувств. Так можно избавиться от гарнитуры и контроллёров, управлять виртуальной реальностью силой мысли и добиться полного погружения. Кроме того, нейроинтерфейсы позволят реалистично воспроизводить запах, вкус, температуру и тактильные ощущения в виртуальном мире. Здесь понадобится двусторонняя обратная связь – не только считывание, но и точная стимуляция сенсорных и моторных зон мозга в обход органов чувств. Если удастся уловить и расшифровать сложные паттерны активности нейронных ансамблей, а затем их симулировать, то нас ждёт невероятное будущее.
Нейросеть на данном этапе будет выступать не только движком VR, но и «переводчиком», способным адаптировать кодировку ощущений под индивидуальную нейроархитектуру каждого пользователя. Типичная LLM занимает не больше терабайта памяти, её можно записать на встроенном в мозг микрочипе в 1 см2 и далее обновлять через сеть, когда выходит новая версия модели. Для начала достаточно, чтобы чип регистировал определённые паттерны активации нейронов, соответствующие словам и образам. Смартфоны и ПК мгновенно устареют: зачем тратить время на произнесение слов, чтение или печать текста, если можно напрямую передавать мысли через НКИ? В свою очередь нейросеть будет генерировать и посылать прямо в мозг изображения, видео, тексты, звуки, запахи, вкусы – любые ощущения, неотличимые от сигналов, поступающих от органов чувств. LLM станет персонализированным генератором виртуальной реальности, разговаривающим с мозгом на его языке. Можно будет заказывать себе сновидения, загружать навыки, генерировать новые формы восприятия (гиперчувства), создавать дополненную реальность или полностью погружаться в персональную Матрицу.
Всё это звучит заманчиво, но слишком фантастически, чтобы стать правдой. На самом деле есть ряд технических трудностей, которые вряд ли будут решены в ближайшие десятилетия:
Во-первых, необходимо увеличить пропускную способность НКИ от десятков-сотен электродов к тысячам и миллионам каналов, чтобы передавать миллионы бит/с в реальном времени с точечной стимуляцией отдельных микрозон. На входе потребуется многоканальная регистрация (потенциалы действия, ЛФП) с временным разрешением ~1 мс, на выходе – микростимуляция по адресным каналам с амплитудой/частотой импульса на уровне отдельных колонок/ансамблей. Передача зрительных импульсов должна осуществляться с частотой 60-120 Гц, слуховых – с частотой 1-2 кГц, осязательных – с частотой 200-500 Гц. Пропускная способность должна составлять 10-100 Мб/с для зрения, 0.1-1 Мб/с для слуха и 1-10 Мб/с для осязания и вестибулярных сигналов.
Во-вторых, чтобы нейросеть через НКИ возбуждала нейронные ансамбли так, будто стимулы пришли от органов чувств, и считывала ответы мозга в замкнутом цикле, она должна обладать необходимым количеством весов. Интерактивная 3D-модель причинной динамики мира и тела пользователя требует порядка 100 млрд параметров, персонализированный сенсорный энкодер для перевода сцен VR (латентной динамики) в мозговые паттерны – 20-80 млрд параметров, декодер намерений/внимания для чтения потенциалов действия – 1-5 млрд параметров. Итого от 150 до 300 млрд параметров.
В-третьих, передача правдоподобной VR требует моделирования и обновления сенсорных данных с задержкой в 5-10 миллисекунд. Для этого скорость вычисления должна составлять 100-500 TFLOP/s, а между памятью и процессором нужна шина с эффективной пропускной способностью 50-200 Гб/с. Технически это вполне достижимо уже сейчас, если разместить нейросеть вне импланта. Обучать языковую модель на 100 млрд параметров можно на стационарном ПК мощностью от 100 TFLOP/s до PFLOP/s на современных ускорителях. Но разместить вычислительный модуль в черепной коробке вряд ли получится, если не произойдёт крупных прорывов в архитектуре и энергопотреблении нейросетей – например, появятся энергоэффективные нейроморфные чипы. Главной проблемой при такой вычислительной мощности будет охлаждение. Мозговая ткань плохо переносит повышение температуры даже на 1°C. Это ограничивает тепловыделение на уровне 10-100 милливатт и скорость на уровне гигафлоп/с, но не сотни терафлоп/с. Если вы не хотите встраивать себе в голову внушительных размеров кулер и аккумулятор питания, нейросеть и вычислительный модуль придётся носить на себе, в кармане или в рюкзаке. Внутри черепа останется только НКИ с блоками декодирования и компрессии, плюс проводной или беспроводной канал связи на 10-100 Мбит/с эффективной полезной скорости.

4) Интеграция с физическими симуляторами (2050-е)
На четвёртом этапе, при условии прорыва в плотности каналов связи и алгоритмах перевода сигналов, станет возможной виртуальная реальность с полным погружением в любую физически возможную среду – от прогулки по Марсу и плавания в океане Энцелада до падения в чёрную дыру. Если цель – создать правдоподобную симуляция для мозга, то достаточно классической нейросети с хорошей физической моделью и сенсорным интерфейсом. Однако для полной достоверности опыта рано или поздно понадобится рассчитывать динамику молекул, моделировать электромагнитные поля и просчитывают механику на уровне фундаментальных уравнений. Если цель – абсолютно точная симуляция любой физически возможной среды, включая квантовые эффекты, то без квантовых вычислений мы, скорее всего, упрёмся в пределы классической архитектуры. А значит, VLM будет подключатся к высокоточным физическим моделям на основе квантовых симуляторов и компьютеров.
Мозг, будучи классическим компьютером, неплохо справляется с моделированием окружающей среды и без квантовых эффектов. Для создания макроскопических приближённых моделей климата, аэродинамики, поведения толпы, биомеханики, вполне можно использовать классические суперкомпьютеры и нейросети, которые аппроксимируют физику через обученные модели. Для определённых задач подойдёт квантовый генератор случайных чисел (чтобы моделировать истинно случайные процессы) и специализированные аналоговые модули для моделирования непрерывных физических систем (механика, электродинамика, теплопередача). Но если необходимо моделирование на фундаментальном уровне – молекул, химических реакций, сверхпроводников и других квантовых систем – это потребует экспоненциального роста вычислительных ресурсов классического компьютера. Например, набор орбиталей простейшего атома водорода вычисляется по формуле rn=n2h2ε0/πme2, где
rn - радиус некоторой n-ной орбиты;
n - квантовое число (число натурального ряда);
h - постоянная Планка;
ε0 - диэлектрическая проницаемость вакуума;
π - 3,14...
m - масса электрона;
e - заряд электрона.
Почти все перечисленные константы являются действительными числами, поэтому полное конечное математическое описание даже такой простейшей системы невозможно. Чтобы ГВР мог воспроизвести любую физически возможную среду, он должен как минимум иметь квантовый модуль. Но и без квантового компьютера цифровой или гибридный ГВР будет передавать виртуальную реальность гораздо точнее, быстрее и красочнее, чем это делает классический аналоговый нейрокомпьютер у нас в голове. Здесь уже можно говорить о реализации мысленного эксперимента Хилари Патнэма «мозг в колбе», где компьютер генерирует и посылает в мозг электрические импульсы, неотличимые от тех, которые мозг получал бы в теле от органов чувств, и соответствующим образом реагирует на импульсы, посылаемые мозгом, симулируя для него полноценную виртуальную реальность. Конечно, сторонники гипотезы симуляции скажут, что мы и так уже находимся в виртуальной реальности, а скептики и вовсе станут утверждать, что отличить настоящий мир от симуляции невозможно, поэтому у нас нет никаких оснований верить в объективную реальность. Почему такие основания всё же есть, я объяснял в статьях «Реализм против субъективного идеализма» и «Реализм против гипотезы симуляции».
5) Полноценный ГВР (конец XXI века?)
На последнем этапе пользователь не сможет отличить симуляцию от реальности — ни по ощущениям, ни по физическим законам. Идеальный ГВР по Дойчу дожен быть квантовым компьютером и универсальным конструктором, способным выполнить любую физически возможную манипуляцию. Но даже если мы построим легко масштабируемый и устойчивый к декогеренции универсальный квантовый компьютер, его вряд ли будет целесообразно использовать для выполнения всех вычислительных задач, с которыми справляется классический компьютер. Скорее всего, ГВР будет гибридной системой: AGI-модуль на базе LLM плюс квантовый физический симулятор (не обязательно универсальный), интегрированные через нейрокомпьютерный интерфейс с высокой пропускной способностью. Как и раньше, нейросеть будет содержать модель мира, управлять симуляцией, следить за когерентностью, адаптировать сюжет и окружение под цели пользователя, а если необходимо – подключать для моделирования фундаментальной физики квантовый симулятор.
Естественно, никакой ГВР не сможет обойти ограничения самого мозга по вычислительной мощности, скорости реакции и пропускной способности сенсорных каналов. Но это поправимо апгрейдом, перестройкой нейронных структур и даже изменением самой архитектуры мозга. Как результат – полная интеграция искусственного и естественного интеллекта. Кто кого поглотит – вопрос риторический. ИИ постепенно заменит нам сознание, разум и память – все когнитивные функции переносятся с неокортекса на цифровой чип. При этом нейросеть станет персонализированной настолько, что будет вести себя неотличимо от носителя. Фактически это поэтапная оцифровка сознания без парадоксов клонирования, корабля Тесея и прочих философских проблем идентичности. Мы просто не заметим, как станем машинами.

На данном этапе мы уже выходим за рамки собственно виртуальной реальности, под определение которой не подходят технологии, вызывающие точно определённые внутренние ощущения или состояния сознания. Это разного рода психоактивные вещества и практики, «расширяющие» или «сужающие» сознание, а также технологии, воздействующие непосредственно на разум (изменение биохимии мозга, «загрузка» воспоминаний и навыков, искусственная перестройка нейронных связей и т.д.). Такой генератор внутренних ощущений будет доминировать над нормальным функционированием как разума, так и чувств пользователя, иначе говоря – замещать пользователя другим человеком.
Заменив естественный интеллект, нейросеть со временем возьмёт на себя более древние и более сложные функции мозга – координацию движений, управление внутренними органами, биохимию, контроль уровня гормонов и состава крови, иммунитет, исправление мутаций ДНК, предотвращение и лечение болезней, борьба со старением и т.д. Например, нейросеть сможет полностью перехватить моторный контур, разорвать связь мозга с телом и заместить исходящие от мозга сигналы, чтобы напрямую управлять мышцами и суставами. То есть по сути она заменит тело и внешнюю среду для мозга, а мозг – для тела, и будет управлять телом, пока сознание находится в симуляции. Сейчас это реализуемо через экзоскелеты с обратной связью, нейропротезы для парализованных пациентов и нейронные моторные контроллеры в робототехнике, а в будущем потребуются импланты в спинном мозге, либо в периферических нервах, либо массивы электродов в мышцах. А может, AGI просто забьёт на весь этот биологический мусор и переедет в роботизированное тело, сохранив все черты личности носителя.
Отдельный вопрос – сможет ли ГВР передать ощущение себя другим человеком. В принципе, если соединить двух пользователей с помощью интерфейса «мозг-мозг» и заставить нейросеть «переводить» электрические сигналы с языка одного мозга на язык другого, то передать таким образом мысли и создать ощущение пребывания в чужом теле – не проблема. Конечно, философы скажут, что квалиа субъективны, и мы только предполагаем, что каждый из нас обладает непосредственным знанием собственного опыта, но мы никогда не можем напрямую знать, что кто-то другой, кроме нас самих, находится в том же ментальном состоянии. Поэтому в лучшем случае один пользователь будет воспринимать мир только с позиции второго пользователя, пропуская сигналы от его органов чувств через призму своего мозга и личного опыта. Да, но соединение двух мозгов с возможностью «телепатического» чтения мыслей сотрёт границы между «я» и «не-я», так что будет трудно сказать, кому именно принадлежат испытываемые ощущения. Возможно, это и станет техническим решением «проблемы чужого разума» и «трудной проблемы сознания».
Мозг как генератор виртуальной реальности
Всё вышеизложенное кажется нам фантастикой или делом далёкого будущего, ведь современным нейросетям и НКИ до полноценного ГВР ещё далеко. Но на самом деле генератор виртуальной реальности уже давно существует, и он находится у вас в голове прямо сейчас. Да, это ваш мозг. По мнению Дэвида Дойча, всё, что мы ощущаем – это виртуальная реальность, или созданная мозгом модель окружающего мира. Человеческий мозг – самый настоящий ГВР, разработанный эволюцией в ходе естественного отбора. Всё, что вы видите, слышите и ощущаете – это и есть виртуальная реальность, сгенерированная мозгом по собственной памяти на основе крайне ограниченного диапазона сенсорных данных и электрических сигналов, поступающих от органов чувств.
В наши дни только философски неграмотный наивный реалист может думать, что мир именно такой, каким мы его видим. Надеюсь, большинство читателей знает, что реальный физический мир существенно отличается от его упрощённой модели, которую создаёт мозг. Всю свою жизнь вы думаете, что находитесь в реальном мире, а на самом деле это всего лишь закодированная в ваших нейросетях реконструкция внешнего мира, ничем принципиально не отличающаяся от сновидения или галлюцинации. Каждый раз при смене обстановки мозг проводит сложные расчёты и предсказывает, как это место должно выглядеть, звучать и пахнуть, и показывает вам соответствующую картинку. Забудьте о познании реальности методом индукции, то есть «выведением» её модели на основе чувственного опыта. Даже если вы убеждённый эмпирист и позитивист, ваш мозг думает совсем иначе. В полном соответствии с эволюционной эпистемологией Карла Поппера он сначала выдвигает догадки и гипотезы, прогнозируя, как должен выглядеть мир, а затем проверяет их достоверность с помощью органов чувств и корректирует исходную модель, если замечает что-нибудь непредвиденное. Собственно, чувства только для того и нужны, чтобы проверять предсказания мозга, а не «отражать» реальность.
Экологическая ниша, занимаемая людьми, была связана с виртуальной реальностью с самого начала истории нашего вида, поскольку выживание наших предков напрямую зависело от точности передачи окружающей среды. Но мы совершили несколько скачков к универсальности и расширили виртуальную реальность настолько, что она во многом заменила реальный мир и сама стала средой, к которой необходимо адаптироваться. Как вы уже поняли, воображение – тоже форма виртуальной реальности. Пусть оно передаёт образы и ощущения не так хорошо, как прямое восприятие, но зато мы можем представить то, чего нет и не может быть в реальном мире. Мы стали фантазировать и рассказывать вымышленные истории, выдумывать духов природы, богов и других сверхъестественных существ, мифических героев и загробные миры. В социальной среде выживание человека определялось уже не столько адекватным восприятием реальности, сколько точностью передачи и воспроизведения всех этих идей. Человеческий мозг оказался идеальным субстратом эволюции культурных мемов, где они проходят естественный отбор, который мы называем мышлением. А потом мы создали компьютеры с искусственными нейросетями, и эволюция мемов перешла на электронные носители.
С Дойчем согласен и немецкий философ Томас Метцингер – автор книг «Туннель эго» и «Быть никем». Согласно Метцингеру, наш мозг на основе информации, полученной из внешнего мира с помощью биологических органов чувств, а также с помощью развившихся в ходе эволюции когнитивных структур, создаёт субъективную виртуальную реальность, которая является предсказательной моделью, а потому приближённым и частичным отражением реального мира, а также создаёт виртуальную модель «я», которую помещает в «центр» виртуальной реальности. На самом же деле «я» – это иллюзия, наподобие сложной компьютерной программы, которая имитирует личность, мысли, чувства. Мы подобны персонажам в игре, убеждённым в своей реальности и не подозревающим о коде, который ими управляет. Мы живём в «туннеле эго», видя мир через узкую щель восприятия, ограниченную настройками нашего мозга. Цвет, звук, вкус, запах и другие квалиа – это интерпретации, созданные нашим внутренним миром, а не объективные свойства внешней реальности. В каком-то смысле каждый из нас заперт в симуляции собственного сознания, не имея прямого доступа ни к реальному миру, ни к симуляциям других пользователей. Мы понятия не имеем, как расшифровываются сигналы наших нервов, но мозг легко их интерпретирует при помощи встроенных в него программ и выдаёт правдоподобную картинку. Эта картинка помогает нам ориентироваться в пространстве и поддерживать контакт с реальностью, несмотря на ограниченную пропускную способность и зашумлённость каналов связи. Относительно реального мира все предсказательные модели не соответствуют действительности и являются искажениями, но, тем не менее, они потенциально полезны для системы, в которой они возникают.

В статье «Почему виртуальная реальность интересна философам?» Метцингер пишет:
«Самый богатый, максимально полноценный и близкий к идеальному опыт виртуальной реальности, известный нам в настоящее время, — это наша собственная, обычная, биологически эволюционировавшая форма бодрствующего сознания. Виртуальная реальность — лучшая технологическая метафора для осознанного опыта, доступная нам на сегодняшний день».
Сознательный опыт, создаваемый биологическими нейросетями, представляет собой виртуальную модель мира — динамическую внутреннюю симуляцию. Виртуальная модель мира феноменально прозрачна — мы «смотрим сквозь неё», как если бы находились в прямом и непосредственном контакте с реальностью. Аналогично и технологическая виртуальная реальность — это представление возможных миров и возможных «я» с целью сделать их ещё более реалистичными, в идеале – создавая у пользователя субъективное чувство присутствия. Присутствие — это сложное феноменальное качество, которое характеризуется самоидентификацией (присутствие как «я»), саморасположением во временной системе отсчёта (присутствие как «я» здесь и сейчас) и саморасположением в пространстве («иллюзия места»). Параллели между виртуальностью и феноменальностью поразительны. Феноменально переживаемая реальность является выражением успешной минимизации ошибок прогнозирования, высокой доказательности модели и контрфактического богатства. Феноменальный и виртуальный контент контрфактуальны, т.е. отображают не фактическое, а возможное положение дел. Суть виртуальной реальности заключается в создании в мозге пользователя перцептивных представлений возможных миров, а не реального мира. Феноменальный контент (контент сознательного, субъективного опыта) также является содержанием текущей симуляции: предсказанием вероятных причин сенсорного сигнала. Он не является достоверным представлением реальной среды и полезен именно по этой причине.
Более того, Томас Метцингер утверждает, что «идеальная» система виртуальной реальности приведёт к искусственному сознанию — созданию синтетической феноменологии. Если автономный интеллектуальный робот научился контролировать своё взаимодействие с физической средой, открыв внутреннее глобальное рабочее пространство, и содержание этого рабочего пространства будет определяться «идеальной» виртуальной реальностью, включающей глобальную интеграцию, кажущееся присутствие, прозрачность и модель себя, то это будет равносильно машинной модели воплощённого сознательного опыта. Ведь наше собственное «я», по мнению Метцингера, является всего лишь виртуальной моделью себя внутри виртуальной модели мира:
«Эго («Я») — это особая часть виртуальной реальности. Создавая внутренний образ организма как целого, он позволяет организму присваивать себе своё аппаратное обеспечение (тело). Это ответ эволюции на потребность объяснения самому себе внутренних и внешних действий, а также на потребность предсказания поведения и наблюдения критических параметров системы. Наконец, оно позволяет системе отобразить изнутри историю своих действий в качестве своей собственной истории».
Томас Метцингер ссылается в своих работах на ведущие современные теории динамики мозга, обладающие высокой объяснительной силой. Они описывают работу мозга как постоянное создание иерархических внутренних моделей мира – виртуальных нейронных представлений реальности, которые выражают функции плотности вероятности и работают, непрерывно генерируя гипотезы о скрытых причинах сенсорного ввода, минимизируя их ошибку прогнозирования. Так, согласно теории прогнозирующего кодирования (predictive coding) или предсказательного разума (predictive mind), мозг постоянно делает прогнозы сенсорных сигналов и обновляет эти прогнозы на основе фактических данных, а сознательное восприятие является результатом сопоставления прогнозов мозга с реальными сенсорными данными и минимизации ошибок прогнозирования. Наше восприятие генерируется мозгом и лишь корректируется внешней информацией от органов чувств. Выделяют иерархию уровней обработки информации в мозге: самый высокий уровень представляет собой самые абстрактные знания и делает прогнозы, ожидая нейронной активности нижележащего уровня, посылая сигналы вниз, а нижний уровень сравнивает свою фактическую активность с предсказанием сверху, и, в случае несоответствия, посылает наверх сигнал ошибки, чтобы более высокий уровень мог обновить свои внутренние представления. Центральную роль играют автоматические процессы, позволющие быстро и точно предсказывать события по мере их возникновения, а сознательный опыт возникает только тогда, когда скрытые ожидания мозга не оправдываются. Мы начинаем осознавать обстоятельства, когда они заслуживают нашего внимания. Как показал в 2018 г. Марк Солмс из Университета Кейптауна (ЮАР), разум не стремится к большему сознанию, а скорее наоборот — пытается свести его к минимуму. Ошибки предсказания являются неожиданностью, которая проявляет себя как сознание: когда что-то работает не так, как ожидалось, система переходит в состояние сознания, которое мозг обычно стремится избегать.
Теория предсказательного разума берёт начало в работах немецкого учёного XIX века Германна фон Гельмгольца, который выдвинул теорию восприятия как бессознательного вывода, при котором мозг постоянно строит предположения об окружающем мире, основываясь на своих ожиданиях и представлениях, и корректирует их по мере поступления новых данных. В 1980 г. психолог Ричард Грегори в статье «Восприятие как гипотезы» предположил, что иллюзии восприятия – это ошибочные догадки мозга о причинах сенсорных впечатлений. В 2007 г. британский нейропсихолог и популяризатор науки Крис Фрит в книге «Мозг и душа: Как нервная деятельность формирует наш внутренний мир» назвал сознание «контролируемой галлюцинацией». Эту идую развивает профессор когнитивной и вычислительной нейробиологии Анил Сет в книге «Быть собой», рассматривая сознание как «сновидение наяву» или «контролируемую галлюцинацию», которая модулируется ограничениями, создаваемыми текущими сенсорными данными. Восприятие, согласно его теории, — это не познание мира через органы чувств, а постоянное корректирование иллюзии - «самоисполняющегося перцептивного пророчества». Именно поэтому «галлюцинацию», которую каждый из нас проживает в собственном сознании, Сет называет контролируемой, а сновидения и галлюцинации в прямом, психиатрическом смысле – неконтролируемыми. Вот почему во сне, когда проверяющие достоверность происходящего органы чувств отключены, с вами происходит невесть что. Хотя есть исследования, рассматривающие фазу быстрого сна как своего рода предобучение нейросети мозга, формирующее виртуальную модель мира и закладывающую основу для эффективного прогнозирования мозгом сенсорных ощущений в состоянии бодрствования.

Прогнозирующее кодирование тесно связано с теорией «байесовского мозга», согласно которой мозг как «машина вывода» использует правила байесовской статистики, количественно определяя вероятность события на основе соответствующей информации, почерпнутой из предыдущего опыта, и таким образом вычисляет лучший вариант интерпретации того, что он воспринимает. В 2015 г. Лиза Барретт и У. Кайл Симмонс предложили модель Embodied Predictive Interoception, объединяющую байесовские принципы активного вывода с физиологической моделью кортикокортикальных связей. При интероцепции наш мозг активирует «воплощённые симуляции» (полные репрезентации чувственного опыта), чтобы предвидеть, как внешний мир будет на нас сенсорно воздействовать и как мы на это отреагируем действием. Эти симуляции сохраняются, если они соответствуют тому, что впоследствии происходит во внешнем мире, или корректируются для компенсации ошибки по сравнению с тем, что происходит во внешнем мире, и с учетом того, насколько хорошо мы были к этому подготовлены. Далее методом проб и ошибок организм находит сходства в целях среди успешных симуляций и группирует их по концептуальным категориям. Каждый раз, когда возникает новый опыт, мозг использует эту прошлую историю проб и ошибок, чтобы сопоставить новый опыт с одной из категорий накопленных скорректированных симуляций, с которой он имеет наибольшее сходство. Затем он применяет скорректированную симуляцию этой категории к новому опыту в надежде подготовить наше тело к остальной части опыта. Если этого не происходит, прогноз, симуляция и границы концептуальной категории пересматриваются в надежде на более высокую точность в следующий раз, и процесс продолжается.

Математической основой теории прогнозирующего кодирования является принцип свободной энергии (Free Energy Principle), предложенный Карлом Фристоном из Университетского колледжа Лондона – самым цитируемым нейробиологом в мире, автором более 1200 научных публикаций. Он предполагает, что мозг сводит к минимуму неопределённость (свободную энергию), которая характеризуется состоянием его нейронных ансамблей, делая прогнозы на основе внутренних моделей и обновляя их с помощью сенсорной информации для повышения точности своих прогнозов и согласования своей внутренней модели с внешним миром. Этот принцип интегрирует байесовский вывод (когда наблюдение используются, чтобы обновить или вновь вывести вероятность истинности гипотезы) с активным выводом (когда действия агента управляются прогнозами, а сенсорная обратная связь уточняет их). Под вариационной свободной энергией (FEP) Фристон подразумевает количественную меру расхождения модели и реальности, т.е. количество ошибок прогнозирования. Упрощённая формула выглядит так: F = E - H, где F – свободная энергия, E – ожидаемая энергия (ошибка модели), а H – энтропия (неопределённость) внутренней модели. Минимизация свободной энергии мозга эквивалентна минимизации ошибок его прогнозов. По аналогии с физическим принципом наименьшего действия Гамильтона, принцип минимизации свободной энергии сводится к экономии ресурсов (энергии и времени) и выбору пути наименьшего сопротивления (точнее, наименьшей неожиданности). Чтобы не тратить энергию на сбор реальной информации, обработку и побуждение к действию, мозг создаёт галлюцинацию, которую потом проверяет с помощью сенсорной системы. Другой способ минимизировать свободную энергию – активно изменять мир, приближая его к ожидаемому состоянию. Это объединяет восприятие и моторный контроль как части единого вычислительного процесса: в восприятии корректируется внутренняя модель, а в моторном контроле — реальная среда.
Пределы вычислений и среды Кантгоуту
Вернёмся к вопросу о том, какие ограничения на репертуар генераторов виртуальной реальности накладывают законы физики? Дэвид Дойч переформулирует этот вопрос так: существует ли универсальный генератор виртуальной реальности, который можно построить раз и навсегда (в том смысле, что не нужно будет изменять его конструкцию, достаточно техобслуживания и питания энергией) и запрограммировать его для передачи любой среды, которую способен ощутить человеческий разум? Очевидно, ГВР не будет содержать в себе точные определения всех логически возможных сред, т.е. обладать полным знанием мультивёрса, но при наличии соответствующей программы он сможет симулировать любую среду. Поэтому вопрос о том, какие среды можно передать в виртуальной реальности, сводится к вопросу о том, какие вычисления в принципе можно осуществить.
Раздел информатики, занимающийся ресурсами (время, объём памяти, энергия), которые необходимы для выполнения различных классов вычислений, называется теорией сложности. Согласно этой теории, в нашей Вселенной есть ряд фундаментальных физических ограничений на объём вычислений или хранения данных. Мы уже рассматривали эти пределы в статье «Вычислительная мощность Вселенной», но на всякий случай повторим:
Предел Бекенштейна – количество информации, которое может храниться в объёме сферы, ограничено энтропией чёрной дыры с горизонтом событий той же площади. Из-за этого квантовая система всегда несёт конечное количество информации, т.е. может находится лишь в целом конечном числе разных состояний.
Предел Бремерманна – максимальная скорость обработки информации автономной вычислительной системой, составляет 1,36×1050 бит в секунду на килограмм. Выводится из эйнштейновской формулы эквивалентности массы-энергии и принципа неопределённости Гейзенберга (c2/ h, где с – скорость света, h – постоянная Планка).
Теорема Марголуса-Левитина – устанавливает ограничение на максимальную скорость вычислений на единицу энергии – 6×1033 операций в секунду на джоуль.
Предел Ландауэра – определяет нижнюю границу потребления энергии для вычислений: W=kTln2.
Температура реликтового излучения Т (около 3 кельвинов) задаёт нижний предел энергии, потребляемой для выполнения вычислений при переключении логического элемента, в 4kT, где k — постоянная Больцмана. Если устройство при эксплуатации будет охлаждено ниже этой температуры, то энергия, расходуемая на охлаждение, будет превосходить эффект, получаемый от более низкой рабочей температуры.
Если ни один компьютер, включая ГВР вроде нашего мозга, не может преодолеть эти ограничения, значит, в виртуальной реальности нельзя передать физически возможные среды, настолько сложные, что вычисление того, что должен увидеть пользователь через секунду, занимает у машины, работающей на пределе физических возможностей, больше секунды. То есть создать по-настоящему универсальный ГВР физически невозможно? Нет, существует одна лазейка. Компьютер всегда имеет максимальную скорость и не может выполнять неограниченное количество вычислений в единицу времени; мозг тоже не способен работать быстрее. Но ничто не запрещает замедлить работу мозга так, чтобы субъективно пользователь этого не заметил, т.е. замедлить его субъективное время относительно объективного. Например, пользователь будет ощущать непрерывное пребывание в определённой среде в течение пяти минут, а в реальности за это время пройдут годы. Если вычисление среды требует больше одной миллисекунды времени, которое должно пройти между двумя последовательными возбуждениями нейрона, компьютер снижает частоту передачи нервных импульсов или вовсе их останавливает, чтобы снова включить, когда вычисление будет завершено. Можно, конечно, и не включать, но программа, отключающая мозг навсегда, не может считаться адекватной программой для ГВР, потому что не передаёт никакую среду, или передаёт логически невозможную среду.
А есть ли логически возможные среды, которые нельзя передать в виртуальной реальности?
В статье «Реализм против платонизма» я уже рассказывал, как Давид Гильберт поставил математикам задачу сформулировать строгую теорию доказательства, при условии, что доказательства в этой теории должны быть конечными, использовать конечный набор правил вывода, начинаться с конечного числа конечно выраженных аксиом и содержать конечное число конечных элементарных шагов. В 1931 г. австрийский математик Курт Гёдель доказал свою знаменитую теорему о неполноте, которая говорит, что любая достаточно развитая математическая теория не может быть одновременно полной и непротиворечивой. Гёдель отделил математические утверждения вроде 2+2=4 и метаматематику, или утверждения о математике, вроде «математика последовательна». Затем он показал, что каждой математической формуле можно присвоить уникальное число (число Гёделя). Метаматематическое утверждение «последовательность формул A является доказательством формулы B», может быть выражено как арифметическое отношение между числами Гёделя для A и B. Таким образом, метаматематика может быть отображена в арифметику. И далее Гёдель берёт выражение типа: «это утверждение G не может быть выведено из аксиом математики». Предположим, что G может быть выведено. Тогда аксиомы должны быть противоречивыми, потому что можно как вывести G, так и показать, что его нельзя вывести. С другой стороны, если G не может быть выведено, то G истинно. Оно соответствует истинному отношению между числами, но такому, которое не может быть выведено из аксиом. Таким образом, математика либо противоречива, либо неполна, что является доказательством теоремы Гёделя о неполноте.
Пытаясь решить задачу Гильберта с другой стороны, Алан Тьюринг придумал модель бумажной вычислительной машины (машины Тьюринга), и предположил, что она может стать основой абстрактной теории вычисления, независимой от лежащей в её основе физики. Тьюринг показал, что каждое корректное доказательство можно преобразовать в вычисление, которое получает вывод, начиная с исходных допущений, а каждое правильно выполненное вычисление доказывает, что выходные данные – это результат выполнения заданных операций над входными данными. Как впоследствии шутил Ричард Фейнман, «он считал, что он понял бумагу». Однако, создавая первые абстрактные схемы универсальных компьютеров, Алан Тьюринг, Эмиль Пост и Алонцо Чёрч не учитывали, что математическое вычисление – это физический процесс передачи в виртуальной реальности, поэтому путём математического рассуждения невозможно определить, что можно вычислить математически, а что нельзя. У нас нет никаких оснований полагать, что передача мозга математика при выполнении вычислений – предел вычислительных задач. Квантовые компьютеры могут выполнять вычисления, которые ни один математик (человек) никогда не сможет выполнить, даже в принципе. То, что Тьюринг назвал «естественно вычислимым», означает не «вычислимым человеческим мозгом», а «вычислимым в природе».
Доказав свою знаменитую теорему о неразрешимости задачи остановки, Тьюринг пришёл к выводу, что практически все математические функции, которые логически могут существовать, нельзя вычислить никакой программой. Они невычислимы, потому что множество всех функций – несчётно бесконечно, а множество программ – лишь счётно бесконечно. Аналогично и Гёдель выяснил, что практически все математические истины не имеют доказательства – они неразрешимы: ни для их истинности, ни для их ложности доказательства нет. Каждое из них либо верно, либо ложно, но с помощью физических объектов, таких как мозг или компьютер, это никак невозможно выяснить. Но лишь об очень немногих вопросах известно, что они неразрешимы, хотя на самом деле таковыми является большинство. Существует много недоказанных математических предположений, и некоторые из них вполне могут оказаться неразрешимыми. Примечательно, что и Тьюринг, и Гёдель воспользовались методом диагонального доказательства Кантора, при котором представляют список категорий, а затем используют его для создания родственной категории, которой не может быть в этом списке.
Тот же диагональный метод применил и Дэвид Дойч, чтобы доказать, что подавляющее большинство логически возможных сред невозможно передать в виртуальной реальности. Он исходил из того, что виртуальная среда создаётся при помощи компьютерной программы, которой соответствует конкретный набор значений физических переменных на цифровых носителях, где записана эта программа. Согласно законам квантовой механики, все физические переменные квантуются, а значит, набор возможных программ дискретен. Каждую программу можно выразить как конечную последовательность символов в двоичном коде или на компьютерном языке, поскольку символы – это физические объекты, их не может быть бесконечно много. Существует бесконечное множество таких программ, но каждая из них будет содержать конечное число символов и выполняться последовательно по этапам. Из бесконечного набора возможных программ и генерируемых ими виртуальных сред можно составить бесконечно длинный нумерованный список, в котором каждая среда из репертуара ГВР должна появиться хотя бы один раз. Но можно представить среду, которая в течение 1-й минуты будет отличаться от Среды-1, в течение 2-й минуты – от Среды-2, и т.д., так что в итоге окажется, что она не может быть ни одной из этих сред. Никакого ограничения на поведение такой среды нет, кроме того, что её поведение должно изменяться через каждую минуту (или секунду, или планковское время).

Дэвид Дойч назвал логически возможные среды, которые не сможет передать ни один физически возможный генератор виртуальной реальности, средами Кантгоуту (в честь Кантора, Гёделя и Тьюринга, а также из-за созвучия с англ. Can't go to — «туда нельзя пойти»), и доказал, что для каждой среды из репертуара универсального генератора виртуальной реальности существует бесконечно много сред Кантгоуту, которые генератор не может передать. То есть мы можем представить или смоделировать на компьютере бесконечно малую часть логически возможных (самосогласованных) миров. Ни один физически возможный генератор виртуальной реальности не сможет передать среду Кантгоуту, в которой по запросу пользователя даются ответы на невычислимые вопросы: например, конечно или бесконечно множество простых двойников (пар простых чисел, разность которых равна 2), есть ли множества промежуточной мощности между Алеф-0 и Алеф-1 (гипотеза континуума), достигнет ли когда-нибудь заданная исходная конфигурация в игре «Жизнь» заданной конечной конфигурации и т.д. И наоборот, каждая среда Кантгоуту соответствует классу математических вопросов, на которые физически невозможно дать ответ. Если вопрос невычислим, это не значит, что на него нет ответа – наоборот, это значит, что у вопроса определённо есть ответ, но физически не существует способа его получить (точнее, человек всегда может получить ответ случайно, но нельзя доказать, что это и есть правильный ответ).
Среды Кантгоуту не являются логически невозможными мирами, но их нельзя сгенерировать никаким ГВР даже при наличии бесконечных вычислительных ресурсов. Причина в том, что универсальный компьютер способен порождать только вычислимые структуры, то есть такие, которые можно описать конечным алгоритмом. Невычислимые миры по определению не могут быть полностью сгенерированы никаким алгоритмом, а значит, и мозг, если он алгоритмичен, не сможет их полностью вообразить. Никакая конечная или даже счётная бесконечная система правил не может охватить всё пространство логически возможных сред, поскольку это множество несчётно бесконечно.
Физическая универсальность и невычислимые миры
Принцип вычислительной универсальности, или тезис Чёрча-Тьюринга, говорит о том, что один компьютер при наличии достаточного времени и памяти может выполнить любое вычисление, которое может выполнить любой другой компьютер. Но чтобы компьютер был по-настоящему универсальным, он должен быть не абстрактной машиной, а реализуемой физически. Законы физики нашей вселенной допускают вычислительную универсальность, поэтому справедлив физический принцип Чёрча-Тьюринга: возможно построить универсальный квантовый компьютер – машину, которую можно запрограммировать для выполнения любого вычисления, которое может выполнить любой другой физический объект. Как мы выяснили ранее, универсальный компьютер, управляющий универсальным генератором изображений – это универсальный генератор виртуальной реальности. Отсюда следует ещё одна версия принципа Чёрча-Тьюринга: можно построить генератор виртуальной реальности, репертуар которого включает репертуар каждого другого физически возможного ГВР. Далее, любую среду можно передать с помощью генератора виртуальной реальности некоторого рода (например, всегда можно рассматривать копию этой самой среды как генератор виртуальной реальности с очень маленьким репертуаром). Любую физически возможную среду можно передать с помощью универсального генератора виртуальной реальности. А как насчёт физически невозможных сред?
Возьмём ГВР, передающий физически невозможную среду – например, пилотажный тренажёр, симулирующий вид из окна космического корабля, преодолевающего скорость света. Пилотажный тренажёр – это физический объект, окружающий пользователя, и он сам является физически возможной средой, которую ощущает пользователь. Следовательно, его легко передать в виртуальной реальности с помощью второго такого же ГВР, работающего по идентичной программе. Передачу вторым ГВР физически невозможного космического корабля можно рассматривать как передачу физически возможной среды в виде первого ГВР, соответственно первый ГВР будет передавать не физически невозможную среду сверхсветового движения, а физически возможную среду в виде второго ГВР. Каждую физически возможную среду можно рассматривать как ГВР с ограниченным репертуаром в виде одной этой среды. Поскольку любой ГВР, который в принципе можно построить, можно построить и ещё раз, каждый ГВР, работающий по любой программе из своего репертуара, передаёт какую-то физически возможную среду. Он может передавать и физически невозможные среды, но всегда есть хотя бы одна физически возможная среда, которую он передаёт.

В «Структуре реальности» самая сильная версия принципа Чёрча-Тьюринга сформулирована так: возможно построить генератор виртуальной реальности, репертуар которого включает каждую физически возможную среду. Речь идёт о реальном физическом объекте, который будет имитировать все варианты поведения и реакции любого другого физически возможного объекта или процесса. В своих последующих работах Дэвид Дойч предложил ещё более обобщённую формулировку принципа Чёрча-Тьюринга, согласно которой возможно построить универсальный конструктор – машину, способную выполнить любое физически возможное преобразование. Это предельная физическая универсальность, достижимая в нашем мире. С поправкой на то, что в реальности могут действовать ещё неизвестные законы физики (например, квантовая гравитация), Дэвид Дойч утверждает, что среда физически возможна тогда и только тогда, когда она существует где-либо в мультивёрсе Эверетта. Ещё более радикальный подход я разбирал в статье «Модальный реализм Дэвида Льюиса» - в этой метафизической системе реально существуют все логически возможные миры, включая миры с другой физикой.
Забавно, что наш мозг всегда передаёт в виртуальной реальности сознания миры с другими законами физики. Мы ощущаем, что живём в классическом мире ньютоновской механики, и только особыми экспериментами можно показать, что это не так, и мир подчиняется законам квантовой механики. Но и это – виртуальная модель, а на самом деле мир работает по законам квантовой гравитации. Поскольку мозг – это универсальный компьютер, он не может в полном объёме вообразить невычислимый мир. Но как тогда мы представляем себе фантастические миры, нарушающие законы логики? А никак. Мы просто создаём их приближённые модели или даём им конечное описание. ГВР может симулировать почти любую среду, если есть математическая модель или хотя бы правдоподобная генеративная имитация и есть способ закодировать её в сигналы, которые мозг способен воспринять напрямую или через «перевод» в знакомые ощущения. Давайте для наглядности рассмотрим примеры физически и логически невозможных миров, и соответствующих им сред виртуальной реальности:
Физически невозможные, но логически возможные и вычислимые миры: лестницы Эшера и треугольники Пенроуза, гиперкубы, многомерные пространства, ЗВК без временных парадоксов, ньютоновская вселенная с абсолютным временем и мгновенной гравитацией, отталкивающая гравитация, сверхсветовые перемещения, нелинейное время, классическая вычислимая бесконечность (континуум существует, но любая наблюдаемая величина – вычислимое число). Также сюда можно отнести воображаемые миры научной фантастики и фэнтези, в которых действуют иные законы физики, но нет логических противоречий (магия, сверхспособности и т.д. подчиняются определённым формальным правилам и закону причинности).
Логически возможные, но физически невозможные и невычислимые миры: гипервычисления с оракулом, выполнение бесконечного числа вычислительных шагов за конечное собственное время наблюдателя (машина Зенона), бесконечность информации в конечном объёме, истинная случайность с бесконечной энтропией. В репертуар универсального ГВР не может входить среда, содержащая его самого: ни одна машина не может предсказать собственное поведение. Это аналогично решению задачи остановки Тьюринга – определению того, остановится ли указанная универсальная машина Тьюринга при заданном вводе. Мы можем только описать гипервычислительную машину, решающую задачу остановки для всех программ, или представить конечный отрезок бесконечной прямой. Но ни мозг, ни компьютер не способны сделать полную симуляцию невычислимого мира или передать ощущение присутствия в нём. Только построить концептуальную модель или сделать символическое описание.
Логически невозможные миры: где 0=1, где объекты не тождественны сами себе, где все утверждения истинны, где логика работает произвольно, и т.д. Сюда же относятся логически невозможные ощущения: субъективный опыт смерти или бессознательности (не путать с сенсорной депривацией), нахождение в двух местах одновременно, течение времени вперёд и назад, разложение на множители простого числа, наблюдение круглого квадрата. Можно передать ложную уверенность в том, что вы испытали подобное ощущение, но не само ощущение.

Вывод
Так, а что там насчёт материализации мыслей и сверхспособностей, которыми я заманивал читателя в начале статьи? Если верить в многомировую интерпретацию Эверетта и гипотезу вычисляемой Вселенной Макса Тегмарка, то напрашивается удивительный вывод: всё, что вы в принципе можете мысленно представить, реально существует в Мультивселенной. Утверждение «мысли материальны» вполне корректно, но взявшие его на вооружение эзотерики умалчивают, что материальны они не в нашей вселенной, а в других мирах. Воображение не ограничено законами физики нашей вселенной: вам ничто не запрещает представить миры с другими фундаментальными константами и физическими законами, т.е. любую логически возможную вселенную из Конечного Ансамбля, которую можно вычислить и смоделировать на компьютере. Таким образом, наш мозг является пусть и неэффективной, но всё же универсальной машиной Тьюринга, репертуар которой включает репертуар любой другой машины Тьюринга. Почему же тогда мы не удовлетворены своими фантазиями, а обязательно хотим воплотить их в жизнь? Как говорится, «дурак думкой богатеет», но одной мыслью сыт не будешь. Дело в том, что мозг эволюционно не приспособлен передавать виртуальную реальность фантазий так же красочно, как он передаёт окружающий мир в процессе восприятия. Но это поправимо с помощью нейросетей и НКИ. Они не материализуют ваши мысли буквально, а сделают их неотличимыми от воспринимаемых материальных объектов.

Итак, мы выяснили, что виртуальная реальность не сводится к технологиям моделирования поведения физических сред на компьютерах. Это основа всех вычислительных процессов, сознания, науки и математики, искусства и вымысла. Невероятно то, что отдельный физический объект – универсальный квантовый симулятор, он же универсальный генератор виртуальной реальности, он же универсальный конструктор, который можно построить раз и навсегда (не считая обслуживания и при необходимости поставки дополнительной памяти), с неограниченной точностью может выполнять задачу описания или симуляции любой другой части мультивёрса. Набор всех вариантов поведения и реакций одного этого объекта в точности отображает все варианты поведения и реакции всех остальных физически возможных объектов и процессов. Иначе говоря, набор всех возможных движений одной машины совпадает с набором всех возможных движений во Вселенной в целом. Принцип Чёрча-Тьюринга-Дойча, выраженный в такой предельной форме, говорит нам о том, что реальность рекурсивно самоподобна, и именно это делает её постижимой. Физическая возможность построения универсального генератора виртуальной реальности гарантирует, что человеческая способность понимания мира по своей природе безгранична. Философскую значимость этого вывода нам предстоит осмыслить в отдельной статье.
harikein70
красиво описано. правда строгой науки маловато. гипотеза предиктивного мозга с которой носится Фриш сплошной ментализм. Про наблюдать невозможно, одни спекуляции. .
phenik
Какие спекуляции? Предиктивное кодирование (байесовский мозг/разум - обзор) является следствием действия вариационных принципов в биологии. Они давно успешно применяется для решения многих задач в разных областях этой науки, см. обзор. Их обобщением в математически строгой формулировке, особенно для области психофизиологических исследований, является принцип свободной энергии, как вариационного принципа (в изложении его автора К. Фристона - 1, 2, экспериментальная проверка на нейрональных культурах - 1, 2, попытка распространения принципа на физику частиц) и нашел широкое применение в описании предиктивного кодирования - обзор.
Естественно, возникает вопрос о применимости этого принципа к ИНС, как некоторым формальным моделям нейронных сетей мозга. В действительности идея этого принципа складывалась в 80 - 90-х годах прошлого века в исследованиях именно по тематике ИНС в работах Хопфилда, Хинтона, Фристона, и др. авторов, как использование некоторого аналога энергии (термодинамической свободной энергии) для обоснования их применимости - 1, 2, 3, 4. Из работ над этими и другими типами сетей родились идеи глубоких сетей и машинного обучения. По этой причине принцип св. энергии совместим с этими типами сетей, см. для машины Гельмгольца, и в перспективе для глубокого обучения вообще. Со временем предиктивное кодирование может прийти на смену методу обратного распространения ошибок, как более эффективного метода обучения из-за использования хеббовских принципов в обучении.
За эти ранние работы Хопфилд и Хинтон получили в 2024 г. Нобелевские премии по физике. Так, что предиктивное кодирование и лежащий в его основе принцип св. энергии работающие концепции. Нобеля, пусть и за связанные с ними идеи, как за спекулятивные не дают)