Информация, чтобы быть использованной, должна получить интерпретацию. Например, красный сигнал светофора можно интерпретировать как запрет ехать, улыбку как сигнал хорошего расположения и тому подобное. Конкретная интерпретация называется смыслом информации. По крайней мере, такой трактовки придерживается международная организация по стандартизации: «knowledge concerning objects, such as facts, events, things, processes, or ideas, including concepts, that within a certain context has a particular meaning».
Для одной и той же информации могут существовать разные интерпретации. Трактовка сообщения «нажата кнопка питания компьютера» зависит от того, в каком состоянии, включенном или нет, компьютер находился до нажатия. В зависимости от этого информация может трактоваться как либо «включение», либо «выключение».
Обстоятельства, которые определяют, как должна трактоваться та или иная информация, принято называть контекстом. Трактовка информации существует только в определенном контексте. Соответственно, обнаруженный в информации смысл также относится к определенному контексту.
Одна и та же информация может в разных контекстах иметь свой смысл. Например, на этом строятся все афоризмы: «Окно в мир можно закрыть газетой», «Из нулей легко сделать цепь», «Говорят, у потерявшего зубы несколько свободнее язык» (Станислав Ежи Лец).
Какая интерпретация будет выбрана человеком для той или иной информации, во многом, определяется его личным опытом. Кто-то может увидеть одно, кто-то другое: «когда дураку показывают на звезды, дурак видит только палец» (фильм «Амели», 2001).
Приведенное соотнесение информации, контекста и смысла информации интуитивно достаточно понятно и хорошо согласуется с нашим повседневным опытом. В предыдущей части я попытался показать, как все это может быть перенесено на формальную модель с несложными правилами:
- У субъекта есть конечный набор понятий;
- Любое описание – это набор понятий;
- Контекст – это набор правил перевода одних понятий в другие;
- Трактовка – это новое описание, полученное в контексте, после применения правил преобразования;
- Пространство контекстов — набор всех доступных субъекту контекстов;
- Смысл – это набор трактовок, имеющих правдоподобный вид. То есть таких, что определенным образом согласуются с памятью субъекта.
Уинстон Черчилль говорил: «Нет фактов, есть только их интерпретации». Информация, получившая корректную трактовку, приобретает смысл. Из полученных трактовок можно сформировать память субъекта.
Если есть примеры исходных сообщений и их корректных трактовок, то можно выделить правила интерпретации, примененные в каждом из случаев толкования. Это как при переводе с одного языка на другой. Одно и то же слово в разных обстоятельствах можно перевести по-разному, но для конкретного предложения и его перевода всегда видно, какой вариант был использован.
Если проанализировать, от чего зависит выбор той или иной трактовки, то окажется, что есть конечный набор обстоятельств, который влияет на этот выбор. Такие обстоятельства являются контекстами. Внутри одного контекста действуют согласованные правила интерпретации сразу для всех понятий. При языковом переводе это соответствует тому, как тематика или предметная область определяет, какой вариант перевода уместнее.
Набор контекстов может быть получен автоматически из кластеризации пар «исходное описание — корректная трактовка». Если объединять в классы пары, правила трактовки которых не противоречат друг другу, то итоговые классы и будут соответствовать контекстам, а правила, собранные со всех пар класса, будут правилами интерпретации этого контекста.
Если сформированы контексты, то поиск смысла в информации — это определение того, какой контекст лучше всего подходит для ее интерпретации. В неподходящих контекстах трактовки выглядят «криво» и только в нужном контексте возникает «правильная» трактовка. Понять, насколько правильно или неправильно выглядит трактовка, можно по тому, насколько она похожа на уже хранящиеся в памяти «правильные» трактовки.
Можно выделить две основные идеи, связанные с выделением контекстов. Первая заключается в том, что, используя контексты, мы получаем возможность давать разумные интерпретации той информации, которая нам раньше никогда не встречалась. Так при переводе, когда мы хорошо знаем оба языка, мы все равно не храним в памяти все возможные варианты предложений и их переводы. Понимая контекст беседы, мы подбираем те варианты перевода отдельных слов, которые наиболее подходят для этого контекста. Вторая идея — в том, что память, то есть предыдущий опыт, позволяет определять, какой контекст в данной ситуации создает наиболее корректную трактовку.
Небольшой пример: предположим, что мы имеем дело с геометрическими фигурами. Нам показали треугольник, а затем показали круг. Мы запомнили эти описания. Затем нам показали тот же треугольник, но со смещением. Описания не совпали. Если мы хотим узнавать треугольник в любом смещении, то можно попытаться запомнить его описания во всех возможных смещениях. Но это не поможет нам потом, увидев повторно круг, узнать его в смещении. Но можно выучить правила, по которым меняются описания фигур при определенных смещениях. Причем эти правила будут едиными и не будут зависеть от конкретной фигуры. Тогда нам достаточно будет один раз увидеть любую фигуру, чтобы в дальнейшем сразу узнать ее в любом смещении.
Был предложен алгоритм определения смысла информации. Исходное описание в каждом из контекстов, образующих пространство контекстов, получает свою трактовку. То есть строится столько возможных гипотез трактовки, сколько существует возможных контекстов. Если в каком-либо контексте получившаяся трактовка окажется похожа на содержимое памяти, то такая интерпретация получает шанс стать смыслом информации.
Для геометрических фигур это означает, что каждый контекст хранит правила изменения описаний для конкретного смещения. Количество контекстов определяется количеством возможных смещений. Увидев квадрат справа сверху, мы должны будем применить к нему в каждом контексте свое смещение и получить все возможные варианты его расположения. Если мы раньше видели подобный квадрат, например, в центре, то в одном из контекстов текущая трактовка совпадает с тем, что было запомнено ранее.
Была предложена вычислительная схема. Каждый контекст обслуживается своим вычислительным модулем. Одно и то же описание поступает на вход каждого модуля. Память каждого модуля содержит правила преобразования понятий для своего контекста. В каждом контексте получается трактовка, которая сравнивается с памятью. По степени соответствия трактовки и памяти определяется, есть ли контексты, в которых информация приобретает осмысленный вид.
В предыдущей части было показано, что многие виды информации, с которыми сталкивается человек, сводятся к подобной вычислительной схеме.
Для работы контекстных вычислительных модулей требуется, чтобы:
- Информация была представлена в виде набора дискретных понятий.
- Каждый контекстный модуль получал одну и ту же информацию;
- Каждый контекстный модуль имел память о своих правилах трансформации исходных понятий в их трактовки;
- Каждый контекстный модуль мог независимо от остальных обратиться к памяти, хранящей весь предыдущий опыт, и произвести оценку достоверности своей гипотезы трактовки.
Что в коре мозга может являться таким вычислительным элементом со своей автономной памятью? Итак, похоже, настало время поговорить о кортикальных миниколонках.
Мозг
Немного освежим в памяти общее строение головного мозга. В основном, он состоит из древнего мозга, коры, белого вещества и мозжечка.
Древний мозг находится в центре и занимает относительно небольшой объем. Он называется древним по той причине, что очень похож у многих живых существ и, видимо, определяет основные возникшие эволюционно базовые функции, общие для всех них.
Древний мозг, белое вещество и кора мозга
Наружная поверхность мозга состоит из тонкого слоя нейронов и глиальных клеток. Это слой называется корой мозга. Чем на более высокой ступени эволюционного развития стоит биологический вид, тем сильнее развита у него и кора.
Когда кора достигает большой площади, например, как у человека, она начинает образовывать складки. Задача складок — вместить большую по площади поверхность коры в относительно небольшой объем черепной коробки.
Известно, что кора приобретает свои функции в процессе обучения. Подтверждает это, например, следующий факт. При повреждении какого-либо места коры, например, при инсульте, удалении или травме, утрачиваются связанные с этим местом функции. Но со временем эти функции могут восстановиться. Заново обучиться утраченным навыкам может либо оставшаяся часть той же области коры, либо такую заместительную функцию берет на себя симметрично расположенная область другого полушария.
Область коры, отвечающая за какой-то определенный функционал, называется зоной коры. Вся кора делится на множество таких зон.
Одна из таких зон – моторная зона коры, отвечает за нашу двигательную активность. Но команды, которые выдает эта зона, носят общий характер. Точная моторика, то есть детальная реализация этих команд в сигналы мышцам, выполняется отдельным органом – мозжечком.
Мозжечок получил такое название за то, что выглядит, как миниатюрный мозг. Кстати, он не всегда миниатюрен, например, у акул мозжечок больше по объему, чем основной мозг. Примечательно, что наружная поверхность мозжечка – это тоже кора. Кора мозжечка несколько отличается от коры мозга, но очень вероятно, что идеология ее работы должна быть очень близка к работе коры больших полушарий.
Пространство между корой больших полушарий и древним мозгом и внутри мозжечка заполнено белым веществом. Это ничто иное, как аксоны нейронов, передающие сигналы от одних участков мозга к другим (рисунок ниже).
Проекционные связи реального мозга. Отдельные «ниточки» соответствуют пучкам нервных волокон (Allen Institute for Brain Science)
Эти связи достаточно хорошо изучены. Они представляют из себя не просто сплошную проекционную среду, а нечто гораздо более интересное.
В искусственных нейронных сетях, использующих глубинное обучение, информация передается с уровня на уровень. Обычно, у уровня есть слой входных нейронов, скрытые слои и выходной слой.
Пример сети прямого распространения
На рисунке выше изображен один из возможных вариантов, но, вообще же, уровень может быть внутри достаточно сложным. Например, уровень может выполнять операции свертки и иметь совсем другую архитектуру. Но общее у всех уровней то, что у них есть входной и выходной слой, на котором информация кодируется набором признаков. Один нейрон — один признак. Совокупность нейронов слоя — признаковое описание. Про каждый нейрон входного и выходного слоя можно сказать, что ему соответствует «своя бабушка».
Чтобы передать состояние одного уровня сети на другой, требуется передать состояние всех нейронов выходного слоя исходного уровня нейронам входного слоя следующего уровня.
Само передаваемое описание получается длинным вектором, состоящим из бинарных признаков. В таком подходе количество признаков ограничено количеством нейронов выходного слоя, а передача от уровня к уровню требует столько же «волокон-связей», сколько и передающих нейронов.
Так вот, ничего даже близко похожего нет в системе связей реального мозга. Зоны коры соединяются между собой и со структурами древнего мозга тонкими пучками волокон. Волокна, составляющие пучок, точечно выходят из одних мест и так же точечно приходят в другие. В каждом пучке всего по несколько сотен волокон. На рисунке выше каждая видимая «ниточка» — это и есть такой пучок.
Можно предположить, что информация по таким пучкам передается не признаковым описанием, где одно волокно – один признак, а кодом (рисунок ниже), когда узор активности волокон кодирует какое-либо передаваемое понятие.
Пучок нервных волокон (слева) и пример кода (справа)
На примере системы проекций хорошо видно отличие предлагаемой модели от моделей с нейронами-детекторами. Сигнал нейрона, если это «нейрон бабушки», подразумевает указание на то, есть бабушка или ее нет в текущем описании. В нашей модели активность нейрона это просто бит в бинарном коде.
Когда обнаруживается, что какой-либо реальный нейрон устойчиво реагирует на определенный стимул, из этого нельзя делать вывод о соответствии нейрона и стимула. Этот же нейрон может успешно реагировать и на другие стимулы.
Передачу информации по проекционным пучкам можно сравнить с передачей бинарных сигналов по компьютерным шинам данных. Это достаточно точная аналогия. Несколько позже на примере зрительной системы я приведу достаточно сильные доказательства справедливости такого предположения.
Резюмируя сказанное:
- Мозг оперирует не признаковыми описаниями, в которых активность нейронов соответствует каким-либо «бабушкам», а «цифровыми» кодами дискретных понятий;
- За обучение, обработку информации, память отвечает кора;
- Кора состоит из зон, выполняющих специфические функции. При этом независимо от того, какие функции та или иная зона выполняет и с какой информацией она работает, архитектура коры остается практически неизменной. А значит можно предположить, что и во всех местах коры используются единые принципы работы с информацией, будь то кора больших полушарий или кора мозжечка.
Миниколонки коры
На срезе кора выглядит как показано на рисунке ниже. Достаточно тонкий слой, порядка полутора миллиметров от поверхности, заполнен нейронами и глиальными клетками, далее начинается белое вещество, состоящее из аксонов.
Срез коры головного мозга. Суммарная толщина всех шести уровней составляет приблизительно полтора миллиметра
Кора условно делится на шесть слоев. Верхний первый слой коры, в основном, содержит горизонтальные аксонные связи и похож на белое вещество. В остальных слоях аксонные связи, в основном, распространяются вертикально. В результате получается, что вертикально расположенные друг под другом нейроны оказываются связаны между собой значительно сильнее, чем с соседними нейронами, находящимися слева и справа от них. Это приводит к тому, что кора «распадается» на отдельные вертикальные колонки нейронов. Как выглядят отдельный нейрон, колонка и группа колонок, показано на рисунке ниже.
Отдельный пирамидальный нейрон (слева), кортикальная миниколонка (в середине), фрагмент коры, состоящий из множества миниколонок (справа) (моделирование BBP/EPFL 2014)
Группу нейронов, располагающихся вертикально друг под другом, принято называть кортикальной миниколонкой. Вернон Маунткасл выдвинул гипотезу (В. Маунткасл, Дж. Эдельман, 1981), что для мозга кортикальная колонка – это основная структурная единица переработки информации.
В одну миниколонку входит от 80 до 120 нейронов в зависимости от зоны коры, в первичной зрительной коре миниколонки содержат до 200 нейронов (рисунок ниже).
Миниколонки первичной зрительной коры кошки (слева) и обезьяны (справа) (Peters and Yilmaze, 1993)
Расстояние между центрами миниколонок в мозгу у человека или макаки варьируется от 20 до 80 мкм в зависимости от зоны. Поперечный диаметр миниколонок в среднем составляет порядка 50 мкм (Brain (1997), 120, 701–722, The columnar organization of the neocortex, Vernon B. Mountcastle). Как я уже говорил, для микроколонок характерно большое количество вертикальных связей. Соответственно, существенная часть синаптических контактов внутри миниколонок приходится на нейроны, относящиеся к этим же миниколонкам.
Чтобы понять, на что способны миниколонки, для начала попробуем оценить емкость памяти одной миниколонки.
Объем памяти одной миниколонки
Нейроны имеют разветвленные дендритные деревья, состоящие из множества веточек. Мы предположили, что информация может передаваться по коре в виде распространения связанных между собой узоров. Сами узоры — это, предположительно, узоры, образованные электрической активностью дендритных веточек. Один узор вызывает вокруг себя связанные с ним узоры-продолжения. Этот процесс повторяется. В результате по коре прокатывается волна с уникальным внутренним узором. Каждый узор соответствует какому-либо понятию.
Ранее была показана схема формирования памяти, построенная на интерференции двух волновых узоров. Первый узор определяет элементы, которые должны сохранить воспоминание. Второй узор задает ключ воспоминания.
Узор активности дендритных веточек, находящихся внутри одной миниколонки, вызывает сигнальный ответ нейронов этой миниколонки. Этот ответ выглядит как картина синхронных спайков. Этот сигнал нейронов является хеш-кодом для исходного дендритного сигнала.
Хеш-преобразование от «длинного» дендритного узора ключа создает на нейронах короткий ключ воспоминания. Когда появляется нейронный код, по аксонам входящих в этот код нейронов начинают распространяться спайки.
Аксоны нейронов одной миниколонки образуют множество синапсов внутри своей миниколонки. Из каждого синапса, принадлежащего активному нейрону, выделяется коктейль нейромедиаторов. Получается сложная картина объемного распределения сигнальных веществ.
Так как нейромедиаторы выбрасываются за пределы синапсов, эта картина оказывается доступна для наблюдения всем рецепторам, которые находятся поблизости. Рецепторы — это специальные молекулы, находящиеся на поверхности нейронов и глиальных клеток. Рецепторы могут реагировать на появление определенного сочетания химических веществ и запускать различные процессы внутри нейрона. Кроме того рецепторы могут менять свое состояние и становиться чувствительными или нечувствительными к определенным сигналам.
Каждый код активности нейронов миниколонки создает уникальную объемную картину распределения нейромедиаторов. Мы показали, что за счет изменений в метаботропных рецепторах любой сегмент дендрита может запомнить и впоследствии узнать с высокой точностью любую картину объемного распределения нейромедиаторов. Причем количество картин, которые может запомнить одна веточка дендрита, определяется количеством рецепторов и составляет десятки и сотни тысяч.
Чтобы сигнал нейронов мог быть запомнен дендритной веткой, на ней должно найтись место, избранное по отношению к этому сигналу. То есть такое место, где пересечется существенная часть аксонов активных нейронов. Было показано, что для любого сигнала на любой дендритной ветке с высокой вероятностью найдется хотя бы одно такое место.
Одиночная кортикальная миниколонка удовлетворяет всем условиям, необходимым для того, чтобы сохранять и воспроизводить воспоминания. Диаметр миниколонки соответствует элементарному объему, необходимому для формирования пространственного сигнала. Нейроны миниколонки могут своей активностью формировать бинарный ключ, длины которого достаточно для однозначной идентификации любой информации. Аксонные и дендритные коллатерали внутри миниколонки образуют структуру, подходящую для появления избранных мест.
Приблизительную оценку того, какой объем памяти может хранить одна миниколонка, можно сделать из следующих соображений. Количество информации в одном описании приблизительно определяется емкостью бинарного кода, возникающего из активности дендритных секций миниколонки. Общее количество дендритных секций Nds в миниколонке приблизительно составляет 100*30=3000 (в миниколонку попадают как дендриты собственных нейронов миниколонки, так и дендриты нейронов соседних миниколонок). Если предположить, что сложное описание кодирует активность Nsig элементов, то количество информации в одном описании по Шеннону будет
При Nsig=150 это составляет 854 бита или порядка 100 байт. Для кодирования одного описания, в сделанных предположениях, необходимо изменить состояние 150 рецептивных кластеров. Таким образом, на один кластер приходится информации
Количество информации на кластер не сильно зависит от Nsig (таблица ниже) и составляет порядка 6 бит.
Таким образом, информационная емкость миниколонки может быть оценена
Где Ncl – количество рецептивных кластеров, приходящихся на один синапс, Nsyn – количество синапсов у одного нейрона (8000), Nneur – количество нейронов в миниколонке (100).
Количество рецепторов, приходящихся на один синапс, подразумевает, в основном, окружающие синапс внесинаптические рецепторы. Потенциально, их количество может изменяться со временем. То есть, гипотетически, накопление воспоминаний может сопровождаться увеличением общего количества рецепторов.
Измерение плотности AMPA рецепторов в синапсе показало значение 1600 рецепторов на кв. мкм. Диаметр мономерного АТХ рецептора составляет 9 нм, расстояние между центрами рецепторов в димере – 9.5 нм. На поверхности шипика и прилегающей к нему поверхности дендрита, потенциально, могут свободно разместиться сотни и тысячи рецепторов.
В нашем подходе максимальное разумное количество рецептивных кластеров вблизи синапса ограничено числом возможных комбинаций активности окружающих источников нейромедиаторов. При 15 источниках выбор 5 активных из них дает около 3000 возможных сочетаний.
Исходя из сказанного, возьмем Ncl равным 500, полагая, что такое количество рецепторов может накопиться в процессе запоминания за долгие годы жизни. Тогда объем памяти миниколонки составит 2.3x109 бит или приблизительно 300 мегабайт. Или 3 миллиона семантических воспоминаний информативностью по 100 байт каждое.
Подход, опирающийся на пластичность синапсов как на основной элемент памяти, дает значительно более скромный результат. В миниколонке содержится порядка 800 000 синапсов. Даже предполагая, что синапс за счет изменения уровня пластичности кодирует несколько бит информации, получается величина, исчисляемая всего сотнями килобайт. Увеличение емкости памяти на три порядка дает качественный скачок в информационных возможностях миниколонки. Так как информация, хранящаяся в миниколонке, имеет природу, близкую к семантической, то 300 мегабайт оказываются объемом вполне достаточным, чтобы сохранить, например, все воспоминания человека, накапливающиеся по ходу его жизни.
Книга размером 500 страниц в несжатом виде занимает около 500 килобайт. Миниколонка позволяет хранить библиотеку воспоминаний, состоящую из 600 томов. Приблизительно по тому на месяц жизни или 15 страниц на день. Похоже, что этого вполне достаточно, чтобы вместить семантическое описание всего того, что с нами происходит.
Опять же, так как каждая зона коры имеет свою специализацию, то и миниколонкам каждой зоны не требуется хранить тотально всю память нашего мозга, им достаточно иметь память о своей тематике.
Триста мегабайт памяти миниколонки не стоит сравнивать с гигабайтными размерами фотографических библиотек или фильмотек. Похоже, что когда изображения хранятся в памяти, они хранятся не в фотографическом виде, а в форме коротких семантических описаний, состоящих из соответствующих изображению понятий. В момент воспоминания изображение не воспроизводится, а реконструируется заново, создавая иллюзию фотографичности памяти. Это можно сравнить с тем, как портрет человека можно восстановить достаточно близко к фотографии только лишь по его словесному описанию.
Реальная память миниколонки может быть в разы выше, если допустить, что рецепторы глиальных клеток коры также являются носителями информационного кода. Для контекстных вычислительных модулей требуется хранить два основных вида памяти: память прошлых интерпретаций и память правил трансформации. Возможно, что эти типы памяти поделены между нейронами и плазматическими астроцитами.
В первый момент мысль о том, что всего 100 нейронов миниколонки могут хранить воспоминания всей жизни, кажется абсурдной, особенно для тех, кто привык считать, что память распределена по всему пространству коры. Более того, дублирование многими миллионами миниколонок одной и той же информации в традиционных информационных подходах кажется бессмысленным расточительством ресурсов. Но идеология определения смысла в пространстве контекстов позволяет подвести под именно такую архитектуру коры серьезное обоснование.
Базовые вычислительные функции кортикальной миниколонки
Основная идея, определяющая работу миниколонки, достаточно проста (рисунок ниже). Рассмотрим один такт работы зоны коры. Информация, несущая текущее описание, распространяется по зоне коры, состоящей из множества миниколонок. Каждая миниколонка видит эту информацию как проходящие через нее узоры определенной активности, предположительно активности дендритных сегментов. Каждая миниколонка хранит память преобразований и отвечает за свой собственный контекст восприятия информации. Каждый контекст подразумевает свои собственные, отличные от других, правила преобразования исходных описаний в их трактовки. Память преобразований миниколонки – это механизм перевода узоров исходных понятий, составляющих описание, в узоры понятий, соответствующих трактовке в контексте конкретной миниколонки.
Схема базовых вычислений миниколонки коры
Понятия, составляющие одно описание, поступают на миниколонку последовательно одно за другим. Каждое из них является, по сути, бинарным кодом. Миниколонка заменяет код исходного понятия на запомненный ею код трактовки этого понятия в контексте этой миниколонки.
Бинарные коды трактовок отдельных понятий накапливаются на дендритных сегментах. Напомню, что разряженные бинарные коды можно побитно логически складывать. В результате сложения получается вектор, аналогичный фильтру Блума – единый бинарный вектор, сохраняющий полноту описания.
После того, как пройдут все волны отдельных понятий из описания, возникнут и сложатся их трактовки, на дендритных сегментах возникнет бинарный код, соответствующий трактовке исходной информации в контексте миниколонки.
Можно предположить, что существуют механизмы, позволяющие преобразованной информации и исходному описанию существовать совместно, не мешая друг другу. Возможно, что за такую раздельную обработку отвечают разные слои коры.
Комбинация активности дендритных сегментов приводит к появлению спайковой активности нейронов миниколонки. Код, составленный из активности нейронов, можно трактовать как хеш-функцию информационного описания, соответствующего трактовке исходной информации.
Ранее было показано, что комбинация активности нейронов может быть ключом, по которому из памяти может быть извлечен предыдущий опыт, связанный с именно таким или похожим на него ключом. Память каждой миниколонки хранит все ранее произошедшие события. Предыдущий опыт, предположительно, хранится в виде пар «хеш от информационного описания – идентификатор» и пар «хеш от идентификатора – информационное описание».
Вот тут и становится понятна необходимость распределенной дублирующей друг друга памяти. Клонирование одной и той же памяти на все миниколонки необходимо для того, чтобы каждая миниколонка могла выполнить сравнение своей трактовки со всем предыдущим опытом самостоятельно, не мешая остальным миниколонкам. Если бы память была общей и хранилась где-то в одном месте проверка миллиона гипотез могла бы выполняться только последовательно одна за другой. Настоящее распараллеливание требует не только наличия параллельных вычислительных мощностей, но и соответствующего параллельного доступа к памяти. Аналогичная задача решается при вычислениях на видеокартах. Когда каждый из процессоров требует быстрого доступа к памяти, не остается ничего другого, кроме как снабдить каждый из них собственной памятью.
Можно предположить, что результатом сравнения трактовки текущего описания и памяти является вычисление функций соответствия. Первая функция соответствия говорит о наличии точного совпадения трактовки и некоторых элементов памяти. Вторая функция оценивает общую похожесть трактовки и опыта, сохраненного в памяти. Позже, когда будет описана процедура обобщения, будет показан еще один вид соответствия – соответствие трактовки выделенным благодаря предыдущему опыту факторам.
Сигналы функций соответствия, потенциально, могут быть закодированы изменением мембранного потенциала отдельных нейронов или нейронных групп.
Функции соответствия позволяют судить о том, насколько контекст миниколонки уместен для интерпретации текущей информации, то есть насколько трактовка, полученная в этом контексте, соответствует ранее полученному опыту.
В итоге, на каждой миниколонке возникает своя гипотеза трактовки текущего описания и оценка того, насколько это трактовка осмыслена. Произведя определенным образом сравнение между миниколонками, можно выбрать миниколонку, контекст которой наилучшим образом подходит для трактовки текущей информации.
Трактовка, полученная на «удачной» миниколонке, строится на понятиях, единых для всей зоны коры. Трактовка может быть паттерно-волновым способом распространена по зоне коры и запомнена всеми кортикальными миниколонками. Для этого на зону коры должен быть подан соответствующий идентификатор воспоминания. Новый опыт будет сохранен в каждой миниколонке. Причем будет сохранена не собственная трактовка миниколонки, а корректная трактовка, полученная в другом, «правильном», контексте. Именно с этой трактовкой и будет сравниваться последующая информация. И если впоследствии в каком-либо контексте возникнет трактовка, смысл которой нам будет знаком по другому контексту, это не помешает нам узнать этот смысл в новом для этого смысла контексте.
Узнавание знакомого смысла в другом, новом для этого смысла контексте, имеет очень важное значение. Пожалуй, это ключевой момент, позволяющий понять основную идею описываемой архитектуры мозга. Например, для изображения его смысл — это тот образ, что удалось на нем узнать. Зрительными контекстами могут быть различные варианты смещения. Тогда увидеть в одном месте, а затем узнать в другом — это и есть найти старый смысл в новом контексте.
Другой пример. Когда человек спит у него замедляется дыхание и вам это известно. Увидев первый раз в жизни, как на компьютере медленно загорается и гаснет индикаторный огонек, вы сразу понимаете, что компьютер в режиме сна.
Большая часть информации поступает к нам не в виде точного повторения чего-то знакомого, а в форме, где мы потенциально можем найти аналогию с чем-то известным. Основной смысл теста Тьюринга как раз в том и состоит, чтобы проверить, насколько далеко распространяется способность компьютера в понимании таких контекстных переносов смысла.
Вернемся к миниколонкам. На элементах победившей миниколонки можно, в зависимости от того, что требуется, воспроизвести либо уместную трактовку текущей информации, либо наиболее подходящее под текущее описание воспоминание из прежнего опыта, либо какую-либо еще информацию, хранящуюся в миниколонке. Воспроизведенная информация может распространиться по зоне коры, а также может быть спроецирована на другие зоны для последующей обработки.
Если исходная информация допускает множественные трактовки, то все они могут быть получены последовательно друг за другом. Для этого достаточно после определения первой интерпретации подавить активность соответствующего контекста и повторить процедуру выбора контекста. Так одну за другой можно вычленить все возможные смысловые трактовки анализируемой информации.
Скорее всего, выбор трактовок, которые могут быть смыслом информации, происходит не последовательно по величине соответствия, а вероятностным методом. Соотнесение между собой функций соответствия позволяет определить вероятность каждой из трактовок. Последующий выбор может осуществляется случайным образом, исходя из получившихся вероятностей. Такой подход позволяет в схожих ситуациях не зацикливаться всегда на одних и тех же стереотипных интерпретациях, а время от времени получать новые, порой неожиданные трактовки.
Миниколонка коры в нашем подходе выглядит как универсальный модуль, выполняющий как автономные вычисления, так и взаимодействие с окружающими миниколонками. Но разные зоны сталкиваются с разными информационными задачами. В одних задачах большее значение имеет количество контекстов и меньшее объем внутренней памяти миниколонок, в других, наоборот, при меньшем количестве контекстов может оказаться важнее увеличение внутренней памяти и как следствие увеличение разрядности внутреннего хеш-кода, то есть количества нейронов в миниколонке. Оптимальная настройка универсальных вычислительных модулей под задачи конкретной зоны коры может идти двумя путями. Во-первых, для разных зон коры может варьироваться количество нейронов в миниколонке, что особенно наглядно на примере первичной зрительной коры. Во-вторых, потенциально возможно объединение нескольких вертикальных столбцов нейронов в один вычислительный модуль. Размах аксонных и дендритных деревьев нейронов, составляющий в диаметре порядка 150 мкм, позволяет объединить несколько столбцов в одну вычислительную систему без изменения описанных выше общих принципов работы.
Кроме того, можно допустить, что полный экземпляр памяти не обязан укладываться в одну миниколонку, а может быть распределен в пространстве нескольких соседних миниколонок. Так как диаметр дендритного дерева составляет порядка 300 мкм, то потенциально такое пространство доступно каждой миниколонке для работы с памятью.
Пока приведена очень приблизительная модель, позволяющая понять основные принципы работы со смыслом. Чтобы эта модель стала действительно работоспособной, не хватает еще нескольких ключевых элементов. Я постараюсь описать их в следующих частях.
Алексей Редозубов
P.S. Продолжается эпопея с переводом. Совместными усилиями делается перевод материалов на английский язык (координатор — Дмитрий Шабанов). Американские коллеги из университета Дюка делают финальную редактуру. Но требуется перевести до того уровня, когда им станет понятен смысл. Сроки сдачи невероятно поджимают. Если есть возможность и желание перевести несколько абзацев, то присоединяйтесь.
Логика сознания. Вступление
Логика сознания. Часть 1. Волны в клеточном автомате
Логика сознания. Часть 2. Дендритные волны
Логика сознания. Часть 3. Голографическая память в клеточном автомате
Логика сознания. Часть 4. Секрет памяти мозга
Логика сознания. Часть 5. Смысловой подход к анализу информации
Логика сознания. Часть 6. Кора мозга как пространство вычисления смыслов
Логика сознания. Часть 7. Самоорганизация пространства контекстов
Комментарии (47)
locutus
19.09.2016 09:50Наличие развитой коры не является необходимым условием появления семантики и сложного адаптивного поведения. Возьмите высших птиц
shabanovd
19.09.2016 12:48А Вы считаете, что у птиц не развитая кора? Кора либо есть, либо ее нету.
locutus
19.09.2016 13:27Маммальная кора, которая описана в этой статье, у птиц отсутствует, все же сказывается разница в 600 миллионов лет эволюции (300 вниз и 300 вверх, а то и больше)
AlexeyR
19.09.2016 13:56Отнесение чего-то из коры к неокортексу достаточно условно. Неявно полагается, что древние виды ели они не сильно поменялись внешне, значит и мозг сохранили тот же, что и миллионы лет назад. Но о внешенем виде можно судить, по остаткам скелетов. О мозге сложнее, только по форме черепа. Возможно, что мозг птиц сильно эволюционировал.
Первые птицы появились 130 миллионов лет назад.
Любая кора уже повод для сложного адаптивного поведения. Уже минимальная кора, например, как у птиц дает огромные результаты. Более сложная кора дает более глубокие возможности. Но, похоже, зависимость от размеров нелинейна. Каждый новый шаг дается за счет существенного усложнения всей системы.locutus
19.09.2016 18:35Птицы разошлись с млекопитающими приблизительно 300миллионов лет назад (±). Это очень большой срок.
Кортикальный шовинизм. Не кора дает результаты, кора — всего лишь способ организации нейронов в большой связности друг с другом. Не факт, что невозможны другие способы.
napa3um
19.09.2016 13:42У птиц нет неокортекса, у них в этом смысле 3D-структура нейросети в отличие от 2D-коры. А ещё бывают насекомые, которые настолько микроскопические, что по пути адаптации к ещё большей :) миниатюризации нейроны живут только на момент формирования синаптических связей и формирования общей структуры нервной сети, а потом их ядра отмирают. Такое происходит с самцами, которые у таких видов редуцируются до эдакого дрона без органов пищеварения и зрения, оптимизированного исключительно для экономичной доставки генетического материала.
MetromDouble
19.09.2016 13:39+2Слежу за публикациями Алексея почти с самого начала. И с каждой новой всё больше укрепляется чувство, что скоро идеи, выраженные здесь, произведут эффект разорвавшейся бомбы. Такого подробного обоснования различных явлений в мозгу я ещё нигде не видел, хотя стараюсь следить за этой темой внимательно.
AlekseiMorozov19730316Ru
19.09.2016 13:40Алексей Редозубов> В первый момент мысль о том, что всего 100 нейронов миниколонки могут хранить воспоминания всей жизни, кажется абсурдной, особенно для тех, кто привык считать, что память распределена по всему пространству коры. Более того, дублирование многими миллионами миниколонок одной и той же информации в традиционных информационных подходах кажется бессмысленным расточительством ресурсов. Но идеология определения смысла в пространстве контекстов позволяет подвести под именно такую архитектуру коры серьезное обоснование.
— Насколько можно понять, данное утверждение — это уже некоторый ключевой высокоуровневый элемент модели. Воздержусь от критики.
Heath
19.09.2016 15:51Алексей, вы знакомы с работами Джулио Тонони и коллег, посвящёнными Integrated Information Theory?
AlexeyR
19.09.2016 16:31Раньше не читал. Насколько я понял из беглого просмотра на википедии это формализация понятия «сознание». Сейчас статьи цикла несколько о другом. Разговор о сознании будет позже. В любом случае спасибо за наводку.
Heath
19.09.2016 16:43Да, вам в целом может быть полезно, не только для этого цикла. Идеология Тонони родилась из философских разработок Дэвида Чалмерса («Сознающий ум» переведён на русский). Тонони, Кох сотоварищи развивают их и формулируют измеримый подход к сознанию, который (с моей точки зрения) крайне важен для разработки ИИ. Важная мысль заключается в том, что «сознание» градуировано. Условно говоря, в системе может не быть сознания вовсе, может быть немножко, а может быть много. И, грубо говоря, количество сознания зависит от количества нередуцируемых каузальных циклов. То есть, создать сознающий аппарат можно только если там будет много обратной связи. Нейронные сетки без обратных связей имеют ноль сознания. А сама природа феномена сознания тесно связана с причинностью.
Yane
19.09.2016 16:32AlexeyR, Вот, кстати, еще одна интересная модель алгоритма коры — идеологически немного похожая на вашу (там тоже кодирование информации происходит в виде последовательности разреженных узоров активаций в миниколонках, но работа с контекстами выведена на уровень единичного нейрона). И там тоже речь о множественых параллельно проверяемых гипотезах.
AlexeyR
19.09.2016 17:21Я бы сказал, что это о другом. Сотня образов для нейрона — это маловато для распределенной памяти. Там нет вариации информации в контекстах. У них, просто, «нейроны бабаушки», но чуть похитрее. Им эта хитрость нужна для объяснения как работать с последовательностями сигналов. У меня последовательность закладывается в структуру идентификаторов. Нет, у них совсем о другом.
AlekseiMorozov19730316Ru
19.09.2016 17:32Но «у них» есть Testable Predictions. Мы увидим таковые от Вас?
Yane
19.09.2016 22:15Про вариацию в контекстах: если есть две входных последовательности АБСД и МБСК, то внутрисетевая репрезентация для БС (и, соответственно, набор порождаемых ею ассоциаций) в этих двух случаях будет отличаться. Если я правильно понимаю, что такое «бабушкин нейрон», то репрезентация была бы одинакова Rep(Б|А) = Rep(Б|М) = Rep(Б).
Мне, правда, осталось непонятно, откуда у них возьмется способность к обобщению (типа, смотрю на два попиксельно разных изображения, и мгновенно говорю, что и там и там кошка). Но зато моделька, имхо, идеально подходит для работы со временем. И при небольших доработках, вероятно, сможет делать предсказания на разную дальность в будущее за небольшое кол-во шагов. А ваша смогла бы, теоретически? Скорей всего да, но я не вполне представляю как именно. Может из-за того, что не все ваши статьи были прочитаны. В какой тогда это лучше почитать?AlexeyR
19.09.2016 23:23Все части достаточно сильно увязаны, трудно сказать какая важнее для понимания. Позже будет описана модель зрения. Возможно, на примере будет понятнее.
Heath
20.09.2016 17:31Если позволите, снова просьба сопрячь с имеющимися исследованиями. Буквально на днях посмотрел выступление Talia Konkle о визуальном восприятии объектов. Там есть, с чем интересным посоответствовать (например, а) что уже с младенчества есть чётко заметные зоны различения больших/малых объектов и неподвижных/движущихся и б) у маленьких обезьянок, которым с детства предъявляли две буквы, восприятие одной из них локализовалось в одном и том же отдельном месте), а также что попредсказывать (Талия говорит о нерешённых вопросах в конце третьей части выступления).
AlexeyR
20.09.2016 17:39+1Основные исследования связаны с изучением зрительного восприятия (там проще прослеживать, что от чего зависит). В последующих частях я подробно расскажу о том как работает зрение и как это соотносится с моей моделью. Там очень много важного и интересного. Если приводить факты сопоставления урывками, то, боюсь, не сложится общей картины.
MooNDeaR
19.09.2016 16:34+1Забавно, что процесс познания мозга похож на процесс раскрутки компилятора :) Мозг изучает сам себя :) Даже немного весело.
Жаль я совсем не в теме, но статьи прочитал с удовольствием. Спасибо за ваши трудыSimSonic
19.09.2016 19:09А мне вся эта кухня с тем, что опыт основывается на предыдущих опытах плюс ещё и хеши от них, уже которую статью наводят на аналогию с блокчейном =)
Halt
Здо?рово.
Вы утверждаете, что каждая миниколонка хранит всю наличную память субъекта. Если же продолжать проводить параллели с вычислительными системами, то напрашивается такой вариант:
Каждая миниколонка является независимым вычислительным модулем, сидящем на общей шине. Память колонки является с одной стороны индивидуальной оперативной памятью (кэш), с другой стороны она является распределенной памятью всего организма. То есть, колонка запоминает как фрагменты памяти, необходимые лично ей для трактовки собственных понятий, так и хранит фрагменты памяти, которые волею случая (хеш) оказалось необходимо сохранить именно здесь.
Все это очень напоминает алгоритмы DHT, когда каждый пир хранит часть информации, интересную ему, в то же время внося вклад в общее распределенное хранилище.
Соответственно, можно ожидать разных реакций колонки в зависимости от стимулов. Либо вычисление, либо информационный поиск, что в предложенной модели, если я правильно понимаю, должно реализоваться похожим образом.
Законы развития информационных систем не зависят от реализации этих самых систем. Что hardware что wetware так или иначе сталкиваются с одинаковыми проблемами (ограниченная полоса пропускания, время доступа к информации и т. д.). Логично предположить, что и решаться они будут похожим образом.
Из прогнозов: можно предполагать, что при появлении новых ассоциаций и трактовок, колонка может захотеть перетащить часть распределенного хранилища поближе к себе и тем самым записать те данные, которые нужны для нее. Таким образом решается задача быстрого доступа к информации (кэширование) и ее распределенного хранения.
napa3um
Как колонка может чего-то «захотеть»?
Не покидает впечатление по мере чтения статьи, что мозг описан как некий сложный инструмент для души или гомункулуса, некоего субъективного начала, мозгом не являющегося и для которого этот мозг транслирует свои смыслы и контексты (а этот субъект нажимает кнопки типа «запомнить» и «вспомнить»). На уровне описания поведения нейронов никакого «смысла» быть не может (либо этот «смысл» должен быть описан как локальный для нейрона эволюционно обусловленный адаптационный аспект), автору стоило бы, как мне кажется, использовать менее субъективизирующие термины, как, например, у Мински в его теории фреймов.
Halt
Так же, как процессор может «захотеть» притащить в свой кэш строку из оперативной памяти, при обращении к ней на уровне инструкций. Это не осознанная деятельность, а некие базовые механизмы системы.
napa3um
Нет состояния процессора, которое можно было бы описать без натяжки как «желание процессора положить что-то в кеш». Но бывают ситуации, которые приводят к тому, что что-то откладывается в кеше. А «желал», чтобы такие ситуации складывались, инженер, построивший процессор. Вот и мозг было бы удобно описывать, вынося субъективизм и целесообразность из этого описания в «инженера» — природу, описывая через эволюционную обусловленность те или иные аспекты функционирования нейронов и их альянсов. Эта придирка не просто к стилю повествования, а именно подозрение, что автор неявно и сам в своих рассуждениях наделяет некоторые части своей модели природным и необъяснимым проактивным поведением, а не пытается эту проактивность вывести из реактивности (механистичности) базовых элементов.
AlexeyR
Опасения насчет автора напрасны :) В основе всего лежит естественный отбор.
AlexeyR
Вопрос терминов всегда непрост. Но если «бытовое» понимание хорошо ложится на термин модели и не противоречит ему я предпочитаю не вводить новых слов.
AlexeyR
Заранее не известно, что когда и кому может понадобиться. Я склоняюсь к тому, что каждая миниколонка хранит всю память своей зоны коры. Но эволюция мозга неизбежно довела любой механизм до совершенства. Я описываю базовый принцип, скорее всего в реальности все еще интереснее и могут быть разные чудеса относительно оптимизации.
Halt
Инженерная фантазия позволяет мне предположить такой вариант: если колонка «знает», что существует некое воспоминание, соответствующее данному набору стимулов, она может по своей инициативе пустить волну поиска и получить в итоге запрошенную информацию. То есть, это промежуточный вариант между «колонка хранит всю информацию локально» и «колонка всегда только спрашивает».
Впрочем, это уже повод для отдельных исследований и одной фантазией тут не отделаешься.
AlexeyR
Дело в том, что для любой информации каждая колонка имеет свою трактовку. Проверить трактовку относительно памяти должна каждая из колонок. Если чего-то нет, то дать запрос, подошло бы если бы такая проблема была у очень небольшого числа колонок. Но проверить надо каждой. Похоже, что кроме своей памяти надеятся не на что.
Оптимизация может быть за счет того, что каждая зона коры хранит только свою память. Соседние миниколонки (в радиусе 150 мкм) могут шарить память.
AlekseiMorozov19730316Ru
Создаётся ощущение, что Ваша модель подогнана под GPU, а не под мозг.
AlexeyR
А нет ощущения, что эволюция компьютеров толкает их в сторону мозга?
AlekseiMorozov19730316Ru
И Вы думаете, что нужно толкать ещё и мозг в сторону GPU? То есть так они быстрее встретятся? Какой в этом смысл?
shabanovd
Вы основываетесь на предположении, что Алексей знает как работает GPU, но оно слегка ошибочно. Думаю, что и Ваши знание поверхностны. GPU еще нужно развиваться и развиваться.
AlekseiMorozov19730316Ru
>… знание…
Знание и понимание — вещи разные. Можно много знать, но мало что понимать. Увеличивать объём знания без понимания — это сродни перееданию.
shabanovd
Как скажете…
Halt
Но ведь у нас уже есть первичная фильтрация по самим признакам/ключу, которая должна отсечь 99% неподходящих колонок и тем самым позволит избежать лавинообразной активности. Оставшийся 1% проверит трактовки в своей памяти, или даст запрос.
Хотя конечно вариант, при котором колонка помнит все что ей нужно подкупает своей простотой организации.
AlexeyR
В общем случае первичной фильтрации нет. Каждый контекст, то есть каждая колонка, строит свою трактовку и сверяет ее с памятью. Ничего нельзя отбросить. Заранее неизвестно опыт какой трактовки придется перенести на текущую ситуацию.
Sergey_Kovalenko
Сократ говорил, что первое знание, которое приходит к человеку в чем бы то ни было — это признание собственного незнания. В связи с этим, чтобы дать другим возможность исследования и шанс сделать все-таки открытие, я призываю Автора статьи исправить одну важную неточность: он должен признаться, что просвещенной части человечества до сих пор не известна никакая удовлетворительная теория придания смысла предложению языка или наблюдаемым явлениям, хотя, без сомнения, осмысление — процесс привычный и интуитивно понятный для каждого из нас.
Понятие интерпретации в математике — чисто формальное отношение между тремя языками без какого-либо придания смысла, более того, даже изгнав всякую осмысленность из своих теорий, математика не освободилась от неформальных изъянов: когда вы пытаетесь дать определение формальной теории, вы неизбежно употребляете, например, слово «множество» в его значащем неформальном смысле, а всеми излюбленное понятие истины вообще не может быть выражено внутри пока что никакой математической теории.
Область познания, относящаяся к приданию смысла, пока что пуста результатами или плодотворными идеями — она только ждет робких шагов своих первых исследователей. Касательно информации и ее количества — здесь в понимании удалось продвинуться не намного дальше. Если кто-либо думает, что все сводится к энтропии, то вот вам вопрос: «Что расскажет больше об античной культуре: хорошо сохранившаяся статуя или груда ее черепков ?»
AlexeyR
Вы правильно говорите. Про аксиоматику математики, исходные понятия и их связь с возможностью понимать математику и находить решения трудных задач я хотел написать отдельно. Общепринятой теории смысла, действительно, нет. Приведенные в начале статьи фразы являются общепринятыми толкованиями (если считать википедию мерилом общепринятости). Но дальше я покажу, что введенная в предыдущей части простая модель смысла при некотором усложнении дает очень хорошие практические результаты и в продвинутом виде может претендовать на объяснение смысла в том виде, как его понимает человек.
Yane
В чем подвох со статуей и черепками?
Если черепки уникальные и можно однозначно воссоздать статую по ним, то «информации об античной культуре» окажется ровно столько же, сколько и в не разбитой статуе. Из-за уникальности черепков энтропия на них будет выше энтропии исходной статуи. Но это не «ошибка» — информации в таких черепках больше, потому что они содержат информацию не только об античной культуре, но и о способе разбиения статуи.
Если черепки неуникальные в достаточной степени, чтоб статуя была по ним невосстановима — то информация о разбиении в них по прежнему останется, а вот об исходной статуе — потеряется. Поэтому мы ожидали бы, что и энтропия у таких черепков будет ниже, чем у предыдущих (чтоб учесть потерю инфоррмации об античной культуре). И это в самом деле выполняется — энтропия на этих черепках будет ниже, т.к. из неуникальности черепка следует более хорошая предсказуемость, что и приводит к уменьшению значения энтропии.
Вроде, все ок.
AlexeyR
Любые понятия имеют спектр возможных трактовок. Сам термин «информация» имеет разный смысл в зависимости от контекста. Шеннон дал одну из трактовок, основанную на вероятности или, что то же самое на энтропии. В своем узком смысле эта трактовка очень хороша и полезна. Но она, например, не учитывает важность информации. Оглашение приговора «казнить» или «помиловать», когда чаша весов колеблется 50 на 50, содержит 1 бит информации по Шеннону. Но этот бит для подсудимого важнее всего на свете и он расценит информативность приговора несколько по другой шкале.
Sergey_Kovalenko
Честно говоря, не так просто сказать чему равна энтропия черепков или статуи, но если перевести спор в область интуитивной физики, то легко можно представить, как, падая, статуя разбивается на много мелких черепков, и довольно трудно, как черепки, брошенные на пол, собираются в образ прекрасной женщины. Говорят, что в природе энтропия замкнутой системы не может уменьшаться.
Еще одна тонкость, которая никак не делает лучше мой пример, но в действительности уничтожает ваши контраргументы, — это то, что состояния, переводимые друг в друга каким либо процессом вычисления, могут иметь различную энтропию (Больцмана): вычислительная машина, как и холодильник, не могут работать без притока энергии извне. Иными словами, чтобы собрать статую, вам придется съесть бутербродов эдак пять, а куда пойдут эти джоули: на порождение или на уничтожение информации, из поверхностного анализа не ясно.
Цель моего полудетского примера со статуей была обратить внимание на то, что большинство естественных сообщений хорошо структурированы и крайне не случайны. Например, текст, который Вы читаете, мало похож на совсем уж случайную последовательность букв и может быть сжат по объему в несколько раз любым адекватным архиватором.