Приветствую, хабравчане! Сегодня речь пойдёт об одном, на мой взгляд, интересном варианте алгоритма для самообучающейся системы. Идея подобной статьи зрела давно, однако руки всё не доходили.

Рассматриваемую ниже модель можно спокойно отнести к областям эволюционного моделирования и роевого интеллекта, однако с заделом на дальнейшую интеграцию с существующими наработками в области нейросетей. Но, обо всём по порядку.

Мотивация

Началось всё с идеи, что восприятие мира нашим мозгом - образное. Каждому объекту реального мира, каждому явлению, с которым человек и его нервная система взаимодействуют, сознание ставит в соответствие некоторый ментальный образ, образ объекта из реального мира. Этот образ может быть как зрительным, так и звуковым или тактильным. Стоит полагать, что в образе и в переходе к нему и содержится смысловая часть нашего восприятия.

Взаимосвязи между объектами в реальном мире аналогичным образом переходят во взаимосвязи между образами этих объектов в голове. Но это уже тема для отдельной статьи.

С образами дерева, мяча, листа бумаги, кошки всё понятно. Но как быть с образами физических величин, спектр значений которых непрерывен? Суть проблемы поясню на примере. Допустим, человеку (будем звать его Василий) дают послушать звук частотой 500 Гц. Во время прослушивания в голове Василия появляется образ этого самого звука. Затем, Василию дают послушать другой звук, уже с частотой 600 Гц. И снова это приводит к появлению нового звуковой образа в голове нашего испытуемого. Теперь он способен отличать эти два звука между собой.

Но эксперимент продолжается. Василию дают слушать всё новые и новые звуки в промежутке от 500 до 600 Герц: 537, 571, 522.93, 586.128, 593.49245, ... Каждый новый звук, который запомнит испытуемый, будет порождать новый образ в голове последнего. До каких пор это будет продолжаться? Как утверждает математика – до бесконечности. Ведь между любыми двумя вещественными числами найдётся как минимум ещё одно вещественное число.

Выходит, если Василий запоминает, всё подряд, всё, с чем взаимодействует, то его память банально переполнится бесконечным числом образов объектов из окружающего мира. Значит, восприятие работает несколько иначе (да, да, для кого-то это было очевидно), преобразуя непрерывную реальность в конечный набор дискретных образов.

Это в свою очередь порождает ряд вопросов:

  • Не ясен механизм выбора, что запомнить, а что нет.

  • Какова предельная точность распознания объектов? Именно мозгом, не органами чувств.

  • Можно заметить, что человек хорошо запоминает только ту информацию с которой он постоянно имеет дело. Другими словами, повторение способствует лучшему запоминанию. Как реализовать и это в рамках теории образов?

Странная жизнь клеток

Прежде чем, перейти к ответам на поставленные вопросы, переместимся в воображаемый мир, где клетки живут ровно по тем правилам, которые мы придумаем.

Для начала определимся с пространством, в котором живут клетки. В игре "Жизнь", например, это дискретное пространство, состоящее из квадратных клеток. Мы же предоставим клеткам все радости жизни в непрерывном метрическом пространстве произвольной размерности.

Питание клеток
Питание клеток

Также разберёмся со способом питания клеток. В пространстве постоянно в разных местах появляются питательные точки, потребляя которые клетка увеличивает свою массу. Можно придумать множество всяких вариантов принципа, определяющего, какая клетка сможет подкрепиться питательной точкой и сможет ли. Остановимся на довольно странном для обычных клеток механизме, когда питание получает ближайшая к источнику клетка. Почему странном? Потому что, даже если ближайшая к питательной точке клетка находится на расстоянии в сотни километров, она всё равное его моментально получит.

Таким образом, клетки разбивают всё пространство на семейство областей с общими границами. Каждая такая область представляет собой множество точек, к которым одна из клеток будет ближайшей.

Деление. Здесь всё достаточно просто: клетка делится, если её масса становится критического значения M. Вопрос лишь в том, где будет располагаться дочерняя клетка. Самый простой вариант – где-то в случайном месте, неподалёку от родительской. Однако прибавим клеткам мобильности: пусть дочерняя клетка располагается на месте текущей питательной точки, которая и привела к делению материнской клетки.

Деление клеток
Деление клеток

Что на счёт старения? Все клетки вне зависимости от положения и питания постоянно теряют небольшую долю своей массы. Это значение подобрано так, чтобы размер колонии оставался стабильным и число клеток было не сильно больше или меньше некоторого фиксированного числа (N). Как только масса клетки становится отрицательной, клетка удаляется с поля со статусом «мёртвая».

Все наши правила можно записать в виде следующих формул:

\forall \vec r \to \exists k(\vec r): \rho (\vec r_k, \vec r) = \min _{i \in 1..n} \rho (\vec r_i, \vec r)\forall i ≠ k \to  \Delta m_i = - {\mu \over N}; \Delta m_k = \mu - {\mu \over N}\Delta n = \theta(m_k - M)-\sum _{i=1} ^n \theta(- m_i)

где ???? – функция Хевисайда, ????(x,y) – расстояние между точками x и y, μ – величина порции питания клетки, M - масса, достаточная для репродукции (репродуктивная масса), n - число клеток в колониии, N - ограничение сверху на численность колонии.

Вот как всё это выглядит в движении:

Сине-оранжевый фон - это распределение плотности вероятности появления питательной точки. Зелеными кружками отмечены клетки. Маленький кружочек - питательная точка, появляющаяся на каждой итерации алгоритма.
Сине-оранжевый фон - это распределение плотности вероятности появления питательной точки. Зелеными кружками отмечены клетки. Маленький кружочек - питательная точка, появляющаяся на каждой итерации алгоритма.

Анализ поведения колонии в целом

Что в итоге мы имеем? Колония клеток растёт и развивается таким образом, что клетки выживают только в тех зонах, где питания достаточно для поддержания их жизнедеятельности. Действительно, если новая клетка «случайным» образом образовалась в месте, где питательные точки появляются редко, то, очевидно, в среднем она будет терять массу быстрее, чем набирать. Ведь все питательные точки будут с большей вероятностью оказываться рядом с другими клетками и подпитывать их.

Как ни удивительно, масса между клетками в колонии распределена квазилинейно (коэффициент наклона графика M/N). То есть на каждый интервал значений массы приходится одно и то же число клеток:

График, показывающий, как распределена масса колонии между клетками. График упорядочен по значению массы.
График, показывающий, как распределена масса колонии между клетками. График упорядочен по значению массы.
m = {M \over N} i; i = {m \over {M \over N}}; dn = di = {N dm \over M}{dn \over N } = {dm \over M}

При этом, как и ожидалось, число клеток в колонии сначала растёт, а затем флуктуирует возле фиксированного значения N:

Данные, как элементы метрического пространства

Допустим, в нашем распоряжении имеется произвольный датасет в виде пар входных и выходных данных. Это может быть некоторая математическая функция f(x), словарь с одного языка на другой, набор картинок с пометками, кто на них изображен.

Так или иначе, элементы входных данных образуют пространство, на котором можно ввести метрику – функцию расстояния между объектами.

// (код на Rust)
trait Distance {
	fn distance(&self, other: &Self) -> f64;
}

Если тип данных является числом, то расстояние легко найти как модуль разности

\forall x,y \in  ℝ \to \rho(x,y) = |x-y|

если вектором чисел, то

\rho (\vec x, \vec y) = \sqrt {\sum_{i=1}^N (x_i - y_i)^2 }

Ну, а если входные данные – это картинка, то можно использовать попиксельное сравнение. В случае чёрно-белой картинки, формулу можно записать так:

\rho(X_{ij}, Y_{ij}) = \sqrt{ \sum_{i=1}^N {\sum_{j=1}^M (X_{ij} - Y_{ij})^2 }}

Для слов можно использовать как «посимвольную», так и тривиальную метрику. Но, строго говоря, лучше использовать именно тривиальную метрику (что и реализовано в коде ниже):

\forall x, y: x ≠ y \to \rho_{tr}(x,x) = 0 ∧ \rho_{tr}(x,y) = 1

Это оправдано тем, что по смыслу, слова «вода» и «мода» отличаются не меньше, чем «вода» и «водой». Тривиальная метрика и в том и в другом случае даст расстояние ρ=1, в то время как, согласно посимвольной метрике, слова «вода» и «мода» отличаются меньше (ρ=1), чем «вода» и «водой» (ρ=2), хотя последняя пара слов представляет собой одно и тоже слово, просто в разных падежах.

// для чисел
impl Distance for f64 {
	fn distance(&self, other: &Self) -> f64 {
		return (self - other).abs();
	}
}


// для векторов и массивов
impl Distance for Vec<f64> {
	fn distance(&self, other: &Self) -> f64 {
		let mut s = 0.0;
    let n = self.len();
    
		for i in 0..n {
			let x = self[i] - other[i];
			s += x*x;
		}
		s.sqrt()
	}
}


struct BWImage {
  matrix : Vec<Vec<u8>>,
}

// для чёрно-белых картинок
impl Distance for BWImage {
	fn distance(&self, other: &Self) -> f64 {
		let mut s = 0.0;
    let n = self.len();
    let m = self[0].len();
    
    for i in 0..n {
      for j in 0..m {
        let x = self.matrix[i][j] - other.matrix[i][j];
        s += x*x;
      }
    }
    s.sqrt()
	}
}


// for strings
impl Distance for String {
	fn distance(&self, other: &Self) -> f64 {
		return (self == other) as i32 as f64;
	}
}

Клетки в поисках паттернов

Попробуем применить описанную выше клеточную модель к анализу данных. Как это сделать? Как уже говорилось, датасет есть набор пар входных данных и выходных. То есть преобразование из одного пространства (метрического) в другое. Клетки в рамках нашей модели тоже «живут» в метрическом пространстве. Следовательно, каждый элемент входных данных можно использовать как питающую клетки точку.

Выходные же данные можно рассматривать как метки на клетках. Метку i-й клетки обозначим l_i.Таким образом каждая клетка в колонии становится своего рода связующим звеном между соответствующим входом и выходом. При этом метки от питательных точек передаются дочерним клеткам во время деления.

Обратимся к примеру. Имеется автомобиль, управлять которым мы хотим научить клеточную колонию. Для этого автомобиль (под управлением водителя) должен несколько раз проехать по нужному маршруту, собирая данные. Получится некоторое семейство траекторий. На «вход» модели будем подавать координаты автомобиля (получаем с помощью GPS), а на «выход» - необходимое действие: ехать прямо/повернуть направо/повернуть налево.

Коричневый цвет – питательные точки (координаты автомобиля из датасета);
тёмно-зелёный цвет – клетки обучившейся колонии (реализуют осреднённую траекторию);
оранжевый цвет – метки на клетках (действия по управлению автомобилем из датасета)
Коричневый цвет – питательные точки (координаты автомобиля из датасета); тёмно-зелёный цвет – клетки обучившейся колонии (реализуют осреднённую траекторию); оранжевый цвет – метки на клетках (действия по управлению автомобилем из датасета)

При приближении автомобиля первому повороту, соответствующая его расположению питательная точка окажется в зоне клетки с меткой «повернуть направо». Система «распознает» ситуацию на дороге, как требующую поворота вправо и повернёт. Затем, посылаемый GPS сигнал будет порождать питательные точки снова в окрестности клеток с меткой «ехать прямо», вплоть до следующего поворота.

Красная точка - питательная точка arcsin(sin(t));
зелёные точки - клетки колонии во время обучения
Красная точка - питательная точка arcsin(sin(t)); зелёные точки - клетки колонии во время обучения

Рассмотрим ещё один пример. Задача состоит в дискретной имитации непрерывной математической функции x(t) = 4\sin(t) – колебания маятника с частотой 1 рад/с и амплитудой 4. В качестве «входа» – время t за вычетом целого числа периодов. В качестве «выхода» – координата маятника x(t). На гифке видно, как происходит добавление и удаление новых клеток колонии. Ниже представлен график результатов.

Оранжевая кривая – график зависимости положения самого маятника от времени. При имитации поведения маятника, сначала время t локализуется на интервале \tau \in (0,T)(вычитаем число целых периодов). Затем для каждого значения ???? (питательной точки) определяется ближайшая к нему клетка под номером k и её метка l_k. Синий график есть зависимость значения метки, получаемой таким образом для каждого значения t. Формулой это можно записать так:

\xi(t) = l_{k(\tau)}, \tau = \arcsin(\sin(t))

В данном случае имитация (аппроксимация) функции происходила 15ю клетками, 15ю зонами.

15 клеток
15 клеток

А вот какой почти гладкий результат даёт колония в 100 клеток (что логично, разбиение периода на большее число отрезков).

100 клеток
100 клеток

Связь с ментальными образами

Применим нашу модель к анализу и классификации картинок. Для простоты в качестве датасета используем примитивные чёрно-белые картинки, с двумя значениями яркости (0 и 255). Размер 17x46. Картинки получаются путём наложения шума на две исходные картинки кошки и собаки.

Две исходные картинки
Две исходные картинки
Результаты анализа моделью
Результаты анализа моделью

Окей, модель отлично справляется с поставленной задачей (хоть и довольно простой). Но что представляют собой координаты клеток колонии после обучения? Если подумать, то все клетки расположены на месте каких-то питательных точек, то есть соответствуют некоторым конкретным картинкам из датасета. Эти картинки, в силу свойств алгоритма, представляют нечто среднее для своей группы (картинок, помеченных одной и той же меткой).

Если выражаться более точно, клетки колонии стремятся занять положение питательных точек, которые ближе всего к геометрическому центру каждой отдельной группы точек (кластера картинок), определяемого по формуле:

\vec r_l = {1 \over N_l}\sum _ {l_s = l} \vec r_s

Таким образом, каждая клетка в ходе обучения пытается стать представителем группы питательных точек, представителем кластера данных. Такой представитель содержит в себе наиболее общие черты всех элементов кластера, выступает в роли эталона, сравнение с которым позволяет классифицировать объекты, определять принадлежность объекта к тому или иному кластеру данных.

В тоже время, это уже вопрос не просто классификации. Это вопрос восприятия. Обученная модель, если мы «покажем» ей картинку, прежде чем ответить, что изображено на последней, сначала перейдёт к картинке, соответствующей ближайшей по метрике клетке. Это то, как модель «видит» то, что мы ей подаём на вход, как воспринимает информацию.

По сути, сам ответ на вопрос «на картинке изображена собака или кошка?» имеет смысл только для нас, для людей. Для модели же именно смысловая нагрузка заключена в переходе от подаваемой картинки к той, что содержится у неё в памяти в виде одной из выживших в ходе обучения клеток. Метка на клетке – это просто удобство; способ, с помощью которого уже мы, люди, интерпретируем результаты обработки данных моделью.

Ментальный образ – это тоже объект в памяти мозга, который наше сознание ставит в соответствие воспринимаемому объекту. Например, когда мы видим какую-то конкретную кошку, в голове это провоцирует отклик в виде образа некоторой абстрактной кошки. Образ и реально наблюдаемый объект не обязаны совпадать в деталях, но их общие характерные черты позволяют нам провести сравнение и осуществить переход.

В виду сказанного, клетки внутри модели выполняют роль ментальных образов. Такая аналогия позволяет нам дать ответы на поставленные выше вопросы, по новому взглянуть на механизм обучения и запоминания.

Мозг как дискретный аппроксиматор

Пришло время дать название нашей модели. В силу того, что конечный набор дискретных клеток во время обучения аппроксимирует в том числе непрерывное распределение входных данных (см. график), хорошим названием видится «дискретный аппроксиматор».

Синим цветом – распределение случайной величины (получаем с помощью генератора псевдорандома).
Красным - расположение клеток колонии. Пространство одномерное.
Синим цветом – распределение случайной величины (получаем с помощью генератора псевдорандома). Красным - расположение клеток колонии. Пространство одномерное.

И так, пусть мозг при запоминании и распознавании действует как дискретный аппроксиматор. В случае взаимодействия с новым для человека объектом, его мозг не стремится сразу запомнить этот объект. Более того, сначала человек может воспринимать объект искаженно. И лишь спустя некоторое время, в течение которого он взаимодействовал с этим объектом, в сознании человека появится новый образ. Например, если вы никогда не видели волка (даже на картинке), никогда про него не слышали, то, скорее всего, при первой встрече подумаете, что это большая собака.

Это происходит потому, что соответствующая волку питательная точка в ментальном пространстве, сначала запитывает клетку-образ собаки (так как она – ближайшая по всем характеристикам). Если взаимодействие с волком произойдет единожды, то новый образ не появится или по крайней мере не закрепится в сознании. Однако при постоянном контакте с волком, клетка-образ собаки наберет массу, поделится и дочерняя клетка станет уже образом волка.

То же самое с изучением иностранных языков. Нужно регулярное повторение, чтобы запомнить новые слова. Сначала новое слово запитывает образы старых, созвучных слов. Поэтому за раз новое слово не выучить, оно быстро забудется. Но регулярное повторение провоцирует клетки-образы достичь критической массы и поделиться, создавая вакантный образ для нового слова.

В то же время, клетки подвержены старению. Старые воспоминания стираются: образ без подкрепления (через взаимодействие с соответствующим реальным объектом) теряет постепенно массу, а затем, по достижении нулевого значения последней, умирает. Хоть способность человека забывать информацию часто рассматривается как нечто негативное, это очень важный механизм приспособления к новым условиям, избавления от неактуальных или добавленных по ошибке образов.

Наконец, можно утверждать, что точность распознавания объектов не имеет ограничений разве только в виде конечного объёма памяти мозга. В рамках предоставленного количества образов можно реализовать любую мелкость разбиения области. Можно 10 клеток расставить на отрезке в 10 см, а можно их же расставить на отрезке в 0,1 см.

При первом знакомстве с новой местностью вы вряд ли позже сможете в точности воспроизвести расположение всех объектов на карте. Однако чем больше вы будете посещать это место, тем лучше вы будете помнить, что где находится, и через время сможете ориентироваться, что называется, «на автомате». Это конкретный пример того, как мозг постепенно увеличивает точность своей внутренней модели реальности.

Ограничение здесь, повторюсь, только в числе образов, которые память мозга может в себя вместить. Но прежде, чем память закончится, мозг очистит её от старых образов – воспоминания о местности, где вы провели детство, будут становиться постепенно всё более размытыми, по мере того, как вы будете всё лучше ориентироваться в новом городе.

Нейроны места

А что на подобные рассуждения может ответить биология? Есть ли биохимические процессы в мозге, которые бы отвечали за формирование новых образов? Не буду томить – такое явление существует и называется оно нейрогенезом.

Нейрогенез – это процесс зарождения и роста новых нейронов. Долгое время ученые полагали, что «нервные клетки не восстанавливаются», что нейрогенез происходит только в раннем возрасте, на этапе активного роста мозга и организма в целом. Так вот это заблуждение. Последние исследования [1] говорят в пользу того, что и у взрослых представителей человеческого вида по крайней мере в гиппокампе протекают процессы образования новых нейронов.

Ежедневно в гиппокампе добавляется около 700 новых нейронов [2]. При этом около 50 % новорождённых клеток погибает по механизмам запрограммированной клеточной гибели, но если молодые нейроны образуют синаптические контакты или получают необходимую трофическую поддержку, то они могут выживать в течение долгого времени [3].

Наконец, как выясняется [4, 5], попытки искусственно затормозить процессы нейрогенеза у крыс приводят к ухудшению распознавания ими схожих объектов, эмоций и мест.

Лично я вижу здесь определённое сходство между тем как работает «дискретный аппроксиматор» и тем как проявляется нейрогенез. Идём дальше.

В 2014-м году нобелевку по физиологии и медицине присудили американскому ученому Джону О’Кифу и и норвежским исследователям Мей-Бритт Мозер и Эдварду Мозер за открытие нейронов места.

Нейроны места – это «особый» тип нейронов, которые активируются, когда животное или человек находятся в определённом месте. То есть каждый нейрон отвечает за определённую область в пространстве (отсюда и название), становится носителем её ментального образа. Расположены нейроны места в гиппокампе.

Вот как выглядят результаты эксперимента над крысой, которая бегала по специальной дорожке, по которой рассыпан корм[6]. Точками нанесены положения животного, когда активировался один из нейронов. Цвет точки соответствует нейрону, который активировался, когда крыса находилась в этой точке.

Легко видеть, что каждой области (группе точек одного цвета) соответствует свой нейрон. И не смотря на то, что пространство непрерывно, мозгу крысы удалось разбить его на 8 зон.

А вот уже результаты симуляции подобного эксперимента с помощью дискретного аппроксиматора. Черными точками отмечены клетки-образы соответствующих мест, цветными точками – положения симуляции крысы. Каждому цвету соответствует область, ближайшая к одной из клеток.

Вот ещё пример. Здесь крыса бегала уже по замкнутой треугольной дорожке.

Довольно показательной является история «пациента H.M.» . Генри Густав Молисон в детстве получил черепно-мозговую травму и впоследствии страдал от приступов эпилепсии. Нейрохирург Уильям Сковилл в качестве решения проблемы предложил удалить некоторые раздела мозга, включая гиппокамп. После операции приступы эпилепсии действительно прошли, но важно не это. Молисон потерял возможность запоминать новые события в его жизни. Такие люди живут в настоящем, не помня, что было 5 минут назад.

Тщательные наблюдения за пациентом, позволили ученым прийти к выводу, что гиппокамп - та самая область мозга с активно протекающими процессами нейрогенеза - принимает активное участие в работе кратковременной памяти.

Согласно современным представлениям, вновь поступающая в мозг информация после первичной обработки сначала сохраняется в гиппокампе. Если переживание достаточно сильное или мы периодически вспоминаем его в первые несколько дней, гиппокамп пересылает его обратно в кору головного мозга на «постоянное» хранение.

Кавычки поставлены по той простой причине, что воспоминания даже в долговременной памяти подвержены стиранию, перезаписи при повторном обращении к ним. Это явление называется реконсолидацией.

Логично предположить, что нейрогенез происходит и в других областях мозга, но менее активно, что приводит к большей стабильности и сохранности воспоминаний и выученных навыков. Другими словами активный нейрогенез соответствует кратковременной памяти, а пассивный - долгосрочной.

Другие примеры

Рассмотрим ещё примеры того, чему можно научить дискретный аппроксиматор. Ниже можно видеть результат аппроксимации сложной траектории, в виде двух фигур, которые в полярных координатах описываются уравнением:

r = cos(5\theta)
Аппроксимация траектории, задаваемой формульно r = cos(5????), ????=Ωt
Аппроксимация траектории, задаваемой формульно r = cos(5????), ????=Ωt

Наконец, самый, на мой взгляд, эффектный пример, когда аппроксиматор учится играть в мяч. Правила довольно простые: необходимо пододвигая платформу снизу ловить мячик, который каждый раз начинает падать в случайном месте.

Во время обучения на вход модели (то есть в качестве координат питательных точек) подаём тройку (x,y,z), где x,y – координаты мячика, z – положение платформы (по горизонтали). А на выход (в качестве метки) подаём действие: подвинуть платформу на позицию вправо, влево или оставить на месте.

Игра. Задача ловить падающий мячик платформой.
Игра. Задача ловить падающий мячик платформой.

Заключение

Статья подходит к концу. К каким выводам можно прийти? Прежде всего, представленная клеточная модель действительно способна справляться с задачами машинного обучения, такими как распознавание картинок, аппроксимация математических функций, автоматическое управление.

Конечно, имеются и проблемы, связанные, например, со сходимостью алгоритма. Однако есть и преимущества, по отношению к тем же нейросетям. Модель не является «черным ящиком», каждая клетка-образ (в отличие от нейронов скрытого слоя) является носителем отдельной смысловой единицы (образа). В силу этого построенная на описанных выше принципах более сложная и полная модель будет более пригодной для масштабирования интерпретации внутренних процессов. Можно будет напрямую комбинировать различные обученные раздельно модели в одну, а также извлекать напрямую выявленные моделью закономерности в данных.

Другой момент, который хотелось бы отметить, это наличие в мозге человека и животных процессов, которые схожи с процессами в модели в плане как механизма протекания, так и назначения. Клетки внутри модели живут и делятся, имитируя процессы нейрогенеза. Нейрогенез принимает активное участие в распознавании и запоминании. Модель также хорошо справляется с этими задачами.

Спасибо всем, кто дочитал до этого места. Отдельное спасибо тем, кто читал вдумчиво, не пропуская абзацы. Надеюсь, статья была интересной и полезной. Жду ваши отзывы и идеи в комментариях.

Ссылки на источники

  1. https://www.cell.com/neuron/fulltext/S0896-6273(11)00348-5?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0896627311003485%3Fshowall%3Dtrue

  2. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4394608/

  3. https://ru.wikipedia.org/wiki/Нейрогенез#cite_note-pmid17922142-3

  4. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5612417/

  5. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3084370/

  6. https://ru.wikipedia.org/wiki/Нейроны_места

Комментарии (34)


  1. Lelant0s
    30.01.2022 12:58
    +3

    "Нейроны места – это «особый» тип нейронов, которые активируются, когда животное или человек находятся в определённом месте."

    Не то, чтобы я спорил с уважаемыми получателями Нобелевской премии, но с гораздо более высокой вероятностью это нейроны "опыта", активирующиеся, когда животное или человек попадают в ситуацию (независимо от места), которая уже имела (или наоборот - не имела) место в прошлом.

    Таким образом, условный поворот трубы направо не будет сильно отличаться от поворота налево, но вот второй поворот куда бы то ни было будет другого "цвета" (если аппеллировать к картинке в статье), т.к. это уже опыт не "поворота" как такового, а "лабиринта", т.е. последовательности поворотов, а значит задача другая и активация других групп нейронов.


    1. phenik
      30.01.2022 13:56
      +2

      но с гораздо более высокой вероятностью это нейроны «опыта»
      Нейроны места, решетки и скорости отвечают именно за ориентацию животного в пространстве. То о чем вы пишете может быть обобщением на более высоком нейронном уровне.


      1. Lelant0s
        30.01.2022 14:08
        +1

        То о чем вы пишете может быть обобщением на более высоком нейронном уровне.

        Не согласен. Обобщение (очевидно из этимологии слова) будет совокупностью факторов, но все факторы, перечисленные вами, относятся к пространственному позиционированию, в то время как я говорю об опыте, т.е. оценочных действиях в отношении **полученного результата**.

        Проще говоря, свечение на картинке (в моем понимании) это не оценка/градация крысой ее положения в пространстве, а различные "категории" опыта (или его отсутствия), активные в данный момент.


        1. phenik
          30.01.2022 17:14

          Не то, чтобы я спорил с уважаемыми получателями Нобелевской премии, но с гораздо более высокой вероятностью это нейроны «опыта»
          Похоже не верно вас понял, посчитал, что вы переопределяете функции нейронов места)


    1. Alexander428 Автор
      30.01.2022 18:55

      Именно) Человек или животное не может распознать то, что никогда ранее не встречал. Нейрон, отвечающий за определенное место, появляется только после того, как существо хотя бы раз посетило это самое место. Аналогичным образом модель добавляет клетку, отвечающую за какой-то объект, только после взаимодействия с этим объектом. Так что да, можно сказать, что мы помним не объекты, но события, не место, но опыт взаимодействия с ним. В голове нет и не может быть карт мест, где мы никогда не были.


      1. napa3um
        30.01.2022 19:48

        Вообще говоря может. Человекам доступны абстрагирование, индукция, синтез, экстраполяция (или тот механизм, тенью которого они являются :)). Люди умеют фантазировать, прогнозировать и способны к проактивному поведению. И табула раса младенца - не чистый лист, а эдакий сделанный эволюцией вида набросок карты тех мест, в которых этот младенец ещё никогда не бывал.

        Люди умеют моделировать реальность и рисовать её карты в своей голове. Но вы, наверное, пытались сказать о том, что сам этот механизм - лишь следствие более примитивных процессов :).


        1. Alexander428 Автор
          31.01.2022 01:51
          +1

          Существует мысленный эксперимент. Называется "Мария в чёрно-белой комнате". Мария – учёная, специализируется на цвете. Она знает всё, что можно знать: длины волн, неврологические эффекты, каждое возможное свойство, присущее цвету. Но она живёт в чб комнате. Она в ней родилась, в ней выросла и может наблюдать внешний мир только в чб монитор. Однажды кто-то открывает дверь и Мария выходит и видит голубое небо, зелёную траву, пёстрых оттенков всевозможные цветы. В этот момент она понимает то, что при всех её знаниях ей было не известно: она узнаёт какого это – видеть цвет.


          К чему это я? А к тому, что мысленная карта местности построенная путём экстраполяции, догадок и т. д. – это не то же самое, что мысле-карта полученная путём непосредственного взаимодействия с этой местностью.
          Ни один рассказ знакомого, ни одна карта не передадут в точности те образы, что появятся у вас в голове, когда вы посетите новое для вас место.

          Имхо, нейроны места имеют сильное отношение к рецепторам и непосредственному восприятию. Это потом уже на последующих уровнях анализа информации, на более высоких уровнях абстракции мозг "проводит знак равенства" между рисунком на карте и тем, как местность непосредственно воспринималась.

          Но всё-таки, это – более абстрактный уровень. В деталях образ карты на бумаге и опыт пребывания в каком то месте – это два разных образа. В каком-то смысле, на высоком уровне абстракции числа 2 и 3 равны, так как оба представляют собой натуральные числа. Но обычно мы считаем их разными. Ладно... уровни абстракции и концепция относительного тождества – это отдельная тема для разговора.


          1. napa3um
            31.01.2022 01:55
            +1

            Скорее всего сознание вообще не имеет дел с реальностью, только с фантазиями, слегка корректируемыми чувственным опытом :).


          1. engine9
            31.01.2022 05:08

            Такой эксперимент проводит и сама жизнь. В ютубе можно без труда найти видеоролики "реакция дальтоников, видящих впервые все цвета".

            Осторожно, для кого-то видео могут быть чрезмерно эмоциональными.


            1. dfgwer
              31.01.2022 05:34

              Но это все-таки не то. Эти люди смогли различить цвета, ценой сужения динамического диапазона. Грубо был 8-битный канал чб, теперь 2бита на красный, 2бита на зеленый, 2бита на синий, 2бита яркость. Вместо 256 оттенков серого, 256 цветов. Нет не так. вместо 256 градаций серого, каждому из этих серых транслируется свое из фулл RGB, и больше нет коллизий между 00ff00 и ff0000.

              ПС. Теперь хочу такие же очки, которые уф и ик преобразуют в видимый.
              ППС. Понял что такие очки существуют и называются очками ночного видения. Далеко не все из них используют и уф и ик. Но все-таки.


          1. dfgwer
            31.01.2022 05:52

            Я думаю, мы узнаем точный ответ на этот вопрос, проведя эксперимент.
            image
            Генетически модифицируем часть из этих клеток на производство другого пигмента, чувствительному к ближнему ИК или другому прозрачному для глаза длине волны.


            1. phenik
              31.01.2022 10:43

              Подобные исследования проводятся давно, но по этическим соображения в основном на животных, см. небольшой обзор на эту тему.


          1. phenik
            31.01.2022 11:14

            Ни один рассказ знакомого, ни одна карта не передадут в точности те образы, что появятся у вас в голове, когда вы посетите новое для вас место.
            Это не край фантазии) Представьте, что с помощью нейроинтерфейса непосредственно в мозг передается информация, например, о поведении квантовых частиц, и мы непосредственно воспринимаем суперпозицию их состояний или запутанность. По сути это новый искусственный орган чувств расширяющий наше восприятие реальности. Такое теоретически возможно благодаря нейронной пластичности на разных уровнях мозга. Если интересны подробности, см. этот комент (ближе к концу).


            1. Alexander428 Автор
              31.01.2022 11:39
              +1

              Это уже не рассказ и не карта. Это новый способ непосредственного восприятия, такой же как зрение, слух и информация от вестибулярки. И, конечно, это будет добавлять новые образы в сознание. Образы от нового органа восприятия. Хотел бы себе такую штуку)


          1. alex_dow
            31.01.2022 18:35

            Руки она свои можнет видеть? если уж зеркала нет


            1. Radisto
              01.02.2022 11:54

              это мысленный эксперимент, не имеющий отношения к реальности. В реальности такой человек вероятнее всего потерял бы способность различать цвета. схожие эксперименты к сожалению прводила сама жизнь: бельмо научились лечить не так давно и были случаи избавления человека от бельм в зрелом возрасте. Если в раннем детстве человек видел, то эксперимент проходил хорошо, с вау-эффектом и счастливо обретенной картинкой, если человек с детства был слеп (из-за бельма конечно, слепота должна быть не связана с сетчаткой),то начинались проблемы, человек не умел видеть, не мог отличить большую фигуру от маленькой, не различал формы или переставал их различать, стоило только изменить цвет или размер, не говоря уже о лицах, буквах или расстоянии. если операция проходила в детстве, умение видеть частично восстанавливалось, взрослые люди продолжали жить на ощупь как слепые при физиологически нормальном зрении. У Сакса и Хьюбела эти примеры были, если не вру даже с именами и возрастом пациентов. нейропластичность очень модна у популяризаторов но мягко говоря чудовищно преувеличивается


              1. Alexander428 Автор
                01.02.2022 13:12

                Бельмо – это заболевание, связанное, с помутнением роговой оболочки глаза. Такой человек видит не черно-белую картинку, а вообще плохо видит или не видит вовсе. Если врождённое бельмо вылечить, то зрительный центр мозга по-прежнему будет необучен воспринимать сигналы от глазных нервов. Естественно потребуется время на то, чтобы нейроны научились распознавать шаблоны, форму, размер и прочее. И чем взрослее человек, тем больше времени потребуется. Это еще раз доказывает значимость процессов нейрогенеза для обучения и распознавания: во взрослом организме они хоть и протекают, но гораздо медленнее, чем в детском. Именно поэтому ребёнок еще имеет шанс на частичное восставноление зрения, а взрослый – почти нет.

                Новорожденные, между прочим, тоже сначала видят лишь размытое изображение, затем, по мере адаптации, они начинают видеть чётку чб картинку и лишь к 4-6 месяцем жизни они начинают видеть мир «полноценно». Но, повторюсь, такая быстрая адаптация мозга у новорожденных обеспечивается за счёт более активного нейрогенеза, чем у взрослого человека.

                Мысленный эксперимент на то и мысленный, что его нельзя воплотить. Однако если бы существовали эффективные методы искусственного ускорения нейрогенеза, применяемые в лечебной практике, то взрослые с вылеченной лейкомой адаптировались бы к новым возможностям не сильно хуже младенцев. И тогда бы эксперимент с Марией был бы возможен в реальности, хоть и был бы антигуманным.

                Смысл эксперимента в другом. Его смысл показать, что косвенным, в том числе, логическим путём полученная мозгом информация создаёт иные нейроны и связи между ними, нежели непосредственный опыт взаимодействия с объектом, в данном случае с цветом.

                Да, сначала бы Мария вообще не воспринимала бы цветной мир. Но затем, у неё бы сформировалась бы отдельная нейронная подсеть (отвечающая за модель цвета) отличная от той, что появилась в ходе научного исследования всех длин волн и их свойств.

                Другими словами нейрон, активирующийся при наблюдении зелёного цвета, нейрон, являющийся образом λ=530 нм, и нейрон, отвечающий за словосочетание «зелёный цвет» – это три разных нейрона. Они связываются синаптическими связями, что и позволяет нам говорить, что все три объекта в памяти суть одно и тоже, но сами нейроны – разные.



              1. phenik
                01.02.2022 14:48
                +1

                нейропластичность очень модна у популяризаторов но мягко говоря чудовищно преувеличивается
                Наоборот, иногда нейропластичность мешает восстановить утраченные функции, т.к. отвечающие за них нейронные структуры перепрофилировались под другие, замещающие функции. Для слепых это обычно расширение восприятия звука, см. этот случай. Чем больше такой опыт, тем труднее возврат, т.к. адаптация происходит на уровне всего организма и выработанного образа жизни. То что вы описали относится к критическим периодам развития функций зрительной системы. Да, и преувеличивать роль нейропластичности тоже нельзя, иначе функции нервной системы будут терять устойчивость, целостность, могут встречаться такие экзотические случаи)


  1. napa3um
    30.01.2022 15:55
    +2

    Оч круто, идеи витают в облаках, strong-AI уже не за горами, и, похоже, выйдет сразу из множества "гаражей", а не из лабораторий больших корпораций :). Делаю что-то подобное, только питательные точечки на пространстве расселения колонии - это самый первый этап абстрагирования модели (прикладной задачи), самый первый уровень представления ландшафта приспособленности для проявления сложной эволюционной динамики, а дальше (для движения к strong-AI) надо обеспечить возможность клеточкам бесконечно самоусложняться и, тем самым, бесконечно усложнять фазовое пространство своей приспособленности (перебираясь из одной экологической ниши в другую учиться не только статичным узорам, но и нелинейно взаимодействующим друг с другом сложным моделям, постигать социальные и экономические закономерности, предсказывать будущее геополитических систем :)). Для этого можно обеспечить многоклеточность и вообще срисовать реальную биологию (и подождать триллиард лет, пока эмуляция родит нам разумных созданий), а можно абстрагироваться от биологии и дать возможность клеточкам сразу формировать "любые" фазовые пространства состояния генома популяции, отвечающие закодированным в факторах отбора прикладным задачам (нужно только хорошенько абстрагироваться от клеточек до циклов преобразования ресурсов, которыми клетки, по сути, являются). Не знаю, была ли понята моя шизофазия, но очень хотелось высказаться :).


    1. napa3um
      30.01.2022 16:28
      +2

      Да, эволюционная теория пола Геодакяна (и половой отбор) тоже пригодится для улучшения вашей модели (для усиления "разумного" "канализирования" эволюции), эффект "зелёной бороды", концепция гандигапа, рецессивные-доминантные гены, - это всё можно реализовывать по отдельности, а можно попробовать обобщить в более абстрактном принципе. Желаю вам успехов в развитии вашего проекта, мне кажется, мы идём по одной дороге :).


    1. Alexander428 Автор
      31.01.2022 02:13

      На мой взгляд, вы слишком ударяетесь в генетическую интерпритацию моей модели. Наследственность, мутации. В роли гена, если можно так сказать, здесь выступает массив координат клетки. Причем наследует она его не столько от родителя, сколько от источника питания. Это как если бы мы становились тем, что едим.


      1. napa3um
        31.01.2022 02:16

        Всё верно, я попытался вам "продать" абстракцию ландшафта приспособленности, который у вас сейчас, действительно, напрямую проецируется в геометрические координаты особи, генотип и фенотип у вас сейчас фактически одно и то же (а увеличивающаяся опосредованность их связи - ключик к бесконечному самоусложнению).

        Допускаю, что нафантазировал лишнего через призму своих собственных изысканий, и вы совсем иначе представляете развитие своей модели :).


  1. Tzimie
    30.01.2022 16:32
    +1

    Тем не менее Молисон, несмотря на отсутствие долговременной памяти, на автомате ориентировался в новом для него месте через какое то время. То есть ориентация - очень старый механизм с несколько другим методом запоминания

    Это возможно подтверждает написанное, но странно, что вы это не упомянули


  1. tsukanov-as
    30.01.2022 18:36
    +2

    Значит, восприятие работает несколько иначе (да, да, для кого-то это было очевидно), преобразуя непрерывную реальность в конечный набор дискретных образов.

    Возможно вам даст пищу для дальнейших размышлений статья: https://habr.com/ru/post/508550/

    Отдельная карточка не может содержать переменную величину. Например, плавное изменение цвета объекта будет отслеживаться как перемещение фишки по карточкам, каждая из которых представляет отдельный конкретный оттенок. То же самое с положением в пространстве. Благодаря этому в модели возможны противоречия, когда объект с точки зрения модели одновременно большой и маленький, или холодный и горячий, или зеленый и красный, или находится и тут и там. Любой объект может иметь любые свойства и любые их сочетания. Это право модели на ошибку, если угодно.

    И на тему клеток места возможно будет интересна статья: https://habr.com/ru/post/508756/


    В целом вы мыслите в правильном направлении, но, имхо, слишком много внимания уделяете самой идее дискретности. Как вы правильно заметили, для многих это очевидно. Имхо, куда продуктивнее принять дискретность за аксиому и пытаться строить дальше, потому что дальше становится на порядок сложнее. Например, вы упомянули клетки места, но совершенно ничего не сказали о том, как это должно работать.


    1. tsukanov-as
      30.01.2022 18:44
      +1

      Еще там в комментах я кидал статью: http://www.matbio.org/2015/Kazanovich_10_88.pdf
      Крайне рекомендую ознакомиться.


    1. Alexander428 Автор
      01.02.2022 13:20

      Спасибо. Изучу ваши статьи. Дискретность мною упомяналась так часто лишь по той причине, что сама идея дискретного аппроксиматора возникла прямо из необходимости решить проблему с перезаполнением памяти при взаимодействии с непрерывной (на макроуровне) реальности. Цель была основательно показать, что такая вот аппроксимация дискретным набором образов вполне справляется с поставленными задачами распознавания и иммитации. Доказать, что с таким предположением можно продолжать работать, что это не заведёт в итоге в тупик.

      В дальнейших своих изысканиях я уже положил дискретность в основу и исследовал механизмы образования связей между такими вот образами. Действительно, система, которая может качественно моделировать закономерности окружающего мира, выявлять наиболее абстрактные паттерны, должна быть не просто горсткой выживающих в конфигурационном пространстве клеток. Тема дискретности отступает на второй план.



      1. napa3um
        01.02.2022 14:26

        Да, биологические клетки убивать целыми популяциями какой-нибудь пчёлке, чтобы просто увидеть какой-нибудь цветочек с нектаром, было бы слишком расточительно. Скорее всего мозг освоил способы кодировать эти "клеточки" более дешёвым с биохимической точки зрения способом.

        Кортикальная колонка - наиболее подходящий биологический элемент, кажется, на роль такого механизма виртуализации отдельной клеточки в процессе эволюционного моделирования окружающей среды в мозгу, модулируемого сенсорными сигналами :). Кортикальная колонка имеет свои виртуальные координаты в пространстве абстрактных признаков, кодируемых паттернами сигналов, которыми колонка обменивается с соседними, и, таким образом, способна перемещаться по этим пространствам без физического перемещения в мозгах (а рождение и смерть заменяются на "просыпание" и "засыпание").

        Пространства в зависимости от топологии сигналов могут получаться неевклидовыми и даже невычислимыми/непредставимыми/противоречивыми. Например, можно построить пространство, являющееся в каждой точке эдаким ветвящимся фракталом, если "позволить" кортикальным колонкам операцию "умножения" сигналов (генерировать различимые сигналы А, Б, АБ, БА в ответ на входящие сигналы А и Б). А ведь на такой "схемотехнике" можно даже генетический алгоритм реализовать, причём даже "гладко упрощаемый" до этой самой базовой "схемотехники". Т.е., можно построить "эволюционно непрерывный путь" усложнения от отдельных "протокортикальноколоночных альянсов" какого-нибудь примитивного вида без централизованной нервной системы до централизованного мозга со специализированными альянсами и гиперальянсами нейронов, и на каждом шаге этого пути организация нейронов/альянсов будет полезна организму. :)


  1. Vernetti
    31.01.2022 01:54
    +1

    каждому явлению, с которым человек и его нервная система взаимодействуют, сознание ставит в соответствие некоторый ментальный образ, образ объекта из реального мира

    Мышление человека - инструмент сознания для анализа входящих данных с органов чувств, посредством осознания ( обработки этих данных) человек создаёт модель окружающего мира и множество субмоделей, как вы выразилась объектов, явлений и так далее.

    Поэтому есть такое понятие относительности всего в мире и мира в целом, ведь модель его и субмодели могут отличаться от человека к человеку.

    Стоит полагать, что в образе и в переходе к нему и содержится смысловая часть нашего восприятия.

    Ассоциация, да у человека сильно развито ассоциативное мышление, меньше нагрузки когда можно обратиться к каким то схожим по параметрам моделям, если модель неизвестного ещё не построена.


  1. phenik
    31.01.2022 13:46
    +1

    Мозг как дискретный аппроксиматор
    Можно также рассматривать с информационной точки зрения. При этом трактовать информацию, как корреляцию, в духе физика-теоретика К. Ровелли, см. эту публикацию, дополнительно.


  1. alex_dow
    31.01.2022 18:51
    +1

    Человек не взаимодействует с реальностью на осмысленном уровне. Он взаимодействует с моделью реальности. Информация в модели постоянно уточнаяется и дополняется, но прямого взаимодействия мышления с реальным миром нет. Поэтому существует время ракции на информацию, поэтому человек и может абстракно мыслить, в рамках модели. Есть конечно рефлексы - отдернуть руку от горячего (работа сердца, дыхание итп), они если и работают через модель, то это другая модель - некая базовая прошивка, она очень простая и маленькая, зато скорость реакции огромная, гораздо быстрее чем осмысленная реакция. Мы даже видим не непосредственно, а с "подмесом" - зрительная информация поступает в нкт - наружное коленчатое тело, и в него же подмешивается обработанный сигнал от остального мозга. Поэтому мы видим сны, зрительная информация циркулирует внутри мозга, не получая (почти не получая, все же дневной свет нас разбудит) внешнюю информацию. Мое личное мнение.


    1. Alexander428 Автор
      01.02.2022 02:18

      Но что тогда эта модель реальности? Если я правильно понимаю, получается, что есть окружающий мир, человек, и некоторый посредник между ними - модель. Напоминает идеи средневекового философа Н. Мальбранша, который считал, что наши ощущения, наше осознанное восприятие являются не прямым следствием внешнего воздействия, но работой Бога.

      «Не предмет, колющий нам руку, несет боль через отверстие, проделанное в теле, и отнюдь не душа вырабатывает в себе это неприятное ощущение, ибо она страдает от боли себе вопреки. Это Сам Бог посредством ощущения открывает нам все происходящее внутри и вне нас.»

      Я же лично, не вижу отделять смысл и восприятие от реальности. Осмысленный уровень не во взаимодействии с моделью, осмысленный уровень – это и есть сама эта модель. И да, она модифицируется и уточняется.

      Это не противоречит ни возможности абстрактно мыслить, ни возможности снов. Представьте себе сложную систему, в которой циркулируют сигналы, есть куча всевозможных обратных связей, но имеющую несколько выводов вовне. Мозг – как раз такая система.

      Смысловая составляющая процессов в мозге заключается в иммитировании (искаженном, потому что как указано в статье, мозг лишь аппроксимирует мир) процессов внешнего мира. Если два события связаны, их образы будут связаны и у нас в сознании. Между нейронами передаются импульсы, а на смысловом уровне мы имеем потоки ассоциаций, которые как кадры видео воспроизводят, что происходило с нами, воспроизводят закономерности внешнего мира, не на физическом, но на смысловом уровне.

      И теперь представьте, что мы отключаем эту систему от внешнего мира. Что будет? Верно, сигналы продолжат распространяться, а в сознании будет проигрываться «фильм», иммитация реального мира. Что это? – Сон.

      Я может излишне физикалист, но я искренне верю, что такие сложные философские вопросы, как «что такое сознание?» и «что такое смысл?» найдут свои ответы в рамках материалистического подхода, не привлекающего что-то ещё, кроме законов природы.


      1. alex_dow
        01.02.2022 10:05

        В депривационной ванной обычный человек может находиться не больше 15-20 минут, но есть люди, способные и несколько часов выдержать.


      1. napa3um
        01.02.2022 14:49

        Модель мира в мозгу - это вся топология сигналов, генерируемых нейронным субстратом под влиянием сенсорных сигналов. Забавно, что сама эта модель нефизична (не подчиняется законам сохранения, хотя и способна их "выражать"), несмотря на то, что "реализовывается" вполне физическим механизмом. Т.е., не выходя за границы материализма у нас рождается платонический мир идей и бессмертые души, влияющие на этот самый материальный мир :).

        Абстрактно способом рождения нематериального в материальном мире можно назвать опосредованность. Карта не есть территория.


        1. alex_dow
          02.02.2022 09:30

          Альфред Коржибски интересен и нагляден