Существующие алгоритмы работающие с о смыслом слов:

  • Векторное представление слов, GPT-3 - статистика

  • Алгоритм Леска - подбор значения многозначного слова по статистике встречаемости слов в предложении

  • Семантическая сеть - информационная модель предметной области, имеет вид ориентированного графа. Вершины графа соответствуют объектам предметной области, а дуги (ребра) задают отношения между ними. (см. рис. 1)

  • В других вариантах - по сути поиск закономерностей через нейросети.

Рис.1
Рис.1

Но, по сути, все что связано с пониманием смысла слов это статистика. Этими методами нельзя дать определение слова в том виде, как нас учат в школе. Определение слова "смысл" - сущность феномена в широком контексте реальности, неисчерпанная совокупность (в отличие от значения, которое исчерпаемо) всех психических (сознательных) когнитивных процессов, связанных со словом.

Для понимания смысла слова нужна какая то система отсчета (координат), но еще никто не догадался, что должно быть в ее осях. Либо люди пытаются связать одно слово с похожими, используя формулы и программы, но это всегда заканчивалось огромной программой в которой человек запутывался, да она (программа) не понимала смысла слов. При попытке написать определения слов для ИИ я столкнулся с тем, что незаметны базовые слова (на базе которых все можно объяснить), выходило что определения слов как бы зациклены по кругу. Вывод - классические рассуждения приводят к неимоверному усложнению алгоритма и тупику. Как я заметил никто из разработчиков ИИ не думал как в мозге организована память, да и глаголам мало внимания уделяли.

Базовые предпосылки и суть алгоритма

1. Надо понять, как выглядит память в мозге - в том, что мы видим, и в том, что мы моделируем. Это двухмерный массив, как бы карта, в его ячейках может находится несколько объектов, упрощенно говоря: под ним карта что было, над ним что будет. В некоторых ячейках связь с одномерным массивом (перечислением чего то). (см. рис. 2)

Рис.2
Рис.2

2. Надо понять, как мозг получает то, что мы видим. Зрительный анализатор передает информацию в виде названий предметов, что на фоне чего находится и каким глаголом оно с чем то связанно. Мы же, без проблем можем назвать любой предмет - что видим, его фон и предлог (глагол) взаимодействия с фоном или другими объектами. Т.е. все что мы видим уже распознано. Эти данные перебрасываются в карту того места, где мы находимся и мы крутя головой ориентируемся в пространстве.

3. Надо понять, что такое глагол и как он связан с памятью. Во первых, глаголы делятся на несколько разных несовместимых групп, например "перемещаться" и "радоваться" они оба создают модели, но они не совместимы. Глаголы имеют отпечаток в памяти и поэтому (см. рис. 3). Глаголы являются программами работы с памятью, создающиеся при обучении у детей.

Рис.3
Рис.3

Каждый глагол имеет 3 функции:

  1. он должен сработать в моделировании - мы что то услышали и смоделировали - поняли все нюансы ситуации.

  2. он должен сработать при понимании того, что видим - мы понимаем глаголы взаимодействия и расположения, а у субъектов их настроение и прогнозируем их поведение

  3. он должен сработать при желании нашего действия - в нашей двигательной системе есть шаблоны движений и мы воплощаем в жизнь свои желания (глаголы) - идем, двигаем и т.д.

4. Надо понять, что такое существительное и как оно связано с памятью и глаголами. Существительные делятся на группы, отличающиеся по базе на основе глаголов. Так же они делятся на субъекты (у них своя система моделирования и глаголы поведения разные (меняются)) и объекты (у них постоянные глаголы взаимодействия с миром). Каждое существительное имеет определение на базе глаголов, в нем говорится что оно может сделать и на этом основано его взаимодействие со всем остальным (см. рис. 4). Из за присутствия глаголов в определении существительного, можно легко понять его взаимодействия с реальностью. Что бы понять как существительное воздействует с реальностью, надо как на рис. 4 видеть его глаголы на 2ого уровня вложенности. - ЭТО ВАЖНО. Глаголы, на базе которых создано существительное, создают отпечаток в памяти и слова контачат друг с другом этими отпечатками. В ЭТОМ ВЕСЬ СМЫСЛ.

Рис.4
Рис.4

Система моделирования реальности в мозге изображена на рис. 5, там выходит что определения существительных и глаголов находятся отдельно и подставляются (или наоборот, при превращении модели в текст) в модель.

Рис. 5
Рис. 5

Примеры

Распознавание информации написанной разными словами. Рассмотрим абстрактное выражение см. рис. 6. Правило в мозге (оно должно распознать это выражение) "если дробь между цифр и равно после дроби, то..." - у каждого расположения (над и правее) есть шаблон и они связались. В условии используется слово между, которое имеет тот же оттиск, что и глаголы расположение/над (по сути это глагол) и поэтому правило распознает формулу, число 2 по определению является цифрой. Так условие распознает текст и его слова связываются с объектами (взаимосвязями). Позже, при выполнении правила используются понятые взаимосвязи.

Рис.6
Рис.6

Создание модели по предложению с одним глаголом имеющим разный смысл, см. рис. 7. В данном предложении дважды используется глагол "шел" - он является производным от глагола перемещаться. Шел в данном случае представляет собой глагол перемещаться с параметрами кто/что, направление, откуда/куда и для указанных существительных (снег и красноармейцы) эти параметры различны не смотря, на то что глагол один, но нужный вариант выбирается по параметрам. Определения глаголов и существительных вносят в модель кучу информации (время года и т.д.)

Рис.7
Рис.7

Понимание использования смысла существительного, в этом примере происходит подборка смысла по глаголам в определении

  • Ключ подошел, дверь открылась

  • Я напился из ключа

  • Жизнь бьет ключом (схожесть поведения (движений) радостного, прыгающего человека и маленького фонтанчика)

Понимание использования смысла местоимения, задача, заключающаяся в определении идентичности сущностей, упомянутых в тексте, тоже происходит подборка смысла по глаголам в определении. Например, "Я поеду в Киров на выходных." - cуть связывания, в этом случае, будет заключаться в соотнесении слова «Киров» с городом Киров, а не с человеком по фамилии Киров, или с чем-либо еще.

Есть существительные на базе времени, например: ход, зима, сейчас, минута. В топографической памяти есть несколько уровней - можно сказать что посередине настоящее выше и ниже карты прошлое и будущее связанные словами ход, сейчас, минута. К тому же времена года и дня это глобальные модификаторы правил реальности, многие глаголы по разному работают, они присутствуют в определениях слов наряду с глаголами. У времени есть алгоритм позволяющий сделать срез.

В модели используются прилагательные, они делятся на группы по своему смыслу и алгоритму, например социальные - тут присутствует модель объекта по умолчанию и прилагательное влияет на его глаголы. Пример - хороший студент (учится, не прогуливает), плохой студент (не учится, прогуливает). Сравнительные прилагательные, тут тоже присутствует модель по умолчанию больше/меньше. У некоторых прилагательных есть программа на базе глаголов - нижний/верхний.

У нас есть модель взаимодействия карты нашего тела с внешними объектами, что до чего дотрагивается, как меняется модель тела и как это можно описать словами. Например "А и Б сидели на трубе; А упало, Б пропало; что осталось на трубе?". Здесь А и Б рассматриваются как люди из за глагола сидеть, и в модели появились карты их тела, где указано с чем и как они взаимодействуют. Так как они упали и пропали в карты взаимодействия внесено изменение и мы понимаем, что на трубе пусто.

Есть существительные связанные с числами и емкостями см. рис. 8. Если рассматривать числа до 10 (или до 20, не зря они по своему называются), то в них выход на карту с соответственным числом вакантных объектов, размер числа более 10 мы понимаем как большие и работаем с ними по правилам.

Рис. 8
Рис. 8

При решении задач (см. рис. 9) в которых требуется абстракция (выделение одних свойств объектов) исходя из условий задачи используются нужные глаголы для выделения нужных свойств.

Рис.9
Рис.9

Если мы работаем с текстом и в нем идет повторение одних и тех же объектов (субъектов) то мозг пытается создать в модели лишние копии объектов, что усложняет понимание, поэтому используются местоимения. При работе мозг старается описать ситуацию более конкретным глаголом подразумевающим конкретное действие и объект (дать больше информации одним словом), хотя в основе работы мозга лежит небольшое число очень общих неопределенных глаголов. Так же надо отметить, что часть глаголов связанных с деятельностью мозга мы понимаем интуитивно (думать, забывать).

Есть глаголы и существительные описывающие взаимоотношения между людьми. Есть цель, чего мы хотим добиться от людей, выбирается модель поведения и появляется из нее слова типа кричать, оскорблять, командовать, помогать.

Понимание заведомо неправильных выражений из разных областей на базе похожести моделирования см. рис. 10.

Рис. 10
Рис. 10

Рассмотрим вопросительные слова:

  • Что, Где, Когда - тут поиск информации определенного типа по условию

  • Почему, Зачем - там в мозге со всеми событиями и объектами связано то, что думала личность об этом

  • Как - поиск модели для ситуации в памяти

  • Сколько - задается критерий выбора в модели, во времени, по условию, появляется связь посчитано.

Существуют сложные объекты, например дверь - она может быть в нескольких состояниях и взаимодействие с ней представляет из себя при моделировании несколько карт, и может быть переходом между картами.

Мною в статье Теория эволюции и работы мозга также описано устройство личности в мозге, эволюция алгоритма разума в нем и алгоритм работы зрительного анализатора. А в статье более подробно Искусственный интеллект описаны принципы определений частей речи.

Инженер Головин Александр Владимирович

E-mail: axelfl35@gmail.com

Комментарии (5)


  1. Upsarin01
    14.07.2022 10:02

    Когда задача сложная - упрощай или бери крайние случаи.

    Тут это слепой человек. Могут они вырасти относительно нормальными - да. Значит для понимания смысла не нужно видеть это. Достаточно слышать и говорить.

    Я думаю ответы нужно искать в слабо развитых племеннах, чтобы понять базовые принципы их взаимодействия. Ну или животные.

    Жесты, звуки и тд. А дальше думать как из этого рождается современный язык.


    1. Tim777
      14.07.2022 15:58

      " Точкой отсчета в истории обучения слепоглухих в России можно считать появление в 1884 г. слепоглухонемой воспитанницы в приюте для детей с глубокой умственной отсталостью (позже «Приют Братства во имя Царицы Небесной»), созданном знаменитой петербурженкой Екатериной Грачевой. Интуитивно, методом проб и ошибок, воспитателям удалось добиться хороших результатов в обучении девочки. В 1905 г. приют принял на попечение второго ребенка. Позже (1909 г.) было создано «Общество попечения слепоглухонемых в России», обеспечившее финансирование воспитания нескольких слепоглухих детей в других учреждениях Санкт-Петербурга, издание книг о слепоглухонемых и, наконец, открытие в 1910 г. в Санкт-Петербурге первого в России приюта для слепоглухонемых детей, в котором воспитывалось 7 детей. "


      1. KyHTEP
        14.07.2022 17:09

        https://ru.wikipedia.org/wiki/Загорский_эксперимент

        https://scepsis.net/library/id_960.html

        Вот более "свежее" исследование по этому вопросу


  1. Sklott
    14.07.2022 15:20

    Для понимания смысла слова нужна какая то система отсчета (координат), но еще никто не догадался, что должно быть в ее осях.

    Сами же выше написали, что есть векторное представление слов.

    А что есть векторное представление слова? Это точка в n-мерном пространстве. Вот вам и система координат.

    То, что вы не можете понять что по каждой конкретной координате измеряется, ну ладно, что в этом плохого? Ведь вам нужна не абстрактная координата, а относительная, относительно других слов. И вообще, может просто нужно "повернуть" систему координать так, чтобы было понятно какая координата за что отвечает и сразу все наладится?


  1. SaemonZixel
    14.07.2022 18:58

    Интересная статья. Плюсанул.

    Я тоже занимаюсь семантическим анализом текстов. И глаголы и существительные - это да, самое главное) Но я решил пойти пока-что более простым путём: захардкодить смыслы и логику глаголов, предлогов и саюзов.

    Есть ещё такая вещь как отглагольные существительные. Которые ведут себя в предложении как существительные и как глаголы.