На краудфайндинговой платформе Boomstarter.ru дан старт новому проекту двойного назначения, социальной и научно-исследовательской направленности. Вы можете поддержать наш проект словом и делом, внести вклад в отечественную науку. Принять участие в создании альтернативной архитектуры в противовес классическим компьютерам и операционным системам, разработанным за рубежом.

image

СИМ собеседник. Зачем это нужно?

Очень многие люди испытывают одиночество, в те или иные моменты своей жизни. Иногда одиночество даже приносит пользу, для переосмысления своих отношений с близкими людьми, для углубления в какую-то деятельность, требующую максимальной сосредоточенности. Люди ограниченные сильно в своих возможностях каким-нибудь недугом. Старики, по той или иной причине, лишённые внимания друзей и близких. Такие люди, не имеющие возможности работать, участвовать в каких-бы то ни было клубах по интересам, лишённые возможности постоянного общения, сильно страдают.

СИМ – собеседник может кардинально изменить ситуацию. Не важно, что это всего лишь машина и не сможет заменить живого человека, по определению. СИМ сможет стать тем, в ком нуждается подопечный. Ребёнком, которому нужен наставник, или партнёром в обучении иностранному языку. СИМ не станет отрывать своего собеседника от общества, наоборот подтолкнёт к поиску возможностей установления контакта с себе подобными. Да, хочу отметить, что такой собеседник, может быть очень полезен некоторым подросткам и даже людям среднего возраста, как своеобразное лекарство от депрессии, на много более эффективное, чем имеются нынче в обиходе. Может даже спасти кого-то от суицида. Пусть таких случаев будет единицы, но оно того стоит.

В чём вижу основную задачу?

Научить систему имитации мышления распознавать Образы и оперировать ими, внутри Коллекций, чтоб по некоторым признакам можно было определить, с чем СИМ имеет дело. Так, чтоб по тем же признакам аппаратно-программный комплекс мог подбирать действия для объектов. Так, чтоб интеллектуальный агент мог в модели окружения, сгенерированной в его памяти, располагать объекты, в соответствии с текущей обстановкой. Чтоб он мог отыгрывать время назад, вспоминая, как объекты располагались в прошлом и какие действия над ними совершались. Чтоб СИМ мог прогнозировать, как будут располагаться объекты в будущем, как будут взаимодействовать. Необходимо наделить систему неким списком глобальных задач жизнедеятельности и средств их достижения, на основе которых СИМ самостоятельно составлял бы для себя списки задач, распределяя их по приоритетам. Необходимо научить мыслящую машину, самой определять, какие действия она должна выполнить для реализации той или иной задачи.

СИМ собеседник, по сути, кроме как вести диалоги с подопечным и людьми из его окружения, ни как иначе воздействовать на объекты из внешнего мира не сможет. Поэтому для аппаратно-программного комплекса имитации мышления диалог, это самое важное в её существовании. Безусловно, интеллектуальный агент сможет читать электронные книги и просматривать интернет, возможно, ему даже стоит позволить общаться на форумах и в соцсетях, но это не должно для него быть на первом плане. Каждый диалог должен сохраняться в памяти, для возможности его повторного и углублённого анализа. В первую очередь для СИМ, как собеседника, необходимо быть интересным для подопечного, как можно меньше повторяться. Даже самая крутая шутка, повторяемая несколько раз, станет вызывать отвращение. Интеллектуальный агент должен менять темы в процессе диалога, но не слишком часто, чтоб подопечный мог успевать за ним.

Надеюсь, благодаря более углублённому распознаванию, мы сможем научить СИМ, не только понимать жесты и мимику, но и оценивать реакцию на сказанное им или другими участниками (родственник пришёл навестить, или сосед заглянул пропустить рюмашку) по интонации и тембру голоса. То есть системе нужно будет тонко вести нить диалога, так чтоб подопечный не просто нуждался в ней, как собеседнике, но и благодаря диалогу был в нормальном тонусе и состоянии духа.

На техническом уровне СИМ будет работать так

В интеллектуальном агенте, в разнообразных Коллекциях, будут возникать события, прерывания от устройств ввода и таймеров. Обработчики событий будут дёргать ускоритель или его эмулятор, заставляя его реагировать на данные события. Часть событий будет начинать обрабатываться непосредственно в ПК, к примеру, движение зафиксированное на камеру или звук зарегистрированный микрофоном. Существуют уже готовые алгоритмы и программы, которые могут осуществлять предварительную математическую обработку информации, а далее через драйвер информация пойдёт на логическую обработку в аппаратно-программный комплекс имитации мышления.

Таймеры будут напоминать о каких-то событиях, которые касаются нужд подопечного, лекарства принять, к примеру. Через драйвер список напоминаний будет записываться в отдельную базу данных, из которых уже средствами ОС будут формироваться таймеры. В интеллектуальном агенте будут идти постоянно несколько теневых основных процессов, обслуживающих глобальные цели жизнедеятельности, формируя задачи в соответствии с ними. Задачи будут генерировать наборы действий, или использовать готовые наборы из памяти. Цели, это, по сути, непрерывные циклы, а задачи – это небольшие программы с проверкой списка условий. Одни задачи могут порождать другие или наоборот менять условия уже решаемых, других задач.

При пропадании основного питания и сигнале с ИБП, или разряде аккумулятора в мобильном устройстве, состояние аппаратно-программного комплекса должно будет сохраняться в дамп на жёстком диске, а все процессы останавливаться, пока параметры не войдут в норму. То есть система будет засыпать (но снов видеть не будет, конечно). После аварийного обесточивания, интеллектуальный агент, при новом старте, будет проверять наличие предыдущих дампов памяти, которые потребуется создавать периодически. В этих дампах будут содержаться статические снимки состояния всех моделей в памяти, в определённый момент времени.

СИМ будет держать в оперативной памяти некоторое количество моделей окружения. Текущая обстановка и история её изменения. Параллельные виртуальные миры, отображающие рассказываемые подопечным, происходящие в недоступном системе имитации мышления месте, но выстраиваемые им, со слов собеседника. Все эти модели в четырёх измерениях дублируются на диск. Если разговор уходит в другую плоскость, модели удаляются из ОЗУ, в первую очередь те, что давно не упоминались, а СИМ создаёт новые модели, на основе вновь поступающей информации. При возвращении к старой теме разговора подгружаются созданные раннее модели.

Модели окружения представляют из себя образ помещения, транспортного средства, или открытого пространства, с расположенными в (на) нём образами объектов, с привязанными к ним образами-действиями. Соответственно каждый объект, по мимо данных о его расположении в пространстве, будет иметь привязку в четвёртом измерении: время появления и удаления из сцены, ключевые моменты взаимодействия с другими объектами.

Момент, связанный с обучением СИМ

Предварительно можно запрограммировать какое-то количество образов для поддержания простого диалога и соответственно осуществить привязку к английскому и русскому языку, в виде словесных описаний этих образов. При обучении, аппаратно-программный комплекс сможет самостоятельно перевести, при помощи интернет, описания образов, на другой естественный язык. Но конечно, для начала, надо будет добавить в его память, либо программированием, либо в виде описания на известном ему языке людей, основные правила орфографии и грамматики нового естественного языка.

Понятно, что любые результаты обучения и самообучения надо будет перепроверять, тем более на первоначальном этапе, при помощи носителей данных языков. Чем больше людей удастся привлечь к проекту, тем меньше на всё это уйдёт времени. У СИМ есть преимущество, перед обучением ребёнка, мыслящая машина сможет запоминать всё моментально, не нуждаясь в заучивании. Разные экземпляры СИМ можно учить разным естественным языкам и результаты объединять, копируя соответствующие части базы знаний.

Для проекта создаётся Язык Образов, который одновременно будет и встроенным языком программирования среды разработки искусственного разума. Отличие же от естественных языков и обычных языков программирования в том, что каждый Образ объекта будет намного более ёмкая единица (квант информации может чуть ближе по смыслу), чем если к примеру сравнивать существительные плюс прилагательные, или объект в ООП парадигме программирования, образ действия глагол плюс прилагательное (наречие) или метод в парадигме ООП. Образы намного ближе к человеческому восприятию сути вещей, более точно семантически должны объяснять те или иные понятия.

Индивидуальность СИМ собеседника определяется матрицей характера. По сути эта матрица регламентирует поведение машины таким образом, что каждый образ, имеющий свою эмоциональную окраску, по разному влияет на принятие решений аппаратно-программного комплекса, в зависимости от набора, заложенных при первоначальном программировании, черт характера. Таких матриц должно быть несколько, для того чтоб пользователь мог выбрать собеседника по душе, вернее на основе рекомендаций киберпсихолога. СИМ собеседник должен дополнять по характеру своего подопечного. Возможно так же организовать подбор характеристик при заказе, но тогда заказчику придётся ждать, пока новый экземпляр СИМ пройдёт предварительное обучение и проверку, прежде чем сможет работать со своим подопечным.
Поделиться с друзьями
-->

Комментарии (23)


  1. hoarywolf
    05.06.2017 16:23
    +7

    — Вот, изволите видеть, так называемая эвристическая машина, — сказал старичок. — Точный электронно-механический прибор для отвечания на любые вопросы, а именно — на научные и хозяйственные. Как она у меня работает? Не имея достаточных средств и будучи отфутболиваем различными бюрократами, она у меня пока не полностью автоматизирована. Вопросы задаются устным образом, и я их печатаю и ввожу таким образом к ей внутрь, довожу, так сказать, до ейного сведения. Отвечание ейное, опять через неполную автоматизацию, печатаю снова я.

    — «У мене внутре… гм… не… неонка». Гм. Что это такое — неонка?


  1. nerudo
    05.06.2017 17:00
    +4

    Чем бы дитя не тешилось, лишь бы не бюджетное бабло пилило ;)


  1. EvilGenius18
    05.06.2017 17:38
    +1

    Библиотеку то к Python никак не написать? Надо еще один язык программирования создавать с нуля…

    К тому же, ни одной математической формулы, какой вы там вклад в «научное исследование» собрались вкладывать?


    1. zpa1972
      05.06.2017 18:36
      -3

      Человек не мыслит формулами и алгоритмами, он их использует для решения типичных задач.


  1. buriy
    05.06.2017 17:51
    +2

    И сколько единиц смыслов вам по силе создать для вашего языка Образов?


    1. zpa1972
      05.06.2017 18:17
      -5

      Планирую через Конструктор Образов сформировать предварительную базу из Признаков, с более менее подробным словарём-описанием на русском языке, это будет от 300 до 500 смыслов (образов-признаков). Далее планируется начать эксперименты по автоматической инициализации Образов, на основе этих Признаков. Конечно придётся предварительно корректировать многие Образы в ручную, пока не удастся добиться приемлемого диалога, с СИМ, когда уже будет возможно обучение и самообучение системы через Универсальное Окно Диалога. Мне как раз нужна помощь программистов, чтоб сделать эти программы в виде вебстраниц на React/Redux, в качестве бэкенда будет Elixir/Phoenix


      1. wtigga
        06.06.2017 04:31
        +2

        Мне как раз нужна помощь программистов, чтоб сделать эти программы в виде вебстраниц


        Но ведь
        Автор проекта: Павел Зачеса
        44 года. 4 детей. Инженер-универсал, механик, электронщик, программист.


        1. zpa1972
          06.06.2017 06:49
          -2

          Вы, как переводчик, на всех языках говорите сразу?


          1. wtigga
            06.06.2017 07:50
            +2

            Ладно, слишком тонкий юмор был.


      1. buriy
        06.06.2017 11:25
        +1

        Обучение человеком — вполне можно делать, а вот самообучение, увы, не работает, сколько его не пытаются бутстрапить таким образом. (А если и начинает как-то работать — то его ошибки исправлять ещё сложнее, чем самому написать сразу без ошибок.)
        Например, в ABBYY Compreno тысяча лингвистов и программистов занимаются уже 15 лет тем же, чем вы собираетесь. В Яндексе, Гугле, Facebook занимаются. А до этого годами занимались во всяких Promt, AOT, CYC и прочих.
        Поэтому я не просто так спрашиваю, и не зря я ссылки на Витгенштейна давал в прошлый раз, чтобы вы понимали немного, что в языке не только и не столько «образы».
        Итак, сколько вы планируете сделать и откорректировать образов и признаков за вашу жизнь?
        Будет ли к закату вашей жизни ваша система знать хотя бы один язык на уровне обычного человека: 60 тысяч слов, 2 миллиона словоформ и 10 миллионов понятий языка (слов, выражений, абстрактных понятий и конструкций)?
        Попробуйте думать, как инженер, как вы с такой большой проблемой будете справляться.
        Ведь даже если вы будете по 100 понятий в день добавлять в вашу систему на основе Образов и Признаков, за 3 года это будет лишь 100 тысяч понятий.
        Ну а начать можете и без веб-интерфейса и без финансирования — в обычном текстовом файлике. Наверняка вас даже на месяц такой работы не хватит — ведь вам постоянно придётся всё переделывать, система начнёт разрушаться под собственной тяжестью, ведь наверняка вы в принципе не понимаете, что ваши Образы и Признаки будут содержать и как данная система будет работать за рамками придуманных вами примеров.
        Так что давайте лучше попробуем обсудить, какими в принципе могут быть эти Образы и Признаки, чтобы всё могло получиться.
        Мне кажется, тут будет удачной аналогия с постройкой моста: для моста нужны специально подобранные прочные материалы, точный расчёт, и уйма тяжёлой механической работы по подготовке и установке этих материалов.


        1. zpa1972
          06.06.2017 11:59
          -2

          Есть множество мелочей, разработанных для СИМа, они кажутся неважными, но в комплексе позволят решить проблему. К примеру, коэффициент достоверности знания, присваиваемый каждому варианту описания инициированного Образа. Это вроде называется обучением с подкреплением (?), когда одна и та же информация многократно дублируется, тем более из разных источников, её ценность повышается.


          1. buriy
            06.06.2017 12:22
            +2

            Коэффициент достоверности знаний был у системы CYC и аналогичных 25 лет назад. Увы, не помогло.
            >Когда одна и та же информация многократно дублируется, тем более из разных источников, её ценность повышается
            На практике, основная проблема языка — неоднозначность, в том числе, отличение описания фрагментов реальности от чепухи, лжи и фантазий.
            Одна из подобных систем с «самоподкреплением» NELL посчитала «internet cookies» видом печенья, и, поверьте, подтверждений этого неправдивого факта в интернете найти можно сколько угодно, но это не делает данное утверждение верным.
            Как вы будете побеждать именно эту проблему?
            Вот вам классический пример неоднозначности синтаксического разбора:
            «Я ел вчера пироги с Надеждой».
            Откуда компьютер поймёт, что вы не резали на кусочки бедную Наденьку и не готовили из них пироги? :)
            А то компьютер прочитает и добавит себе в базу данных «пироги могут содержать кусочки людей с именем Надежда». И подтверждений найдёт ещё в интернете и в своей базе данных: «действительно, пироги бывают с мясом, а в людях есть мясо => значит, пироги действительно были с Надеждой»!


            1. zpa1972
              06.06.2017 15:18
              -1

              На этот вопрос ответ напрашивается сам собой, я не зря пишу о том, что Признаки могут быть основными, как отражение сенсорных чувств, но и дополнительными, как отражение внутренних чувств. Поэтому «пироги с котятами» и прочие подобные выражения, уже не будут пониматься буквально, не просто потому, что котята не относятся к сельскохозяйственным домашним животным, а потому что… ну вообщем это очень плохо котят есть.

              Или к примеру классический вопрос, чем отличается красное от соленого и прочее.

              Прикольное тут на Гиктаймс сообщество, мне уже интересно сколько будут плюсоваться язвительные замечания в мой адрес и минусоваться мои посты. Давайте хомячки жмите на кнопку!


  1. nad_oby
    05.06.2017 20:57
    +12

    Зло прокомментирую.
    Из статьи создаётся впечатление, что Вы незнакомы с предметной областью, совсем.
    Для почти всех изобретенных здесь терминов есть принятые в научном сообществе.
    И если перевести на нормальный язык весь пафос теряется.
    Перевод ниже.
    "Привет человеки.
    Собираю деньги на систему которая будет состоять из чат-бота, schedule-ра и (барабанная дробь) ещё одной реализации world representation базы данных совмещённый с охренительным нечётким N-dimentional Prolog на котором и будет запилен сильный ИИ.
    Эта загогулина не только сможет поговорить с "Вашей Бабушкой" ™©® но сможет лайкать на фейсбуке и флеймить на форумах.
    Все будет написано на коленке за еду программистами, которых у меня нет пока."
    Нет слов, кроме матерных.


    А за идею нечеткого Prolog спасибо.
    Поищу в литературе.


    1. zpa1972
      06.06.2017 06:44
      -3

      Спасибо за ваше мнение и вольный перевод. Нечёткий Пролог говорите… надо запомнить.


  1. dead_undead
    05.06.2017 21:24
    +11

    А корованы грабить можно будет?


  1. Denkenmacht
    06.06.2017 04:18

    каждый Образ объекта будет намного более ёмкая единица (квант информации может чуть ближе по смыслу), чем если к примеру сравнивать существительные плюс прилагательные, или объект в ООП парадигме программирования, образ действия глагол плюс прилагательное (наречие) или метод в парадигме ООП.

    Позволю себе привести здесь как пример одну дисциплину, по которой мне когда-то лекции профессор читал, советую просто ознакомиться с темой для понимания, как люди придумывают/разрабатывают новые дисциплины, какими подходами пользуются, как создают мат аппарат.

    Вообще еще и собирать на такое деньги равнозначно сбору религиозных пожертвований, этому ощущению еще очень способствует продажа кепок, открыток, футболок и прочего сопутствующего.
    Может быть стоит просто книги писать, изложение в статье вроде не хромает, а на фантастике автор намного больше сможет заработать, чем на бумстартере.


  1. mimoprobegal
    06.06.2017 07:47
    +3

    По крайней мере, эмблема у вас уже есть. Депрессивная, похожая на работу школьника в бездуховном американском паинте. Зарубежье, должно быть, уже трепещет от страха.


  1. wtigga
    06.06.2017 07:58
    +1

    Кстати, а где описание

    альтернативной архитектуры в противовес классическим компьютерам и операционным системам
    ?

    Я ждал какого-то сильного аналога фон-неймановской архитектуры, как у того школьника из Ангары:
    Считаю возможным создание ЭВМ только на основе элементов памяти, — говорит школьник. — Для этого надо создать новую структуру памяти и запрограммировать в ней один, два и более существующих процессоров. В дальнейшем появятся новые конфигурации процессоров и ЭВМ.


  1. IronHead
    06.06.2017 08:40
    +3

    Автор еще и свое слово не держит. В прошлой статье написал:

    Это последняя моя статья, здесь на Гиктаймс,
    Пруф, последний абзац

    Если та была последняя, то эта после последняя?


    1. zpa1972
      06.06.2017 12:11
      -3

      Эту статью я не писал для Гиктаймс, а скопировал со своего сайта http://caiw.ru/sim-sobesednik/


  1. kogemrka
    06.06.2017 10:57

    Правильно ли я понимаю, что бумстартер работает так, что если вы не наберёте заявленную сумму на цель, деньги в итоге вам не попадут?


  1. Dmitry_4
    06.06.2017 14:05

    Судя по логотипу, связано с Яндексом?