Недавно мы с товарищем начали делать проект по цифровому бессмертию. Мы всегда были реалистами, и понимали, что два энтузиаста вряд ли создадут «нейролинк» для оцифровки нейронных связей, поэтому пошли уже привычным для подобных проектов путём — созданию чат‑ботов, основанных на воспоминаниях людей.

Мы рассуждали так — раз мы пока не имеем продвинутых технологий переноса мыслей в компьютер - используем то что есть. А есть у нас большие языковые модели, которые можно промптить так, чтобы они имитировали поведение конкретного человека. Контекстное окно у них довольно широкое, и инструкциям они следуют достаточно точно. Понятно, что даже в 128 тысяч токенов сложно уместить обилие воспоминаний и фактов, но тут мы поступили следующим образом: создали обыкновенную базу данных, которую пользователь может неограниченно наполнять ответами на вопросы, фактами и историями из своей жизни. Во время беседы, система распознаёт ключевые слова текущей темы разговора и подтягивает в промпт соответствующие факты. Кроме них, в каждый запрос к нейросети подставляется некое базовое описание личности (имя, профессия, хобби, интересы, убеждения и многое другое).

Насколько же аватар может быть похож на вас в разговоре? Всё зависит от того, сколько информации о себе вы заполните — чем больше, тем правдоподобнее получится. Этот процесс чем то похож на создание литературного героя, с вашей биографией. Только герой в данном случае становится интерактивным и с ним можно общаться.

Является ли личностью Шерлок Холмс? Мы сразу можем представить себе характер и поведение этого знаменитого персонажа, вспомнить фильмы, снятые о нём. Набор качеств детектива с Бейкер‑стрит является устойчивым сочетанием, которые явственно вырисовывают его индивидуальность. Точно также, мы создаём описание самого себя, а нейросеть с какой‑то долей достоверности пробует воспроизвести указанное поведение.

Да, наша душа волшебным образом не перекочует в аватара. Но, лучше создать правдоподобную имитацию личности, чем ничего. В конце концов, люди многие века воспитывают детей, надеясь, что потомки хоть капельку будут похожи на них.

Может быть, кому‑то это покажется не настоящим цифровым бессмертием. Ну что же, тогда вам следует дождаться других, более продвинутых технологий «оцифровки». Если дождётесь. Умных роботов в каждый дом обещали ещё во времена СССР, но пока этого не наблюдается. А вот прогресс в сфере LLM не стоит на месте, нейронки становятся все сообразительней, размер контекстного окна — больше, а доступ по API — дешевле. И, по аналогии с восстановлением замыленных картинок, в будущем, языковые модели смогут имитировать вашу личность всё более и более правдоподобно. Поэтому, начать собирать информацию о себе необходимо уже сейчас.

Теперь расскажем о самом проекте. После регистрации, нужно заполнить несколько разделов с вопросами. Это базовый уровень, который составит минимально необходимый набор информации. Но кроме него, существует возможность неограниченного пополнения вами фактов о себе, историй, загрузка фото и аудио‑записей.

Личный кабинет, где можно заполнить данные о себе
Личный кабинет, где можно заполнить данные о себе

В разделе Аватары можно поговорить с другими аватарами (включая своего).

Раздел с аватарами
Раздел с аватарами

Так как система использует API ChatGPT 4o, для бесед используется система токенов. За один запрос в нейросеть уходит не только ваше текущее сообщение, но и довольно большой промпт, собранный из фактов о вас.

Интерфейс чата на сайте
Интерфейс чата на сайте

Помимо сайта, есть возможность взаимодействовать с аватарами через Android приложение. Там можно говорить с ними голосом, а отвечать они будут вслух (используется движок синтеза речи от Google).

Скриншоты из Android приложения
Скриншоты из Android приложения

Кроме того, у нас есть Telegram - бот, где можно авторизоваться под логином - паролем от сайта, и вести беседы с аватарами через привычный мессенджер.

Скриншот телеграм бота
Скриншот телеграм бота

Зачем же нужны такие цифровые чат-боты?

На данном этапе - система позволяет легко и удобно создавать чат-ботов на основе фактов о вас, и ваших воспоминаний. Аватары могут служить приятными собеседниками, всегда готовыми поговорить на интересные для вас темы. Также их можно использовать как память для ваших друзей и потомков.

Но это ещё не всё!

В перспективе, мы хотим наделить аватаров некоторой самостоятельностью:

  • Возможностью ставить себе цели, и решать их исходя из имеющихся инструментов (интернет, мессенджеры, почта, написание и запуск скриптов на Python)

  • Возможностью оценивать результаты своих действий для их корректировки

Сейчас общение с чатботами проходит в формате вопрос — ответ (раздражитель — реакция). Для создания непрерывности мышления, аватар должен сам придумывать для себя следующий промпт, подставляя в него информацию из базы данных (внешняя память, не ограниченная размерами контекстного окна), знания из интернета, результаты своих действий, текущую основную задачу, и список дополнительных.

Если аватар продолжит какую‑либо деятельность (хотя бы в, сети), сохраняя характер, и память оригинала, приобретая новые знания, друзей, то это уже будет не просто интерактивная автобиография, а реальная цифровая сущность.

Мы планируем вести исследования в этом направлении, и следующая статья будет о возможных путях достижения аватарами самостоятельности.

У нас нет инвесторов, или какого‑то бизнес плана, мы — энтузиасты, и не являемся компанией. Большая просьба — в комментариях поменьше критиковать, и побольше предлагать интересные идеи на тему цифрового бессмертия.

Комментарии (21)


  1. Artur0Kildiyarov
    30.07.2024 07:21

    Классная реализация, есть ли в планах создать свою LLM, а не использовать API ChatGPT?


    1. virtperson Автор
      30.07.2024 07:21

      Мы пробовали свою LLM - она потребляет много ресурсов, а по интеллекту всё равно проигрывает крупным языковым моделям вроде Chat GPT


  1. serjeant
    30.07.2024 07:21

    Спасибо за статью, очень интересная идея! Скажите, а есть возможность развернуть вашу систему на своем железе? Не каждый согласится хранить всю информацию о себе где-то во внешнем хранилище. Тут и вопросы безопасности и отказоустойчивости.


    1. virtperson Автор
      30.07.2024 07:21

      Мы не выкладывали скрипты в OpenSorce, но на сайте есть возможность экспортировать заполненную информацию о своей личности, и использовать в любых локальных системах.


  1. yMad
    30.07.2024 07:21

    вроде не секрет что в процессе обучения ллм, ллм перенимает лингвистическую биометрию учителя или учителей


  1. Elpi
    30.07.2024 07:21

    Интересный подход.

    *

    Вы зря используете громкие лозунги типа "цифровое бессмертие". Точнее необходимо определять термины. В фантастике под созданием цифровой копии, насколько я знаю, понимают максимально полный перенос даже не сознания, а Самости. Поскольку в сознании манифестируется лишь очень малая часть мозговой деятельности. Т.е. требуется выявить содержание памяти, уникальных процессов в мозге данного человека и пр. А потом воспроизвести в цифре. Вам до этого далеко.

    *

    В текущем виде я бы назвал этот проект "Мечта пенсионера". Им же скучно. А тут сначала кусочками бесконечно в разных вариациях рассказываешь свою жизнь в БД. А потом общаешься с самим собой. Только еще голос нужно воспроизводить максимально близко (с приятными комплиментарными улучшениями, как в караоке) Это же прелесть:) Или для написания мемуаров.


    1. savostin
      30.07.2024 07:21

      Откуда вы знаете, что пенсионерам скучно?


    1. virtperson Автор
      30.07.2024 07:21

      Это не громкий лозунг, скорее некий стереотип - шаблон, которым называют подобные проекты. Если употребить какое-то другое выражение, многие не сразу поймут, о чем речь.

      В начале статьи, мы как раз и упомянули что до переноса сознания через "нейролинк" двум энтузиастам далеко - поэтому, делаем то, что можем на сегодняшний день )


  1. Wizard_of_light
    30.07.2024 07:21
    +2

    Вижу знамение и прорицаю, что в суровом будущем смерть не будет являться оправданием для закрытия проекта - соберут наиболее вероятную модель по цифровому следу и заставят её править свой говнокод.


    1. qw1
      30.07.2024 07:21

      Зачем ждать смерти? Склонируют автора в 20 копий и проект полетит на космической скорости.


      1. Wizard_of_light
        30.07.2024 07:21

        Тут главное чтобы они во мнениях сошлись, а то получим 20 форков.


        1. virtperson Автор
          30.07.2024 07:21

          Ещё и конкурировать начнут ))


  1. Elpi
    30.07.2024 07:21

    Есть альтернативный вариант. Физически клонировать индивида. И лет в 18-20 пересаживать мозг от предыдущего экземпляра.


    1. virtperson Автор
      30.07.2024 07:21

      Это уже возможно? )
      К сожалению, пока нет.
      Поэтому начинаем с малого, но хотя бы с чего то нужно начать
      А то пока мечтаем о клонировании, состаримся и вообще ничего не останется )))


  1. savostin
    30.07.2024 07:21

    «Товарищ майор» добавил ваш проект вас в закладки. Авось пригодится ;)


    1. virtperson Автор
      30.07.2024 07:21

      Служу России )))


  1. talgatSat
    30.07.2024 07:21

    Использовать API ChatGPT добавляет мусор в "сознание" . Т.к GPT знает вещи которые не может знать аватар


    1. virtperson Автор
      30.07.2024 07:21

      Базовая картина мира должна быть, так как способа перенести вообще все знания оригинала о мире в систему пока не существует.

      В настройках есть галочка, которая ограничивает фантазирование аватара о себе самом (то есть, чат-бот старается не выдумывать факты о себе, кроме тех, что заполнены юзером)


  1. aka352
    30.07.2024 07:21
    +1

    Идея интересная, но таким образом получится не цифровая копия личности, а скорее справочник о личности, что далеко не одно и тоже. Личность - это гораздо сложнее, чем набор фактов, это огромный набор психоэмоциональных характеристик, когнитивных особенностей, привычек и т.д. Многое из этого не формализовать в виде фактов и не загрузить в промпт. А без этого будет лишь сборник мемуаров "каким он парнем был". Куда более правильный путь, как уже указали выше, обучать LLM на контенте, сгенерированном человеком. Да, это не в пример сложнее, но можно брать за базу уже готовую модель и дообучать ее. Можно таким образом "клонировать" известных личностей, ушедших в небытие, но оставивших немалый след в виде текстовых произведений - писатели, политики и т.д. ЛДПР вроде уже делала цифровую копию Жириновского, правда что-то о ней давно ничего не слышно )


    1. yMad
      30.07.2024 07:21

      когнитивных особенностей

      ну, после обучения ллм, основная функция когнитивки будет отключена.) будет неплохой такой, почти как настоящий оригинал, балванчик)


    1. virtperson Автор
      30.07.2024 07:21

      - обучать LLM на контенте, сгенерированном человеком

      Это если человек генерирует оригинальный контент, а не просто, скажем, репостит на стену чужие цитаты в ВК

      По сути - самоописание - это и есть генерация контента, но сразу чётко и по делу