В основном нейросети text to image применяют для генерации картинок для статей или для социальных сетей. Мы нашли интересный способ, как применить Mid Journey для нашего приложения.
В основном нейросети text to image применяют для генерации картинок для статей или для социальных сетей. Мы нашли интересный способ, как применить Mid Journey для нашего приложения.

Я - создатель сервиса Mind Tracker. Если простыми словами, Mind Tracker — это переосмысленный дневник эмоций. Год назад у нас был релиз. Вести дневник эмоций совсем не просто, эффект ты в среднем почувствуешь через 2-4 недели. Каждый день заходить и отмечать настроение, эмоции очень лень, а иногда даже бесит. Хотя это первый признак того, что уже начинается терапевтический эффект. Но в начале не про саму терапию, а как мы попытались удержать внимание пользователей и что у нас получилось.

В плане бизнеса мы пошли от геймификации и поощрения. За каждые 20 оценок внутри приложения пользователь получает индивидуальную сферу эмоций (пока расскажу про цифры, подробно о сферах эмоций чуть ниже). У нас была гипотеза, что если пользователя хоть немного награждать за труды, то он задержится. Так и получилось. Retention 7 дня у нас вырос на 20%, и самое главное Retention 30 дня на 43%. Мы как раз хотели повышать показатель удержания на 30-й день. Так же у нас начала повышаться виральность, пользователи стали делиться своими сфера в социальных сетях и с друзьями.

В двух словах о Нейро-сферах

В приложение Mind Tracker человек отмечает своё настроение, энергию, эмоции. На основе этих данных создается графическое изображение вашего эмоционального состояния в виде виртуальной сферы. Цвет сферы - это твоё настроение за последнее время. Форма сферы — это энергия, чем больше у вас было энергии тем сфера активней. Наполнение сферы — это ваши эмоции.

О промты мои промты

Промпт (от англ. prompt – «побуждать») – это запрос, подсказка, или инструкция – те вводные данные, которые вы набираете, когда общаетесь с нейросетью. От правильного промпта, то есть корректного запроса, зависит то, насколько релевантной будет информация на выходе

Задача сгенерировать приятную визуальную сферу, которая будет основываться на состояние пользователя за последнюю неделю.

Дефолтно, промт состоит из 3 частей: Голова, тело, хвост.

Голова

Здесь, чем проще начало, тем более контролируемый результат. Начал я банально со “Sphere, glass sphere”. В ходе экспиремента выявил ещё два параметра: “magic”, “abstract” которые задают основной тон и это именно та визуализация которая меня устраивала. Я хотел чтобы сфера была немного “загадочной” и её было интересно разглядывать.

Тело

Это дополнительные детали уже в основе композиции. У нас 3 основных параметра: Настроение, энергия, эмоции.

Настроение

Для настроения всё просто, у нас в приложении используется 7 бальная шкала, каждое настроение привязано к цвету. Например, плохое - красный, хорошее - синий. Поэтому с настроением было всё понятно. Какое у пользователя чаще всего было настроение за последнюю неделю, то слово и добавляем в промт. То есть при плохом настроение мы просто добавляем “red” в тело промта.

Энергия

Далее энергия, с энергией я нашёл для себя такие параметры: “Energy inside sphere, electricity” — когда у человека за последнюю неделю было много энергии. “Low Energy, Calm” - если энергии было мало.

Эмоции

А вот с эмоциями было сложнее всего. Во первых — это очень абстрактная сущность и её в целом тяжело визуализировать. Во вторых, MJ каждый раз пытался мне сгенерировать лица.

Дефекты. Вот такие результаты мне выдавала нейронка на “angry”. Как я говорил, она очень буквальна. И естественно это не то, что человек хочет видеть в своем дневнике эмоций.

От “angry” я полностью отказался. Перебирая десятки слов, остановился прям на базе-базе: “Calm, Joy, Sadness”. Принцип тут такой же, какую человек эмоцию испытывал чаще, то слово мы и вставляем в тело промта.

Хвост

Впервые когда люди начинают “трогать” нейросети, они забывают про хвост. Хвосте чаще всего отвечает за пространство вокруг основного объекта и качество изображения. Нейросеть слишком буквальна. И если ты напишешь “super quality, 4k” оно тебе выдаст действительно более качественную картинку. Можете сами поэксперементировать, сделать просто промт без хвоста и потом добавить например “4k, 8k, super quality, ultra details, best quality”. Помимо этих промтов, ещё существуют достаточно специфичные промты, но при грамотном использовании с ними тоже можно улучшить результат. Я сейчас не буду погружать вас в детали про рендер, движки 3D редакторов, но если в двух словах, то это выглядит так. Есть в 3D редакторах рендер, например: octane render, redshift, unreal engine - они считаются более реалистичными и качественными. Нейросеть обучали на изображениях с тегами. По этому когда вы добавляете эти ключевые слова, она делает их аналог. Если у вас изображение подразумевает 3D, то добавляя их результат становится лучше.

Важно:голова, тело, хвост — это абстрактные понятия, используемые для того, чтобы человек мог понять принцип работы нейросети. У самой нейросети логика другая: она учитывает “вес” слова. Чем раньше слово стоит в промте, тем выше у него “вес” и тем больше будет присутствия этого слова в итоговом изображении. Но при этом например в MJ существует отдельная механика для указания веса слова. Оно указывается через два двоеточия “::”. Например, если вам нужно изображение красно - голубое, но красного должно быть больше. Вы можете добавить следующее “red::0.7 blue::0.3”. Деапозон от -1 до 1.

Общие советы от меня

  1. Когда вы подбираете промты, пробуйте все синонимичные слова в начале. Не бойтесь делать длинные промты, через N итераций вы поймете какие промты работают лучше, а от некоторых можно избавиться и результат практически не изменится. Тут на самом деле большой простор для творчества. Никто не помешает вам использовать промты типа “electricity fire in deep space amazing” и порой самыми абсурдными промтами вы можете добиться нужного результата. Перебирая десятки слов в итоге находишь то, что нужно.

  2. Не используйте сложные языковые конструкции, забудьте о склонениях, почти не используйте глаголы. Существительные работают лучше всего.

  3. В хвосте промта не забывайте ставить “4k”, “ultra details”, “realistic” и подобные. Они улучшают картинку.

  4. Найдите идеальный баланс, чем короче будет промт, тем легче его будет масштабировать в дальнейшем.

    Техническая реализация

    Сразу отвечаю на вопрос почему не stable diffusion. В некоторых моментах SB не дотягивает до уровня качества MJ или нужна невероятно тонкая настройка. В MJ у меня быстро получилось достичь желаемого результата, который не получилось достичь в SB. Но при этом была самая большая проблема, у MJ нет ни исходного кода ни API, а всё взаимодействие происходит через discord. Мы взяли и написали бота, который отправляет запросы в discord. Путём экспериментов я составил таблицу на которую ориентируется бот и “склеивает” все нужные слова.

    А вы знали, что есть люди которые уже зарабатывают на своих промтах?) Они выкладывают изображение которое можно достичь их промтом, а ты можешь купить их промт за деньги чтобы использовать в своих целях. Мы стараемся максимально быть открытыми и с радостью делимся нашей незамысловатой таблицей

Изначально таблица была раза в 4 больше, но уменьшив её, результат стал лучше и более подконтрольный.

Цвет — это частота выбора слова для промта. Получилось достичь результата, при котором мы получаем практически 0% дефектов и нежелательных визуальных сфер. Например таких как в примере выше, с голубым злым шаром.

У нас стандартная подписка за $30 в месяц. Сейчас мы сгенерировали 30 000 сфер. В день примерно генерится от 500 до 2000 сфер. И фоново они постоянно генерятся, это похоже на огромный конвейер. Минус в том, что мы не можем делать на 100% уникальные сферы. Они достаточно уникальны и действительно подбираются в зависимости от того, что происходило у человека на неделе. Но мы например не можем учитывать события которые происходили у человека. В будущем мы хотим обучить SB уже на наших сферах, сделать разметку. Например, если человек взял отпуск и полный эйфории полностью прошёл Atomic Heart, сфера уже будет учитывать эти моменты и отображать события пользователя.

Про терапию

На каждом этапе мы консультируемся с психиатрами и психологами. Как минимум мы не хотим навредить, как максимум хотим улучшить ментальное состояние человека.

Самое важное — интерпретация сферы человеком. Познание направлено вглубь человека. Остается только связь "человек-человек". Что вы видите? Какие чувства испытываете? Что вас беспокоит? Прислушайтесь к себе, какие эмоции и мысли первыми приходят к вам в голову?

Когда человек видит визуализацию своих эмоций, он также испытывает эмоции, что стимулирует дополнительную рефлексию и самоанализ. Это особенно важно, когда процесс становится систематическим, вы начинаете замечать изменения. Например, ваша сфера стала темнее, чем раньше, появились новые элементы и формы — вы понимаете, что что-то происходит с вашим внутренним миром.

Также стоит учесть, что эмоции по своей природе абстрактны. Их визуализация и интерпретация может помочь вам по-новому соприкоснуться с ними и понять их сущность. В конечном итоге, это делает процесс самопознания более глубоким и продуктивным, расширяя возможности для личностного развития и самосовершенствования. Прислушиваясь к своим чувствам и мыслям, каждый сможет лучше понять себя и свои внутренние переживания.

Люди делятся

Иногда словами сложно объяснить свое состояние, а такая визуализация может помочь. Вы можете попросить своего близкого человека найти сходства между вами и вашей сферой. Это ещё один интересный способ познания друг друга и ваших эмоций. Люди всегда находят закономерности. И вы можете удивиться тому, какие связи найдет ваш близкий человек. Или вы можете спросить об этом своих подписчиков в сторис. Поверьте, вы удивитесь и получите те инсайты, о которых раньше не думали ;) Это про то, как вас воспринимает окружение.

Нас очень удивило, как часто люди делятся своими сферами. Вчера мы выяснили, что часть пользователей сделали для себя специально чат куда скидывают сферы. Они радуются первой полученной сфере. Благодаря этому, люди остаются и заводят привычку пользоваться дневником эмоций чаще.

Экспериментируйте с этим, возможно вы найдёте ещё более интересные способы применения. А они наверняка есть :) Мы постоянно стараемся развивать Mind Tracker. Мы читаем все отзывы и на все отзывы стараемся отвечать. И всегда очень вам благодарны за обратную связь. Мы продолжаем делать продукт для вас. Дальше больше и лучше!

Ссылка на приложение — https://mindtracker.page.link/install

Наш Telegram (здесь мы рассказываем про новые фичи, делимся исследованиями и раздаём будущие премиум фичи которые тестируем) — https://t.me/mindtrackerru

Ладно, а теперь серьезно. Вот как, на самом деле создаются сферы эмоций:

Это достаточно сложный и высоко технологичный процесс. В начале, сфера эмоций проходит инкубационный период. В этот момент всё ментальное состояние человека инкубируется и поступает, как сок, насыщая сферу. Изначально сфера совсем маленькая, но по мере наполнения, постоянно приходится менять стеклянный каркас. В итоге она вырастает от 3 до 10 метров. Затем производственный процесс делится, в зависимости от материала сферы.

Твердые сферы — наши специалисты вручную полируют и красят каждую сферу, после чего отправляют её к визажисту и фотографу.

Плазменные сферы — сферы у которых очень много энергии, они наблюдаются исключительно в лабораторных условиях, под присмотром ученых, с ними необходимо обращаться максимально осторожно.

Органические сферы — такие сферы сразу же помещаются в металлических каркас. После чего, их вывозят на специальных грузовиках в естественную среду и уже там устраивают фотосессию.

И только после всех этих длительных, кропотливых процессов, сфера попадает пользователю в телефон. И никак иначе.

;)

Комментарии (3)