Я работаю в Сбере, в команде, которая развивает продажи в СберБизнес, интернет-банке для предпринимателей. Наша лента историй (stories) — главный способ помочь клиентам освоиться с продуктами и услугами банка и его партнёров: пользователь читает ленту, находит что-то интересное для себя, нажимает кнопку и подключает услугу. Помимо продуктовых внушительную часть нашей ленты занимают «познавательные» истории (interaction stories). Они дают советы по предпринимательской деятельности, посвящают клиентов Сбера в нюансы изменений законодательства, делятся выводами, рассказывают про интересные случаи. Подготовкой такого контента для ленты занимается сразу несколько команд. Это трудозатратно и занимает немало времени на разных этапах согласования. Хотелось этот процесс ускорить, но как? У нас появилась идея: пусть ИИ сам производит контент за нас. У него нет понятия «не могу или не умею», он сделает всё, что захочешь. Конечно, в разумных пределах.

Из чего состоит лента историй и почему она важна

Рекламные возможности СберБизнес

Истории — один из инструментов размещения рекламных и информационных материалов, используемых в СберБизнес для коммуникации с пользователями. Они есть в веб- и мобильном каналах.

Главный экран

На главном экране СберБизнеса расположена лента с продуктовыми и познавательными историями. Через последние можно информировать клиентов об изменениях, проблемах и новых законодательных нормах, давать интересную информацию. А через продуктовые истории можно рассказывать про новые и релевантные для клиентов продукты и услуги.

Бизнес-контент

При нажатии на предпросмотр открывается бизнес-контент с заголовком и остальными этажами. В нём содержится полезная для клиента информация: новости, вовлекающий, познавательный, обучающий контент, либо контент с информацией о продукте и его функциональности.

Пример продуктовой истории — Product Story Preview Web:

Пример информационной истории — Interaction Story Preview Web:

Контент interaction-лендинга в формате статьи:

Interaction + Product Structure

Для познавательных историй допустимы вариации в структуре. Могут использоваться как лендинги и слайды, так и только слайды по примеру продуктовых историй, структура которых описана выше.

Примеры Interaction + Product Structure Landing Web:

Почему прикрутили ИИ

Мы используем типовые приёмы и формулировки для создания interaction-лендингов, а это может негативно повлиять на вовлечённость клиентов. Да, иногда приходится осознанно жертвовать качеством в пользу количества. Причины мы описали выше. Какая из этого возникает потребность? Хочется делать много, разнообразно и быстро. Пути решения: нанимать много людей только под эти задачи либо пытаться автоматизировать процесс.

Про «классический» путь создания контента в разрезе типов

Тексты

Хочешь, чтобы было быстро — повторно используешь тексты из других каналов коммуникаций, либо используешь какие-то шаблоны для типовых interaction-лендингов: интересные статьи, инструкции, новости.

Картинки

То же касается и картинок. Как мы раньше разрабатывали дизайн:

  1. Предоставляешь исполнителю информацию о продукте, накидываешь референсы про конкретную тематику. Чтобы быстро выпускать много контента, дизайнер зачастую выдаёт что-то из готовой медиабиблиотеки, разнообразие сокращается, к тому же дизайнер пытается сохранить консистентность. Это напрямую влияет на качество, пользователям необходимо разнообразие.

  2. Присылаешь референс и говоришь «сделайте вот так»; например, скидываешь картинку телефона с интерфейсом и произвольной инфографикой на фоне. То есть просишь сделать так же, адаптировав под фирменный стиль.

Получаем картинки и выпускаем.

Были случаи, когда из-за сжатых сроков нужно было быстро подготовить картинку, и использовалось готовое изображение из библиотеки, которая раньше «шла» с другим interaction-лендингом. Так как картинка до этого уже показывалась клиенту, к ней возникала «баннерная слепота».

Как это работает

Тексты

Вначале мы использовали ChatGPT, так как в начале наших изысканий в этом направлении у Сбера не было собственных решений. Как была построена работа?

Постановка параметров в первых промптах
  1. Первый промпт про особенности и tone of voice коммуникаций от текстового стандарта нашего подразделения.

    • Правило № 1: Цифровой банк должен разговаривать с клиентом на понятном языке. В мире людей текст — больше чем просто информация. Это их мир, культура и чувства.

    • Аксиома № 2: Наш язык общения не должен быть языком машин. Наш тон не унижает. Наша информация не ставит в тупик.

    • Закон № 3: Мы верим, что наши продукты — партнёры нашего клиента. А надёжный и понятный партнёр — всегда залог успеха. Давайте двигаться к этому вместе!

    Описанные правила выведены из самых популярных ошибок на демо:

    • Не используйте канцеляризмы. Казённые слова и фразы, которые кажутся официальными и «статусными», на деле только размывают смысл текста и усложняют его. Чтобы облегчить усвоение прочитанной информации, не используйте глаголы «есть», «является», «осуществляется», «производится».

    • Избегайте наречия «успешно». В интернет-банке вы общаетесь не с разработчиком, а с клиентом. Не используйте наречие «успешно» в нотификациях или статусах об обработке запросов: все процессы в интернет-банке могут быть либо выполнены, либо нет. Дополнительно сообщать об успехе не имеет смысла.

      Прилагательное «успешный» использовать можно, но исходите из контекста.

    • Обращайтесь к пользователю. Не усложняйте прочтение текста использованием страдательного залога. Пользователю должно быть сразу понятно, кто и над каким объектом совершает действие. Но есть ситуации, в которых страдательный залог предпочтительнее: если описывается состояние объекта, то указывать действующее лицо не нужно.

    • Замените причастие и деепричастие на обычный глагол. В интерфейсе, статьях и историях избегайте причастий и деепричастий. Такие формы утяжеляют текст и делают его трудным для восприятия.

    • Границы между читателем и автором. Не пытайтесь принудить клиента использовать определённую услугу. Не решайте за него, он сам знает, чего хочет. Иначе клиент почувствует, что вы им манипулируете. Чтобы не нарушать границы клиентов, не навязывайте ему свои мысли.

    • Интернет и веб. В СберБизнес пишите слово «интернет» кириллицей и со строчной (маленькой) буквы. Само слово «интернет» при этом склоняется, и ставить перед ним «сеть» не нужно. Аналогично с приставкой «веб-»: пишите кириллицей и со строчной буквы.

    • Онлайн. Пишите только так: «онлайн». Кириллицей и в одно слово, без дефиса, лишних символов или заглавных букв (кроме случаев, когда это первое слово в предложении или часть названия сервиса или услуги). Англоязычное написание допускается также только для названий продуктов и сервисов.

    • Не кричите на клиента. Банк всегда спокойно общается с клиентами: без капслока и лишних восклицательных знаков. Если ситуация критичная, объясните её аргументированно и просто. Даже в статус-трекере восклицательные знаки не ставятся. Только в таблицах наименование колонок бледного шрифта можете писать капслоком, например «ДАТА», «КОНТРАГЕНТ», «СУММА», «СТАТУС»

    • Пишите «вы» со строчной буквы. Всегда и везде обращайтесь к клиенту на «вы» со строчной буквы, потому что с интернет-банком работает не один пользователь, а целая организация. Обращение на «ты» недопустимо. Обращение на «Вы» с прописной буквы в СберБизнес избыточно.

    • Пропуск местоимения. Часто местоимение вообще лишнее.

    • В конце важно написать Don't give a detailed response. Just write "..." if understood., иначе модель в ответе начнёт пересказывать содержимое требований и тратить драгоценные токены.

  2. Рассказываем про цель написания статей и даём технические требования к полям, для которых нам нужно сгенерировать текст.

    Пример написания новости

    Основные цели:

    1. подать информацию в максимально интересном виде и максимизировать CTR статьи;

    2. кратко рассказать клиентам о самом главном, о сути статьи.

    На основе этой новости подготовь контент для interaction-истории в соответствии с идеологией текстового стандарта СберБизнес. Необходимо написать тексты:

    • Цепляющий и интригующий заголовок для карточки предпросмотра (1 абзац, до 35 символов).

    • Цепляющий и интригующий подзаголовок для карточки предпросмотра (1 абзац, примерно 46 символов). Подзаголовок не должен повторять то, что рассказано в заголовке.

    • Заголовок для лендинга (не более 100 символов).

    • Начало и основная часть статьи (не более 250 символов).

    • Продолжение статьи (без ограничений).

Дальнейший процесс зависит от задачи.

  • Если тема узкая, то скармливаем вводную с нужными фактами и просим написать нужный материал.

  • Если тематика общая и допускается, что по теме уже есть много информации, то просим ChatGPT написать с нуля. 

Также необходимо помнить про ограничения: ChatGPT обучен до 2021 года, а GigaChat обучен уже на существенный срок позже, поэтому его мы активно используем для написания материалов на общие темы.

Картинки

Генерация картинок сегодня также возможна с помощью привлечения ИИ. Конечно, мы воспользовались и этим. Самый сложный вопрос — как скопировать существующий стиль иллюстраций истории? Какой выбрать генеративный искусственный интеллект для этой задачи? DALL-E 2 рисует в не совсем удовлетворительном качестве. Midjourney и Kandinsky 2.1 рисуют очень красиво, на пока что результат нас до конца не удовлетворил. Мы выбрали Stable Diffusion с огромным количество возможностей благодаря наличию Open Source-инструмента (Web UI). И заранее запустили процесс прохождения банковской бюрократии по поднятию сервера с нейросетью. Идти по стандартному пути выделения комплекса технических средств нам мешало использование нестандартного оборудования. Было трудно, но в конечном итоге мы победили и получили сервер с GPU промышленного уровня (генерация картинки со стандартными настройками занимает 1 секунду). Нейросеть развернули в Docker-контейнере.

Попробовали генерировать — отлично получаются очень абстрактные изображения, что нам чаще всего и нужно, но не хватает фирменного стиля. Занялись задачей его копирования. Изучили огромное количество руководств по способам тюнинга: дообучению модели, использованию Embeddings, Textual Inversions, Hypernetworks, Lora. Для всех перечисленных способов нужен набор картинок. Мы обратились к командам редакторов и дизайнеров. Но оказалось, что им подготовить такой набор непросто. Так как нам доступны все данные по всем ссылкам, по которым размещены картинки опубликованных в СберБизнесе историй, то мы написали простейший скрипт на Python для скачивания изображений. Вот результат:

Дальше нужно было подогнать картинки под требуемый формат 512х512. Для этого отлично подошёл сервис https://www.birme.net/.

Удобный интерфейс, вся обработка происходит локально без необходимости выгрузки данных вне контура банка. Затем мы пытались улучшить стиль генерируемых картинок через обучение своих Embeddings, Textual inversions и Hypernetworks. Результат для конкретной задачи вышел не очень удовлетворительным. Стиль стал больше похож на то, что нам нужно, но получались слишком абстрактные изображения.

Может быть, нужно было делать что-то иначе. Есть ещё идеи?

Идея!

В ходе очередного демо по правилам работы с визуальными решениями на нашей платформе к нам пришло озарение. У нас есть великолепная дизайн-система Triplex. Поискали в ней требования к иллюстрациям и нашли такую страницу. Выделили суть и перевели на английский, сохранили текстовое описание как новый стиль SberBusiness Technologic Futurism (функция Styles).

Кстати, можем поделиться советом: на основе получившегося текстового описания стиля можно попросить LLM придумать неограниченное количество новых интересных и уникальных стилей под заданные требования.

Стандартная модель SD выдала не самые красивые результаты. Поискали альтернативу, протестировали, начали использовать модель Deliberate. Результат превосходный.

Ещё одна из подзадач — получение метафоры, которая послужит самой значимой частью промпта для генерации основного объекта на изображении. С этим отлично справляется GigaChat.

Используем предложенные метафоры для генерации изображений с применением нашего стиля:

Отлично! Вот так один искусственный интеллект помог другому.

Показали результат дизайнерам, параллельно выяснили дополнительные непрописанные требования. Прописали в negative prompt запрещённые объекты. Безусловно, периодически получаются чересчур абстрактные и не совсем подходящие картинки. Иногда приходится «покрутить» разные метафоры и генерации изображений, чтобы получить нужный результат.

Итоговый процесс:

Что мы получаем на выходе

Прежде всего, мы обучили редакторов и дизайнеров и запустили A/B-тесты.

Получили истории про мошенничество и способы противостояния, сравнивали полностью сгенерированный текст с целиком написанным человеком. Превью истории, сгенерированное ИИ: 

Превью истории, сделанная дизайнерами:

Вторая партия — рекламировали Telegram-канал нашего интернет-банка. Здесь было попарное сравнение влияния сгенерированных:

  • текстов;

  • картинок;

  • текстов + картинок (вся история).

История, полностью сгенерированная ИИ:

История, сделанная дизайнерами и редакторами (вторая):

В обоих случаях по всем показателям сгенерированные истории не уступают. Выигрыш в time2market в 1,5-2 раза!

Заключение

Сейчас мы можем утверждать, что использование генеративного ИИ встало на поток в некоторых процессах по подготовке контента. Это позволило разгрузить часть дизайнеров и редакторов и дать им возможность переключиться на другие процессы, оставаясь минимально вовлечёнными для контроля качества производимого ИИ-контента. Также использование собственных ИИ-сервисов, таких как GigaChat, позволяет нам не выходить за контуры банка.

Таким образом мы сокращаем все те издержки, которые мы хотели сократить, и получаем возможность быстрого производства актуального и качественного контента. Как команда, мы готовы делиться экспертизой и с радостью ознакомились бы с примерами применения ИИ у других коллег.

Наши дальнейшие планы (уже в процессе, есть работающие прототипы):

  1. ИИ-зация подбора и подготовки контента для ленты историй.

  2. Прикручивание процесса поиска метафор и генерации картинок прямо в нашу CMS для бесшовной работы из одного окна. Все возможности для этого есть: в Stable Diffusion Web UI из коробки доступен достаточно гибкий API, в GigaChat также недавно появился API для внутреннего использования.

Комментарии (3)


  1. Anvano
    12.07.2023 07:12
    +12

    Если бы эти истории еще и отключать можно было - цены бы им не было.

    Я считаю, что в БАНКОВСКОМ продукте 80% полезной площади экрана браузера и тем более мобильного телефона должна занимать ФИНАНСОВАЯ информация клиента, а не "свистоперделки" банка.

    Вы хоть раз попробовали посмотреть на главный экран приложения с точки зрения клиента, а не программистов и менеджеров банка?

    Информация о счетах занимает крохотную амбразуру, дай бог процентов 25% от высоты экрана, вся остальная площадь забита совершенно ненужными контролами, не несущими никакой информационной нагрузки.

    Меня как клиента интересует в первую очередь способ быстро узнать информацию по всем своим счетам/картам с остатками /лимитами. А мне предлагают совершать для этого кучу лишних кликов и телодвижений.

    Приложение перестаёт выполнять свою основную функцию. Этим страдают сегодня мобильные приложения всех крупных игроков и банков и яндекса. В попытке превратить приложение в "всемогутный комбайн" разработчики забывают зачем вообще изначально оно создавалось и какая основная задача решается.


    1. spc
      12.07.2023 07:12
      -1

      "Спасибо за обратную связь! Уже провели митап с коллегами. Разработали сценарий и стратегию внедрения нового функционала: отключение историй про истории в историях. Планируем внедрить в виде лендинга с ИИ". /s


    1. dixi
      12.07.2023 07:12
      +2

      Особенно здорово, когда нужно на медленном интернете просто посмотреть баланс. Но нет, сначала нужно загрузить Истории.