Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили. 

Меня зовут Артём Попов, я — руководитель отдела маркетинга в интернет-магазине xcom-shop, и сегодняшний пост отражает отношение потребителя или, если хотите, заказчика графики. У дизайнеров постоянно не хватает времени на то, чтобы выполнять запросы всех бизнес-юнитов, а нам постоянно хочется чего-то этакого… Может, заказать отрисовку нейросети?

Раньше никто и не задумался бы о таком решении, но сейчас тема явно находится в зоне хайпа: про нейросети не слышал только ленивый. На прошлой неделе вышел лонгрид о возможностях нейросетей, позже мы всем рунетом ужасались реалистичностью “последнего селфи на Земле”, сделанного “руками” DALL-E 2. А благодаря тому, что редакция портала 72.ru поэкспериментировала со словами запросов, жители Тюмени (и все, кто неравнодушен к Тюмени) смогли взглянуть на свой родной край “глазами” нейросети MidJorney — результаты можно посмотреть тут.

Какую нейросеть выбрать?

Признаюсь честно, мы тоже все это читали и смотрели. И даже вдохновились качеством и глубиной сгенерированных картинок. После этого оказалось просто невозможно пройти мимо (мы ведь работаем в сегменте высоких технологий и должны идти в ногу со временем). А значит, мы в xcom-shop просто обязаны попробовать работу с нейросетью. 

Так начался выбор оптимального для нас решения. В фокусе оказались две наиболее раскрученные на данный момент системы. Ниже я постарался свести в единую таблицу их характеристики/плюсы/минусы:

Нейросеть

DALL-E 2

MidJourney

Разработчик

OpenAI

MidJourney (независимая группа разработчиков)

Дата запуска, текущий статус

20 июля 2022 (закрытый бета-тест) 

13 июля 2022 (открытый бета-тест)

Максимальный размер изображения

PNG, до 1024x1024 пикселей

JPG, до 1664x1664 (или другой до 3 миллионов пикселей)

Возможность менять масштаб

нет

да, можно задавать пользовательский размер изображения

Доступ

API (причем доступ из РФ закрыт)...тоже мне OPEN

Discord

Права на использование в коммерческих целях

Полные права на все сгенерированные изображения

По подписке (для компаний с оборотом от $1 млн. в год стоит $600)

Бесплатный лимит, стоимость

50 запросов в месяц, далее 115 запросов за $15

25 запросов бесплатно, 

далее по подписке

Субъективная оценка удобства работы с запросами

Нейросеть более чутко схватывает суть сложных запросов

Очень хорошие изображения даже по простым запросам

Субъективная оценка качества изображений на выходе

Удовлетворительный уровень качества и детализации итогового изображения.

Высокий уровень качества и детализации итогового изображения.

Но я практически уверен, что моя субъективная оценка вас не убедила. :) Делюсь изображениями, которые мы получили в ходе тестирования нейросетей по одним и тем же запросам:

Несмотря на то, что DALL-E 2, кажется, более тонко схватывает все нюансы запросов и, по моим ощущениям, дает более релевантные сложным текстам картинки, наш выбор все-таки пал на Midjourney. И на то несколько причин.

Главная — мы всем коллективом очарованы тем, как MidJourney видит наш xcom-shop в будущем.

Во вторых, этот вариант реально доступен для бизнеса без заморочек с VPN и правами на коммерческое использование. Заплатив $600 (714 с учетом налога) за корпоративный тарифный план, мы тут же отправились тестировать алгоритмы AI. Это, кстати, очень увлекательно, и в первый вечер я пересидел на работе 3 часа сверх нормы, играясь с веселыми картинками…зато ехал домой без пробок. ;)

Интересный факт, мы первые? Да!

“Автор, ты о чем?" — скажете вы. — "Уже многие компании использовали нейросеть для генерации изображений.” И будете правы! 

Например, Cosmopolitan заказал обложку алгоритму DALL-E 2 — получилось очень даже неплохо. А ранее The Economist использовал ИИ-бота для создания обложки тематического номера о современных цифровых технологиях. И не забывайте про “особого дизайнера” студии Лебедева, Николая Иронова, который уже больше года выполняет самые разные работы для заказчиков.

Но все они не интернет-магазины! И, судя по всему, мы — первый интернет-магазин в России, реально применяющий нейросеть на своем сайте. И не просто один раз разместив какой-то элемент, а на постоянной основе (само собой, мы ж подписку на год оплатили).

Решение практических задач

Что касается задач, мы решили не придумывать каких-то специальных выкрутасов для нейросети — я наигрался с ними в первый же вечер. Вместо этого мы сфокусировались на своих текущих потребностях. А именно - “подсветке” на сайте недавно выпущенного подборщика блоков питания.

Вообще это обычная практика — мы размещаем баннеры на главной и в соответствующем разделе каталога. Вот именно их создание мы и поручили нейросети.

На баннере нужно было показать креатив, связанный с блоками питания ПК, мощностью и энергией (сервис подбирает оптимальный БП под конфигурацию системного блока). Имея эти образы в голове, мы с дизайнером Ярославом Шиловым начали перебирать запросы для нейросети.

Вот несколько наших запросов и полученный для них результат:

На каждый запрос нейросеть представляет четыре варианта изображения на выбор. Это оказалось очень удобно: можно сразу сделать выбор и на основе понравившегося варианта получить ещё четыре скетча. А если какой-то вариант устраивает, можно улучшить его в качестве (сделать апскейл разрешения).

В запросах к Midjourney можно дополнительно указывать разрешение итоговых изображений, преимущественные цвета, художественный стиль и многое другое.

В поисках необходимого изображения было сделано более 30 запросов. Иногда нейросеть выдавала совсем неподходящие варианты, возможно из-за нехватки с нашей стороны опыта в написании запросов. Так что для планомерной работы (но крайней мере нам сейчас) нужен большой запас запросов. Но в итоге, уловив правильное направление, нам  удалось прийти к желаемому результату. 

На первом же опыте мы убедились в том, что нейросеть может ускорить рабочий процесс дизайнера. Обычно специалист тратит много времени на поиск идеи, графические ресурсы в открытом доступе и прочий креатив. Мы же в итоге решили эту задачу вдвое быстрее. Ну и, конечно, дизайнер получает уникальные материалы для дальнейшей работы, и ее результат будет отличаться от всего, что есть в сети. 

Да, в подборках встречалась какая-то ерунда. Но, проработав несколько запросов, волшебным образом мы получили то самое изображение, подходящее под нашу тематику.

Несколько доработок, добавляем текст, адаптируем под нужное разрешение - и вуаля! Картинка для баннера готова. И баннер уже красуется на нашем сайте.

Нейросеть – вдохновитель дизайнера

Помимо графики, которую дизайнер сможет использовать в своей работе, нейросеть обладает еще одним удивительным свойством, а именно – генерирует идеи. Для любого творческого специалиста это отличное подспорье. И мой коллега, дизайнер Ярослав Шилов подтвердил, что это именно так. 

В процессе работы с AI сложно не заметить, что некоторые изображения действительно бьют “прямо в точку”! Невольно задаешься вопросом – как раньше мне это не пришло в голову? Так что нейросеть совершенно точно можно использовать как бесконечный источник мыслей для вдохновения.

Дальше — больше

Итак, мы получили вполне себе положительные результаты эксперимента по использованию сгенерированных нейросетью изображений на нашем сайте и готовы идти дальше и масштабировать полученный результат. 

Однозначно, мы будем применять технологию для подготовки email-рассылок (следующую нашу еженедельную рассылку мы полностью составим из сгенерированных изображений, подписывайтесь).

Также будем генерировать визуалы наших постов в соцсетях исключительно через нейросеть. Весь август вести группы xcom-shop нам будет помогать робот. И для знатоков работы нейросетей мы приготовили забавный конкурс: Первый, кто угадает запрос, по которому мы сгенерировали изображение для поста - получит 1000 баллов на свой бонусный счёт, все подробности у нас в телеграм, ВК и Яндекс.Дзен.

Выводы

Конечно, пока рано говорить, что нейросеть способна полностью заменить дизайнера. Но уже сейчас искусственный интеллект может упростить работу специалиста, ответственного за подготовку графики. Ведь на отрисовку иллюстрации обычно и уходит большая часть времени дизайнера, а с этой задачей нейросеть уже сейчас справляется если не отлично, то уверенно хорошо. Важно только найти правильный подход и научиться формулировать запросы.

С другой стороны, пока роботу непосильны как минимум такие стандартные дизайнерские задачи, как набор текста, работа по брендбуку и правильное размещение логотипов. И тут как раз выручает дизайнер, который уже адаптирует сгенерированные AI изображения для решения вполне конкретных бизнес-задач. 

Возможно, скоро мы увидим в резюме дизайнеров в дополнение к привычной креативности, многозадачности и стрессоустойчивости (ну или виртуозного владения графическим пакетом Adobe/Corel) приписку вроде “уверенно ставлю задачи нейросети”. И как знать, может быть именно это станет конкурентным преимуществом при приеме на работу. 

А вы что думаете про результаты нашей работы с нейросетью? Делитесь в комментариях, давайте обсудим!

Комментарии (35)


  1. keydach555
    02.08.2022 15:40
    +4

    Неплохая попытка привлечь внимание к своему магазинчику на волне хайпа с нейросетками-дизайнерами ) Весь вопрос в том, что скоро, через год-два, ВСЕ сайты, сайтики и лендинги станут одинаково чудо как хороши и покупатели уже не смогут выбирать продавца по качеству дизайну. Для дизайнеров это безусловно плохо, для владельцев маленьких частных бизнесов в сети - на начальном этапе безусловный плюс, дальше по мере роста количества таких сайтиков из-за упрощения разработки - безусловный минус ) Выиграют большие торговые онлайн-платформы, остальные со временем проиграют


    1. art-popov Автор
      02.08.2022 16:00
      +3

      Вы, конечно, замахнулись загадывать, что будет через годы, особенно в нашей стране) Но в чем-то я с вами соглашусь, потребители уже выбирают магазины не по обертке, а по качеству сервиса, скорости работы, экспертизе консультантов, удобству доставки, ассортименту и другим не связанным с дизайном параметрам.


      1. keydach555
        02.08.2022 16:05

        Потребители, еще не имеющие опыта взаимодействия с вашим замечательным магазином, а это по идее, для маленьких и средних магазинов 99% аудитории - выбирают только по визуалу, ну и возможно по удобству интерфейса и скорости загрузки.


      1. ghostinushanka
        02.08.2022 16:15

        потребители уже выбирают магазины не по обертке ...

        А есть в довесок к этому утверждению соответствующие данные? Хотелось бы, конечно, чтобы оно так и было, но сколько ни смотрю на классический ритейл, не вижу таких тенденций.


        1. art-popov Автор
          02.08.2022 16:27
          +4

          Могу привести наглядный пример - знаменитые сайты, через которые можно заказать продукцию из Китая. Сказать, что там продуманный интерфейс, классный дизайн и удобная навигация нельзя, но при этом их популярность только растёт из-за вполне понятного преимущества.


  1. Medeyko
    02.08.2022 16:18
    +1

    Вы так сформулировали, что может показаться, что Вам не нравится, что покупатели перестанут выбирать продавца по качеству дизайна интернет-магазина из-за того, что он везде будет на высоком уровне.

    На мой же взгляд, это отлично! Это же совершенно неважный параметр для последующего использования купленного товара. Вот бы избавиться ещё бы и от других методов втюхать покупателю посредственный товар задорого!

    (А статья хорошая, практический опыт использования штук, которые на слуху, всегда интересен.)


    1. keydach555
      02.08.2022 16:32
      +1

      Да, не очень удачно сформулировал. Мне самому в принципе, как владельцу подобного мелкого сетевого бизнеса это на руку, но как представишь, что начнется когда в сеть придет куча левого народа, зайдет на условный гибрид dalle-3 и copilot, напишет что-то типа "нарисуй мне интернет магазин по продаже (чего-нибудь), очень очень продающий, цифровой арт, открытие года, top-3 мировых интернет-магазинов" и получит реально хороший продающий магазин ))) все это приведет к очень простой вещи - росту цен на рекламу и вымывание мелких и средних бизнесов в пользу больших торговых интернет-платформ типа яндекс.маркета, озона итд


    1. art-popov Автор
      02.08.2022 16:34

      Спасибо) Вы правы, неоднозначно получилось. Дизайн крайне важен, ведь встречают, как говорится, по обертке. И именно поэтому мы уделяем столько внимания дизайну, оптимизации интерфейсов и user flow. Но кроме дизайна есть и другие аспекты, которые тоже влияют на выбор и не менее важны - я это хотел донести


  1. Alisun
    02.08.2022 16:28
    +1

    Крутая штука, попробую тоже сделать пару баннеров для работы. Выглядит впечатляюще)


    1. art-popov Автор
      02.08.2022 16:35

      Обязательно пробуйте, покажите потом, что у вас получилось


  1. xshd
    02.08.2022 17:42

    мне вот интересно, я получил инвайт на dall-e, но при прохождении верификации и указании российского номера сразу выходит сообщение - недоступно в вашей стране и после уже не логинится


    1. art-popov Автор
      02.08.2022 17:49

      Да, в РФ их апи не работает, только если через посредников как-то выходить


      1. dm_deko
        03.08.2022 00:37
        +1

        И как вы это преодолели?

        Давайте уже делиться - так по полной)))


        1. art-popov Автор
          03.08.2022 06:06

          Да легко) в начале моей статьи ссылка на лонгрид, там автор игрался с запросами dalle, а снизу есть контакты того, кто доступ предоставил - ему в телегу и написал


  1. Eugeeny
    02.08.2022 17:43

    Еще бы запрос на грамотном английском без ошибок написать для сравнения.


  1. technik
    02.08.2022 21:30

    А насколько релевантные результаты выдаёт сетка MidJourney, если попробовать генерировать изображения товаров? Для уникализации изображений товаров было бы самое то :)


    1. art-popov Автор
      03.08.2022 06:08
      +1

      вот как раз сами товары пока отрисовывает неоднозначно, например, “IPhone 13 pro max”


    1. delaklo
      03.08.2022 13:10
      +1

      IMac late 2026 concept
      IMac late 2026 concept

      Right-top пикча мне понравилась


  1. Smooke_ju
    03.08.2022 06:09

    Специально зарегался. Вы там товарища в непопулярных паттеррнах обвинили. В целом паттерн многих запросов в каментах можно одним словом задать,ну или двумя. (хотя на эту тематику больше всего пик ей изобразил человек)

    Heaven.

    God

    Самому бы хотелось увидеть

    The end of infinity/ Infinity cap.

    Только не фракталы, пожалуйста!)


    1. art-popov Автор
      03.08.2022 06:11
      +3

      А что, неплохо получается)

      The end of infinity
      The end of infinity


  1. Tarakanator
    03.08.2022 09:07
    +3

    Ждём сервис по печати на одежде уникальных сгенерированных изображений. Т.е. пользователь приходит, генерирует принт на футболку и печатает себе уникальную футболку. Только надо чтоб не квадрат печатать, а сразу во всю поверхность. Типа так https://printbang.ru/img/products/75/muzhskaya-futbolka-dune-2000-75371.jpg


  1. Tarakanator
    03.08.2022 10:53

    Не смог я его заставить ringworld нарисовать. Может кто знает какие ключевые слова ещё попробовать?


    1. art-popov Автор
      03.08.2022 11:45

      Вот что у меня выходит


      1. Tarakanator
        03.08.2022 11:53

        у меня такое же, а я хотел типа https://youtu.be/_ZO5pOAwN0Q?t=821


    1. Refridgerator
      03.08.2022 13:07

      Вы забыли добавить «very very very beautiful art». А если серьёзно, нейросеть — это вам не искусственный интеллект, понять и осмыслить ваш запрос она не может. Ориентироваться надо не на то, что вы хотите, а на то, из какого исходного материала в датасете вашу картинку можно состряпать и какие ключевые слова с ним могут быть ассоциированы. Добавьте «science fiction», замените «world» на «city» и т.д.


      1. Tarakanator
        03.08.2022 13:12

        Нет, я хотел ringworld. А уж насколько он бьютифул вопрос другой.
        Другими словами я не смог подобрать


        1. Refridgerator
          03.08.2022 13:45

          Ну раз автор для картинки с Эйнштейном добавил «very very beautiful art» — значит, без этого результат получался нерелевантным.


  1. StrangerInTheKy
    03.08.2022 12:56

    Я попробовал нагуглить, где можно погенерировать изображения онлайн забесплатно.
    Описание картинки у меня такое: "A picture made with a thin grey line on a simple white background. The picture shows a soaring bird of prey, which prepared to attack a running hare."
    А вот результаты - так себе: https://ibb.co/album/VgVfCp (по ссылке - 5 картинок от 5 разных нейросетей).
    Я так понимаю, что за деньги обещают качество получше, чем за бесплатно? Вопрос в том, насколько получше. А то пока создается ощущение, что слухе о всемогуществе нейросетей несколько преувеличены.

    Если не жалко, попробуйте на вашей. Интересно взглянуть.


    1. Gordon01
      03.08.2022 19:11
      +2

      DALL-E 2 что-то не нравится в вашем запросе:

      МБ вот это:

      • Violence: violent acts and the suffering or humiliation of others.

        Если сократить то "A picture made with a thin grey line on a simple white background. The picture shows a soaring bird of prey", то будет вот такая картинка:


      1. StrangerInTheKy
        03.08.2022 22:45
        +1

        Спасибо!
        Да, это уже намного лучше, и даже лучше, чем нарисую я (но все еще хуже, чем рисует моя 15-летняя дочь ;) ). Но неожиданно вскрылся ооочень неприятный момент. Вот тот самый - с насилием и прочей такой лабудой. Извините, что невольно вас подставил. Content policy - это хорошо, но так и хочется воскликнуть знаменитое "Огласите весь список, пожалуйста!" Если о некорректном запросе узнаешь только постфактум, а N некорректных запросов = бан, то сразу же возникает вопрос "а за что я плачу деньги". Ну, у меня бы точно возник. Орел, атакующий зайца - это плохо. Ну, ок. А конь, атакующий короля? Всего-то шахматная партия... И никаких иллюзий ни у кого давно нет - никакой человек никогда не будет разбирать спорные случаи нарушений, просто забанят и всё, как уже давно происходит на всех подобных платформах.
        А дело всё в том, что я увлекаюсь бердвотчингом, и вообще дикой природой интересуюсь, и иногда посещает мысль запилить что-нибудь на тему своих хобби. Видимо, придется все-таки самому рисовать. Ведь дикая природа - она такая дикая...
        Второй момент, над которым я долго думал. В моем запросе описываются два взаимодействующих объекта. А нейросети выдавали результат, на котором изображен один объект, но обладающий свойствами двух заданных. Я пытаюсь нащупать границу применимости, причем довольно простую и незамысловатую. Например, что-то чуть менее ходовое, чем роботы, котики и покемоны (ну вот птицы хотя бы). Если у вас еще не пропало желание, попробуйте написать что-то вроде "A magpie sits on the nest and feeds three nestlings". Или там "выдра смотрит на свое отражение в зеркале". Даже без уточнения про серые линии и фон. Интересно, насколько сильной будет деградация по сравнению с одиночной парящей птицей.


        1. Gordon01
          03.08.2022 23:25
          +2

          Второй момент, над которым я долго думал. В моем запросе описываются два взаимодействующих объекта. А нейросети выдавали результат, на котором изображен один объект, но обладающий свойствами двух заданных.

          DALL-E выдала такой результат, потому что зайца я убрал из запроса, лень было переформулировать, простите.

          "A magpie sits on the nest and feeds three nestlings":


          1. art-popov Автор
            04.08.2022 09:21

            Очень хороший результат, на мой взгляд! Midjourney не схватывает кормление, вот что выходит:


          1. StrangerInTheKy
            04.08.2022 10:37

            DALL-E выдала такой результат, потому что зайца я убрал из запроса, лень было переформулировать, простите.

            Я имел в виду не ваши результаты, а мои - те, что нагенерировали бесплатные онлайн-генераторы (они, кстати, и к насилию не придирались).
            А результаты DALL-E с сорокой просто сумасшедшие! Можно придраться немного к анатомии и к числу птенцов, но это такие мелочи уже.
            С выдрой, как я понимаю, проблема та же, что и со всеми остальными нейросетями вообще - они на самом деле ничего не понимают. Если выдра смотрит в зеркало, она видит свое отражение. Это запросто понимает даже маленький ребенок. Но ни на одной картинке этого нет. Есть либо выдра, либо ее отражение в зеркале.
            Большое спасибо!


        1. art-popov Автор
          04.08.2022 09:17

          Вот ваша выдра с зеркалом, про линии в запросе уточнять не стал


    1. art-popov Автор
      04.08.2022 09:08

      Вот что у меня получилось, запрос тот же "A picture made with a thin grey line on a simple white background. The picture shows a soaring bird of prey"