Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили.
Меня зовут Артём Попов, я — руководитель отдела маркетинга в интернет-магазине xcom-shop, и сегодняшний пост отражает отношение потребителя или, если хотите, заказчика графики. У дизайнеров постоянно не хватает времени на то, чтобы выполнять запросы всех бизнес-юнитов, а нам постоянно хочется чего-то этакого… Может, заказать отрисовку нейросети?
Раньше никто и не задумался бы о таком решении, но сейчас тема явно находится в зоне хайпа: про нейросети не слышал только ленивый. На прошлой неделе вышел лонгрид о возможностях нейросетей, позже мы всем рунетом ужасались реалистичностью “последнего селфи на Земле”, сделанного “руками” DALL-E 2. А благодаря тому, что редакция портала 72.ru поэкспериментировала со словами запросов, жители Тюмени (и все, кто неравнодушен к Тюмени) смогли взглянуть на свой родной край “глазами” нейросети MidJorney — результаты можно посмотреть тут.
Какую нейросеть выбрать?
Признаюсь честно, мы тоже все это читали и смотрели. И даже вдохновились качеством и глубиной сгенерированных картинок. После этого оказалось просто невозможно пройти мимо (мы ведь работаем в сегменте высоких технологий и должны идти в ногу со временем). А значит, мы в xcom-shop просто обязаны попробовать работу с нейросетью.
Так начался выбор оптимального для нас решения. В фокусе оказались две наиболее раскрученные на данный момент системы. Ниже я постарался свести в единую таблицу их характеристики/плюсы/минусы:
Нейросеть |
DALL-E 2 |
MidJourney |
Разработчик |
OpenAI |
MidJourney (независимая группа разработчиков) |
Дата запуска, текущий статус |
20 июля 2022 (закрытый бета-тест) |
13 июля 2022 (открытый бета-тест) |
Максимальный размер изображения |
PNG, до 1024x1024 пикселей |
JPG, до 1664x1664 (или другой до 3 миллионов пикселей) |
Возможность менять масштаб |
нет |
да, можно задавать пользовательский размер изображения |
Доступ |
API (причем доступ из РФ закрыт)...тоже мне OPEN |
Discord |
Права на использование в коммерческих целях |
Полные права на все сгенерированные изображения |
По подписке (для компаний с оборотом от $1 млн. в год стоит $600) |
Бесплатный лимит, стоимость |
50 запросов в месяц, далее 115 запросов за $15 |
25 запросов бесплатно, далее по подписке |
Субъективная оценка удобства работы с запросами |
Нейросеть более чутко схватывает суть сложных запросов |
Очень хорошие изображения даже по простым запросам |
Субъективная оценка качества изображений на выходе |
Удовлетворительный уровень качества и детализации итогового изображения. |
Высокий уровень качества и детализации итогового изображения. |
Но я практически уверен, что моя субъективная оценка вас не убедила. :) Делюсь изображениями, которые мы получили в ходе тестирования нейросетей по одним и тем же запросам:
Несмотря на то, что DALL-E 2, кажется, более тонко схватывает все нюансы запросов и, по моим ощущениям, дает более релевантные сложным текстам картинки, наш выбор все-таки пал на Midjourney. И на то несколько причин.
Главная — мы всем коллективом очарованы тем, как MidJourney видит наш xcom-shop в будущем.
Во вторых, этот вариант реально доступен для бизнеса без заморочек с VPN и правами на коммерческое использование. Заплатив $600 (714 с учетом налога) за корпоративный тарифный план, мы тут же отправились тестировать алгоритмы AI. Это, кстати, очень увлекательно, и в первый вечер я пересидел на работе 3 часа сверх нормы, играясь с веселыми картинками…зато ехал домой без пробок. ;)
Интересный факт, мы первые? Да!
“Автор, ты о чем?" — скажете вы. — "Уже многие компании использовали нейросеть для генерации изображений.” И будете правы!
Например, Cosmopolitan заказал обложку алгоритму DALL-E 2 — получилось очень даже неплохо. А ранее The Economist использовал ИИ-бота для создания обложки тематического номера о современных цифровых технологиях. И не забывайте про “особого дизайнера” студии Лебедева, Николая Иронова, который уже больше года выполняет самые разные работы для заказчиков.
Но все они не интернет-магазины! И, судя по всему, мы — первый интернет-магазин в России, реально применяющий нейросеть на своем сайте. И не просто один раз разместив какой-то элемент, а на постоянной основе (само собой, мы ж подписку на год оплатили).
Решение практических задач
Что касается задач, мы решили не придумывать каких-то специальных выкрутасов для нейросети — я наигрался с ними в первый же вечер. Вместо этого мы сфокусировались на своих текущих потребностях. А именно - “подсветке” на сайте недавно выпущенного подборщика блоков питания.
Вообще это обычная практика — мы размещаем баннеры на главной и в соответствующем разделе каталога. Вот именно их создание мы и поручили нейросети.
На баннере нужно было показать креатив, связанный с блоками питания ПК, мощностью и энергией (сервис подбирает оптимальный БП под конфигурацию системного блока). Имея эти образы в голове, мы с дизайнером Ярославом Шиловым начали перебирать запросы для нейросети.
Вот несколько наших запросов и полученный для них результат:
На каждый запрос нейросеть представляет четыре варианта изображения на выбор. Это оказалось очень удобно: можно сразу сделать выбор и на основе понравившегося варианта получить ещё четыре скетча. А если какой-то вариант устраивает, можно улучшить его в качестве (сделать апскейл разрешения).
В запросах к Midjourney можно дополнительно указывать разрешение итоговых изображений, преимущественные цвета, художественный стиль и многое другое.
В поисках необходимого изображения было сделано более 30 запросов. Иногда нейросеть выдавала совсем неподходящие варианты, возможно из-за нехватки с нашей стороны опыта в написании запросов. Так что для планомерной работы (но крайней мере нам сейчас) нужен большой запас запросов. Но в итоге, уловив правильное направление, нам удалось прийти к желаемому результату.
На первом же опыте мы убедились в том, что нейросеть может ускорить рабочий процесс дизайнера. Обычно специалист тратит много времени на поиск идеи, графические ресурсы в открытом доступе и прочий креатив. Мы же в итоге решили эту задачу вдвое быстрее. Ну и, конечно, дизайнер получает уникальные материалы для дальнейшей работы, и ее результат будет отличаться от всего, что есть в сети.
Да, в подборках встречалась какая-то ерунда. Но, проработав несколько запросов, волшебным образом мы получили то самое изображение, подходящее под нашу тематику.
Несколько доработок, добавляем текст, адаптируем под нужное разрешение - и вуаля! Картинка для баннера готова. И баннер уже красуется на нашем сайте.
Нейросеть – вдохновитель дизайнера
Помимо графики, которую дизайнер сможет использовать в своей работе, нейросеть обладает еще одним удивительным свойством, а именно – генерирует идеи. Для любого творческого специалиста это отличное подспорье. И мой коллега, дизайнер Ярослав Шилов подтвердил, что это именно так.
В процессе работы с AI сложно не заметить, что некоторые изображения действительно бьют “прямо в точку”! Невольно задаешься вопросом – как раньше мне это не пришло в голову? Так что нейросеть совершенно точно можно использовать как бесконечный источник мыслей для вдохновения.
Дальше — больше
Итак, мы получили вполне себе положительные результаты эксперимента по использованию сгенерированных нейросетью изображений на нашем сайте и готовы идти дальше и масштабировать полученный результат.
Однозначно, мы будем применять технологию для подготовки email-рассылок (следующую нашу еженедельную рассылку мы полностью составим из сгенерированных изображений, подписывайтесь).
Также будем генерировать визуалы наших постов в соцсетях исключительно через нейросеть. Весь август вести группы xcom-shop нам будет помогать робот. И для знатоков работы нейросетей мы приготовили забавный конкурс: Первый, кто угадает запрос, по которому мы сгенерировали изображение для поста - получит 1000 баллов на свой бонусный счёт, все подробности у нас в телеграм, ВК и Яндекс.Дзен.
Выводы
Конечно, пока рано говорить, что нейросеть способна полностью заменить дизайнера. Но уже сейчас искусственный интеллект может упростить работу специалиста, ответственного за подготовку графики. Ведь на отрисовку иллюстрации обычно и уходит большая часть времени дизайнера, а с этой задачей нейросеть уже сейчас справляется если не отлично, то уверенно хорошо. Важно только найти правильный подход и научиться формулировать запросы.
С другой стороны, пока роботу непосильны как минимум такие стандартные дизайнерские задачи, как набор текста, работа по брендбуку и правильное размещение логотипов. И тут как раз выручает дизайнер, который уже адаптирует сгенерированные AI изображения для решения вполне конкретных бизнес-задач.
Возможно, скоро мы увидим в резюме дизайнеров в дополнение к привычной креативности, многозадачности и стрессоустойчивости (ну или виртуозного владения графическим пакетом Adobe/Corel) приписку вроде “уверенно ставлю задачи нейросети”. И как знать, может быть именно это станет конкурентным преимуществом при приеме на работу.
А вы что думаете про результаты нашей работы с нейросетью? Делитесь в комментариях, давайте обсудим!
Комментарии (35)
Medeyko
02.08.2022 16:18+1Вы так сформулировали, что может показаться, что Вам не нравится, что покупатели перестанут выбирать продавца по качеству дизайна интернет-магазина из-за того, что он везде будет на высоком уровне.
На мой же взгляд, это отлично! Это же совершенно неважный параметр для последующего использования купленного товара. Вот бы избавиться ещё бы и от других методов втюхать покупателю посредственный товар задорого!
(А статья хорошая, практический опыт использования штук, которые на слуху, всегда интересен.)keydach555
02.08.2022 16:32+1Да, не очень удачно сформулировал. Мне самому в принципе, как владельцу подобного мелкого сетевого бизнеса это на руку, но как представишь, что начнется когда в сеть придет куча левого народа, зайдет на условный гибрид dalle-3 и copilot, напишет что-то типа "нарисуй мне интернет магазин по продаже (чего-нибудь), очень очень продающий, цифровой арт, открытие года, top-3 мировых интернет-магазинов" и получит реально хороший продающий магазин ))) все это приведет к очень простой вещи - росту цен на рекламу и вымывание мелких и средних бизнесов в пользу больших торговых интернет-платформ типа яндекс.маркета, озона итд
art-popov Автор
02.08.2022 16:34Спасибо) Вы правы, неоднозначно получилось. Дизайн крайне важен, ведь встречают, как говорится, по обертке. И именно поэтому мы уделяем столько внимания дизайну, оптимизации интерфейсов и user flow. Но кроме дизайна есть и другие аспекты, которые тоже влияют на выбор и не менее важны - я это хотел донести
xshd
02.08.2022 17:42мне вот интересно, я получил инвайт на dall-e, но при прохождении верификации и указании российского номера сразу выходит сообщение - недоступно в вашей стране и после уже не логинится
art-popov Автор
02.08.2022 17:49Да, в РФ их апи не работает, только если через посредников как-то выходить
technik
02.08.2022 21:30А насколько релевантные результаты выдаёт сетка MidJourney, если попробовать генерировать изображения товаров? Для уникализации изображений товаров было бы самое то :)
art-popov Автор
03.08.2022 06:08+1вот как раз сами товары пока отрисовывает неоднозначно, например, “IPhone 13 pro max”
Smooke_ju
03.08.2022 06:09Специально зарегался. Вы там товарища в непопулярных паттеррнах обвинили. В целом паттерн многих запросов в каментах можно одним словом задать,ну или двумя. (хотя на эту тематику больше всего пик ей изобразил человек)
Heaven.
God
Самому бы хотелось увидеть
The end of infinity/ Infinity cap.
Только не фракталы, пожалуйста!)
Tarakanator
03.08.2022 09:07+3Ждём сервис по печати на одежде уникальных сгенерированных изображений. Т.е. пользователь приходит, генерирует принт на футболку и печатает себе уникальную футболку. Только надо чтоб не квадрат печатать, а сразу во всю поверхность. Типа так https://printbang.ru/img/products/75/muzhskaya-futbolka-dune-2000-75371.jpg
Tarakanator
03.08.2022 10:53Не смог я его заставить ringworld нарисовать. Может кто знает какие ключевые слова ещё попробовать?
Refridgerator
03.08.2022 13:07Вы забыли добавить «very very very beautiful art». А если серьёзно, нейросеть — это вам не искусственный интеллект, понять и осмыслить ваш запрос она не может. Ориентироваться надо не на то, что вы хотите, а на то, из какого исходного материала в датасете вашу картинку можно состряпать и какие ключевые слова с ним могут быть ассоциированы. Добавьте «science fiction», замените «world» на «city» и т.д.
Tarakanator
03.08.2022 13:12Нет, я хотел ringworld. А уж насколько он бьютифул вопрос другой.
Другими словами я не смог подобратьRefridgerator
03.08.2022 13:45Ну раз автор для картинки с Эйнштейном добавил «very very beautiful art» — значит, без этого результат получался нерелевантным.
StrangerInTheKy
03.08.2022 12:56Я попробовал нагуглить, где можно погенерировать изображения онлайн забесплатно.
Описание картинки у меня такое: "A picture made with a thin grey line on a simple white background. The picture shows a soaring bird of prey, which prepared to attack a running hare."
А вот результаты - так себе: https://ibb.co/album/VgVfCp (по ссылке - 5 картинок от 5 разных нейросетей).
Я так понимаю, что за деньги обещают качество получше, чем за бесплатно? Вопрос в том, насколько получше. А то пока создается ощущение, что слухе о всемогуществе нейросетей несколько преувеличены.Если не жалко, попробуйте на вашей. Интересно взглянуть.
Gordon01
03.08.2022 19:11+2DALL-E 2 что-то не нравится в вашем запросе:
МБ вот это:
-
Violence: violent acts and the suffering or humiliation of others.
Если сократить то "A picture made with a thin grey line on a simple white background. The picture shows a soaring bird of prey", то будет вот такая картинка:
StrangerInTheKy
03.08.2022 22:45+1Спасибо!
Да, это уже намного лучше, и даже лучше, чем нарисую я (но все еще хуже, чем рисует моя 15-летняя дочь ;) ). Но неожиданно вскрылся ооочень неприятный момент. Вот тот самый - с насилием и прочей такой лабудой. Извините, что невольно вас подставил. Content policy - это хорошо, но так и хочется воскликнуть знаменитое "Огласите весь список, пожалуйста!" Если о некорректном запросе узнаешь только постфактум, а N некорректных запросов = бан, то сразу же возникает вопрос "а за что я плачу деньги". Ну, у меня бы точно возник. Орел, атакующий зайца - это плохо. Ну, ок. А конь, атакующий короля? Всего-то шахматная партия... И никаких иллюзий ни у кого давно нет - никакой человек никогда не будет разбирать спорные случаи нарушений, просто забанят и всё, как уже давно происходит на всех подобных платформах.
А дело всё в том, что я увлекаюсь бердвотчингом, и вообще дикой природой интересуюсь, и иногда посещает мысль запилить что-нибудь на тему своих хобби. Видимо, придется все-таки самому рисовать. Ведь дикая природа - она такая дикая...
Второй момент, над которым я долго думал. В моем запросе описываются два взаимодействующих объекта. А нейросети выдавали результат, на котором изображен один объект, но обладающий свойствами двух заданных. Я пытаюсь нащупать границу применимости, причем довольно простую и незамысловатую. Например, что-то чуть менее ходовое, чем роботы, котики и покемоны (ну вот птицы хотя бы). Если у вас еще не пропало желание, попробуйте написать что-то вроде "A magpie sits on the nest and feeds three nestlings". Или там "выдра смотрит на свое отражение в зеркале". Даже без уточнения про серые линии и фон. Интересно, насколько сильной будет деградация по сравнению с одиночной парящей птицей.Gordon01
03.08.2022 23:25+2Второй момент, над которым я долго думал. В моем запросе описываются два взаимодействующих объекта. А нейросети выдавали результат, на котором изображен один объект, но обладающий свойствами двух заданных.
DALL-E выдала такой результат, потому что зайца я убрал из запроса, лень было переформулировать, простите.
"A magpie sits on the nest and feeds three nestlings":
art-popov Автор
04.08.2022 09:21Очень хороший результат, на мой взгляд! Midjourney не схватывает кормление, вот что выходит:
StrangerInTheKy
04.08.2022 10:37DALL-E выдала такой результат, потому что зайца я убрал из запроса, лень было переформулировать, простите.
Я имел в виду не ваши результаты, а мои - те, что нагенерировали бесплатные онлайн-генераторы (они, кстати, и к насилию не придирались).
А результаты DALL-E с сорокой просто сумасшедшие! Можно придраться немного к анатомии и к числу птенцов, но это такие мелочи уже.
С выдрой, как я понимаю, проблема та же, что и со всеми остальными нейросетями вообще - они на самом деле ничего не понимают. Если выдра смотрит в зеркало, она видит свое отражение. Это запросто понимает даже маленький ребенок. Но ни на одной картинке этого нет. Есть либо выдра, либо ее отражение в зеркале.
Большое спасибо!
-
art-popov Автор
04.08.2022 09:08Вот что у меня получилось, запрос тот же "A picture made with a thin grey line on a simple white background. The picture shows a soaring bird of prey"
keydach555
Неплохая попытка привлечь внимание к своему магазинчику на волне хайпа с нейросетками-дизайнерами ) Весь вопрос в том, что скоро, через год-два, ВСЕ сайты, сайтики и лендинги станут одинаково чудо как хороши и покупатели уже не смогут выбирать продавца по качеству дизайну. Для дизайнеров это безусловно плохо, для владельцев маленьких частных бизнесов в сети - на начальном этапе безусловный плюс, дальше по мере роста количества таких сайтиков из-за упрощения разработки - безусловный минус ) Выиграют большие торговые онлайн-платформы, остальные со временем проиграют
art-popov Автор
Вы, конечно, замахнулись загадывать, что будет через годы, особенно в нашей стране) Но в чем-то я с вами соглашусь, потребители уже выбирают магазины не по обертке, а по качеству сервиса, скорости работы, экспертизе консультантов, удобству доставки, ассортименту и другим не связанным с дизайном параметрам.
keydach555
Потребители, еще не имеющие опыта взаимодействия с вашим замечательным магазином, а это по идее, для маленьких и средних магазинов 99% аудитории - выбирают только по визуалу, ну и возможно по удобству интерфейса и скорости загрузки.
ghostinushanka
А есть в довесок к этому утверждению соответствующие данные? Хотелось бы, конечно, чтобы оно так и было, но сколько ни смотрю на классический ритейл, не вижу таких тенденций.
art-popov Автор
Могу привести наглядный пример - знаменитые сайты, через которые можно заказать продукцию из Китая. Сказать, что там продуманный интерфейс, классный дизайн и удобная навигация нельзя, но при этом их популярность только растёт из-за вполне понятного преимущества.