И кажется мы оставим его в штате

Сегодня будет мало текста, но много красивых картинок
Сегодня будет мало текста, но много красивых картинок

Все началось с того, что нам нужен был иллюстратор. Как это обычно бывает, нужно нарисовать пару красивых картинок, а рисовать никто не умеет, а картинки нужны прям обязательно все уникальные и классные

Можно даже не читать, ведь я только-лишь хотел поделиться картиночками
Можно даже не читать, ведь я только-лишь хотел поделиться картиночками

А денег на иллюстратора конечно не было. Стартап же!

Таким образом, визуальное наполнение проекта висело в статусе “обязательно найдем иллюстратора и деньги, а пока пусть пустует”

Главное не присматриваться..
Главное не присматриваться..

Разглядывая очередную подборку пикч от новомодных нейросеток, меня вдруг осенило:

А давайте всё генерить в DALL-E?

Я сейчас в бангкоке, так что выбираю киберпанк стилем всё чаще ????‍♀️
Я сейчас в бангкоке, так что выбираю киберпанк стилем всё чаще ????‍♀️

3 дня ожидания в очереди и доступ к DALL-E получен, ура!

Генерить картиночки!

Это дерево. И дождь из денег. Не слишком похоже на деньги, но зато красиво
Это дерево. И дождь из денег. Не слишком похоже на деньги, но зато красиво

Результат вышел, как минимум, очень интересным

Подобрать подходящий стиль было сложно. Чем точнее формулировать запрос, тем лучше выходит результат. И грамотно формулировать запрос пришлось поучиться. Зато периодически рандомно получались классные картинки!

Просто посмотрите как легко и непринужденно наш новый иллюстратор предоставляет альтернативные варианты
Просто посмотрите как легко и непринужденно наш новый иллюстратор предоставляет альтернативные варианты

В итоге удалось подобрать несколько прямо очень понравившихся иллюстраций!
И переделать лого, на более красивенькое, просто сгенерив похожие логотипы по уже существующему

synthwave AI drawing an illustration for tech startup, digital art
synthwave AI drawing an illustration for tech startup, digital art

Была лишь одна проблема, разрешение картинок на выходе - 1024х1024

Коллеге пришла в голову совершенно гениальная идея:

А давайте попробуем засунуть результаты в другую нейронку, которая дорисовывает пиксели и повышает разрешение?

Не пытайтесь угадать, что на этой картинке. Если контекста недостаточно, AI выдает откровенную шизу
Не пытайтесь угадать, что на этой картинке. Если контекста недостаточно, AI выдает откровенную шизу

В общем, чтобы не тянуть - это сработало!

Да ???? Мы сгенерировали иллюстрации в одной нейросети, а потом подняли ей разрешение в другой. И результат нас очень устроил. Я в восторге!

Но вообще шизу можно сгенерировать и осознанно
Но вообще шизу можно сгенерировать и осознанно

В нашем кейсе получилось сгенерировать достаточно материала, чтобы оживить мобильное приложение. Было много неудачных попыток, но несколько удачных, с уточнениями вдогонку - зарешали

Действительно интересно наблюдать за тем, как DALL-E пытается “угадать”
Действительно интересно наблюдать за тем, как DALL-E пытается “угадать”

Теперь я активно слежу за развитием направления и изучаю аналоги. Использую нейросеть как в качестве вдохновения, так и для реализации готовых идей. По-крайней мере, пока результаты её работы можно использовать легально, даже в коммерческих целях:

Use of Images. Subject to your compliance with these terms and our Content Policy, you may use Generations for any legal purpose, including for commercial use.

Можно задавать практически что угодно: стиль, цвета, отдельные элементы, эффекты, рисовку
Можно задавать практически что угодно: стиль, цвета, отдельные элементы, эффекты, рисовку

После этого мне захотелось погенерить изображений для чатиков и каналов в телеграме. И с этим нейросеть тоже отлично справилась, правда поначалу было неочевидно что вводить.

Еще более крутых результов я добился добавив на сгенеренную картинку немного анимаций через мобильное моушн приложение (посмотреть можно в оригинале статьи в моем блоге)

Вот такой 2022 год. Чтобы создавать красивые картиночки и даже анимированные картиночки уже и не обязательно нанимать специалистов. А из навыков становится важным - сформулировать запрос.

Впрочем, уметь формулировать запрос для меня стало важно давно, ведь я пишу код ????


Все картинки представленные в статье, были сгенерированы моделью DALL-E

Комментарии (12)


  1. JumpinCarrot
    11.08.2022 20:22
    +3

    3 дня?! Я в очереди уже 3 месяца.


    1. logran
      11.08.2022 21:57
      +3

      Можно прекращать ждать и идти в stable diffusion за фотореалистичными генерациями и в MidJourney за стилизованными.

      Получил 2 инвайта на Dalle-2, потыкал 100 генераций и разочаровался. Мало того, что ограничений вагон и маленькая тележка + подменяет часть результатов на черных женщин или вообще рандом (ибо вмешивается в промт ради diversity творя дичь на 1 кадр из 4х за мои же деньги), так еще и с промтом приходится чуть ли не ритуалы призыва дьявола проводить чтобы получить что-то стилизованное и художественное хотя бы на уровне актуальной версии MJ. С фотореалистичным (если закрыть глаза на ограничения) чуть лучше, но Stable Diffusion выкатилась вчера в свободный бесплатный доступ для всех и с фотореалистичными кадрами у неё как минимум не хуже.

      P.S. В личку если надо кому могу инвайт в дискорд Stable diffusion прислать, пока он еще валидный.


      1. copywr1ter
        13.08.2022 08:18

        Будьте добры мне инвайт.


  1. himynameistom
    11.08.2022 20:32
    +2

    Любопытная статья. Захотелось и себе такого иллюстратора.

    Немного не понятно, что использовали для увеличения разрешения?


    1. VladimirBrejcha Автор
      11.08.2022 21:05
      +1

      Не могу порекомендовать сервис, потому что искали бегло и взяли первое что нашлось. Работает оно медленно и не всегда хорошо. https://bigjpg.com


      1. himynameistom
        12.08.2022 10:01

        Спасибо)


  1. mixas-f
    11.08.2022 21:03

    Отличная идея! Автору респект что поделился! Буду теперь пользоваться :)


  1. DDroll
    11.08.2022 21:51

    Можно попробовать www.midjourney.com, но насколько он пригоден для профессионального применения, я не знаю, и там бета. Зато 3 дня не надо ждать, чтобы пощупать — описание боту в дискорде, результат минуты через 2


  1. PereslavlFoto
    11.08.2022 22:41
    +1

    По какой лицензии DALL-E выпускает эти изображения?


  1. Wesha
    12.08.2022 02:25

    из навыков становится важным - сформулировать запрос.

    А вотхвост. Вот я сформулировал запрос, очень детально. Посчитайте, сколько требований из запроса оно НЕ выполнило.


  1. lario7
    12.08.2022 14:35
    +1

    Предлагаю идею для фильма:

    Группа людей ("заговорщики") создает AI, который создает нейросеть из людей ("все остальные") для обучения которой составлять запросы к AI используется BigData, полученные от AI и которые продаются за деньги.

    После оглушительного успеха фильма не забудьте отблагодарить автора этого комментария.


    1. Wesha
      12.08.2022 22:49

      который создает нейросеть из людей

      (зевая) Про Amazon Mechanical Turk помним?