Раскраски — лучшее применение генеративных сетей :) / forpes.ru

Главная
Раскраски — лучшее применение генеративных сетей :)

Раскраски — лучшее применение генеративных сетей :) +12

13.04.2023 07:45

Maslukhin 16 1800 Источник

Мне кажется, я нашел самое правильное применение генеративных сетей, рисующих по описанию. Это генерация раскрасок!

У меня есть дети. Дети равно раскраски. Раскраски — это постоянный поиск всякой фигни, типа «хочу чтобы был единорог, а рядом его малыш панда, и чтобы малыш был похож на маму». Интересно, что нейросети неплохо справляются с такими задачами. Причем, забавный момент — результаты начинающих нейросетей, типа того же Кандинского, принимаются более благосклонно, потому что рисуют они пока плохо. Но! эта «плохость» и ошибки в изображениях очень похожи на рисунки ребенка и воспринимается за творение собрата по детсаду/школе.

Промт: “Раскраска: единорог смотрит на солнце, рядом его ребенок панда. Белый фон”

Были варианты, больше похожие на панду, но этот был выбран заказчиком как, цитирую «самый милый». Ну и увы, варианты от Кандинского требуют финального штриха в виде дополнительного клика в графическом редакторе для убирания серого фона. На фото выше пришлось чуть задрать уровни, зато получилась уже нормальная раскраска, пригодная для печати.

Другие генеративные сети справляются более детализировано. Ниже пример от Stable Diffusion.

Black and White Coloring book: unicorn looking at the sun, panda baby next to him

Но! тут и доводить до ума дольше, раскрашивать из‑за деталей уже не так интересно, плюс требуется перевод на английский, что немного лишает процесса магии.

Зато в таких сетях отлично генерировать детализированные раскраски, пригодные уже для более взрослых детей. Ниже ответ на запрос: детализированная раскраска девушка павлина.

Detailed black and white coloring: peacock girl

Еще одним персональным минусом развитых генеративных сетей типа MidJourney является выбор из 4 вариантов. А выбор не всегда хорошо — маленький заказчик начинает требовать совместить вариант 3 и 4, что бывает проблемно. Проще перегенерить. Поэтому возвращаемся к Кандинскому, где его неразвитость может быть обращена в плюс.

Сам кандинский, конечно, еще очень сыр. Начиная с того, что после генерации картинки, даже если полностью изменить описание, он все равно пытается просто перерисовать текущую. Приходится перезаходить. Второе — при попытке скачать изображение он всегда ошибается с рамкой для выбора скачиваемой части картинки. Немного бесит.

Но, зато он дает отличный простор для воображения.

Промт: "Раскраска: алладин дерется на мечах с черепашкой ниндзя"

Забавно, что сами авторы сетей, очевидно, не предполагают такого использования своего творения. В кандинском можно явно задать стиль выводимого изображения, но стиль именно раскраски в нем отсутствует.

Аналогично в других сетях генерации изображения. Между тем, если прямо задать такой стиль в описании, получается похоже.

Промт: Кукла LOL в кабине звездолета “Сокол тысячелетия”

Кукла, конечно, нифига не LOL, но большие глаза «продали» картинку заказчику. Плюс небольшая пасхалка в виде R2D2 в панели слева :)

Комментарии (16)

Voiddancer
13.04.2023 07:49
#25440686
+3
Как многодетный отец выражаю вам огромное спасибо за идею!

sergeyns
13.04.2023 07:49
#25440704
+2
Беспокоит одна мыслишка.. насколько безопасно знакомить детей с недозрелым творчеством нейронок.. Так мы нейронки детей будем тренировать на искаженном результате деятельности наших нейронок... Потом придется объяснять почему у настоящих лошадей всего 4 ноги, а не 5 или 6...

Отвечаю редактированием этого поста, т.к. иначе никак (.

каляку-маляку от соседа по саду ребенку показываете

Если вы будете постоянно показывать ребенку каляки-маляки, то, в общем, выше этого уровня ребенок у вас не "прыгнет"... а в советских мультиках с цветами и числом ног всё в порядке. Ребенок познает мир, и фильтра "вот это правильно, а вот это - так не бывает, и чисто для развлечения" у него нет...
1. Fen1kz
  13.04.2023 07:49
  #25440760
  +10
  я не психолог, но думаю что уровень опасности и урон для психики будет примерно 0.2-0.3 по шкале ОСМ (обычного советского мультика)
1. Maslukhin Автор
  13.04.2023 07:49
  #25440772
  +5
  Вы когда каляку-маляку от соседа по саду ребенку показываете - видимо наносите непоправимую психическую травму.
1. Maslukhin Автор
  13.04.2023 07:49
  #25441278
  +2
  Покажите ему утконоса. Вот кого точно нейросеть генерила. Или бразильскую горбатку :))))
  
  Вы почему-то считаете, что при встрече с необычным у ребенка случится BSOD. Нет, конечно. Понятно, что если все время показывать результаты нейросети, ничего хорошего не будет. Но это никто и не предлагает же
1. GlukKazan
  13.04.2023 07:49
  #25441978
  +1
  В том-то и дело, что у этих пони ног не 4, а именно 5 или 6 (или больше)
  1. Maslukhin Автор
    13.04.2023 07:49
    #25442202
    Это просто другой пони стоит сзади. Это стало :)

Schwalbach
13.04.2023 07:49
#25440774
-2
все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.

я категорически не рекомендую использовать картинки с подобными ошибками для развития детей, особенно с образами живых существ.

кривые домики с нереальными окнами или какие-то чудо автомобили - ради бога, но тут - не стоит. кроме того картинки в посте попросту уродливы.
1. Maslukhin Автор
  13.04.2023 07:49
  #25440776
  +3
  Эээ, а когда дети рисуют лишние ноги, это как?
1. vassabi
  13.04.2023 07:49
  #25440952
  +2
  извините, а у вас сколько детей в семье ?
1. f614
  13.04.2023 07:49
  #25441302
  +4
  Интересно, сколько детей по вашей логике получили травму, когда узнали, что животные в реальности не умеют разговаривать, как в 90% мультфильмов.
1. Kanut
  13.04.2023 07:49
  #25442018
  все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.
  
  Мне даже страшно подумать к каким девиациям привели мультики и иллюстрации к детским книжкам… Да одни только Муми-тролли наверное загубили тысячи жизней....

alex3f
13.04.2023 07:49
#25441304
+1
Спасибо за идею! Кстати, стиль можно прямо в запросе писать: "День космонавтики и хомячка, в стиле Левитана, маслом", а для раскрасок можно просто "День космонавтики и хомячка, раскраска"
1. Maslukhin Автор
  13.04.2023 07:49
  #25441312
  +4

f614
13.04.2023 07:49
#25441410
+1
Как то не додумался до подобного применения, можно даже лазерный гравер достать с балкона.

Aniro
13.04.2023 07:49
#25442420
+2
По стэйбл дифьюжину - можно же взять не базвоую модель, а файнтюн на мультиках или раскрасках. А можно взять оба и смерджить. Есть еще плагин для векторизации. Не проверял, но должно получиться на вполне годном уровне.

Раскраски — лучшее применение генеративных сетей :) +12

Комментарии (16)

Maslukhin Автор

Maslukhin Автор

Maslukhin Автор

Maslukhin Автор

Maslukhin Автор