Мне кажется, я нашел самое правильное применение генеративных сетей, рисующих по описанию. Это генерация раскрасок!
У меня есть дети. Дети равно раскраски. Раскраски — это постоянный поиск всякой фигни, типа «хочу чтобы был единорог, а рядом его малыш панда, и чтобы малыш был похож на маму». Интересно, что нейросети неплохо справляются с такими задачами. Причем, забавный момент — результаты начинающих нейросетей, типа того же Кандинского, принимаются более благосклонно, потому что рисуют они пока плохо. Но! эта «плохость» и ошибки в изображениях очень похожи на рисунки ребенка и воспринимается за творение собрата по детсаду/школе.
![Промт: “Раскраска: единорог смотрит на солнце, рядом его ребенок панда. Белый фон” Промт: “Раскраска: единорог смотрит на солнце, рядом его ребенок панда. Белый фон”](https://habrastorage.org/getpro/habr/upload_files/679/970/23e/67997023e096e41eebf55c2db504bb7c.png)
Были варианты, больше похожие на панду, но этот был выбран заказчиком как, цитирую «самый милый». Ну и увы, варианты от Кандинского требуют финального штриха в виде дополнительного клика в графическом редакторе для убирания серого фона. На фото выше пришлось чуть задрать уровни, зато получилась уже нормальная раскраска, пригодная для печати.
![Чуть-чуть подтянул уровни Чуть-чуть подтянул уровни](https://habrastorage.org/getpro/habr/upload_files/119/57e/782/11957e782d421b9117d9289ca11af0e1.png)
Другие генеративные сети справляются более детализировано. Ниже пример от Stable Diffusion.
![Black and White Coloring book: unicorn looking at the sun, panda baby next to him Black and White Coloring book: unicorn looking at the sun, panda baby next to him](https://habrastorage.org/getpro/habr/upload_files/48b/b66/be3/48bb66be3ad52bc676fee5865069b559.png)
Но! тут и доводить до ума дольше, раскрашивать из‑за деталей уже не так интересно, плюс требуется перевод на английский, что немного лишает процесса магии.
Зато в таких сетях отлично генерировать детализированные раскраски, пригодные уже для более взрослых детей. Ниже ответ на запрос: детализированная раскраска девушка павлина.
![Detailed black and white coloring: peacock girl Detailed black and white coloring: peacock girl](https://habrastorage.org/getpro/habr/upload_files/44b/160/394/44b160394d5a598b654f8208357d9787.png)
Еще одним персональным минусом развитых генеративных сетей типа MidJourney является выбор из 4 вариантов. А выбор не всегда хорошо — маленький заказчик начинает требовать совместить вариант 3 и 4, что бывает проблемно. Проще перегенерить. Поэтому возвращаемся к Кандинскому, где его неразвитость может быть обращена в плюс.
Сам кандинский, конечно, еще очень сыр. Начиная с того, что после генерации картинки, даже если полностью изменить описание, он все равно пытается просто перерисовать текущую. Приходится перезаходить. Второе — при попытке скачать изображение он всегда ошибается с рамкой для выбора скачиваемой части картинки. Немного бесит.
Но, зато он дает отличный простор для воображения.
![Промт: "Раскраска: алладин дерется на мечах с черепашкой ниндзя" Промт: "Раскраска: алладин дерется на мечах с черепашкой ниндзя"](https://habrastorage.org/getpro/habr/upload_files/7aa/2ae/924/7aa2ae9249d9ffa304dcd78d7f0e872c.png)
Забавно, что сами авторы сетей, очевидно, не предполагают такого использования своего творения. В кандинском можно явно задать стиль выводимого изображения, но стиль именно раскраски в нем отсутствует.
![](https://habrastorage.org/getpro/habr/upload_files/d91/e78/58d/d91e7858d3143d8628abe2deddd96e2b.png)
Аналогично в других сетях генерации изображения. Между тем, если прямо задать такой стиль в описании, получается похоже.
![Промт: Кукла LOL в кабине звездолета “Сокол тысячелетия” Промт: Кукла LOL в кабине звездолета “Сокол тысячелетия”](https://habrastorage.org/getpro/habr/upload_files/4cb/496/6c0/4cb4966c026e9b6dc330db68535113e7.png)
Кукла, конечно, нифига не LOL, но большие глаза «продали» картинку заказчику. Плюс небольшая пасхалка в виде R2D2 в панели слева :)
Комментарии (16)
sergeyns
13.04.2023 07:49+2Беспокоит одна мыслишка.. насколько безопасно знакомить детей с недозрелым творчеством нейронок.. Так мы нейронки детей будем тренировать на искаженном результате деятельности наших нейронок... Потом придется объяснять почему у настоящих лошадей всего 4 ноги, а не 5 или 6...
Отвечаю редактированием этого поста, т.к. иначе никак (.
каляку-маляку от соседа по саду ребенку показываете
Если вы будете постоянно показывать ребенку каляки-маляки, то, в общем, выше этого уровня ребенок у вас не "прыгнет"... а в советских мультиках с цветами и числом ног всё в порядке. Ребенок познает мир, и фильтра "вот это правильно, а вот это - так не бывает, и чисто для развлечения" у него нет...
Fen1kz
13.04.2023 07:49+10я не психолог, но думаю что уровень опасности и урон для психики будет примерно 0.2-0.3 по шкале ОСМ (обычного советского мультика)
Maslukhin Автор
13.04.2023 07:49+5Вы когда каляку-маляку от соседа по саду ребенку показываете - видимо наносите непоправимую психическую травму.
Maslukhin Автор
13.04.2023 07:49+2Покажите ему утконоса. Вот кого точно нейросеть генерила. Или бразильскую горбатку :))))
Вы почему-то считаете, что при встрече с необычным у ребенка случится BSOD. Нет, конечно. Понятно, что если все время показывать результаты нейросети, ничего хорошего не будет. Но это никто и не предлагает же
Schwalbach
13.04.2023 07:49-2все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.
я категорически не рекомендую использовать картинки с подобными ошибками для развития детей, особенно с образами живых существ.
кривые домики с нереальными окнами или какие-то чудо автомобили - ради бога, но тут - не стоит. кроме того картинки в посте попросту уродливы.
f614
13.04.2023 07:49+4Интересно, сколько детей по вашей логике получили травму, когда узнали, что животные в реальности не умеют разговаривать, как в 90% мультфильмов.
Kanut
13.04.2023 07:49все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.
Мне даже страшно подумать к каким девиациям привели мультики и иллюстрации к детским книжкам… Да одни только Муми-тролли наверное загубили тысячи жизней....
f614
13.04.2023 07:49+1Как то не додумался до подобного применения, можно даже лазерный гравер достать с балкона.
Aniro
13.04.2023 07:49+2По стэйбл дифьюжину - можно же взять не базвоую модель, а файнтюн на мультиках или раскрасках. А можно взять оба и смерджить. Есть еще плагин для векторизации. Не проверял, но должно получиться на вполне годном уровне.
Voiddancer
Как многодетный отец выражаю вам огромное спасибо за идею!