Мне кажется, я нашел самое правильное применение генеративных сетей, рисующих по описанию. Это генерация раскрасок!
У меня есть дети. Дети равно раскраски. Раскраски — это постоянный поиск всякой фигни, типа «хочу чтобы был единорог, а рядом его малыш панда, и чтобы малыш был похож на маму». Интересно, что нейросети неплохо справляются с такими задачами. Причем, забавный момент — результаты начинающих нейросетей, типа того же Кандинского, принимаются более благосклонно, потому что рисуют они пока плохо. Но! эта «плохость» и ошибки в изображениях очень похожи на рисунки ребенка и воспринимается за творение собрата по детсаду/школе.
Были варианты, больше похожие на панду, но этот был выбран заказчиком как, цитирую «самый милый». Ну и увы, варианты от Кандинского требуют финального штриха в виде дополнительного клика в графическом редакторе для убирания серого фона. На фото выше пришлось чуть задрать уровни, зато получилась уже нормальная раскраска, пригодная для печати.
Другие генеративные сети справляются более детализировано. Ниже пример от Stable Diffusion.
Но! тут и доводить до ума дольше, раскрашивать из‑за деталей уже не так интересно, плюс требуется перевод на английский, что немного лишает процесса магии.
Зато в таких сетях отлично генерировать детализированные раскраски, пригодные уже для более взрослых детей. Ниже ответ на запрос: детализированная раскраска девушка павлина.
Еще одним персональным минусом развитых генеративных сетей типа MidJourney является выбор из 4 вариантов. А выбор не всегда хорошо — маленький заказчик начинает требовать совместить вариант 3 и 4, что бывает проблемно. Проще перегенерить. Поэтому возвращаемся к Кандинскому, где его неразвитость может быть обращена в плюс.
Сам кандинский, конечно, еще очень сыр. Начиная с того, что после генерации картинки, даже если полностью изменить описание, он все равно пытается просто перерисовать текущую. Приходится перезаходить. Второе — при попытке скачать изображение он всегда ошибается с рамкой для выбора скачиваемой части картинки. Немного бесит.
Но, зато он дает отличный простор для воображения.
Забавно, что сами авторы сетей, очевидно, не предполагают такого использования своего творения. В кандинском можно явно задать стиль выводимого изображения, но стиль именно раскраски в нем отсутствует.
Аналогично в других сетях генерации изображения. Между тем, если прямо задать такой стиль в описании, получается похоже.
Кукла, конечно, нифига не LOL, но большие глаза «продали» картинку заказчику. Плюс небольшая пасхалка в виде R2D2 в панели слева :)
Комментарии (16)
sergeyns
13.04.2023 07:49+2Беспокоит одна мыслишка.. насколько безопасно знакомить детей с недозрелым творчеством нейронок.. Так мы нейронки детей будем тренировать на искаженном результате деятельности наших нейронок... Потом придется объяснять почему у настоящих лошадей всего 4 ноги, а не 5 или 6...
Отвечаю редактированием этого поста, т.к. иначе никак (.
каляку-маляку от соседа по саду ребенку показываете
Если вы будете постоянно показывать ребенку каляки-маляки, то, в общем, выше этого уровня ребенок у вас не "прыгнет"... а в советских мультиках с цветами и числом ног всё в порядке. Ребенок познает мир, и фильтра "вот это правильно, а вот это - так не бывает, и чисто для развлечения" у него нет...
Fen1kz
13.04.2023 07:49+10я не психолог, но думаю что уровень опасности и урон для психики будет примерно 0.2-0.3 по шкале ОСМ (обычного советского мультика)
Maslukhin Автор
13.04.2023 07:49+5Вы когда каляку-маляку от соседа по саду ребенку показываете - видимо наносите непоправимую психическую травму.
Maslukhin Автор
13.04.2023 07:49+2Покажите ему утконоса. Вот кого точно нейросеть генерила. Или бразильскую горбатку :))))
Вы почему-то считаете, что при встрече с необычным у ребенка случится BSOD. Нет, конечно. Понятно, что если все время показывать результаты нейросети, ничего хорошего не будет. Но это никто и не предлагает же
Schwalbach
13.04.2023 07:49-2все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.
я категорически не рекомендую использовать картинки с подобными ошибками для развития детей, особенно с образами живых существ.
кривые домики с нереальными окнами или какие-то чудо автомобили - ради бога, но тут - не стоит. кроме того картинки в посте попросту уродливы.
f614
13.04.2023 07:49+4Интересно, сколько детей по вашей логике получили травму, когда узнали, что животные в реальности не умеют разговаривать, как в 90% мультфильмов.
Kanut
13.04.2023 07:49все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.
Мне даже страшно подумать к каким девиациям привели мультики и иллюстрации к детским книжкам… Да одни только Муми-тролли наверное загубили тысячи жизней....
f614
13.04.2023 07:49+1Как то не додумался до подобного применения, можно даже лазерный гравер достать с балкона.
Aniro
13.04.2023 07:49+2По стэйбл дифьюжину - можно же взять не базвоую модель, а файнтюн на мультиках или раскрасках. А можно взять оба и смерджить. Есть еще плагин для векторизации. Не проверял, но должно получиться на вполне годном уровне.
Voiddancer
Как многодетный отец выражаю вам огромное спасибо за идею!