Мне кажется, я нашел самое правильное применение генеративных сетей, рисующих по описанию. Это генерация раскрасок!

У меня есть дети. Дети равно раскраски. Раскраски — это постоянный поиск всякой фигни, типа «хочу чтобы был единорог, а рядом его малыш панда, и чтобы малыш был похож на маму». Интересно, что нейросети неплохо справляются с такими задачами. Причем, забавный момент — результаты начинающих нейросетей, типа того же Кандинского, принимаются более благосклонно, потому что рисуют они пока плохо. Но! эта «плохость» и ошибки в изображениях очень похожи на рисунки ребенка и воспринимается за творение собрата по детсаду/школе.

Промт: “Раскраска: единорог смотрит на солнце, рядом его ребенок панда. Белый фон”
Промт: “Раскраска: единорог смотрит на солнце, рядом его ребенок панда. Белый фон”

Были варианты, больше похожие на панду, но этот был выбран заказчиком как, цитирую «самый милый». Ну и увы, варианты от Кандинского требуют финального штриха в виде дополнительного клика в графическом редакторе для убирания серого фона. На фото выше пришлось чуть задрать уровни, зато получилась уже нормальная раскраска, пригодная для печати.

Чуть-чуть подтянул уровни
Чуть-чуть подтянул уровни

Другие генеративные сети справляются более детализировано. Ниже пример от Stable Diffusion.

Black and White Coloring book: unicorn looking at the sun, panda baby next to him
Black and White Coloring book: unicorn looking at the sun, panda baby next to him

Но! тут и доводить до ума дольше, раскрашивать из‑за деталей уже не так интересно, плюс требуется перевод на английский, что немного лишает процесса магии.

Зато в таких сетях отлично генерировать детализированные раскраски, пригодные уже для более взрослых детей. Ниже ответ на запрос: детализированная раскраска девушка павлина.

Detailed black and white coloring: peacock girl
Detailed black and white coloring: peacock girl

Еще одним персональным минусом развитых генеративных сетей типа MidJourney является выбор из 4 вариантов. А выбор не всегда хорошо — маленький заказчик начинает требовать совместить вариант 3 и 4, что бывает проблемно. Проще перегенерить. Поэтому возвращаемся к Кандинскому, где его неразвитость может быть обращена в плюс.

Сам кандинский, конечно, еще очень сыр. Начиная с того, что после генерации картинки, даже если полностью изменить описание, он все равно пытается просто перерисовать текущую. Приходится перезаходить. Второе — при попытке скачать изображение он всегда ошибается с рамкой для выбора скачиваемой части картинки. Немного бесит.

Но, зато он дает отличный простор для воображения.

Промт: "Раскраска: алладин дерется на мечах с черепашкой ниндзя"
Промт: "Раскраска: алладин дерется на мечах с черепашкой ниндзя"

Забавно, что сами авторы сетей, очевидно, не предполагают такого использования своего творения. В кандинском можно явно задать стиль выводимого изображения, но стиль именно раскраски в нем отсутствует.

Аналогично в других сетях генерации изображения. Между тем, если прямо задать такой стиль в описании, получается похоже.

Промт: Кукла  LOL в кабине звездолета “Сокол тысячелетия”
Промт: Кукла  LOL в кабине звездолета “Сокол тысячелетия”

Кукла, конечно, нифига не LOL, но большие глаза «продали» картинку заказчику. Плюс небольшая пасхалка в виде R2D2 в панели слева :)

Комментарии (16)


  1. Voiddancer
    13.04.2023 07:49
    +3

    Как многодетный отец выражаю вам огромное спасибо за идею!


  1. sergeyns
    13.04.2023 07:49
    +2

    Беспокоит одна мыслишка.. насколько безопасно знакомить детей с недозрелым творчеством нейронок.. Так мы нейронки детей будем тренировать на искаженном результате деятельности наших нейронок... Потом придется объяснять почему у настоящих лошадей всего 4 ноги, а не 5 или 6...

    Отвечаю редактированием этого поста, т.к. иначе никак (.

    каляку-маляку от соседа по саду ребенку показываете 

    Если вы будете постоянно показывать ребенку каляки-маляки, то, в общем, выше этого уровня ребенок у вас не "прыгнет"... а в советских мультиках с цветами и числом ног всё в порядке. Ребенок познает мир, и фильтра "вот это правильно, а вот это - так не бывает, и чисто для развлечения" у него нет...


    1. Fen1kz
      13.04.2023 07:49
      +10

      я не психолог, но думаю что уровень опасности и урон для психики будет примерно 0.2-0.3 по шкале ОСМ (обычного советского мультика)


    1. Maslukhin Автор
      13.04.2023 07:49
      +5

      Вы когда каляку-маляку от соседа по саду ребенку показываете - видимо наносите непоправимую психическую травму.


    1. Maslukhin Автор
      13.04.2023 07:49
      +2

      Покажите ему утконоса. Вот кого точно нейросеть генерила. Или бразильскую горбатку :))))

      Вы почему-то считаете, что при встрече с необычным у ребенка случится BSOD. Нет, конечно. Понятно, что если все время показывать результаты нейросети, ничего хорошего не будет. Но это никто и не предлагает же


    1. GlukKazan
      13.04.2023 07:49
      +1

      В том-то и дело, что у этих пони ног не 4, а именно 5 или 6 (или больше)


      1. Maslukhin Автор
        13.04.2023 07:49

        Это просто другой пони стоит сзади. Это стало :)


  1. Schwalbach
    13.04.2023 07:49
    -2

    все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.

    я категорически не рекомендую использовать картинки с подобными ошибками для развития детей, особенно с образами живых существ.

    кривые домики с нереальными окнами или какие-то чудо автомобили - ради бога, но тут - не стоит. кроме того картинки в посте попросту уродливы.


    1. Maslukhin Автор
      13.04.2023 07:49
      +3

      Эээ, а когда дети рисуют лишние ноги, это как?


    1. vassabi
      13.04.2023 07:49
      +2

      извините, а у вас сколько детей в семье ?


    1. f614
      13.04.2023 07:49
      +4

      Интересно, сколько детей по вашей логике получили травму, когда узнали, что животные в реальности не умеют разговаривать, как в 90% мультфильмов.


    1. Kanut
      13.04.2023 07:49

      все верно, у детей под влиянием таких недокартинок могут сформироваться ошибочные базисные образы, что может привести к любым девиациям впоследствии.

      Мне даже страшно подумать к каким девиациям привели мультики и иллюстрации к детским книжкам… Да одни только Муми-тролли наверное загубили тысячи жизней....


  1. alex3f
    13.04.2023 07:49
    +1

    Спасибо за идею! Кстати, стиль можно прямо в запросе писать: "День космонавтики и хомячка, в стиле Левитана, маслом", а для раскрасок можно просто "День космонавтики и хомячка, раскраска"


    1. Maslukhin Автор
      13.04.2023 07:49
      +4


  1. f614
    13.04.2023 07:49
    +1

    Как то не додумался до подобного применения, можно даже лазерный гравер достать с балкона.


  1. Aniro
    13.04.2023 07:49
    +2

    По стэйбл дифьюжину - можно же взять не базвоую модель, а файнтюн на мультиках или раскрасках. А можно взять оба и смерджить. Есть еще плагин для векторизации. Не проверял, но должно получиться на вполне годном уровне.