Привет, меня зовут Алина, и я нейрохудожник. В ТГ-канале «Параллельные издания» я выкладываю свои работы, сгенерированные в нейросети. Вы можете по-разному относиться к предыдущей фразе: с презрением («не может быть СВОИХ работ из НЕЙРОсети»), с негодованием («Я тоже рисую в нейросети, но не заявляю, что я нейрохудожник»), с интересом («Ого, почитаю, а то у меня не получается нарисовать то, что хочу») и даже благоговением («У меня до сих пор руки не дошли что-то нарисовать в нейросети, а человек уже нейрохудожником стал»). Прежде, чем спорить о праве называться нейрохудожником, стоит сперва ответить на более общий вопрос: а можно ли называть искусством генерацию изображений в нейросети?
Ничто не ново под луной: дискуссии об искусстве тянутся испокон веков. В эпоху Возрождения разгорелся спор между реалистами и идеалистами о том, что первично — идеи или видимый мир — и малые голландцы, мастера жанровой живописи, подвергались критике за то, что их картины не соответствовали идеалам и часто изображали повседневную жизнь. В XIX веке фотографии считались механическими репродукциями реальности, лишенными души и творчества. В первые десятилетия XX века фильмы считались развлекательным зрелищем, а не искусством, пока не вышли фильмы «Рождение нации» (1915) и «Броненосец Потемкин» (1925).
В этой статье на примере цифрового искусства я разберу смысл изображения на составляющие части и соберу его заново, показав, как при помощи нейросети мы слой за слоем можем усложнять иллюстрацию. С каждым новым наложенным пластом информации мозг будет считывать изображение как более интересное и глубокое. Помимо транслирования моих взглядов на нейроискусство статья несёт практическую пользу. Я буду приводить промты, то есть текстовые запросы для генерации изображений, в одной из нейросетей — Midjourney — на примере цветка кувшинки. Для использования промтов под свои нужды нужно будет заменить слова «water lily» на любой другой объект.
Что такое искусство
На примере кино проще всего объяснить, какое произведение мы назовем искусством: то, в котором зритель увидит несколько пластов.
Романтический вечер, влюбленные сидят за столиком при свечах, герой говорит героине: «Я люблю тебя». И если он под этими словами подразумевает, что он её любит, то это не искусство: когда автор описывает ровно то, что происходит, а герои говорят ровно то, что думают, это лишь первый слой, «высказанное» — идеи и чувства, которые герой решается открыть другим.
В хорошем кино зритель услышит второй слой, «невысказанное» — мысли и чувства, которые герой произносит внутренним голосом и только себе самому. «Я не уверен, как ты примешь эти слова и что они значат для тебя», «Пожалуйста, только не отталкивай меня» или даже «Надеюсь, ты попадешься на крючок».
Третий слой, «невысказываемое» — неосознанные желания и страсти, которые герой не может выразить словами даже себе, потому что они слишком смутны и трудно определимы. «Мне нужно быть хоть с кем-то, я не могу быть один», «Когда на меня не обращают внимание, я хочу умереть» или даже «Я должен добиваться недоступных женщин, чтобы чувствовать себя уверенно».
Иногда может быть ещё и четвертый слой — за всеми переживаниями героя можно разглядеть позицию режиссера, который уже знает, что суждено героям: совместное счастье или разлука.
Если вы увидели разницу между представленными изображениями и почувствовали, что разные кадры влюбленной пары несут разное наполнение, тогда вам будет интересно дочитать эту статью.
Место нейрохудожника в изобразительном искусстве
Цифровое искусство — это форма искусства, созданная с использованием компьютерных технологий или цифровых устройств. Оно может включать в себя различные формы, такие как компьютерная графика, цифровая живопись, анимация, мультимедийное искусство, цифровая фотография и даже интерактивные инсталляции. Цифровые художники используют специальные программы и инструменты для создания своих произведений.
Нейрохудожник создает цифровое изображение, но только определенным способом — превращая текст в изображение в нейросети. Однако самое главное отличие нейрохудожников от всех остальных мастеров не в уникальности работы с нейросетью: создавать изображение из текста может научиться каждый, кто умеет печатать. Я вижу несколько характерных особенностей работы именно нейрохудожника:
Широкий арсенал техник и инструментов, накопленных за всю историю человечества. Для его использования надо постоянно расширять свой кругозор.
Возможность тренировать нейросеть и прокачивать её мастерство — причем не в одиночку. Техника исполнения находится вне художника и над её улучшением работают все пользователи нейросети.
Из предыдущего пункта следует, что ты никогда не можешь получить одинаковое изображение из одного промта. Они будут похожи, но всегда отличаться, а с течением времени даже меняться.
По мере расширения арсенала и кругозора нейрохудожник способен довольно быстро по сравнению с остальными творческими людьми прокачать насмотренность.
Ниже я рассмотрю три смысла, которые я вкладываю в понятие цифрового искусства и предоставлю промты для генерации каждого. Потом я объединю промты, чтобы показать, что изображение становится интереснее и сложнее, его хочется разглядывать, о нем хочется думать и делать выводы. Я приведу примеры использования таких изображений в статьях на айти-тематику. И, наконец, сделаю вывод о том, можно ли считать это всё искусством.
Пустота, из которой рождается изображение
Мне сложно представить пустоту, предшествовавшую Большому Взрыву. Однако даже когда я была далека от программирования, я понимала, что в виртуальном мире объект можно создавать из ничего и окруженным ничем. Глубокая темень, таящая в себе миллиарды возможностей — так я представляю себе плодородную почву для выращивания цифровых цветов. Вот несколько способов изобразить пустоту.
Частицы, из которых изображение состоит
Я не могу без микроскопа разглядеть даже молекулу и клетку, не говоря уж об атомах и кварках, поэтому физический мир представляется в сознании достаточно целостным. Однако когда я думаю о цифровом мире, я представляю Нео из Матрицы, окруженного зелёными цифрами, и старые компьютерные игры с огромными пикселями. Характерный признак виртуального изображения — его декомпозируемость на ячейки, причем не все ячейки могут быть заполнены. Виртуальный цветок берет свое начало необязательно из корня: он может начаться и с лепестка.
Кстати, ASCII-графика, на которую я ссылаюсь в данном промте — показательный пример того, как название в промте не соответствует результату. Это изображение больше походит на Майнкрафт, чем на эски графику, однако результат соответствует моим целям, поэтому я использую именно этот промт.
Экран, на который проецируется изображение
Первые два пункта — пустота и частицы — можно отнести и к картине, нарисованной на листе. Так что же отличает цифровое искусство? Оно проектируется и создается для того, чтобы быть отображенным на экране. На экране могут быть помехи, зернистость, неестественные цвета, блики, разный контраст и яркость, экран может разбиться. Водная лилия берет свое начало из глубины, но распускается на поверхности пруда. Отображение — финальный слой смысла, который я вижу в цифровом искусстве.
Два слоя
Теперь я покажу эффекты, которые дают комбинации разных промтов из трех приведенных выше групп. Отдельные промты показали себя особенно устойчивыми и предсказуемыми, поэтому к ним я приложу несколько удачных изображений, а не одно.
Пустота + Частицы
При объединении на одной картине пустоты и частиц я угадываю процесс того, как цветок кувшинки создается буквально у меня на глазах и вот-вот сформируется, обретя форму.
Частицы + Экран
По точным координатам пиксели на экране — в процессе передачи сигналов с тонкопленочных транзисторов на жидкокристаллические панели — отражают результаты трудов: цветок, проявляющийся на границе реального и виртуального миров. Изображение на этих картинах более статичное, хотя и кажется, будто вот-вот рассыпется.
Пустота + экран
В этой комбинации промтов нет ничего о пикселях и цифровом коде: целостная картинка бьётся об экран прямиком из пустоты. Цифровой цветок, который выпрыгнул на поверхность минуя процесс сотворения и оттого еще не сформировался, оставляет ощущение незавершенности и большой скорости.
Три слоя
Совмещение трех стилей в промтах притягивает взгляд и выглядит сложнее, чем все предыдущие картины.
Тренировка нейросети
Все картинки выше было бы невозможно создать, если бы десятки тысяч людей со всего мира не генерировали в Midjourney изображения в соответствии со своими представлениями о прекрасном. Как нейрохудожник я часто тренирую нейросеть: отбираю лучшие изображения, увеличиваю их, создаю вариации и делаю так снова и снова, пока нейросеть не обучится создавать по определенному промту ожидаемый результат.
Вот, например, мой промт, на обучение которому я потратила полгода назад несколько вечеров:
С тех пор нейросеть развилась и сочетание «Nick Veasey» и «dotted pattern projecting texture» дает потрясающие результаты.
А вот другой промт. Несколько месяцев назад я тренировала нейросеть создавать цветок магнолии в процессе проектирования:
Промт до сих пор не очень устойчивый, хотя мне удалось добиться похожего результата для кувшинки:
Кстати, а что будет, если использовать все указанные мной 15 стилей в одном промте?
Как видите, ничего особенного в этом изображении по сравнению с предыдущими нет. Написание промтов — это не та область, в которой количество переходит в качество.
Практическое применение промтов
У Рене Магритта есть картина «Вероломство образов», на которой изображена курительная трубка с надписью «Это не трубка», потому что это не сама трубка, а ее образ. Вот, что говорил сам Магритт: «Эта знаменитая трубка. Как люди попрекали меня ей! И всё же, вы можете набить её табаком? Нет, это ведь всего лишь изображение, не так ли? Так что, если бы я написал под картиной „Это трубка“, я бы солгал!»
В промтах выше я не учу создавать цифровое искусство, а показываю, как создать изображение, которое бы указывало на то, что это искусство — цифровое. Такие картинки можно использовать в статьях и рекламе для описания цифровых продуктов, делая акцент на их создании, содержании или отображении. Ниже я приведу примеры на основе всё тех же 15 стилей, которые я указала выше, хотя их существует несколько тысяч. За время своей работы я использовала более тысячи стилей.
Например, если я хочу рассказать о том, как наша фирма создавала логистическую систему для транспортной компании, я подсвечу в изображении процесс проектирования.
Если я рассказываю о характеристиках системы, я покажу ее устойчивой и осязаемой, при этом не убирая фокусировку с того, что это цифровой продукт. Вот так бы я подчеркнула надежность системы в любых условиях.
А вот так — скорость.
А с помощью следующей иллюстрации я бы намекнула, что разработки конкурентов не отличаются высоким качеством.
Возьмем другой пример — приложение для знакомств. Если пользователям важен подбор партнера по анализу совместимости, я бы сделала акцент на лежащих в его основе алгоритмах.
Если пользователи ищут разовые свидания, я бы добавила цвет — для страсти.
Если пользователи ищут долгосрочные отношения и брак, я бы дополнительно нанесла слой старомодности.
А, быть может, кто-то ожидает историю любви, как в кино?
Авторский взгляд
Я постаралась описать, как нейрохудожник может добиваться нужного впечатления в зависимости от контекста, но это всё ещё не искусство, а визуализации и рекламные изображения. Так что же сделает нейроизображения искусством? Ровно то же самое, что делает искусством картину, фотографию или кино. Это способность художника убрать от холста кисть, когда картина закончена; способность фотографа в нужный момент нажать на спуск затвора; способность режиссера выстроить кадр и начать снимать. Сочетание технического мастерства и творческой интуиции называется авторским взглядом.
Авторский взгляд отличается тем, что его эффект на зрителя невозможно предугадать: картина живет своей жизнью, в ней не три и не четыре смысла, а тысячи. Не все пласты мы можем разделить и отрефлексировать, но подсознательно мы их понимаем. Умению видеть нельзя научить, но в его основе лежит сама суть нейросети: тренировка насмотренности на лучших работах.
Импрессионист Клод Моне писал цикл «Кувшинки» из 250 картин в течение 30 лет. Я посмотрела 240 изображений кувшинок на основе 60 разных техник за 3 часа. В статью попала десятая часть. Из 240 картинок у меня получилось только три изображения, из которых можно развить авторский стиль. Они получились случайно, их не удается воспроизвести, а, значит, я буду тренировать нейросеть: создавать вариации этих изображений, выбирать, увеличивать лучшие.
За полтора года работы в Миджорни я много раз тренировала нейросеть и выработала несколько собственных техник, многие из них сложносоставные: например, надо переводить изображение из одной версии Миджорни в другую или наслаивать изображения друг на друга. Вот три промта, которые я использую в версиях Миджорни v 6 или v 3:
… in the style of Wong Kar-wai
Sam Toft’s illustration of a …
Nick Veasey’s clean, sketch-style illustration depicting a … --weird 100
Получившееся изображение использую с другим промтом в другой версии, чтобы добиться нужного мне эффекта. Ниже я приведу несколько работ в своём стиле.
Все изображения сделаны в разных техниках и разными промтами, но их объединяет мой взгляд: я люблю приглушенный свет, небрежность и одиночество.
Если вам интересно продолжить исследование темы нейроискусства, приглашаю в свой ТГ-канал «Параллельные издания».
propulsive
Искусство — это процесс и результат осмысления действительности, вызывающий эмоциональный отклик. Если вы, глядя на изображение котика, сгенерированного нейросетью, чувствуете радость, умиление или любое другое сильное чувство — разве это не искусство? Ведь настоящая ценность искусства в способности затронуть нас, вызвать эмоции и оставить след в нашем сердце.
Wesha
А если сильное чувство "тля, ну когда же оно наконец научится в анатомию?"
propulsive
geirby
А что тут "осмыслено"? В чем мысль этой картинки?
Котиками мы и на фотках умиляемся.
propulsive
в данном случае это мой ответ в виде расстроенного котика на "тля, ну когда же оно наконец научится в анатомию?"
Wesha
ИЧСХ этот котик является отличной иллюстрацией. Вы живого котика когда-нибудь видели? (Картинка-то с претензией на фотореалистичность.) Вы пропорции котёнка себе ну хоть примерно себе представляете? Что это за мутант, у которого тело в несчастных два раза больше головы? И где вы видели, чтобы вибриссы имели столько изломов? У моего котика вибриссы — честные сплайны!
(Размышляя) Интересно, почему у моего поколения ещё вовсю работает эффект зловещей долины, а у молодьожи — одно сплошное ми-ми-ми как красиво? А ну как это кармодиед?
geirby
Он получился очень милым, но, простите, не грустным. Понимаете, искусство настолько спонтанно и феноменально, что для того чтобы изобразить расстроенного котика иногда не нужен ни котик, ни "расстройство", и тем не менее, всем будет понятен ОБРАЗ.
Вот лапки четыре прошли под дождем.
Вот лапки четыре царапались в дом...
Сотрут милосердные струи воды
Ушедших за радугой лапок следы.
Wesha
А также не котиком. Ну не бывает у котиков, даже самых маленьких, настолько огромная голова. Так что это кармодиед, прикидывающийся котиком. Ну в крайнем случае флёркен!
evtomax
Вы потеряли первую часть своего же определения. Чтобы называться искусством, это ещё и должно быть процессом и результатом осмысления действительности. Натягивание образов на шум по ключевым словам - это не результат осмысления действительности. Если что-то вызывает у вас сильное чувство, но за этим что-то не стоит создатель, который осмысленно показывал действительность так, чтобы вызвать у вас сильное чувство, то это не является искусством.
По этому критерию надёжно отсеивается и так называемое современное искусство. Если без расшифровки никто не может чувствами или разумом понять, что изображено на картине, то автор занимался чем угодно, но не осмыслением действительности так, чтобы это вызвало эмоциональный отклик.
propulsive
А кто стоит? Нейросеть сама для себя инструкцию придумала, после осмысления действительности?
savostin
Нет, как мне кажется, ни осмысления действительности с той стороны, ни эмоционального отклика с этой. Так что для меня пока не искусство.
Polyguner
так может не стоит свои определения выдумывать ? Тем более что под такое определение попадет например - включить на всю музыку в 2 часа.. ну потому что я так чувствую. эмоциональный отклик будет у всех.
Wesha
Плавно переходящий в физический!