▎Добрый день, дорогие хабражители!
Сегодня должно было выйти продолжение серии Анатомия игры, но у Вселенной оказались свои планы на мой компьютер. С другой стороны, где-то что-то убыло, где-то что-то прибыло. Так же можно сказать и о сегодняшнем объекте нашего внимания.
Недавно, буквально пару дней назад, закрылась халявная лавочка под названием MidJourney. Вернее, по-настоящему халявной она никогда не была, но к этому мы еще вернемся.
Здесь я представлю список бесплатных AI-painter'ов — нейросетей, способных заменить MidJourney.
Это не рейтинг, так как одни нейросети хорошо справляются с одними задачами, а другие — с прямо противоположными. Хотя свой личный выбор я все же обозначу.
Сей пост — не реклама, я просто делюсь с вами полезными знаниями.
Ну что, погнали?
Примечание: в посте не будет программ, чья единственная функция — делать картинки из фото. Речь пойдет именно о генераторах, в том числе поддерживающих обработку фото. Все картинки в посте сгенерированы мной. Можете сохранить их себе как пример (хотя лучше сгенерируйте свои), но воздержитесь от коммерческого использования. Споры о том, погубят ли ИИ современное общество, лучше оставить для соответствующего поста. |
▎Что такое MidJourney
MidJourney — одна из мощнейших нейросетей, генерирующая картинки на основе текстового запроса — промта (англ. promts). Работала она через команды в канале своего официального сервера в Discord.
Нейросети — программные алгоритмы, имитирующие элементы работы нервной системы человека. В частности, нейронки могут выполнять весьма сложные логические операции, например, узнавать (распознавать объект по признакам), каталогизировать, сравнивать, описывать и т.д. Ряд нейросетей может выполнять и более сложные задачи. |
Формально, НС — это весьма продвинутые логические алгоритмы, наподобие тех, что выдают вам «умные» рекомендации в ленте в вашей любимой социальной сети, которые работают на основе предыдущих запросов. Но куда более сложные и развитые.
По сути, это практически уже тот самый Искусственный интеллект, как в фантастических романах.
Вообще, сами по себе нейросети появились более двадцати лет назад, но из-за недостатка вычислительных мощностей, ограничений по количеству и сложности операций и итераций, недостатков движков и языков программирования и сложностей с организацией обучения полноценно развиваться они начали только с 2015 года. Я думаю, тогда уже слышали про бота, который мог поддерживать разговор наравне с живым человеком. И которого закрыли из-за нарастающей паники по поводу слижком человечного общения и изобретения собственного языка, на котором боты общались друг с другом. Было это еще в 2017 году.
Самыми известными (вернее, раскрученными в СМИ) являются ChatGPT и Midjourney.
Первая умеет внятно и почти адекватно отвечать на различные вопросы и писать более-менее связные тексты на заданную тему. Не без оговорок, конечно — итоговый результат больше похож на то, что ваш не слишком разбирающийся в вопросе, но очень начитанный друг попытался нагуглить ответ по первым результатам в поиске, игнорируя надежность источников. С художественными текстами получше, но ошибки в логике и построении сюжетов все же хорошо видны. Впрочем, по опыту обитания на отечественных самиздат-сайтах, люди в 80% совершают такие же ошибки.
Вторая специализируется на создании картинок по написанному тексту. Вам только нужно ввести команду /imagine (англ. «вообразить»), грамотно составить несколько словосочетаний на английском и через запятую добавить желаемые детали. Например, космонавт на зеленом лугу, закат на фоне, детализированный, кинематографичный, черно-белый и т.д. Но не все запросы одинаково хорошо воспринимаются нейросетью.
Например, у людей на картинках часто бывали проблемы с пальцами, а на фотореалистичных картинках возникали проблемы с фокусом, выпадение частей окружения, косяки освещения, проблемы с мехом и волосами и т.д. А уж заставить ИИ сделать приличного дракона — задача из разряда «миссия невыполнима». Кроме того, НС лучше воспринимает абстрактные понятия и простые конкретные запросы. Если вы описываете сложную динамичную сцену на абзац текста, результат вас, скорее всего, разочарует.
MidJourney или MJ обрела большую популярность за счет открытого бета-теста. Любой желающий мог зайти на официальный канал в Дискорде и с помощью несложных команд сгенерировать вполне пристойную картинку. Поначалу качество изображений было не ахти какое, однако сервис развивался, и к сегодняшнему дню MJ способен выдавать как весьма близкие к заданному стилю картинки, так и фотореалистичные пейзажи. Фотореалистичность и стала причиной закрытия бесплатного доступа, но об этом чуть позже. |
Но не все пользователи добросовестно создавали картинки. И дело не в монетизации результата генерации (собственно, во многих странах ИИ считается только инструментом создания и права на результат принадлежат пользователю).
Проблема, как всегда, оказалась в доверчивости людей, сидящих на новостных сайтах и всевозможных форумах — некоторые пользователи выложили фейковые новости со сгенерированными в MJ картинками с Папой Римским и американским президентом. Хотя, на мой взгляд, типичные для НС ошибки на картинках сразу выдают их фейковость. Так что халява кончилась — в генератор картинок больше не поиграть. Или поиграть?
▎AI-painters или ИИ-генераторы картинок
Artifical intelligence. ИИ: Starry AI
MJ была одной из мощнейший рисовальных НС, но не первой, не последней и не единственной.
Лично я насчитала почти два десятка бесплатных и условно бесплатных НС, и почти все из них попробовала. Список оных я вам сегодня и представляю. Также почти все они прекрасно работают на телефоне, а потому доступ к компьютеру вам не понадобится (кроме как для первой НС в списке). Однако все они (почти) работают исключительно через интернет, т.к. вычисления и операции проходят на облачном сервере, не нагружая ваше устройство. Кроме первой.
???? Для того, чтобы более-менее объяснить разницу в рисовалках, введем систему сущностных характеристик:
Платформа доступа (ПК, Android) Количество бесплатных попыток на аккаунт Доступные стили/режимы Финальное качество картинки (разрешение, детализация) Работа с референсами (создание картинки на основе картинки/фотографии, например, обработка своих фото для создания стилизованной аватарки) Промты на русском или поддержка запросов на русском языке (не все могут составить грамотный запрос, понятный для НС, особенно для сложных картинок) |
Кроме того, не все запросы одинаково хорошо воспроизводятся. Я уже упоминала, что MJ плохо справляется с драконами, особенно если не задавать ей уточнений по стилю. Это весьма распространенная проблема у нейросетей — поскольку большая часть НС сейчас имеет японское или китайское происхождение, драконы в них на выходе обычно имеют восточные мотивы. Либо являются совсем корявой кракозяброй с мордой, растущей на морде, мятыми парусами вместо крыльев и неопределенным количеством лап. Примерно такая же проблема и с другими мифологическими тварями.
Русалок ИИ рисуют чуть лучше, чертей и демонов похуже, мантикору или мимика даже по конкретному описанию придется выпрашивать десяток попыток. Дело в том, что для улучшения качества портретных картинок НС учат игнорировать аберрации (искажения) и удалять большую часть уродств вроде дополнительных глаз, пальцев или рогов. Некоторым разработчикам удается преодолеть это ограничение, но далеко не всем. Ну, а проблема с крыльями летающих существ в принципе распространена среди художников-людей. Что уж там, редкий фильм или игра с драконами может похвастаться приличными крыльями.
Еще один немаловажный момент: почти все нейросети плохо работают с отрицательными формами слов. Например, если написать в промте «человек без бороды» (man without beard) или «безбородый мужчина» (beardless man) нейросеть воспримет слова «мужчина» и «борода» (man и beard), но проигнорирует отрицательную форму или предлог «без» (without и суффикс -less) и сгенерирует вам мужика с бородой. То же самое и с частицей «не». Однако в некоторых проектах добавили отдельный модификатор Delete from, позволяющий заранее написать, чего не должно быть на вашей картинке.
Так что всем нейросетям будем задавать одни и те же задачи: сюжетная картинка с уточнениями стиля, дракон (потому что драконов почти все НС рисуют либо плохо, либо в виде китайских лунов, такова особенность бесплатных картинок), абстрактное понятие без уточнений. А именно:
Астронавт на поле пшеницы, заря, пейзаж, фотореализм — Astronaut on fields of wheat, sunset, landscape, photorealistic Дракон на скале, шторм, море — Dragon on cliff, storm sea Чертоги разума — Palace of Mind |
▎Stable Diffusion
Наиболее известный, развитый и мощный из AI-генераторов картинок в свободном доступе, созданный группой StabilityAI. Более того, исходный код программы также открыт на сервисе GitHub, что позволяет каждому желающему поработать с ним, прокачать или интегрировать в свой проект.
Официальный сайт проекта, если кому интересно, находится по этой ссылке |
- Первый — с помощью сервиса от Google — Google Collab. Все вычисления для генерации происходят на сервере Google. Но сходу разобраться, что и куда писать, весьма сложно. Впрочем, главное, что вам понадобится сделать — найти первую строку PROMT и вписать в нее свой запрос. Разделы ниже предназначены для работы с картинками и создания анимаций. Опробовать можно здесь (предупреждение — сайт страшно виснет) Спойлер: примеры работы с программой через браузерЗаглавная страница проекта:
Ниже — поля для ввода текста и модификаторы:
Чем меньше размер исходных картинок, тем быстрее генерация
- Второй — через сторонние и дочерние проекты, такие как Night cafe, объединяющий сразу несколько нейросетевых алгоритмов (Stable Diffusion. DALL-E, Artistic, Coherent и сервис обработки фото под арт по образцу Style transfer). Но, если честно, система токенов или кредитов (условной «валюты» для пользования или количество запросов) на этом сайте для меня остается туманной. То они начисляются за регистрацию, то нет. Ознакомиться тут.Спойлер: примеры работы через сторонний сервис NightCafeВыбор рисовальщика и стиля:
Вводите свой запрос в поле Promts и выбираете стиль:
Немного ждем. Время генерации зависит от загруженности сервера:
Результат — четыре картинки, каждую из которых можно увеличить (enhance), перегенерировать (evolve), скачать и т.д.:
- Третий — скачать локальную версию с адекватным GUI (оконный интерфейс) на свой компьютер и использовать ее. Внутри есть окно с полем для ввода и иконки с модификаторами, иллюстрирующие результат. Разрешение картинки и количество итераций (проходов визуализации, каждый проход улучшает качество) можно настраивать отдельно. Но в таком случае рендерить картинки НС будет на вашем компьютере, используя ресурс видеокарты и процессора. Так что чем мощнее ваш комп, тем быстрее и лучше результат. На слабом компьютере она тоже работает, но генерация одной картинки может занять до часа. Повторю: скачать можно тут.Спойлер с работой в stand-alone приложенииПри установке в корневой директории появится папка. Запуск интерфейса осуществляется через Start Stable Diffusion UI:
При первом запуске программа будет очень долго качать библиотеки и инструменты, все это займет до 20 Гб свободного места на диске. При последующих запусках процесс идет быстрее:
Сама программа после загрузки автоматически открывается в браузере. В поле слева вводите запрос, ниже — настройки размера, количества картинок, стилей и т.п.:
Надо отметить, что выход новых версий для локальной вариации отстает от оригинальной, поэтому некоторые стили и запросы могут выполняться хуже:
У меня сгенерировать на ПК не получилось, т.к. видеокарта вышла из строя.
Платформа: ПК. Количество бесплатных попыток: не ограничено на ПК и в Google, внутри сервисов свои правила. Доступные стили: более 100, можно смешивать. Финальное качество: зависит от настроек. Референс: да. Промты на русском: нет. |
▎Starry AI
Весьма сильный инструмент, позволяющий работать со сложными многосоставными запросами с возможностью смешивать стили. За один токен можно создать четыре картинки. Кроме целевого запроса (то есть, что вы хотите непосредственно увидеть) и ключевых слов вы можете воспользоваться выбором режима (фото или один из вариантов художественного произведения) и стилями, среди которых есть как комплексные пресеты (аниме-портрет, фэнтези-пейзаж). Вызвать конструктор можно по кнопке Promt builder/
В приложении есть возможность настроить желаемое качество картинок (увеличение количества итераций — проходов визуализации) с 50 до 150, и количество итоговых картинок — с 4 до 16 соответственно. Это потребует дополнительных токенов. Также за токены внутри самого приложения можно выбрать один из результатов и увеличить его до 8к. А также добавили возможность ретуши — вам предложат выделить область на картинке и внести уточнения в текст. |
Но лично на мой вкус пользоваться этой программой не очень удобно — в ней есть огромное количество модификаторов, хоть и оформленных в виде плиток с примерами. Каждый из модификаторов добавляет к вашему запросу еще один тег, обозначающий стиль, направление в искусстве, популярного автора или характеристику. Вы можете выбрать как готовые пресеты, так и самолично выбирать модификаторы из категорий — портрет, пейзаж, тренды в сообществах художников, эпоха и т.д.
Платформа: Android. Количество бесплатных попыток: минимум 5 в день в зависимости от качества и количества, накапливаются. Доступные стили: подсчету не поддаются, очень много модификаторов, можно смешивать. Финальное качество: до 8к. Референс: да. Промты на русском: нет. |
▎Инструмент ИИ-генерации внутри Picsart
Picsart — инструмент для обработки фотографий и рисования картинок для телефонов. Однако в последнее время появилась и встроенная нейросеть, весьма неплохо генерирующая по текстовому запросу. |
Полученное изображение можно сразу же отредактировать в рисовалке, так что для художников, мучающихся в отсутствие музы или времени, вариант почти идеальный:
Платформа: Android. Количество бесплатных попыток: не ограничено. Доступные стили: около 20. Финальное качество:1024х1024 Референс: нет (хотя в какой-то момент эта функция была в бета-версии) Промты на русском: да. |
▎Dream AI
На данный момент (тьфу-тьфу-тьфу, чтоб не сглазить) самый мой любимый инструмент. Начинала я в нем работать еще год назад, и кроме десяти абстрактных стилей в бесплатном режиме была всего пара более-менее «нормальных» стилей, включая Comic. Хотя он не комиксовый, а, скорее, графически-новелльный (причем не в смысле отомэ-игр, а в смысле графических романов Алана Мура).
Сейчас из платного доступа вышли еще полтора десятка очень красивых стилей. Есть Buliojourney, универсальный и в некоторой степени имитирующий MidJourney, есть создающие потрясающие по свету картинки Anime и Watercolour, особенно хорошо подходящие под нуарный киберпанк The cut, есть Spectral 2 для вечерних улочек Лондона и стимпанковских городов с налетом мистики, есть Flora 2, подражающая золотым индийским растительным орнаментам и абстрактным портретам из овощей, есть генератор фотографий с миниатюрами… И все это бесплатно, плюс с постоянными обновлениями и временным выходом платных стилей в бесплатный доступ.
Если добавить через знак "|" имя автора, то к конечной картинке будет применён дополнительный модификатор стиля. Вот, например, промт «Warhammer 40k spacemarines| Junji ito» — космодесантники Вахи в стиле известного хоррор-мангаки Дзюндзи Ито
А недавно добавили русский язык и еще два стиля, идеально подходящих для перетемненных картинок в духе Лавкрафтовских фанфиков. Кроме того, у меня, видимо, как-то образовалась подписка на бесплатную бета-версию, и мне доступна ретушь области финальной картинки по тексту. У сестры в этом же приложении такой функции нет.
Платформа: Android. Количество бесплатных попыток: не ограничено, но во время генерации и сохранения выскакивает реклама. Одна картинка за раз. Доступные стили: более 30, от абстрактных и лайн-артов до аниме и фотореализма. Финальное качество: 960х1568 (вертикальная картинка). Референс: да, с возможностью настроить «силу» сходства. Промты на русском: да. |
▎Wonder AI
Генерация из старой версии (август 2022)
Первоначально это был один из моих любимых инструментов, однако в последнее время создатели ограничили качество картинок в бесплатной версии, да и соответствие результата запросу стало порой сильно страдать.
При регистрации год назад программа выдавала по 4 картинки на запрос и позволяла делать до 10 бесплатных запросов в сутки, сейчас только одну картинку и три попытки. При этом вы еще и рискуете встать в очередь, которая может вылететь, потратив вашу попытку впустую. Впрочем, если вам удастся заставить ее сделать что-то годное, оно будет очень годным…
Платформа: Android. Количество бесплатных попыток: 3 в сутки, 1 картинка за раз. Доступные стили: 10, включая аниме и фотореализм. Финальное качество: 1к. Референс: да. Промты на русском: да, но очень плохо. |
▎AI Anime
Этот ИИ специализируется на создании аниме-портретов как на основе текста, так и по образцу. Причем не важно, фотографию вы ему скормите, арт, анимешный арт или картинку из подборки «парейдолия». Впрочем, вы можете создать прообраз в какой-нибудь рисовалке или в программах типа Anime Avatar maker и загрузить в AI Anime.
Однако создать полноценную иллюстрацию или пейзаж у вас, скорее всего, не выйдет — как уже говорилось, ИИ специализируется на портретах, так что до 80% площади картинки займет персонаж. К тому же, данный ИИ крайне плохо реагирует на запросы не-человеческих персонажей. Дракона или нормального космонавта я его сделать так и не заставила. Только роботы и люди, пусть и весьма милые.
Хотя некоторые стили выдают неплохие фоны:
Платформа: Android. Количество бесплатных попыток: первоначально 10 (100 токенов при регистрации, 10 на картинку). Попытки можно фармить за просмотр рекламы. Также можно генерировать картинки за рекламу, если токены кончились. Одна картинка за генерацию. Доступные стили: 20 стилей, из них 10 бесплатно. Есть ротация. Финальное качество: 512х512 (соотношение сторон можно настроить). Референс: да. Промты на русском: нет. |
▎Шедеврум
Сравнительно новая нейросеть от Яндекса, все еще находящаяся в бета-тесте. Функций в программе относительно мало — собственно, сгенерировать по тексту, поделиться в ленте, увеличить разрешение. |
Сервис создает по четыре картинки за раз, из которых вам нужно выбрать только одну для увеличения. После этого вы получаете несколько пиксельную мыльную пикчу и можете поделиться ею в общей ленте. И уже там ткнуть на едва заметную в правом нижнем углу картинки кнопку — повысить разрешение. Скачать свою картинку в приложении у меня тоже не вышло, пришлось делиться ею на Pinterest и сохранять оттуда. В общем, сервис интересный, но пока неудобный.
Примечание: сервис блокирует некоторые запросы. Например, в приложении действует запрет на генерацию ангелов и демонов, т.к. любые упоминания религии запрещены.
Платформа: Android. Количество бесплатных попыток: неизвестно (лимит не достигнут). Доступные стили: нет (только через промты). Финальное качество: 736х736 (если сделать экспорт в Пинтерест). Референс: нет. Промты на русском: да. |
▎DALL-E
Лучше всего справляется с генерацией картинок с участием существующих известных актеров. Абстрактные запросы выполняет значительно хуже, даже с новым алгоритмом (Kandinsky).
Доступна в приложении Салют (от Сбербанка) и в Телеграме. Возможно, еще где-то, я не нашла. Телеграм-версия работает очень плохо.
Салют-версия уже лучше, но боту периодически надо напоминать кнопкой «Как там мой рисунок?», иначе он может забыть вам ее загрузить. Да и скачивать свои картинки надо через пень-колоду (через переход на сайт под своим ID). Плюс сервер периодически «падает», а при попытке поделиться отправляет ссылку без картинки.
Сначала он проигнорировал дракона и нарисовал только море. Чертоги разума он не понял вообще и выдал мне растение чертополох:
Платформа: ПК, Android (через Телеграм и Салют). Количество бесплатных попыток: не ограничено. Доступные стили: нет. Финальное качество: - Референс: нет. Промты на русском: да. |
▎Итого
Я привела вам список более-менее годных ИИ-рисовалок, которыми пользуюсь сама. Разумеется, это не полный перечень, и, скорее всего, я упустила еще что-то интересное — делитесь в комментариях. Однако приведенные выше нейросети отлично работают и доступны без танцев с бубном, ВПН и предоплат.
Фон для фантазии на тему Говарда Филлипса наше все Лавкрафта. Starry AI, промт: Scarry hungry teeth, horror, lovecraft, organic, hyperdetailed. Режим/стиль: Art/Fantasy
Если вы — начинающий художник, писатель или просто мимокрокодил, перерывший интернет в поисках годной аватарки, то этот набор вам может пригодиться. Как и мне, хотя еще пару лет назад я понятия не имела, насколько продвинулись НС в делах художественных.
Готовая обложка к фанфику на тему киберпанка. Dream AI, промт: artifical mind, neon, cyberpunk, detailed. Стиль Dreamwawe
Зачем мне нужны НСки? Я слышала много негативных отзывов, как от простых людей, так и от околохудожественного сообщества. Почти все в голос заявляют о том, что НС погубят людей, лишат работы и вообще станут причиной деградации. |
И напоследок. Немного жизненной жизы художников и тридешников:
С вами была Людмила Хигерович. Всего хорошего и не болейте!
НЛО прилетело и оставило здесь промокод для читателей нашего блога:
— 15% на все тарифы VDS (кроме тарифа Прогрев) — HABRFIRSTVDS
Комментарии (9)
TularemY
26.04.2023 08:25+1Спасибо!
Раньше пользовалась Dream by Wombo (который Dream.ai). Но он быстро раскрутился и слишком много всего стало платным.
Пойду другие опробую :)
maza11
26.04.2023 08:25+1Полезная статья, я неделю исследую эту тему сейчас, миджорни я пропустил
, тогда меня это не интересовало.
По первому пункту из статьи Stable Diffusion, я пользовался им через сайт dreamstudio (платно, но даются 20 условных монеток) и huggingface (полностью бесплатно). Через dreamstudio пользоваться удобнее, есть выбор стилей, хотя если в huggingface дописать в конце промта стиль, то результаты будут одинаковы. Вот один и тот же запрос в стиле Enhance style (на скрине dreamstudio это две верхних картины)Пробовал еще Kandinsky 2.1 через сайт fusionbrain, на мой взгляд хуже всех выдает, в отражении кувшина всегда рисует непонятно что. Но есть редактор, можно закрасить
участок и сгенерировать заново и большой выбор стилей ему в плюс.
Еще пробовал dream by wombo, огромный выбор стилей, количество символов для промта равняется 200 символов. результаты по тому же запросу очень неоднозначные. Был выбран No style и прописан в промте Enhance style
Остальные сети указанные в статье пойду сейчас пробовать. Спасибо за такую статью.
NeuroLab
26.04.2023 08:25+1Спасибо за обзор. А в Кандинском можно генерировать не только в боте и приложении, есть еще их сайт fusionbrain.ai - там есть доп. инструменты перерисовки и дорисовки
UprightMan
Шикарный обзор - спасибо! С удовольствием протестирую несколько сервисов из списка (жалко мне, как «ПК-боярину» придется юзать прокладку в ввиде БлюСтака))
От себя добавил бы к списку FusionBrain.AI - сервис полностью бесплатный (даже не надо регать учетку) и отлично понимает русский язык.
Кстати, Dream.ai - не название сервиса, а адрес сайте (гугл не даст соврать), верно - Dream by WOMBO.
phanerostroi_evidence Автор
Спасибо за уточнение=)