За последние несколько месяцев нейросети, которые работают с изображениями, получили множество улучшений, доработок и дополнений. Разработчики не сидят сложа руки, постоянно совершенствуя нейронки и сервисы на их основе. В этой подборке как раз и поговорим о новинках.
Midjourney + Insight Face Swapper
Эта нейросеть и раньше была хороша, а теперь и вовсе отлично работает. В целом нейронки допускают всё меньше ошибок и «галлюцинаций». Это могут быть дополнительные пальцы у человека, несуществующие в реальности детали объектов и т. п.
Так вот, с задачей изобразить человека Midjourney справляется очень хорошо. Пример — генерал в обмундировании. Получается чудесная картинка. Возможно, форма — чистая фантазия нейронки, но всё это выглядит вполне внушительно.
Ну а эддон Insight Face Swapper, который, к слову, бесплатен, даёт возможность заменить лицо сгенерированного человека на лицо с фотографии. Т. е. получится реальный человек в форме генерала. Возможно, есть какие-то мелкие погрешности, но они настолько незначительны, что незаметны.
Единственное требование к снимкам, которые используются для модификации сгенерированного рисунка, — они должны быть чёткими, а освещение — хорошим.
Stable Doodle
А это официальный проект от создателей Stable Diffusion. Сервис позволяет рисовать дудлы, которые нейронка доводит до логического завершения. Т. е. вы можете нарисовать эскиз, даже крайне кривой, а нейронка сделает из него «конфетку». Вот тут реальное воплощение мема про сову:
Нейронка сделает из кружочков не только сову, но и всё что угодно, придерживаясь при этом изначальной композиции, заданной автором. При этом, как и в случае предыдущего сервиса, нет проблем с лишними артефактами. Объекты, животные, люди и т. п. получаются очень реалистичными.
Рисовать при этом сервис может в разных стилях, включая 3D, Pixel Art, Photo. К сожалению, этот сервис платный, но его стоимость составляет около $5 в месяц, что не так и много для нейронки с подобным функционалом.
«Шедеврум»
А это приложение от Яндекса на базе нейронной сети YandexGPT, аналог популярной Stable Diffusion и Midjourney. Генерация изображений осуществляется методом каскадной диффузии. На первом этапе генерируется сразу четыре варианта на выбор. Потом пользователь может выбрать то, что ему понравилось больше всего.
Вот дополнительные возможности приложения:
возможность поделиться у себя в профиле изображениями
просмотр ленты с изображениями других пользователей
лайки, комментарии и подписки на авторов
возможность поделиться записью или профилем
возможность скопировать запрос и создать аналог
скачивание изображений
Всё это — бесплатно, генерация реализуется с минимальным количеством «галлюцинаций». Кроме статичных картинок поддерживается и видео. «Шедеврум» работает с описаниями как на русском, так и на английском языке.
Пользователь может «заказывать» разную степень освещённости и детализации. После этого появляется базовая версия картинки, которую нейросеть постепенно совершенствует и дорабатывает.
Достоинство приложения — простой и понятный интерфейс, который позволяет без проблем взаимодействовать с нейронной сетью. Главное — правильный запрос, а далее инструмент уже доделает за пользователя всё необходимое.
Starryai
В начале мы говорили о том, что нейросети уже не «галлюцинируют», добавляя несуществующие артефакты на изображения реальных объектов, тех, что существуют в нашей с вами реальности. Но есть нейросети, которые позволяют визуализировать полёт фантазии, и в этом случае «галлюцинации» — уже не баг, а фича.
Именно таким инструментом стал Starryai. Пользователь может задавать основной и дополнительные запросы, при этом добавлять референсную картинку, количество вариаций изображений и уровень проработки. Авторы также создали и социальную сеть, где можно посмотреть на чужие работы, оценив полёт фантазии других пользователей.
В целом, результаты могут быть не только «галлюцинациями», но и вполне реальными объектами, с хорошей прорисовкой и детализацией.
fusionbrain.ai
Это ещё один инструмент, причём новый, для создания изображений при помощи искусственного интеллекта. На данный момент этот инструмент полностью бесплатный, а работает он не хуже той же Midjourney. Fusion Brain AI прекрасно понимает русский язык и имеет интерфейс полностью на русском языке.
Cначала по запросу формируется базовое изображение. Смещая рамку, можно его расширять, добавляя всё новые объекты. При этом можно менять и описание картинки, так что стиль/наполнение тоже могут меняться. Сервис очень хорошо понимает то, что от него хотят. Вот, например, скриншот изображения, сгенерированного по запросу «Шварценеггер, Брэд Питт».
Положительные стороны сервиса — полная бесплатность (по крайней мере, пока), нет необходимости в регистрации, поддержка весьма широкого спектра стилей. С этим сервисом можно создавать самые разные иллюстрации.
Кстати, если у вас есть свои фавориты в мире ИИ-сервисов для рисования, расскажите о них в комментариях, пожалуйста. Нам всем будет интересно узнать что-то новое, благо таких сервисов сейчас очень много, и постепенно их становится всё больше.
Комментарии (5)
axe_chita
03.11.2023 16:28Положительные стороны сервиса — полная бесплатность (по крайней мере, пока), нет необходимости в регистрации, поддержка весьма широкого спектра стилей.
На fusionbrain.ai уже требуется регистрация, пока бесплатная, требуется действующий email. Других ограничений пока не наблюдается. Из плюсов, сервис стал корректнее обрабатывать запросы на русском языке и меньше бредить дичью.
arzybek
Как можно написать статью на эту тему, упомянуть какой-то генератор от Яндекса, про который я впервые услышал, но забыть бесплатный Dall-e 3 в Bing ????
stanislav_mikov
Это не «какой-то генератор от Яндекса», а вполне неплохая генеративная нейросеть на уровне между 3 и 4 Midjourney. Есть также весьма неплохой «Кандинский» от Сбера. Но статья слабенькая, да, просто чтобы отметиться «МТС тоже в теме AI, йоу, йоу, сноуборд»