Теперь изображения сложно отличить от реальных фото - морщины, складки, красные глаза, текстура кожи — генерации выглядят почти идеально.
Midjourney V6 отличает от предыдущей версии целый ряд особенностей:
Более высокое разрешение изображения: Midjourney v6 имеет максимальное разрешение 2048 × 2048 пикселей, что почти вдвое больше, чем у предыдущей версии.
Улучшенная обработка естественного языка: Midjourney 6 обладает более совершенным и интуитивно понятным пониманием текстовых подсказок, что позволяет создавать более точные и реалистичные изображения на основе ваших описаний.
Больше контроля над вариациями: Предполагалось, что Midjourney V6 позволит больше настраивать варианты изображений, например изменять цвет, стиль или ракурс создаваемых изображений.
Улучшенная генерация рук: Улучшена генерация рук, что означает, что теперь вам будет проще создавать изображения с реалистичными руками.
Новая версия доступна уже с четверга (21.12).
Тестирую новую версию менее недели. Делюсь тем, что заметил за время использования.
Детализация стала в разы выше.
Вот как выглядит работа новой версии по сравнению с предыдущей. Примеры хорошо показывают новый уровень детализации изображений. Деталей стало в разы больше.
Вот еще несколько примеров с высокой детализацией
Стиль фотореализм стал еще более похож на реальные фото.
Лучше копирует стили.
Вот хороший пример. Теперь миджорни почти 1 в 1 может скопировать стилистику любого мультфильма. Вот пример копирования рисовки Симпсонов. Разве с ходу можно определить, что это ИИ?.
Вот промт для теста: scene from the simpsons персонаж --ar 16:9 --style raw --v 6.0
Может генерировать текст (не без косяков, но может).
Иногда написание и правильность может быть немного искажены, но они уже значительно улучшены по сравнению с предыдущей версией.
Чтобы сгенерировать изображение с текстом необходимо сам текст поместить в "кавычки".
Точнее понимает промты
Для тех кто хочет генерировать максимально реалистичные изображения перевели новую структуру идеального промта в Midjourney V6:
1. Стиль
Зачем: Обеспечивает определенное эстетическое или художественное направление.
Что прописываем: детали, которые необходимо включить: Предпочитаемый стиль или эпоха.
2. Тема
Зачем: Определяет основной акцент изображения.
Что прописываем: детали, которые должны включать: Характеристики центрального объекта (например, человека, объекта, животного), включая внешний вид, цвета и уникальные особенности.
3. Обстановка
Зачем: Устанавливает среду или контекст для объекта.
Что прописываем: детали, которые должны включать: местоположение (внутреннее, наружное, воображаемое), элементы окружающей среды (природа, город), время суток и погодные условия.
4. Композиция
Зачем: Определяет, как объект и элементы будут обрамлены и просматриваться.
Что прописываем: детали, которые должны включать: точку обзора (крупный план, широкий, аэрофотосъемка), ракурс и конкретные предпочтения в кадрировании.
5. Освещение
Зачем: Задает настроение и визуальный тон изображения.
Что прописываем: детали, которые необходимо включить: Тип освещения (яркое, приглушенное, естественное), настроение (веселое, таинственное) и атмосферные эффекты.
6. Дополнительная информация
Зачем: Добавляет сложности и глубины изображению.
Что прописываем: детали, которые необходимо включить: второстепенные объекты, персонажи, животные и их взаимодействие или расположение относительно основного объекта.
Ну и минибонус - эволюция качества портретов в нейросети Midjourney.
Напомню, что между появлением первой и шестой версиями прошло чуть меньше двух лет, а между 5 и 6 менее года.
Да, конечно есть штуки потехнологичнее (например, Gemini или PromeAI), но прогресс миджорни за этот год все равно впечатляет.
p.s. еще больше про digital в моей телеге
Комментарии (14)
NutsUnderline
26.12.2023 13:17+1мне одному кажется что КДПВ v6 слишком реалистичная? чтобы такое сфоткать надо много чего.. мне че то больше 5.2 нравится
dimitrii_z
26.12.2023 13:17+2Да, лицо рисует неплохо, а вот с пальцами ещё бывают проблемы. Обратите внимание на руку левую, со сросшимися пальцами:
А ещё 3 зуба вверху передних вместо 4х, чётко один зуб посередине )
Astus
26.12.2023 13:17+2А ещё 3 зуба вверху передних вместо 4х, чётко один зуб посередине )
Может с Тома Круза генерилось)
Refridgerator
26.12.2023 13:17А он уже может объединять разных персонажей в одной сцене? Ну типа "Robocop, ED-209 and T-800 drinking beer together from human skulls".
oalisevich
26.12.2023 13:17+1Общение с любым чатботом по сути свой является "программированием на естественном языке". Ну или почти естественном. Оператору! Все равно надо Уметь это делать, для получения Результата. А так да, прогресс ))
Pro2492 Автор
26.12.2023 13:17Но кстати, чем дальше, тем это проще. 6 мидж реально точнее понимает даже не самый продуманный промт
rzcoder
Проблема с v6 что он может практически 1 в 1 повторить картинку с обучающей выборки, что может запросто вылиться в копирайт страйк.
Pro2492 Автор
верно, на авторские права им пофигу
Neurostudio_Multimedia
Ну так тут задача такая и поставлена, он и обязан выдать максимально похожую картинку на кадр из конкретного фильма. А в страйк вылиться может и любое использование изображения конкретного человека, без его разрешения.