Что нового в Midjourney 6? 5 видимых отличий от 5.2 / forpes.ru

Главная
Что нового в Midjourney 6? 5 видимых отличий от 5.2

Что нового в Midjourney 6? 5 видимых отличий от 5.2

26.12.2023 12:14

Pro2492 14 4300 Источник

Теперь изображения сложно отличить от реальных фото - морщины, складки, красные глаза, текстура кожи — генерации выглядят почти идеально.

Midjourney V6 отличает от предыдущей версии целый ряд особенностей:

Более высокое разрешение изображения: Midjourney v6 имеет максимальное разрешение 2048 × 2048 пикселей, что почти вдвое больше, чем у предыдущей версии.
Улучшенная обработка естественного языка: Midjourney 6 обладает более совершенным и интуитивно понятным пониманием текстовых подсказок, что позволяет создавать более точные и реалистичные изображения на основе ваших описаний.
Больше контроля над вариациями: Предполагалось, что Midjourney V6 позволит больше настраивать варианты изображений, например изменять цвет, стиль или ракурс создаваемых изображений.
Улучшенная генерация рук: Улучшена генерация рук, что означает, что теперь вам будет проще создавать изображения с реалистичными руками.

Новая версия доступна уже с четверга (21.12).

Тестирую новую версию менее недели. Делюсь тем, что заметил за время использования.

Детализация стала в разы выше.

Вот как выглядит работа новой версии по сравнению с предыдущей. Примеры хорошо показывают новый уровень детализации изображений. Деталей стало в разы больше.

apture the essence of a mature woman, with an intimate close-up portrait style. Emphasize the facial features and emotions with intricate detail, while gently blurring the background

close up of a red crab sitting in the sea in the sand

Audi Q8 50 TDI, 2023 car black realistic

Вот еще несколько примеров с высокой детализацией

Стиль фотореализм стал еще более похож на реальные фото.

Да, еще много деталей, к которым можно придраться, но это прогресс за год впечатляет (в сравнении с 4 версией и даже с 4.5)

Лучше копирует стили.

Вот хороший пример. Теперь миджорни почти 1 в 1 может скопировать стилистику любого мультфильма. Вот пример копирования рисовки Симпсонов. Разве с ходу можно определить, что это ИИ?.

Вот промт для теста: scene from the simpsons персонаж --ar 16:9 --style raw --v 6.0

Может генерировать текст (не без косяков, но может).

Иногда написание и правильность может быть немного искажены, но они уже значительно улучшены по сравнению с предыдущей версией.

Чтобы сгенерировать изображение с текстом необходимо сам текст поместить в "кавычки".

промт - concept spring with flowers, text "spring" --ar 3:2 --s 250 --v 6.0

промт - nasa logo 1961

Точнее понимает промты

Для тех кто хочет генерировать максимально реалистичные изображения перевели новую структуру идеального промта в Midjourney V6:

1. Стиль
Зачем: Обеспечивает определенное эстетическое или художественное направление.
Что прописываем: детали, которые необходимо включить: Предпочитаемый стиль или эпоха.

2. Тема
Зачем: Определяет основной акцент изображения.
Что прописываем: детали, которые должны включать: Характеристики центрального объекта (например, человека, объекта, животного), включая внешний вид, цвета и уникальные особенности.

3. Обстановка
Зачем: Устанавливает среду или контекст для объекта.
Что прописываем: детали, которые должны включать: местоположение (внутреннее, наружное, воображаемое), элементы окружающей среды (природа, город), время суток и погодные условия.

4. Композиция
Зачем: Определяет, как объект и элементы будут обрамлены и просматриваться.
Что прописываем: детали, которые должны включать: точку обзора (крупный план, широкий, аэрофотосъемка), ракурс и конкретные предпочтения в кадрировании.

5. Освещение
Зачем: Задает настроение и визуальный тон изображения.
Что прописываем: детали, которые необходимо включить: Тип освещения (яркое, приглушенное, естественное), настроение (веселое, таинственное) и атмосферные эффекты.

6. Дополнительная информация
Зачем: Добавляет сложности и глубины изображению.
Что прописываем: детали, которые необходимо включить: второстепенные объекты, персонажи, животные и их взаимодействие или расположение относительно основного объекта.

Ну и минибонус - эволюция качества портретов в нейросети Midjourney.

Напомню, что между появлением первой и шестой версиями прошло чуть меньше двух лет, а между 5 и 6 менее года.

Да, конечно есть штуки потехнологичнее (например, Gemini или PromeAI), но прогресс миджорни за этот год все равно впечатляет.

p.s. еще больше про digital в моей телеге

Комментарии (14)

rzcoder
26.12.2023 13:17
#26307984
+8
Проблема с v6 что он может практически 1 в 1 повторить картинку с обучающей выборки, что может запросто вылиться в копирайт страйк.
1. Pro2492 Автор
  26.12.2023 13:17
  #26308032
  верно, на авторские права им пофигу
1. Neurostudio_Multimedia
  26.12.2023 13:17
  #26310652
  Ну так тут задача такая и поставлена, он и обязан выдать максимально похожую картинку на кадр из конкретного фильма. А в страйк вылиться может и любое использование изображения конкретного человека, без его разрешения.

NutsUnderline
26.12.2023 13:17
#26309298
+1
мне одному кажется что КДПВ v6 слишком реалистичная? чтобы такое сфоткать надо много чего.. мне че то больше 5.2 нравится
1. dimitrii_z
  26.12.2023 13:17
  #26309336
  +2
  Да, лицо рисует неплохо, а вот с пальцами ещё бывают проблемы. Обратите внимание на руку левую, со сросшимися пальцами:
  
  А ещё 3 зуба вверху передних вместо 4х, чётко один зуб посередине )
  1. Astus
    26.12.2023 13:17
    #26309578
    +2
    А ещё 3 зуба вверху передних вместо 4х, чётко один зуб посередине )
    
    Может с Тома Круза генерилось)
  1. Pro2492 Автор
    26.12.2023 13:17
    #26310656
    Ну это так скажем мелочи. хD
  1. NutsUnderline
    26.12.2023 13:17
    #26313566
    не, вот эта мне понраилась уже несмотря на детали

Refridgerator
26.12.2023 13:17
#26310028
А он уже может объединять разных персонажей в одной сцене? Ну типа "Robocop, ED-209 and T-800 drinking beer together from human skulls".
1. Pro2492 Автор
  26.12.2023 13:17
  #26310660
  попробуем

oalisevich
26.12.2023 13:17
#26315732
+1
Общение с любым чатботом по сути свой является "программированием на естественном языке". Ну или почти естественном. Оператору! Все равно надо Уметь это делать, для получения Результата. А так да, прогресс ))
1. Pro2492 Автор
  26.12.2023 13:17
  #26316268
  Но кстати, чем дальше, тем это проще. 6 мидж реально точнее понимает даже не самый продуманный промт

Snark-s
26.12.2023 13:17
#26315784
+1
Вроде она токены расходует быстрее, можно за один день месячную подписку потратить
1. Pro2492 Автор
  26.12.2023 13:17
  #26316270
  да, так и есть сейчас. 6 генерит медленнее, но обещают поправить

Что нового в Midjourney 6? 5 видимых отличий от 5.2

Комментарии (14)

Pro2492 Автор

Pro2492 Автор

Pro2492 Автор

Pro2492 Автор

Pro2492 Автор