Теперь изображения сложно отличить от реальных фото - морщины, складки, красные глаза, текстура кожи — генерации выглядят почти идеально.

Вот сравнение версий 5.2 и 6
Вот сравнение версий 5.2 и 6

Midjourney V6 отличает от предыдущей версии целый ряд особенностей:

  • Более высокое разрешение изображения: Midjourney v6 имеет максимальное разрешение 2048 × 2048 пикселей, что почти вдвое больше, чем у предыдущей версии.

  • Улучшенная обработка естественного языка: Midjourney 6 обладает более совершенным и интуитивно понятным пониманием текстовых подсказок, что позволяет создавать более точные и реалистичные изображения на основе ваших описаний.

  • Больше контроля над вариациями: Предполагалось, что Midjourney V6 позволит больше настраивать варианты изображений, например изменять цвет, стиль или ракурс создаваемых изображений.

  • Улучшенная генерация рук: Улучшена генерация рук, что означает, что теперь вам будет проще создавать изображения с реалистичными руками.

Новая версия доступна уже с четверга (21.12).

Тестирую новую версию менее недели. Делюсь тем, что заметил за время использования.

Детализация стала в разы выше.

Вот как выглядит работа новой версии по сравнению с предыдущей. Примеры хорошо показывают новый уровень детализации изображений. Деталей стало в разы больше.

apture the essence of a mature woman, with an intimate close-up portrait style. Emphasize the facial features and emotions with intricate detail, while gently blurring the background
apture the essence of a mature woman, with an intimate close-up portrait style. Emphasize the facial features and emotions with intricate detail, while gently blurring the background
close up of a red crab sitting in the sea in the sand
close up of a red crab sitting in the sea in the sand
Audi Q8 50 TDI, 2023 car black realistic
Audi Q8 50 TDI, 2023 car black realistic

Вот еще несколько примеров с высокой детализацией

Стиль фотореализм стал еще более похож на реальные фото.

Да, еще много деталей, к которым можно придраться, но это прогресс за год впечатляет (в сравнении с 4 версией и даже с 4.5)
Да, еще много деталей, к которым можно придраться, но это прогресс за год впечатляет (в сравнении с 4 версией и даже с 4.5)

Лучше копирует стили.

Вот хороший пример. Теперь миджорни почти 1 в 1 может скопировать стилистику любого мультфильма. Вот пример копирования рисовки Симпсонов. Разве с ходу можно определить, что это ИИ?.

Вот промт для теста: scene from the simpsons персонаж --ar 16:9 --style raw --v 6.0

Может генерировать текст (не без косяков, но может).

Иногда написание и правильность может быть немного искажены, но они уже значительно улучшены по сравнению с предыдущей версией.

Чтобы сгенерировать изображение с текстом необходимо сам текст поместить в "кавычки".

промт - concept spring with flowers, text "spring" --ar 3:2 --s 250 --v 6.0
промт - concept spring with flowers, text "spring" --ar 3:2 --s 250 --v 6.0
промт - nasa logo 1961
промт - nasa logo 1961

Точнее понимает промты

Для тех кто хочет генерировать максимально реалистичные изображения перевели новую структуру идеального промта в  Midjourney V6:

1. Стиль
Зачем: Обеспечивает определенное эстетическое или художественное направление.
Что прописываем: детали, которые необходимо включить: Предпочитаемый стиль или эпоха.

2. Тема
Зачем: Определяет основной акцент изображения.
Что прописываем: детали, которые должны включать: Характеристики центрального объекта (например, человека, объекта, животного), включая внешний вид, цвета и уникальные особенности.

3. Обстановка
Зачем: Устанавливает среду или контекст для объекта.
Что прописываем: детали, которые должны включать: местоположение (внутреннее, наружное, воображаемое), элементы окружающей среды (природа, город), время суток и погодные условия.

4. Композиция
Зачем: Определяет, как объект и элементы будут обрамлены и просматриваться.
Что прописываем: детали, которые должны включать: точку обзора (крупный план, широкий, аэрофотосъемка), ракурс и конкретные предпочтения в кадрировании.

5. Освещение
Зачем: Задает настроение и визуальный тон изображения.
Что прописываем: детали, которые необходимо включить: Тип освещения (яркое, приглушенное, естественное), настроение (веселое, таинственное) и атмосферные эффекты.

6. Дополнительная информация
Зачем: Добавляет сложности и глубины изображению.
Что прописываем: детали, которые необходимо включить: второстепенные объекты, персонажи, животные и их взаимодействие или расположение относительно основного объекта.

Ну и минибонус - эволюция качества портретов в нейросети Midjourney.

Напомню, что между появлением первой и шестой версиями прошло чуть меньше двух лет, а между 5 и 6 менее года.

Да, конечно есть штуки потехнологичнее (например, Gemini или PromeAI), но прогресс миджорни за этот год все равно впечатляет.

p.s. еще больше про digital в моей телеге

Комментарии (14)


  1. rzcoder
    26.12.2023 13:17
    +8

    Проблема с v6 что он может практически 1 в 1 повторить картинку с обучающей выборки, что может запросто вылиться в копирайт страйк.


    1. Pro2492 Автор
      26.12.2023 13:17

      верно, на авторские права им пофигу


    1. Neurostudio_Multimedia
      26.12.2023 13:17

      Ну так тут задача такая и поставлена, он и обязан выдать максимально похожую картинку на кадр из конкретного фильма. А в страйк вылиться может и любое использование изображения конкретного человека, без его разрешения.


  1. NutsUnderline
    26.12.2023 13:17
    +1

    мне одному кажется что КДПВ v6 слишком реалистичная? чтобы такое сфоткать надо много чего.. мне че то больше 5.2 нравится


    1. dimitrii_z
      26.12.2023 13:17
      +2

      Да, лицо рисует неплохо, а вот с пальцами ещё бывают проблемы. Обратите внимание на руку левую, со сросшимися пальцами:

      А ещё 3 зуба вверху передних вместо 4х, чётко один зуб посередине )


      1. Astus
        26.12.2023 13:17
        +2

        А ещё 3 зуба вверху передних вместо 4х, чётко один зуб посередине )

        Может с Тома Круза генерилось)



      1. Pro2492 Автор
        26.12.2023 13:17

        Ну это так скажем мелочи. хD


      1. NutsUnderline
        26.12.2023 13:17

        не, вот эта мне понраилась уже несмотря на детали


  1. Refridgerator
    26.12.2023 13:17

    А он уже может объединять разных персонажей в одной сцене? Ну типа "Robocop, ED-209 and T-800 drinking beer together from human skulls".


    1. Pro2492 Автор
      26.12.2023 13:17

      попробуем


  1. oalisevich
    26.12.2023 13:17
    +1

    Общение с любым чатботом по сути свой является "программированием на естественном языке". Ну или почти естественном. Оператору! Все равно надо Уметь это делать, для получения Результата. А так да, прогресс ))


    1. Pro2492 Автор
      26.12.2023 13:17

      Но кстати, чем дальше, тем это проще. 6 мидж реально точнее понимает даже не самый продуманный промт


  1. Snark-s
    26.12.2023 13:17
    +1

    Вроде она токены расходует быстрее, можно за один день месячную подписку потратить


    1. Pro2492 Автор
      26.12.2023 13:17

      да, так и есть сейчас. 6 генерит медленнее, но обещают поправить