Всем привет!
Flux.1 D — это мощная модель для генерации изображений по текстовому описанию. Меня зовут Вандер, я куратор клуба по нейросети Fooocus и нейро-энтузиаст, и сегодня мы разберемся, почему вам точно стоит обратить внимание на свежеиспеченную Flux.
Разработчики Flux — бывшие создатели Stable Diffusion и Stable Diffusion XL — Робин Ромбах и Андреас Блаттман. Оба выступали за идею, но компания преследовала только коммерческие интересы. Как итог — произошел конфликт и ключевые фигуры покинули Stability AI. Недавно ими была создана новая компания The Black Forest Team, которая и представила нам Flux.
Flux основана на 12-миллиардном трансформере и использует инновационный подход, так что достигать высокой производительности и качества изображения возможно даже при запуске на бытовых видеокартах.
Модель очень хорошо следует промпту и распознает текст.
В статье мы посмотрим, как запустить Flux онлайн и локально, а так же на ее возможности.
❯ Версии модели Flux
Модель FLUX представлена в трёх версиях:
FLUX.1 DEV: эта версия является открытой и предназначена для некоммерческого использования. Она была создана на основе Pro-версии и обладает схожим качеством и способностью следовать подсказкам, но работает более эффективно.
FLUX.1 SCHNELL: ориентирована на скорость, позволяя генерировать изображения за 1-4 шага. Это самая быстрая версия модели, предназначенная для локальной разработки и личного использования, в которой так же предусмотрена интеграция в ComfyUI.
FLUX.1 PRO: это самая продвинутая версия модели, обеспечивающая высококачественную генерацию изображений. Она отличается отличным следованием подсказкам, высоким визуальным качеством, детализацией изображений и разнообразием выходных данных.
❯ Как опробовать Flux онлайн и бесплатно
Демо на Hugging Face.
Интерфейс довольно простой, особенно если вы ранее сталкивались с генеративными нейросетями:
Окно Enter your prompt — добавьте в это окно текстовый запрос для будущего изображения.
Seed — начальное значение шума. Для каждого изображения используется свой seed — нажмите Randomize seed, если вы не хотите зафиксировать текущий результат.
Width и Height — размеры изображения от 256 до 2048 пикселей (кратные 64). Чем больше разрешение, тем больше изображение, но тем больше времени занимает генерация.
Guidance Scale — определяет, насколько строго модель следует текстовому запросу. Чем выше — тем лучше соответствие, но меньше творческого размаха у нейросети. Рекомендую использовать значение по умолчанию.
Number of inference steps — количество шагов, за которые модель генерирует изображение. Рекомендую использовать значение по умолчанию.
Сервис ArtGeneration.me.
Вы так же можете опробовать FLUX на ArtGeneration.me бесплатно. При регистрации дают 3 бесплатных дня PRO.
У сервиса куча преимуществ перед демо на Hugging Face:
возможность Upscale (увеличение разрешения);
возможность Outpaint (расширение изображения);
Inpaint (к сожалению, пока только на моделях XL).
И если вы начинающий, на ArtGeneration невозможно промахнуться с разрешением.
Тут интерфейс более понятный, так как он на русском языке.
Здесь есть куча популярных XL-моделей на любой вкус помимо Flux, поэтому вводим название в поиск и нажимаем на превью модели.
Окно промпта находится под изображением.
Избегать — негативный запрос, то, чего не хотим видеть на изображении.
Проработка — то же, что и количество шагов.
Соответствие запросу — то же, что и guidance scale.
Шум — seed.
Сэмплеры — это различные математические функции, по которым генерируется шум для преобразования его в изображение. Советую использовать значение по умолчанию.
Количество изображений — еще один плюс в копилку сервиса — за раз можно сгенерировать до 4-х картинок.
Функции апскейла/расширения находятся на верхней панели.
❯ Как установить Flux локально к себе на компьютер
Flux Dev для Forge
Сперва качаем Forge с установкой в один клик.
Далее скачиваем эту модель, если у вас видеокарта NVIDIA 30-й или 40-й серии, или эту модель для карт 10-й и 20-й серий.
Если у вас уже установлен Forge, то просто скачайте и добавьте Flux к остальным моделям в папку models. Не забудьте перед этим запустить файл update.bat и обновить интерфейс.
Портативная версия
.Если вы просто хотите скачать Flux к себе на компьютер с установкой в один клик — то специально для вас мы сделали портативную версию с установкой в один клик. Это квантованная версия модели.
А теперь посмотрим на возможности Flux и красивые примеры с промптами.
Примеры и возможности Flux
Начнем с аниме, попросим Flux изобразить милую девушку в кимоно с драконом:
masterpiece, 1girl, long white hair, kimono, a dragon, red eyes, foggy, onsen.
Прекрасный результат! Мне очень нравится.
Сгенерируем красивый и детальный глаз в оранжево-пурпурных оттенках:
Hyper-detailed close-up purpe eye with the iris and pupil transformed into an abstract galaxy with a high-contrast purple and orange theme. Surrounding the eye, stylized makeup in bold black and bright orange mirrors the lightning with sharp, the atmosphere is dark and moody, charged with a sense of power and mystery.
Девушка с синими волосами и таинственной коробкой:
extremely beautiful, highly detailed, dark background, young lady 19 years old, long blue hair, freckles, blue eyes, black silk robe, racks, paper, makeup, named Alexis, smiling, easygoing, affectionate, enthusiastic, holding a box, light shines out of the box, light particles, depth of field, Highly Detailed, intricately detailed gothic art trending translucent, illumination, surrealistic, abstract, dark night.
Попробуем эту шедевральную модель с текстом, хотя, вы наверняка уже поняли, что и тут она справляется на отлично:
Hyper details and shaprness, night cyberpunk empty street, rainy weather, the puddles reflect the neon "WONDER" sign.
Lana Del Ray Holding a "FLUXIK" neon sign, night street, cyberpunk.
Flux.1 — это выдающаяся модель для генерации изображений, которая сочетает в себе мощь современных технологий с доступностью для обычных пользователей.
Советую вам опробовать ее, если вы еще этого не сделали!
Скачать портативную версию Flux с установкой в один клик для самых ленивых вы можете тут.
Подписывайтесь на ?Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!
Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩
? Читайте также:
Комментарии (21)
MountainGoat
04.09.2024 14:42Invoke AI последняя бета умеет FLUX. После InvokeAI всё остальное кажется сляпанным за час на коленке.
Посмотрел. FLUX не впечатляет. Возможность генерировать тексты конечно радует, но и до неё были способы это сделать, просто дольше. А в остальном чего-то нового не увидел. Знаменитое "нарисуй мужика с оранжевыми волосами и зелёными глазами, в жёлтом пиджаке с синими пуговицами и фиолетовых штанах на красном диване в комнате с зелёными стенами" точно так же ставят её в тупик.
А теперь главное. FLUX нельзя дообучить на одной видяхе в 24Гб. А значит, что такого разгула тюнингов всех направлений и PG рейтингов не будет, а значит отклика в народе она не найдёт. Если заклинатели матриц придумают, как исправить положение, то да, ситуация изменится.
Не надо искать волшебных моделей, надо совершенствовать способы управления имеющимися.
P.S. В статье в роли примеров как всегда вещи, которые проще всего генерировать всегда.
jarkevithwlad
04.09.2024 14:42уже есть разные вариации её в gguf формате, самая минимальная около 4гб весит, возможно их можно дообучать, но это не точно, зато на слабом железе работает локально
positroid
04.09.2024 14:42+16schnell версию можно тренировать на видяхе 24 гб + есть сервисы, которые за копейки или даже бесплатно дают тренировать LoRA на dev-версии модели (тюнинги всех направлений и PG-рейтингов уже есть в избытке).
Про воодушевление сообщества вы неправы, flux в опенсорсе дал такой же всплеск как в свое время SD (сужу по тематическим чатикам и себе)
Ну и вот картинка, forge + flux-dev (nf4) на 3060Ti 8Gb сгенерировал за минуту с первого раза
axe_chita
04.09.2024 14:42+3https://fluxai.art/ru/app
промпт чуть чуть поправил, тут запросом и человек запутается, что тут про ИИ говорить.
"мужчина с оранжевыми волосами, зелёными глазами, в жёлтом пиджаке с синими пуговицами, фиолетовых штанах, сидит на красном диване в комнате с зелёными стенами"
Axelaredz
04.09.2024 14:42+6Да вроде как всё норм с первого раза)
perfect_genius
04.09.2024 14:42До чего дошли нейросети... А ведь так и до совсем точных попаданий дойдёт.
Ximus
04.09.2024 14:42+1Some girl having sex with a man complete nude couple exposed to the nature. - упс! А что такооооое? Флакс не может в порно?! А как тааааак? Пока не сможет, ему не победить нормальные модели.
Статья с рекламой онлайн генератора, но без упоминания gguf, нуну :D
А с текстом ещё SD3-калека прекрасно работала, но это её не спасло.axe_chita
04.09.2024 14:42Some girl having sex with a man complete nude couple exposed to the nature. - упс! А что такооооое? Флакс не может в порно?! А как тааааак? Пока не сможет, ему не победить нормальные модели.
Так на чем сеть учили, то она и "рисует". Навскидку генерация запроса в онлайн генераторе
axe_chita
04.09.2024 14:42Портативная версия вываливается при старте с ошибкой "torch.cuda.outofmemoryerror: cuda out of memory. tried to allocate 14.00 MiB. GPU" на 3050 с 8гб
crims0n_ru
04.09.2024 14:42Вы её размер видели? Я сомневаюсь, что она на моей 3080 с 10 ГБ взлетит, а вы с 8 ГБ хотите)
yamifa_1234
04.09.2024 14:42А сервис ArtGeneration.me вроде бы и с цензурой но полную обнаженку нарисовал) главное слова правильные подобрать
axe_chita
04.09.2024 14:42"Обнаженка" там доступна в PRO режиме, который доступен по платной подписке или в течении трех дней при первоначальной регистрации.
d-sh
fastflux.ai а тут что за моделька. Генерирует картинку за полсекунды
holodoz
holodoz
это не самые криповые кошачьи пальцы, которые модель генерит, здесь их хотя бы поровну и меньше двенадцати
positroid
Во flux встроена llm (T5), поэтому миджорни-стайл промпты можно не использовать, хорошо воспринимается естественный язык (как у DALLE-3 через chatGpt), в ряде случаев даже лучше специально составленных
nebularia
В Midjourney тоже с версии 6 не нужны такие промпты