Для Stable Diffusion WebUI (он же Automatic1111) уже несколько дней, как стала доступна модель Stable Diffusion 3.
Чтобы ее поставить и использовать в нем необходимо:
В установленном Stable Diffusion WebUI перейти на pre-release ветку:
git switch release_candidate
git pull
Не забудьте потом переключиться на релизную веткуgit switch master
Зарегистрироваться на HuggingFace (обязательно!), принять все условия лицензии и скачать версию модели sd3_medium_incl_clips.safetensors отсюда.
Поместить эту модель в директорию ../models/Stable-diffusion установленного SD WebUI
Запустить Stable Diffusion WebUI с параметром --medvram . Его необходимо добавить в webui-user.bat или webui-user.sh, если у вас 8 Гб ОЗУ. На 6 Гб ОЗУ и менее модель скорее всего не заработает, если у вас больше памяти, то опять же параметр скорее всего будет не нужен.
-
Выбрать эту модель и использовать следующие параметры:
Sampling method: Euler
Schedule type: Automatic
Sampling steps: от 30 и выше. Я сильной разницы между 30 и 40 не заметил.
Width: 1024
Heigth: 1024
Размер по высоте и ширине может быть другой, но их произведение должно быть равно 1 048 576. С другими параметрами Sampling method пока генерация нормально не работает.
Если у вас 16 Гб видеопамяти и выше, вы можете выставить в Settings опцию Enable T5. Вам придется дождаться скачивания 9 гигабайт CLIP модели и, как пишут разработчики, получить лучший результат и 4К промпт.
Мне попробовать в этом режиме модель не получилось, так как SD WebUI у меня или вылетал с ошибкой нехватки памяти для CUDA или вылетал Pytorch из‑за проблем с GPU offload. Хотя в ComfyUI T5 у меня работал.
По скорости медленнее чем SD XL (там у меня на моей 8 гиговой 4060 генерация занимала примерно 20 секунд, здесь же около 30 секунд), по качеству изображений SD 3 мне нравится больше, особенно в части прорисовки текста.
P. S. Для SD3 вышла новая редакция «Community License», которая внесла ряд существенных изменений, что позволяет теперь эту модель использовать почти без ограничений:
Бесплатное некоммерческое использование для всех пользователей.
Бесплатное коммерческое использование для индивидуальных пользователей и малого бизнеса с годовым доходом до $1 млн.
Отмена ограничений на количество генерируемых файлов.
Арендуйте выделенные и виртуальные GPU серверы с профессиональными графическими картами NVIDIA RTX A5000 / A4000 и Tesla H100/A100, а также RTX4090 в надежных дата-центрах класса TIER III в России, Нидерландах и Исландии. Почасовая аренда GPU-серверов.
Mike_666
Ни один обзор Stable Diffusion 3 medium не будет полным без запроса "Девушка лежащая на траве".
akdengi Автор
Там девушки такие, что фильмы ужасов отдыхают :) Хотя на один из сидов выдало что-то вменяемое (ну почти). Обещали же модель поправить, но пока ждем...с