Друзья, всем привет! Недавно популярный нейросетевой интерфейс Fooocus обновился сразу до версии v2.4.1. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Давайте посмотрим, какие основные нововведения и улучшения появились. Я отдельно озвучу самые заметные обновления и оставлю полный список изминений в конце.
Добавился новый режим Hyper-SD, это еще одна лора чтобы генерировать за 4 шага в ущерб качеству, кому-то пригодится, работает не хуже чем лайтнинг.
Aspect Ratios - разрешения теперь зачем-то свернуты, меня лично это бесит, это не красиво и не удобно.
Random style - случайный стиль при каждой генерации будет включать - случайный стиль, если вам совсем нечем заняться, не забудьте выставить на максимум количество изображений.
На вкладке Debug Menu в разделе Inpaint вы найдете Inpaint brush color, на тот случай если вас всегда бесил белый цвет маски.
Там же в Debug Menu, но уже в разделе Debug Tools появился параметр CLIP Skip, который по умолчанию выставлен на 2, имейте это ввиду.
Там же добавились семплер и планировщик TCD, которые запрашивал ваш покорный слуга. Сначала скачайте и включите вот эту лору, затем в Debug Menu, в разделе Debug Tools поставьте на 1 CFG Mimicking from TSNR, затем Sampler поставьте TCD, а Scheduler - sgm_uniform, ниже Forced Overwrite of Sampling Step поставьте на 6, я нашел это оптимальным значением для соотношения скорость - качество, но вы конечно можете поэкспериментировать и написать в комментариях как работает лучше. Guidance Scale рекомендуется поставить на минимум, но я нахожу что на 1.5-2 изображения получаются интереснее. Изображение с обложки было создано именно в таком режиме всего за 6 шагов и за 2 секунды в разрешении 1280х768, а так и не скажешь. Еще несколько изображений ниже.
Все новые функции и улучшения:
Добавлена возможность загружать файлы с Hugging Face через зеркальный сайт.
Обновлен модуль Interposer с v3.1 до v4.0.
Теперь можно переподключиться к интерфейсу без перезагрузки страницы с помощью специальной кнопки.
Появился выбор VAE моделей для генерации.
Добавлен новый стиль "Random Style" для случайного выбора стиля.
Обновлена модель аниме с animaPencilXL_v100 до animaPencilXL_v310.
В историю логов теперь сохраняются полные необработанные промпты (full raw prompts).
При загрузке изображения для апскейла (upscaling) теперь можно автоматически получить его описание.
Добавлена цензура NSFW изображений (отключает предварительный просмотр промежуточного изображения при генерации). Установите значение конфигурации default_black_out_nsfw в True, чтобы всегда включать эту опцию.
Добавлена поддержка встроенных ссылок на LoRA в промптах с поддержкой подпапок, пример: colorful bird lora:toucan:1.2
При описании изображения теперь даются рекомендации по размеру и соотношению сторон.
В инструменте инпейнтинга появился выбор цвета кисти, что удобно, когда изображение и кисть маски имеют одинаковый цвет.
Автоматизирована сборка Docker-образа с помощью Github Actions при каждом релизе.
Планировщики и семплеры:
Добавлен планировщик AlignYourSteps от Nvidia.
Добавлены семплер TCD и планировщик, основанный на sgm_uniform (аналогично lcm).
Производительность:
Добавлена производительность "hyper-sd" на основе 4-шагового LoRA.
Исправления:
Исправлено значение clip skip по умолчанию с 1 на 2.
Добавлена проверка типов на неопределенные значения, использование резервных вариантов, когда нет перевода для соотношений сторон.
Использовано корректное свойство CSS border-radius.
Исправлен незакрытый мета-тег в заголовке HTML.
Удален оставшийся код для тестирования hyper-sd.
Оптимизировано управление моделями для цензуры NSFW изображений.
Улучшена панель прогресса генерации.
Оптимизирована работа со встроенными LoRA.
Настройки интерфейса:
Элементы вкладки настроек стали более компактными.
Добавлен слайдер clip skip.
У большинства полей ввода изображений удалены подписи.
Настройки пользовательского интерфейса стали более компактными.
Прочее:
Изменен владелец кода с @lllyasviel на @mashb1t для автоматического уведомления о проблемах и Merge Requests.
Используются только действительные встроенные LoRA, добавлена поддержка подпапок.
Значение 'CFG Mimicking from TSNR' теперь читается из пресетов.
Изменена конфигурация окончания строк по умолчанию.
Оригинальный список изменений доступен на странице автора.
Как обновиться?
Скорее всего обновление уже произошло автоматически когда вы запускали фокус и никаких специальных действий не требуется. Если в консоли вы видите Already up-to-date, то можно не беспокоиться.
Но в моем случае была вот такая ошибка и я не нашел иного решения как просто скачать новый установщик и после этого все прошло гладко.
Читайте другие мои материалы о нейросети Fooocus:
А если захотите изучить Fooocus профессионально, то приглашаю на мой курс Fooocus.ru, где за 15 уроков вы узнаете всю базу необходимую для дальнейшего развития.
Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял. Удачных генераций!
azTotMD
а бывают нейронки для генерации малых изображений? 40*40, 50*50 и т.п.?
timonin Автор
На самом деле все нейронки такого размера примерно и генерируют изображения, но потом апскейлят их. В геймдеве обычно генерируют большое изображение, а потом уменьшают, часто для иконок используется, но вот чтобы заточенная конкретно под генерацию мелких форматов - такого не видел.
azTotMD
имеется ввиду размер скрытого пространства, latent space?
timonin Автор
Да, именно, возможно можно разобрать нейронку и не прогонять картинку через VAE, но это надо руками наверное =)
azTotMD
так в лоб вряд-ли получится. Это надо заменить энкодер на свой, который из 64*64*4 сделает 40*40*3 и всё это хозяйство переобучать