Stable Diffusion 3 Medium Portable, портативная версия лучшей модели для генерации изображений от Stability AI / forpes.ru

Главная
Stable Diffusion 3 Medium Portable, портативная версия лучшей модели для генерации изображений от Stability AI

Stable Diffusion 3 Medium Portable, портативная версия лучшей модели для генерации изображений от Stability AI

04.07.2024 22:00

timonin 9 5200 Источник

Мир искусственного интеллекта продолжает стремительно развиваться, и недавний релиз Stable Diffusion 3 от Stability AI — яркое тому подтверждение. Давайте разберемся, что нового предлагает эта модель и как она меняет ландшафт генерации изображений.

Ключевые особенности Stable Diffusion 3

Улучшенная архитектура SD3 использует новую архитектуру Multimodal Diffusion Transformer (MMDiT), которая обрабатывает текст и изображения отдельно, но позволяет информации "перетекать" между модальностями. Это приводит к лучшему пониманию запросов и более точной генерации изображений.
Превосходная работа с текстом Одно из главных улучшений — качество генерируемого текста на изображениях. SD3 демонстрирует значительный прогресс в типографике, правильном написании слов и соблюдении пропорций букв. Это особенно важно для создания инфографики, постеров и других изображений с текстовым содержанием.
Эффективность использования ресурсов Несмотря на увеличение количества параметров (до 8 миллиардов в крупнейшей версии), SD3 оптимизирован для работы на потребительском оборудовании. Модель может работать на видеокартах с 24 ГБ VRAM, что делает ее доступной для энтузиастов и исследователей.
Гибкость в настройке SD3 предлагает возможность отключения некоторых компонентов (например, текстового энкодера T5) для экономии памяти, с минимальной потерей качества для большинства задач.

Тестирование и сравнение

Согласно исследованиям Stability AI, SD3 превосходит или не уступает таким моделям как DALL·E 3, Midjourney v6 и Ideogram v1 в плане следования промпту, качества типографики и визуальной эстетики. Это серьезное достижение, учитывая, что SD3 — открытая модель.

Портативная версия от НейроСофт

Чтобы сделать эту передовую технологию доступной широкому кругу пользователей, наша команда создала портативную версию Stable Diffusion 3 Medium. Вот ее ключевые особенности:

Простота использования:
- Удобный интерфейс на русском.
- Быстрая установка без сложных настроек
- Работает на Windows с NVIDIA GPU (рекомендуется от 12 ГБ VRAM)
Функциональность интерфейса:
- Большое поле для ввода детальных промптов
- Настройка размера изображения (ширина и высота от 1024 пикселей)
- Регулировка параметров генерации (Guidance scale, количество шагов)
- Возможность задать негативный промпт
- Управление сидом для воспроизводимости результатов
Высокое качество генерации:
- Поддержка сложных, детализированных запросов
- Возможность создания высокореалистичных изображений
- Улучшенная работа с текстом на изображениях

Stable Diffusion 3 представляет собой значительный шаг вперед в области генерации изображений. Благодаря улучшенной архитектуре, она открывает новые возможности как для исследователей, так и для творческих профессионалов. А с нашей портативный версией вы сможете легко протестировать новую модель.

Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял. Удачных генераций!

Комментарии (9)

MountainGoat
05.07.2024 04:27
#27007966
+5
Все уже написали по нескольку раз, что SD3 хуже предыдущей SDXL, разве что жрёт поменьше, что в этом контексте не так важно.

KEugene
05.07.2024 04:27
#27008032
+3
Я вот одного не пойму: на кой все через одно место делать, в смысле, через Телеграм? Если нет сайта, то файлы хотя бы на git можно выложить... ну или на гуглодиск, в крайнем случае.
1. akdengi
  05.07.2024 04:27
  #27008990
  Потому что надо софт с вирусней распространить. Нафига это все, когда есть portable comfyui тот же.
  1. timonin Автор
    05.07.2024 04:27
    #27009020
    +2
    Комфи сложен для освоения и тем более сложен для того, чтобы просто запустить модель, сделать 10 картинок и удалить. Код портативки открытый, проверьте на вирусы.

NeiroNext
05.07.2024 04:27
#27010924
К сожалению о модели много не самого хорошего много где писалось, но вот улучшенную генерацию текста проверить бы хотелось.

Немного не удобно что ссылка вела в телегу - не самое ожидаемое место скачивания чего-либо, из-за чего засветился там в онлайне, можно было подписать, что ссылка в телегу ведёт.

Но т.к. уже зашёл туда, дополнительно могу сказать, что скрины генерации лучше было оформить в вертикальном формате, полезная информация от этого не потеряется и на ПК все будет так же, но дополнительно это будет комфортно выглядеть и на телефоне, сейчас с телефона каждую картинку нужно зумить ибо ничего не разглядеть из-за пустого пространства слева и справа от изображения.

И хотелось узнать, заработает ли модель на видеокарте с 8 Гб видеопамяти? Просто в телеге написано, что минимум для нее это 12 Гб, а здесь в статье 12 Гб лишь рекомендуемы. Заранее благодарю!
1. Shannon
  05.07.2024 04:27
  #27011650
  +1
  вот улучшенную генерацию текста проверить бы хотелось.
  
  Текст только на английском, если что. И можете проверить в официальном спейсе, быстрее получится (работает без регистрации):
  https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium
  
  Epic realictic artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "HABR" made out of colorful energy
1. timonin Автор
  05.07.2024 04:27
  #27013118
  Заработает даже на CPU, просто дольше будет генерировать.

ran4erep
05.07.2024 04:27
#27011300
+1
достаточно одного примера (блондинка) чтобы увидеть что SD3 делает хуже, чем SDXL. Хвалёный текст на картинках стал чуть лучше, конечно, но всё равно те же проблемы - кривые буквы, ошибки в словах или пропущенные буквы. Да, приятно что можно писать промпты естественным языком, но все и так привыкли писать токены, это больше фича для новичков. А ещё какие-то непонятки с лицензией, из-за которых CivitAI убрали кастомные модели для SD3... Короче лично я остался под негативным впечатлением от SD3, предыдущие модели (даже 1.5) делают красивее и лучше, SD3 выглядит как какой-то SD2

StarJohn
05.07.2024 04:27
#27011450
+1
Хорошие модели для SD и SDXL пока делают SD3 одной левой. И AUTOMATIC1111 вполне себе годный инструмент, особенно если нет необходимости автоматизировать прям все на свете, а какой-то процент творчества все ж допустим. :)

(Чтоб не быть голословным, epicphotogasm и dreamshaperXL. Но это сейчас, потом будут и другие модели-лидеры)

Stable Diffusion 3 Medium Portable, портативная версия лучшей модели для генерации изображений от Stability AI

Комментарии (9)

MountainGoat

KEugene

akdengi

timonin Автор

NeiroNext

Shannon

timonin Автор

ran4erep

StarJohn