После того как блестящий дебют ChatGPT сделал большие языковые модели (LLM) основным центром приложения инвестиций в ИТ, новые продукты на основе генеративного ИИ сыпятся на удивленных пользователей как из рога изобилия. Буквально каждую неделю лидеры ИТ-индустрии и небольшие «ламповые» стартапы презентуют нам новые умные сервисы, способные эффективно автоматизировать рутину и облегчить человеку раскрытие его творческого потенциала. 

В центре всеобщего интереса сегодня находятся генеративные нейросети — алгоритмы ИИ, которые можно использовать для создания нового контента, включая аудио, код, изображения, текст, симуляции и видео. Эти инструменты могут за секунду превратить краткий набросок в полноценную статью или презентацию, а неосознанный визуальный образ в привлекательное изображение с высокой степенью детализации.  

Но даже те, кто не испытывает беспокойства от накатившего технологического «вала», могут прийти в лёгкое замешательство от подобного океана новых возможностей. Разобраться с самыми перспективными нейросетями поможет наша краткая «шпаргалка» с их перечислением и краткой сервисной информацией. 

В список вошли как непосредственно LLM, так и наиболее интересные нейросетевые генеративные решения на их основе. Группировку мы решили сделать на функциональной основе — по типу преобразования контента, на котором специализируется генеративный АИ. Например, в разделе «Текст в изображение», собраны нейросети, превращающие текстовый промпт в картинку, а в разделе «Текст в текст» находятся сервисы, выдающие на текстовую «затравку» осмысленные и структурно целостные фрагменты текста.  

Важно. Этот список намеренно сосредоточился на охвате и не претендует на аналитическую глубину. Те, кто захочет узнать больше подробностей, могут лично изучить каждый сервис отдельно (ссылочки прикрепим) или почитать наш ранее выходивший разбор про «умные рисовалки». Ну и конечно, чтобы полноценно распробовать функционал представленных здесь нейросетевых продуктов, крайне желательно владеть английским, хотя бы на среднем уровне.

Текст в изображение (text-to-image)

Подружившись с Midjourney, можно осуществить самые смелые творческие фантазии. Источник: vk.com/neuromachina
Подружившись с Midjourney, можно осуществить самые смелые творческие фантазии. Источник: vk.com/neuromachina

Midjourney
API:
нет
Доступно: бот Discord

Midjourney описывает себя как: «...независимая исследовательская лаборатория, которая изучает новые средства мышления и расширяет творческие способности человечества». Лаборатория в Сан-Франциско является одним из лидеров (если не лидером) в области создания ИИ-изображений на основе текстовых промптов наряду со Stable Diffusion и DALL-E.

Stable Diffusion / Dream Studio
База:
Stable Diffusion
API: да
Доступно: веб

Stable Diffusion — основанная на глубоком обучении модель, позволяющая создавать высокодетализированные изображения на основе текстовых описаний. Модель обучалась на 4 000 графических процессоров Nvidia A100.

DALL-E 2
База:
DALL-E 2
API: да
Доступно: веб

Система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки из описания на естественном языке, а также предлагает альтернативные версии результатов и позволяет дорабатывать их.

Wombo / Dream
База:
VQ-GAN, CLIP
API: да
Доступно: веб

Генератор изображений с искусственным интеллектом, который создаёт оригинальные «произведения искусства» в зависимости от текстовой подсказки.

Kandinsky 
База:
CLIP, MoVQ
API: нет
Доступно: веб, бот Telegram

Диффузионная модель для синтеза изображений по текстовым описаниям от Сбера, созданная на объединенном датасете Sber AI и компании SberDevices.

Imagen
База:
VQ-GAN, CLIP, Latent Diffusion, DALL-E 2
API: да
Доступно: EditBench

Imagen AI — модель преобразования текста в изображение, разработанная Google.

Wonder
API:
нет
Доступно: веб, бот Discord

Простой в использовании генератор ИИ для преобразования текста в изображение с возможностью выбора художественного стиля: Pen and Ink, Novelistic, Magic, Cinematic и др.

Craiyon
База:
DALL-E 2
API: нет
Доступно: веб

Craiyon (экс DALL·E Mini) основан на оригинальной модели DALL·E, но работает значительно проще и быстрее, чем большинство новейших генераторов изображений.

Pixray 
База:
VQ-GAN
API: да
Доступно: веб

Простой в использовании генератор изображений с искусственным интеллектом доступен в веб-версии, для локальной установки, а также в качестве API для всех, кто хочет создавать ботов Discord с искусственным интеллектом. Прогнозы выполняются на аппаратном обеспечении графического процессора Nvidia T4.

Supercreator.ai
API:
нет
Доступно: мобильное приложение

Мобильный ИИ-инструмент для быстрой генерации и редактирования видео, которое можно использовать в социальных сетях.

Playground
База:
Stable Diffusion
API: нет
Доступно: веб (нужен акк Google)

Playground AI — ИИ-платформа, которая позволяет пользователям экспериментировать с моделями и наборами данных в удобной для пользователя среде даже без навыков программирования.

Omneky
База:
GPT-3
API: нет
Доступно: демо по запросу

Omneky (Omnichannel Creative Orchestration & Ad Creation) позиционирует себя как коммерческий продукт, позволяющий использовать возможности ИИ для создания инновационных рекламных визуалов.

DreamUp (DeviantArt)
База:
Stable Diffusion, LAION
API: нет
Доступно: веб (5 бесплатных промптов с аккаунтом DeviantArt)

Генератор изображений по текстовому описанию от коммерческой онлайн-галереи DeviantArt.

Lexica
База:
Stable Diffusion
API: да
Доступно: веб

Нейросеть, которая умеет превращать текстовые описания или загруженные фотографии в уникальные арты. Инструмент позволяет не только самостоятельно генерировать, но и находить подходящий вариант из базы уже созданных ИИ изображений.

AlpacaAI
API:
нет
Доступно: бета по запросу 

ИИ-генератор и редактор, который позволяет легко встраивать генеративные модели в процесс создания изображений. Функционал включает преобразование текста в изображение, вариации изображения в изображение, перекрашивание, масштабирование, создание карты глубины. Плагин Alpaca можно встроить в Photoshop. 

Nyx.gallery
База:
GAN
API: нет
Доступно: веб

Виртуальная галерея фотореалистичных изображений, созданных искусственным интеллектом, от NyxAI. Каждое изображение в ближайшем будущем будет доступно для онлайн-редактирования.

KREA
База:
Stable Diffusion
API: да
Доступно: веб

ИИ-инструмент для исследования изображений, созданных искусственным интеллектом, и улучшения собственных навыков составления промптов.

Artbreeder
База:
StyleGAN
API: нет
Доступно: веб (требуется аккаунт Google)

Artbreeder — модификатор изображений на основе искусственного интеллекта. Позволяет делать визуальные «ремиксы» в разных стилях — от классических пейзажей и портретов до аниме, а также создавать анимированных персонажей на основе получившихся изображений.

DeepAI
API:
да
Доступно: веб

Основной продукт — это набор платных API для разработчиков, но на веб-сайте есть бесплатный генератор изображений, который позволяет получить полное представление о возможностях ИИ.

Bertha
База:
GPT
API: нет
Доступно: плагин для WordPress и расширение для Chrome

Bertha AI — инструмент для автоматического создания контента на основе искусственного интеллекта, специализированный под встраивание в сайты на WordPress, а также для работы с популярными соцсетями.

Hypotenuse
API:
да
Доступно: веб

Набор инструментов для автоматизации создания контента, куда, помимо прочего, входит удобный и достаточно качественный генератор изображений.

NVIDIA Picasso
API:
нет
Доступно: бета по запросу

Облачный сервис (NVIDIA DGX) для создания генеративных визуальных приложений на основе ИИ. Пользователи могут анализировать свои модели, обучать базовые модели NVIDIA Edify на собственных данных или начинать с предварительно обученных моделей для создания изображений, видео и 3D-контента из текстовых подсказок. Прямые интеграции с Adobe, Getty Images, Shutterstock.

PhotoRoom
База:
Stable Diffusion
API: да
Доступно: веб

Мощный, но простой в использовании ИИ-инструмент редактирования фотографий.

StockImg AI
API:
нет
Доступно: веб (ограниченный б/п тариф с аккаунтом Google)

ИИ-платформа для создания графических элементов оформления — логотипов, изображений, плакатов, обложек книг и других.

Leap
База:
Openjourney, Stable Diffusion
API: да
Доступно: веб (требуется аккаунт Google)

Leap AI — это платформа, которая позволяет создавать изображения (например, рисунки, аватары, логотипы) с использованием предварительно обученных моделей с открытым исходным кодом.

Текст в текст (text-to-text)

ChatGPT постоянно преподносит своим пользователям всё более продвинутые возможности, а ИИ-скептикам даёт ещё больше поводов для беспокойства. Источник: BPawesome/stock.adobe.com
ChatGPT постоянно преподносит своим пользователям всё более продвинутые возможности, а ИИ-скептикам даёт ещё больше поводов для беспокойства. Источник: BPawesome/stock.adobe.com

ChatGPT
База:
GPT 3/4
API: да
Доступно: веб, после регистрации аккаунта OpenAI (недоступно для жителей РФ)

Универсальный чат-бот от компании OpenAI, чья публичная презентация в конце ноября 2022 года считается неофициальной датой начала LLM-гонки. Революционная нейросеть была создана на суперкомпьютере Azure AI с помощью системы Reinforcement Learning from Human Feedback («обучения с подкреплением на основе обратной связи с человеком»). 

YandexGPT
База: YaLM 2.0
API: да
Доступно: в тестовом режиме на Yandex Cloud (после регистрации)

Новая нейросеть семейства GPT от «Яндекса» генерирует тексты на основе различных источников информации из интернета. Инструмент призван расширить возможности виртуального голосового помощника «Алиса» и других флагманских продуктов компании.

GooseAI
База:
GPT
API: да
Доступно: веб («песочница») 

GooseAI — инструмент из разряда NaaS (NLP-as-a-Service), который предлагает хорошую скорость развёртывания через API и богатый выбор языковых моделей на основе GPT. 

Сohere
База:
GPT, BERT
API: да
Доступно: веб («песочница»)

Платформа коммерческой интеграции ИИ-решений на базе собственных NLP/LLM инструментов. Модели Cohere поддерживают функции интерактивного чата, генерируют текст для описания продуктов, сообщений в блогах и статей, а также распознают значение текста для поиска и модерации контента. 

jasper.ai
База:
GPT-3
API: да
Доступно: веб (после регистрации аккаунта)

Инструмент для автоматизации создания коммерческого контента с возможностью выбрать авторскую «тональность».

TextCortext
База:
NeoCortex
API: да
Доступно: веб/браузер

Коммерческая платформа для автоматизации создания корпоративного контента с помощью ИИ, который персонализирует тексты под принятый в компании тон общения и стиль.

Rytr
База:
GPT-3
API: да
Доступно: расширение Chrome

ИИ-помощник копирайтера, помогающий ускорить процесс создания текстов до 10 раз. Доступно более 40 готовых шаблонов кейсов и более 20 вариантов «tone of voice».

ChibiAI
База:
ANI
API: нет
Доступно: веб (2 000 слов бесплатно, потребуется Google аккаунт) 

Коммерческий ИИ-инструмент для быстрого наполнения корпоративных соцсетей или блога, а также создания персонализированной рекламы.

Copy.ai
База:
GPT-3
API: да
Доступно: веб (2 000 слов в месяц бесплатно)

Генеративный маркетинговый инструмент для автоматизированного написания контента для сайта, почтовых рассылок, рекламы и других корпоративных нужд.

Nichess
База:
GPT-3
API: нет
Доступно: веб

Набор из более 150 ИИ-инструментов, позволяющий быстро создавать тексты любого назначения и стилистики — от отдельных промптов до постов в блог и бизнес-презентаций.

Simplified
API:
нет
Доступно: веб (бесплатно)

Чат-бот с ИИ, дополненный многочисленными генеративными инструментами для работы с видео и изображениями. Доступно более 70 готовых шаблонов для стилизации текста под разные коммерческие ниши.

Anyword
База:
GPT, T5, CTRL
API: да
Доступно: веб (бесплатно)

Платформа искусственного интеллекта Anyword создаёт и оптимизирует маркетинговые тексты для рекламы, страниц сайта, постов в социальных сетях, электронных писем и SMS.

HubSpot AI Tools
База:
GPT
API: да
Доступно: плагин

Контент-помощник на основе ИИ от компании HubSpot, легко встраиваемый на сайт, в CRM и другие маркетинговые инструменты.

MarketMuse
API:
нет
Доступно: веб (ограниченный бесплатный тариф)

ИИ SEO-платформа для централизованного создания и управления оптимизированным коммерческим контентом в потоковом режиме. Интегрирована с X-Ray Serp.

Frase
API:
да
Доступно: веб

ИИ-генератор контента для автоматизации написания качественных SEO-оптимизированного контента разной направленности. Включает более десятка специализированных инструментов для отдельных видов текста.

AI21 Labs / Wordtune
API:
да
Доступно: веб

Набор инструментов для генерации текстового контента на основе обработки естественного языка (NLP).

EleutherAI
База:
GPTJ-6B
API: нет
Доступно: веб

EleutherAI — это некоммерческая исследовательская лаборатория ИИ, которая занимается интерпретацией и согласованием больших языковых моделей.

Inferkit
База:
LTSM
API: да
Доступно: веб

InferKit предлагает веб-интерфейс и API для текстовых генераторов на основе ИИ.

Blog Idea Generator
База:
GPT-3
API: нет
Доступно: веб

Как несложно догадаться по названию, это ИИ-инструмент для быстрой и простой генерации тем для постов в блог или соцсети по ключевым словам.

Sudowrite
База:
GPT
API: нет
Доступно: веб

ИИ-копирайтер, работающий в нескольких режимах: «Писать», «Переписывать», «Описать», «Брейншторм». Включает расширение для Chrome, позволяющее встраивать Sudowrite в Google Docs.

Research AI
API:
нет
Доступно: веб

Ещё один удобный контент-маркетинговый инструмент на базе генеративного ИИ с оптимальным набором полезных функций и бесплатным тарифом (5 000 слов). Есть интеграция с SEMrush.

IdeasAI
База:
GPT-3
API: нет
Доступно: веб

Забавный проект — страница, на которой собраны лучшие идеи для бизнеса, полностью сгенерированные ИИ. Карточки с идеями разбиты по популярности и тематикам.

Requstory
API:
нет
Доступно: веб

Маркетинговый инструмент на базе ИИ, главное предназначение которого — создание пользовательских историй (User Story) для разных областей бизнеса. Очень полезно для стартапов.

FeedHive
API:
нет
Доступно: веб

ИИ-платформа для потокового создания контента в соцсетях. В число основных функций входят: планирование, визуальное планирование, управление почтовыми ящиками в социальных сетях, ИИ-аналитика, совместная работа и исследования.

Context
База:
GPT
API: да

Доступно: бот создаётся прямо в браузере (требуется дать ссылки на корпоративный канал на YouTube или базу знаний на сайте) и потом может быть инсталлирован на сайт или в нужное приложение. Context — простой способ превратить существующую базу знаний в автоматизированного бота технической поддержки, работающего в режиме 24/7.

MoonBeam
API:
да
Доступно: веб

Многопрофильный ИИ-помощник со специализацией под создание лонгридов.

Letterdrop
База:
GPT-3
API: да
Доступно: веб

Маркетинговый цифровой инструмент для автоматизации создания постов и статей в блогах с помощью ИИ.

Peppertype
База:
GPT-3
API: нет
Доступно: демо по записи

ИИ-платформа, максимально упрощающая создание коммерческого контента для разных целей.

Subtxt
База:
GPT
API: нет
Доступно: веб

Прокачиваем навыки сторителлинга с помощью подсказок от искусственного интеллекта.

LAIKA
API:
нет
Доступно: веб

Персонализированный ИИ-помощник для писателей. Можно оттачивать свой стиль или выбирать стилистику изложения одного из всемирно известных прозаиков (например, Достоевского или Кафки).

Writer
База:
PALMYRA LLM
API: да
Доступно: демо по запросу

Платформа для создания корпоративного контента, использующая решения на основе LLM, NLP и ML технологий для повышения эффективности работы команд копирайтеров.

Compose AI
База:
GPT-3
API: нет
Доступно: расширение Chrome

Браузерное расширение, позволяющее автоматизировать написание текстов с помощью ИИ. Интегрировано с Google Docs и Gmail.

HyperWrite
API:
нет
Доступно: веб, расширение Chrome

Персональный ИИ-помощник с сильным уклоном в автоматизированное создание контента. Обширный набор специализированных инструментов под разные задачи.

Writesonic
База:
GPT
API: да
Доступно: веб

ИИ-сервис для быстрого создания SEO-оптимизированного текстового контента. Более 100 инструментов копирайтинга на борту.

Typli
API:
нет
Доступно: веб

Интуитивно понятный ИИ-сервис для работы с контентом, который сочетает в себе достоинства опытного копирайтера и продвинутого SEO-специалиста.

Easy-Peasy.AI 
База:
GPT, Claude
API: нет
Доступно: веб

ИИ-ускоритель коммерческого копирайтинга, позволяющий использовать более 80 готовых шаблонов по разным тематикам и областям применения текста.

NovelAI

База: GPT-3
API: да
Доступно: веб

NovelAI — ИИ-инструмент для авторского сторителлинга, виртуального общения или развития ресурсов воображения в режиме песочницы на основе GPT.

Describely
База:
GPT
API: неДоступно: веб (после регистрации)

Новая ИИ-платформа от создателей Copysmith для потокового создания коммерческого SEO-оптимизированного текстового контента (ближайший аналог Rytr и Frase). Поддерживает персонализацию по «tone of voice» бренда.

Текст в видео (text-to-video)

Gen-2 / Runway 
База:
Gen-2 Synthetic Video Model
API: нет
Доступно: веб, приложение для iOS (105 секунд бесплатной генерации)

Мультимодальная нейросеть от компании Runway для генерации изображений и видео по текстовым запросам. На борту — более 30 «волшебных» инструментов для редактирования видео в реальном времени, совместной работы и т. д.

Syneshtesia
API:
да
Доступно: веб

Synthesia.io — это инструмент для создания видео с искусственным интеллектом, который позволяет пользователям создавать профессиональные видеоролики, корпоративные видео-аватары, преобразовывая текст в речь за несколько минут. В сервисе доступна озвучка на 120 языках, для создания которой привлекали профессиональных актеров.

RunwayML
API:
нет
Доступно: веб

Мощный ИИ-редактор видео, который позволяет создавать реалистичные произведения в качестве 4К с помощью «волшебных инструментов», а также работать с 3-D и аудиоконтентом.

fliki
API:
да
Доступно: веб

Платформа Fliki предлагает решение для создания высококачественного аудио- и видеоконтента с помощью генеративного искусственного интеллекта. 

Phenaki
База:
Phenaki
API: нет
Доступно: данные о модели представлены в документе

Генеративная модель для создания коротких видео из текста с подсказками, способная учитывать меняющийся контекст.

Steve AI
API:
нет
Доступно: веб

Steve AI — это онлайн-программа на базе ИИ, которая создает видео и анимацию из текстовых подсказок за считанные секунды.

Descript
API:
да
Доступно: локально (MacOS, Windows)

Descript — популярный набор инструментов для редактирования видео на основе искусственного интеллекта, который упрощает написание, расшифровку, редактирование, совместную работу и обмен видео или подкастами. В набор, помимо прочего, входит Overdub — удобный преобразователь текста в речь (text-to-speech).

Contenda
API:
да
Доступно: веб

Последний инструмент предназначен для обратной трансформации — видео в текст. С помощью него на базе ИИ можно «в пару кликов» превратить недавнюю презентацию или выступление на конференции в полезную статью для корпоративного или внешнего блога.

Текст в аудио / аудио в текст (text-to-audio / audio-to-text)

Источник:openai.com.
Источник:openai.com.

Whisper (OpenAI)
База:
ASR
API: да
Доступно: GitHub

Модель автоматического распознавания речи ASR (automatic speech recognition) от OpenAI (GPT, DALL-E) представляет собой многоязычную многозадачную систему, производительность которой приближается к человеческому уровню. Она была обучена на 680 000 часах контролируемых данных, что соответствует 70 годам непрерывного прослушивания аудио.

WellSaid Labs
API:
да
Доступно: по запросу

Голосовая платформа на базе искусственного интеллекта для создания озвучки из текста в режиме реального времени.

Murf AI
API:
да
Доступно: веб

Главный конкурент WellSaid Labs на ниве преобразования текста в речь предлагает такие дополнительные возможности озвучки, как предустановленные роли (учитель, сотрудник технической поддержки, автор подкаста и т. д.), поддержку более 20 языков, функцию «клонирование голоса» и возможность мультиформатного сохранения результатов.

Resemble
API:
да
Доступно: веб

ИИ-генератор голоса позволяет за считанные секунды создавать реалистичную озвучку для любого типа контента с нуля. Преобразование работает в режимах «Text-to-Speech» (текст в речь) и «Speech-to-Speech» (речь в речь).

PlayHT
API:
да
Доступно: веб (2 500 слов бесплатно)

Удобный генеративный инструмент для быстрого создания озвучки на базе 600+ голосовых образцов. Недавно вышедшая вторая версия PlayHT способна озвучивать текст за 0,8 секунд, а клонировать голос всего за 3 секунды в реальном времени.  

AudioStack / Aflorithmic
API:
да
Доступно: веб (демо), по запросу

ИИ-сервис для автоматизации озвучивания маркетингового контента (реклама, подкасты) от британской компании Aflorithmic.

AssemblyAI
API:
дДоступно: через API

Набор моделей для создания компонентов обработки естественной речи в ИИ-приложениях. В функционал входит: распознавание речи, автоматическая транскрипция, обобщение результатов и многое другое.  

Текст в код (text-to-code)

GitHub Copilot
API:
нет
Доступно: веб (потребуется аккаунт GitHub)

TTC-cервис от крупнейшего хостинга для программных продуктов красноречиво презентует себя, как «ваш ИИ-напарник в программировании». Обученный на миллиардах строк кода, GitHub Copilot действительно способен за доли секунды превращать подсказки на естественном языке в работающий код на десятках языков. 

Replit / Ghostwriter
API:
нет
Доступно: веб (только платно)

Ghostwriter Chat — коммерческая альтернатива GitHub Copilot, интегрированная в Replit IDE. Большие возможности в деле автоматизации дополнения, объяснения и преобразования кода.

Tabnine
API:
нет
Доступно: в виде интеграции в популярные IDE

ИИ-помощник разработчика с упором на лёгкость интеграции и безопасность данных. Сервис позиционирует себя как актуальную альтернативу возможностям дополнения кода ChatGPT Plus (Code Interpreter).

Мutable AI
API:
нет
Доступно: демо по запросу, плагин для репозиториев

Бесплатная альтернатива GitHub Copilot с похожим функционалом, но упором на лучшую скорость и качество исполнения.

CodeWhisperer (Amazon)
API:
нет
Доступно: плагин в Наборе инструментов AWS для интеграции в популярные IDE

ИИ-генератор кода от Amazon. CodeWhisperer обучается работе с миллиардами строк кода и может генерировать предложения по автодополнению в реальном времени — от фрагментов до полноценных функций на основе комментариев и существующего кода.

Code Suggestions
API:
нет
Доступно: бета по запросу

ИИ от создателей GitLab позволяет генерировать фрагменты кода по текстовому описанию на естественном языке. Сервис поддерживает работу с 13 языками программирования, включая: C/C++, C#, Go, Java, JavaScript и Python. 

Изображение в текст (image-to-text)

Neural.love
API:
да
Доступно: веб 

Онлайн-инструмент для улучшения изображений, видео и аудио. ИИ может также генерировать изображения из текста и тренироваться на пользовательских фотографиях.

Auxiliary Tools
База:
GPT-3
API: нет
Доступно: по запросу

Набор ИИ-плагинов для создания и обработки изображений с помощью команд на естественном языке.

Аудио в аудио (audio-to-audio)

AudioLM (Google)
API:
нет
Доступно: GitHub (имплементация для Pytorch)

Новая система искусственного интеллекта от Google способна создавать полноценный звуковой контент (речь, музыку) на основе автозавершения короткого аудиофрагмента.

Voicemod / AI-voices
API:
да
Доступно: установочный файл (по предварительной регистрации через аккаунт Google или Discord)

ИИ-генератор, позволяющий в режиме реального времени изменять голос пользователя для общения в мессенджерах, социальных сетях и игровых платформах (Roblox, OBS, VRChat, Discord).

Translate.Video
API:
нет
Доступно: по запросу

Инструмент на основе искусственного интеллекта, который может «в один клик» перевести аудиодорожку с русского на 70 языков мира и обратно.

Текст в 3D (text-to-3d) / 3D-визуализация

GET3D (NVIDIA)
API:
нет
Доступно: GitHub (имплементация для Pytorch)

Генеративная модель для создания высококачественных трёхмерных текстурированных форм, извлечённых из изображений.

DreamFusion (Google)
База:
NeRF
API: нет
Доступно: документ

Нейросеть DreamFusion от Google способна генерировать трёхмерные изображения из запросов на естественном языке, используя предварительно обученную 2D-модель диффузии текста в изображение.

Skybox AI
API:
да

Доступно: веб

Нейросеть позволяет создать с нуля реалистичное 360-градусное панорамное изображение с помощью промптов и встроенного конструктора. Идеально для добавления интерактивного элемента на сайт или создания виртуальной прогулки по объекту 

Found (AaLab)
База:
Stable Diffusion
API: да
Доступно: скачиваемое приложение, расширение Chrome

ИИ-платформа для управления цифровыми активами. В функциональность входит создание видео, 3D-моделей, изображений и HDRI на основе текстовых запросов.

CLIP-Mesh
База:
CLIP
API: нет
Доступно: GitHub

Нейросеть для создания 3D-моделей на основе только текстовых промптов.

MDM: Human Motion Diffusion Model
База:
HumanML3D, KIT
API: нет
Доступно: GitHub 

Модель диффузии движения (MDM) — тщательно адаптированная генерирующая модель на основе диффузии без классификатора, способная воспроизвести движения человеческого тела по текстовым запросам.

Rosebud AI
API:
нет
Доступно: веб («песочница»), доступ к бета-версии AI Game Creator по запросу

Rosebud AI позволяет создавать визуальные цифровые модели для компьютерных игр (например, персонажей, предметы или одежду) на основе запросов к искусственному интеллекту.

Текст в NFT (text-to-NFT)

LensAI / Lens Protocol
База:
Proof of Stake (PoS)
API: да
Доступно: GitHub

Lens Protocol — это социальный граф Web3 на блокчейне Polygon Proof-of-Stake. Протокол предусматривает богатые возможности по созданию и распространению пользовательских NFT.

NightCafe
База:
DALL-E 2, Stable Diffusion
API: нет
Доступно: веб

NightCafe — не просто очередной ИИ-генератор изображений, а универсальный инструмент, позволяющий выбирать не только стиль выходного изображения, но и используемый алгоритм, а также мгновенно преобразовывать свои творения в NFT.

Другое

Non-invasive brain recordings
API:
нет
Доступно: GitHub

Превращением текстовых или голосовых промптов в статьи или видеоклипы уже никого не удивишь. А как насчет перекодирования человеческих мыслей? Данная нейросетевая модель вплотную подошла к решению этой задачи.

supermeme.ai
API:
да
Доступно: веб

И, чтобы немного отдохнуть от задач компьютерной науки и бизнеса, мы завершим каталог генеративных нейросетевых продуктов этим крайне несерьёзным сервисом. Всё что он может — превратить любую вашу идею в мем. Довольно бесполезно, зато точно добавит в жизнь несколько весёлых моментов.


НЛО прилетело и оставило здесь промокод для читателей нашего блога:
-15% на заказ любого VDS (кроме тарифа Прогрев) — HABRFIRSTVDS

Комментарии (1)


  1. AyratGil
    14.08.2023 08:48

    Спасибо большое.