Привет, Хабр! Меня до сих пор зовут Владимир Садовский, я по-прежнему работаю программистом инструментария в Nau Engine, всё так же обожаю игры, и меня всё ещё не заменил искусственный интеллект. В прошлый раз я рассказывал о процедурной генерации в игровой индустрии. Пришла пора продолжить тему и взглянуть на другую сторону генеративной медали — искусственный интеллект.

Вопрос создания ИИ будоражит лучшие умы человечества уже давно. Позитронные роботы Айзека Азимова, всемогущий суперкомпьютер Харлана Эллисона, репликанты Филипа Дика и сотни, тысячи других искусственных разумов, придуманных фантастами, так глубоко проникли в поп-культуру, что рождение реального AI было исключительно вопросом времени. И в современных IT, включая геймдев, без него уже никуда. 

Современную игровую индустрию тоже сложно представить без ИИ, хотя ещё пару лет назад они были в новинку. Нейросети помогают геймдизайнерам в поиске идей и автоматизируют рутинную работу художников.

По данным Unity, в 2023 году 62% игровых студий использовали в работе ИИ для быстрого прототипирования, создания ассетов, кодинга и других задач. При этом 71% разработчиков, применяющих нейросети, утверждают, что AI ускоряет и облегчает их труд.

Для чего, по результатам опросов Unity, игровые разработчики используют ИИ
Для чего, по результатам опросов Unity, игровые разработчики используют ИИ

Пройти мимо такого масштабного явления просто невозможно. Поэтому предлагаю вспомнить историю генеративного ИИ, обсудить его роль в современном геймдеве и представить, что он сможет предложить игровой индустрии в будущем.

Подноготная GAI

Генеративный искусственный интеллект (Generative Artificial Intelligence, GAI) способен создавать различный медиаконтент, например текст или изображения, с использованием так называемых генеративных моделей.

Пример самой простой архитектуры полносвязной нейронной сети
Пример самой простой архитектуры полносвязной нейронной сети

Генеративные модели работают примерно так же, как и другие нейросети. Они изучают закономерности в представленных на вход данных, а затем генерируют новые данные, которые напоминают то, на чём их непосредственно обучали.

Началом истории искусственного интеллекта можно считать статью Алана Тьюринга 1950 года «Вычислительная техника и интеллект». Она задала первые вопросы о том, что является машинным разумом, насколько он может быть аналогичен человеческому интеллекту, да и в целом внесла некоторое фундаментальное понимание того, что может собой представлять искусственный интеллект.

Развитие архитектуры нейронных сетей. "Мешок слов" - забавный термин
Развитие архитектуры нейронных сетей. "Мешок слов" - забавный термин

По-настоящему активное развитие темы ИИ началось с «Дартмутского летнего исследовательского проекта по искусственному интеллекту» в 1956 году. Именно на этом научном семинаре прозвучали первые призывы к более активному изучению вопроса искусственного интеллекта.

К началу 1970-х появились первые работы, связанные с ИИ. Например, компьютерная программа AARON, которая предназначалась для создания картин.

В начале XXI века прогресс в области искусственного интеллекта сильно стимулировало появление метода глубокого обучения. Этот подход позволил дальше исследовать классификацию изображений, распознавания речи и обработки естественного языка. Но из-за больших объёмов данных на тот момент нейронные сети обучались как дискриминационные (условные) модели.

Процесс работы нейронной сети, натренированной с помощью глубокого обучения
Процесс работы нейронной сети, натренированной с помощью глубокого обучения

В 2017 году была представлена новая архитектура нейронных сетей с глубоким обучением — «трансформер» (или «преобразователь»), которая позволила усовершенствовать уже существующие модели. Это привело к созданию так называемого «первого генеративного предварительно обученного преобразователя» или же GPT-1 в 2018 году. А в 2021 году вышла DALL-E — модель генерации растровых изображений на основе архитектуры трансформера.

Архитектура нейронной сети «трансформер»
Архитектура нейронной сети «трансформер»

К последним громким новостям в этой сфере относится заявление Microsoft Research, сделанное в марте 2023 года, о том, что GPT-4 можно считать системой общего искусственного интеллекта (AGI). То есть, в сущности, почти полным аналогом человеческого разума. Тем не менее это достижение всё ещё оспаривается, так как некоторые исследователи считают, что GPT-4 не дотягивает до нужного уровня.

А говорили, что у нейросетей нет фантазии
А говорили, что у нейросетей нет фантазии

Но для этого материала не так уж важно, насколько конкретный ИИ похож на человека. Главное, что современные нейросети создают медиаконтент почти всех возможных форматов.

GAI на службе человечества

В число актуальных генеративных моделей входят GPT, Copilot, а также ряд художественных систем искусственного интеллекта: Stable Diffusion, Midjourney, DALL-E и отечественная нейронная сеть Kandinsky.

А вот что умеет Kandinsky 3.0
А вот что умеет Kandinsky 3.0

Недавно в тройку самых популярных приложений на основе GAI вошёл Шедеврум Яндекса. Как отмечают в самой корпорации, с момента запуска в апреле 2023 года нейросеть уже установили почти 8,5 миллионов пользователей.

Попробуйте с помощью Шедеврума обработать фотографию Арнольда Шварценеггера с дробовиком из фильма «Терминатор» и посмотрите, что из этого выйдет
Попробуйте с помощью Шедеврума обработать фотографию Арнольда Шварценеггера с дробовиком из фильма «Терминатор» и посмотрите, что из этого выйдет

Ну и как не упомянуть выход 15 февраля 2024 года новой нейросети OpenAI Sora! Потенциально она может стать полноценным поставщиком визуального контента для видеохостингов. Более подробно про нее можно почитать на сайте разработчика, да и на Хабре уже есть несколько подробных статей.

Хотя для генерации всего одной минуты FullHD-видео требуются колоссальные вычислительные мощности и около часа времени.

Большого бума решений от небольших коммерческих компаний в этой области, к сожалению, не случилось. Дело в том, что для обучения таких нейронных сетей требуются фантастические объёмы данных. Гиганты вроде Microsoft или Google годами собирали информацию для обучения ИИ. А компания, ответственная за создание крупнейшего китайского интернет-поисковика Baidu, относительно недавно выпустила свой аналог GPT под названием ERNIE, который обучался на основе двух триллионов токенов. Маленькие студии не имеют доступа к такому количеству данных и поэтому не спешат с разработками области ИИ.

На рынке игровых движков ситуация аналогичная. Возможность создать собственный GAI имеют только самые крупные и популярные решения вроде Unity или Unreal Engine. Впрочем, им хватает альтернатив. О том, что сейчас есть на рынке, и чем уже можно пользоваться, расскажу ниже.

ИИ как инструмент игрового разработчика

Всеобщее распространение нейронных сетей началось недавно, поэтому на рынке пока мало решений, заточенных под игровую индустрию. Обычно в геймдеве применяют генеративные модели общего назначения. Например, можно использовать ChatGPT для развития уже придуманной истории. Или попросить Midjourney нарисовать арты, чтобы потом использовать их при создании диздока или быстрого прототипа. Однако существуют несколько проектов, ориентированных на игровую индустрию.

Самый интересный, на мой взгляд, инструмент — Unity Muse. Уже сейчас, в стадии раннего доступа, он позволяет создавать текстуры и спрайты прямо в интерфейсе движка, а для работы с генеративной моделью предлагает аналог ChatGPT. Нейросеть охотно генерирует, например, новые идеи или куски часто встречающегося кода. В дальнейшем Unity планирует добавить новые возможности по созданию гуманоидных анимаций, деревьев поведения игрового ИИ, 3D-моделей для прототипирования игр.

Признаюсь, такой подход к работе с документаций мне нравится больше
Признаюсь, такой подход к работе с документаций мне нравится больше

Epic Games пока что не заявили об официальных инструментах для работы с нативным искусственным интеллектом. Тем не менее уже сейчас существуют сторонние решения от сообщества.

Promethean AI уже с 2019 года автоматизирует рутину разработчиков. Этот инструмент предназначен для менеджмента игровых ассетов и создания виртуального мира.

Просто пишешь, что тебе нужно, а ИИ сам подбирает нужный игровой ассет
Просто пишешь, что тебе нужно, а ИИ сам подбирает нужный игровой ассет

Благодаря тому, что Promethean AI комбинирует в себе как генеративную нейронную сеть, так и менеджер ассетов, пользователь может достаточно быстро проектировать игровые уровни. Для создания больших объемов контента предусмотрен встроенный помощник. Его можно попросить, к примеру, создать участок для генерации большого массива растительности или небольшую зону отдыха для спальни. Плюс всегда можно вызвать встроенный менеджер ассетов и оперативно собрать необходимые визуальные элементы из готовых решений.

Такой подход немного отличается от концепции Muse. Ведь в Unity, скорее всего, хотят, чтобы игровые ассеты, которые генерирует искусственный интеллект, не нужно было как-то править. В то время как Promethean AI выглядит больше как некий аналог визуального ассистента на основе искусственного интеллекта, который позволяет упростить и ускорить работу, например, технического художника.

Ещё один полезный для игрового разработчика инструмент интегрирован в MANU Video Game Maker. Создатели позиционируют свой проект как трёхмерный игровой движок, который позволяет создать игру мечты без программирования — зато с использованием встроенного ИИ-ассистента. В перспективе он сможет генерировать даже небо почти весь игровой контент, включая уровни и катсцены. Но пока всё это по большей части экспериментальные фичи, недоступные широкой публике. Зато уже сейчас MANU может помочь с проработкой истории и игровых механик.

Интерфейс MANU Video Game Maker выглядит довольно аскетично, но для запуска ассистента предназначена отдельная кнопка в боковом меню
Интерфейс MANU Video Game Maker выглядит довольно аскетично, но для запуска ассистента предназначена отдельная кнопка в боковом меню

Достаточно написать запрос, нажать кнопку “Imagine storytelling” — и…  

The Scent of the Undead — даже продающее название есть!
The Scent of the Undead — даже продающее название есть!

…вуаля! MANU представляет готовую историю в виде схемы с подробными комментариями. Например, вот что может получиться, если попросить ИИ придумать сюжет для платформера про зомби, которые ориентируются на запах.

Нелинейная история по запросу. Я, правда, не рассчитывал, что главный герой будет зомби
Нелинейная история по запросу. Я, правда, не рассчитывал, что главный герой будет зомби

А вот так выглядит логика вражеского NPC, сгенерированная искусственным интеллектом. 

Все состояния вражеского NPC подробно расписаны в выпадающем списке справа
Все состояния вражеского NPC подробно расписаны в выпадающем списке справа

Я провёл в MANU несколько часов и могу сказать, что здешнему AI-ассистенту точно есть куда расти, но натолкнуть на верную мысль и задать направление работы он может уже сейчас. Осталось подружить его с генерацией ассетов, и можно будет оставить в интерфейсе всего одну кнопку — «Создать игру». Фантастика, конечно, но не такая уж далёкая от реальности. 

А пока оставим мечты и обратимся к проекту наших соотечественников, на котором хотелось бы чуть подробнее остановиться по двум причинам. Во-первых, он приносит геймдеву реальную пользу уже сейчас. Во-вторых, принцип его работы очень наглядно демонстрирует особенности функционирования нейросетей. 

В 2019 году Московская студия Banzai Games начала работать над новым инструментом для создания анимаций Cascadeur. У авторов образовалось много материала после работы над Shadow Fight 3, и они разумно рассудили, что более 1100 анимаций не должны пылиться на полке. Разработчики дополнили уже существующий датасет, разбили анимации на отдельные позы и обучили на этом несколько нейросетей, которые предсказывают поведение всех ключевых точек в анимации по нескольким значениям управляющих точек.

Шесть ключевых точек
Шесть ключевых точек

Подход Banzai Games основан на использовании композиции нейросетей. По началу они пытались использовать стандартную архитектуру нейронной сети и ключевых точек, поданных на вход. В зависимости от того, насколько отклонилось предсказанное значение, оценивалась точность работы сети.

Поначалу отклонения было высоким — около 3,5 сантиметра. Но разработчики заметили, что при увеличении входного количества точек до 16 точность улучшилась в два раза. Это натолкнуло их на мысль, что можно использовать композицию нейросетей. 

Так, первая нейросеть может принимать всё те же 6 ключевых точек, а вот следующая за ней будет принимать 15 точек, предсказанных прошлой нейросетью и т.д. Таким образом можно добиться уменьшения ошибки без увеличения работы аниматора, который всё так же использует лишь 6 точек.

Уровни детализации скелета, которые передаются на вход разным нейросетям
Уровни детализации скелета, которые передаются на вход разным нейросетям
Выглядит техномагически
Выглядит техномагически

Интересно было бы посмотреть, как Cascadeur справляется с предсказанием поведения анимации неантропоморфных персонажей. Ведь, судя по открытой информации, он обучался на человекоподобных анимациях. Впрочем, Banzai Games, судя по всему, справилась и с этой задачей. По крайней мере авторы смогли решить проблему позиционирования кошки в пространстве при падении.

А скоро Cascadeur выйдет и на мобильных устройствах
А скоро Cascadeur выйдет и на мобильных устройствах

Совсем недавно, 13 марта 2024 года, в открытый доступ вышел исходный код работы под названием Animatable Gaussians: Learning Pose-dependent Gaussian Maps for High-fidelity Human Avatar Modeling. Данный метод создания анимированных гуманоидных моделей обучается на основе RGB-видео и благодаря технологии 3D Gaussian splatting, а также инновационному подходу к обучению нейросети, превосходит существующие решения на основе neural radiance fields (NeRF).

Нейролюди выглядят так, будто танцевать их заставили
Нейролюди выглядят так, будто танцевать их заставили

Я немного затронул тему создания 3D-моделей по их текстовому описанию, когда говорил про Unity Muse. Но нельзя не отметить, что сегодня уже существует похожее решение, которое называется Luma AI.

Эта машина точно не похожа на меня
Эта машина точно не похожа на меня

Решение позволяет по текстовому описанию генерировать полноценные 3D-модели с развёрткой и текстурами в удобных для игровой индустрии форматах, например .fbx или .gltf. Также Luma AI имеет интеграцию с Unreal Engine, точнее с UEFN.

Но говорить про полноценные генераторы 3D-моделей по запросам на естественном языке пока рановато. Любая более-менее сложная задача заставляет такие GAI генерировать несвязные образы — генеративную овсянку. Совсем как первые версии нейронных сетей при генерации 2D-изображений. 

Хотя генеративные модели для работы с 2D-изображениями всё же развились и сейчас выдают более-менее адекватные результаты даже на сложных запросах. Существуют и специализированные решения для геймдева, типа PixelLab, которые упрощают рутинную работу со спрайтами.

Вот так легко и просто можно в пиксель арт с ИИ
Вот так легко и просто можно в пиксель арт с ИИ

Сложно выделить какой-то один инструмент, потому что каждый пользуется тем, чем удобно. Сфера применения таких моделей представляет, на мой взгляд, больший интерес.

Нейронные сети можно использовать в основном для двух вещей. Первая — это скоростное прототипирование 2D-ассетов, будь то иконки для пользовательского интерфейса или какие-то простенькие скетчи. Вторая — быстрое улучшение качества изображений. Тем более, что сейчас часть таких нейросетей встраивается на аппаратном уровне разработчиками микропроцессоров. Живой пример — Deep Learning Super Sampling (DLSS). Это может пригодиться при работе, например, над ремастером уже существующей игры.

Всё так же смешно, но теперь в четыре раза больше
Всё так же смешно, но теперь в четыре раза больше

GAI к успеху идёт

Одним из перспективных, на мой взгляд, направлений использования генеративного искусственного интеллекта является сканирование пространства.

Некоторое время назад качественная фотограмметрия произвела фурор в игровом сообществе. Когда Epic Games купила компанию Quixel, крупнейшую в мире библиотеку доступных ассетов на основе технологии фотограмметрии, это сильно упростило вход в игровую разработку. Можно было начать создание игры не с примитивным набором базовых ассетов, которые поставлялись вместе с движком, а использовать качественные ассеты из библиотеки Quixel Megascan — и не тратить ни время, ни деньги.

Тем не менее процесс качественной фотограмметрии остаётся сложным и долгим. В полевых условиях можно воспользоваться лазерным сканером, но при этом качество фотограмметрии будет очень сильно отличаться от профессионального.

При этом та же Luma AI предоставляет экспериментальный инструмент для 3D-сканирования пространства, который улучшает качество фотограмметрии за счёт применения нейронных сетей. Данный метод называют NeRF или Neural Radiance Field. Он основан на глубоком обучении и позволяет восстанавливать трёхмерное пространство по его двумерным изображениям. В отличие от других методов восстановления сцены NeRF может учитывать в том числе и отражения.

Созданную при помощи NeRF 3D-сцену можно рассмотреть со всех сторон. Автор: @madebysaurus, источник: lumalabs.ai
Созданную при помощи NeRF 3D-сцену можно рассмотреть со всех сторон. Автор: @madebysaurus, источник: lumalabs.ai

Интерактив:

Другим перспективным направлением в области генеративного искусственного интеллекта я считаю ИИ для неигровых персонажей.

Компания NVIDIA предлагает использовать языковые модели как основу для системы общения NPC друг с другом и с игроком. Такой подход позволяет сделать каждый разговор с NPC уникальным. Этот функционал представлен в технодемке NVIDIA ACE.

NVIDIA обещает сделать технологии ACE бесплатными и доступными для всех
NVIDIA обещает сделать технологии ACE бесплатными и доступными для всех

Пока я работал над этим материалом, в сети появился анонс BuildBox 4 — игрового движка, основанного на ИИ. Авторы обещают встроенную генерацию ассетов, сцен, логики и вообще чуть ли не всей игры по текстовым запросам. Уже сейчас можно записаться в лист ожидания и поучаствовать в альфе.

То, насколько широким становится спектр применения генеративного искусственного интеллекта в игровой индустрии, не может не радовать. Однако технический прогресс немыслим без проблем. В первую очередь юридического толка.

Проблемы с законом

До сих пор нет единого понимания, что делать с искусственным интеллектом, который обучался на текстах или изображениях, защищённых авторским правом. Тем более, что это могло произойти случайно. Например, во время разметки интернет-ресурсов, которые необходимы, чтобы сформировать контекст истории для генеративного искусственного интеллекта за определенный промежуток времени. Ни для кого не секрет, что ChatGPT знает только о тех событиях, которые произошли на момент его обучения.

Разумеется, эта тема важна не только для геймдева. Риэ Кудан, лауреат премии Рюноскэ Акутагавы, признавалась, что около 5% её романа «Токийская башня сочувствия» написал ИИ. Книга как раз затрагивает моральный вопрос использования искусственного интеллекта.

Риэ Кудан где-то за океаном
Риэ Кудан где-то за океаном

Риэ Кудан решила на себе проверить, как же ИИ влияет на нашу жизнь. В итоге получила волну негатива, так как не все считают, что без использовании нейросетей она смогла бы добиться такого успеха. Оргкомитет пока остался в стороне.

Steam же долгое время предупреждал, что в случае использования в играх контента, созданного с помощью генеративных моделей, у разработчиков могут возникнуть проблемы — вплоть до блокировки. Дело в том, что внутри вроде бы уникальных изображений, сгенерированных нейронной сетью, могут находиться фрагменты чьих-то работ, защищенных авторским правом. А его необходимо уважать.

DREAMIO: AI-Powered Adventures одна из тех игр, что полностью основаны на использовании нейросетей
DREAMIO: AI-Powered Adventures одна из тех игр, что полностью основаны на использовании нейросетей

Совсем недавно Steam ввёл правила, которые регулируют этот вопрос. Теперь в случае использования GAI при создании игры необходимо это указывать. При публикации такой контент обязательно нужно помечать и доказывать, что он действительно не нарушаете ничьи права.

Теперь игра будет помечена, если её автор использовал сторонний GAI
Теперь игра будет помечена, если её автор использовал сторонний GAI

Но никакие ограничения не могут помешать энтузиастам исследовать границы применимости ИИ в игровой индустрии. И уже сейчас в Steam хватает достойных игр с использованием ИИ от независимых разработчиков. Вот лишь несколько примеров.

Играем в GAI

В стильном приключении в духе "Твин Пикс" Who's Lila от российского разработчика-одиночки Garage Heathen мы не выбираем диалоговые опции, а меняем мимику главного героя при помощи мыши. Нейросеть распознаёт эмоцию, и это влияет на сюжет.

Кто убил Лору Палмер такая Лила?
Кто убил Лору Палмер такая Лила?

Ещё один соло-проект «АИдвенчура» предлагает отправиться в текстовое приключение, которое на лету создаёт искусственный интеллект. Можно писать что угодно на живом языке — причём почти на любом, ведь игра поддерживает автоперевод с помощью всё того же ИИ.

«АИдвенчура» — это классический текстовый квест на стероидах
«АИдвенчура» — это классический текстовый квест на стероидах

Ещё дальше идёт отечественная DREAMIO: AI-Powered Adventures. Она генерирует не только текст, но заодно иллюстрации и голос диктора. Получается что-то вроде бесконечной визуальной новеллы, в которой можно делать всё что угодно.

Пожалуй, главный недостаток DREAMIO — необходимость покупать токены для генераций за реальные деньги
Пожалуй, главный недостаток DREAMIO — необходимость покупать токены для генераций за реальные деньги

Интерактивный детектив Vaudeville предлагает общаться со свидетелями и подозреваемыми как с живыми людьми — голосом. С персонажами можно поболтать почти на любые темы, кроме оскорбительных и неэтичных, и они будут поддерживать разговор, не выходя при этом из роли. Кажется, будущее уже здесь.

Бесконечное богатство возможностей делает Vaudeville крайне непредсказуемой и сложной в прохождении
Бесконечное богатство возможностей делает Vaudeville крайне непредсказуемой и сложной в прохождении

Прошло совсем немного времени с момента массового распространения генеративных моделей как инструмента для разработчиков. В дальнейшем, конечно, эту сферу формализуют получше. Но тем не менее проявить осторожность при использовании трудов GAI стоит уже сейчас. Тем более, что ИИ постепенно охватывает всё больше областей геймдева.

Где от ИИ больше всего пользы?

Наибольшую полезность нейронные сети показывают на ниве визуального ассистирования, когда на их могучие плечи перекладывают рутинную работу по расстановке объектов. Такие предложения отлично чувствуют себя на рынке (вспомнить хотя бы Promethean AI). Судя по обещаниям создателей Unity Muse, данное направление продолжит развитие.

А ещё нейросети могут стать для программиста полезными помощниками в изучении игровых библиотек.

Изучаем Bullet вместе с ChatGPT
Изучаем Bullet вместе с ChatGPT

Сложно найти примеры использования GAI для создания, допустим, игровых уровней во время работы программы. Это связано с тем, что нейронные сети подвержены такой проблеме, как генеративная овсянка, и в целом не являются детерминированными. Разработчик может влиять на процесс обучения и таким образом улучшать результаты, которые будет получать в дальнейшем. Но после обучения повлиять на то, какие результаты будет выдавать ИИ, уже нельзя.

Для игр очень важен гарантированный стандарт игрового опыта. А его сложно добиться при использовании нейронной сети, которая не способна даже понять, что созданный ей уровень, например, непроходим. Более того, мы не можем гарантировать заданный игровой темп или то, что от генерации к генерации сложность игрового уровня (скажем, в шутере от первого лица) будет одинакова. В то время как при использовании PCG эти метрики можно проверить ещё на этапе генерации.

После создания уровня нейронной сетью можно запускать процесс апробации на соответствие его игровым метрикам с помощью агентных систем. Но всё же это достаточно долгий процесс, да и агентные системы не сильно отличаются от PCG, так как тоже являются алгоритмическими.

В совокупности эти проблемы приводят к тому, что на рынке не существует коммерческих продуктов, способных создавать игровые уровни. Но, надеюсь, в будущем ситуация изменится.

Тем более, что один из крупнейших игроков на рынке открыто заявляет: «ИИ спасёт игровую индустрию». CEO Tencent Holdings Пони Ма заявил, что, несмотря на высокую конкуренцию, им удалось за 2023 год сократить технологическое отставание от компаний первого эшелона в области ИИ-технологий. Пока, правда, не совсем понятно, что нас ждёт: PUBG Mobile и Genshin Impact с применением этих технологий или массовые сокращения. Время покажет.

«На плечах титанов»
«На плечах титанов»

***

Итак, сейчас нейронные сети можно использовать для генерации простого игрового контента вроде спрайтов, текстур и (пока с солидными ограничениями) 3D-моделей. Есть первые попытки использовать текстовые модели как основы для какой-то части игрового искусственного интеллекта. Но всё это нужно делать с осторожностью, потому что юридическая и этическая стороны вопроса пока не до конца проработаны.

Если во время разработки необходимо гарантировать какой-то детерминированный постоянный результат, который опирается на понятные параметры генерации, то, конечно же, нужно использовать алгоритмы процедурной генерации. 

Если же необходим быстрый инструмент для прототипирования игр, чтобы на ранних этапах работы уже собирать первые наброски игровых ассетов, или просто инструмент креативного ассистента, то для этого смело можно использовать генеративные нейронные сети, которые намного лучше себя показывают в творческом ключе.

Для разработчиков как игр, так и игровых движков очень важно различать PCG и GAI, потому что это абсолютно разные инструменты, которые при умелом совместном использовании могут дать невероятные результаты.

P.S. Неужели будущее настолько близко? А сколько искусственно созданных лиц сможете угадать вы? 

Комментарии (8)


  1. joger
    21.03.2024 08:18

    как-то это всё банально: коддинг, спрайты, разговоры... с помощью ИИ можно сделать настоящий живой МИР, ММО где сюжет развивается не по сезонам, а прямо вот сейчас! где можно действительно повлиять на что угодно!


    1. Ascard
      21.03.2024 08:18

      Ага, а для монетизировать этот "живой мир" как? Хотя бы для оплаты вычислительных мощностей. Ставить на свою машину их клиент распределённых вычислений? Приходить к NPC за квестами только в платных шмотках, иначе фиг тебе а не квест? Или тебе NPCи сразу будут QRкод на оплату прямо в 3D рисовать? И сейчас в ММО, без всяких нейросетей, абонплата бывает неприятной, особенно когда поощряет игру за несколько аккаунтов, а как начнут внедрять все эти чудеса, так вообще ползарплаты сразу перечислять туда?


      1. joger
        21.03.2024 08:18

        есть примерно миллион честно отьёма денег у граждан: абон. плата, аукцион за реал, свистоперделки всякие. бесплатный фортнайт чего не загнётся?


        1. Ascard
          21.03.2024 08:18

          Про форнайт много не знаю, не играл, но исходя из первого коммента ветки, я так понял что подразумевается генерация чуть менее чем всего и вся в реальном времени. А это требует некоторых вычислительных мощностей и каналов передачи на непрерывной основе. Причём, несколько отличных от типичных вычислений игрового сервера аля "нажатие кнопки W принял, проверил что впереди не стена, изменил координаты сущности, всем вокруг в радиусе передал". Как минимум там будет работа ChatGPT-похожих моделей для общения с NPCями в реальном времени, ато и генерация карты/текстур/3д объектов/звука, и их сохранение и/или потоковая передача. По итогу имеем в беке (не-)большую ферму топовых GPU. Нам же нужно чтобы работало мгновенно, так? Никто не будет ждать от NPC ответа через 2 минуты. /И так далее. Что-то отдалённо похожее на реализации такого, мне кажется, получилось у авторов StarCitizen, у которых уже сейчас есть динамической передачи ассетов на клиент как и возможность их менять в реальном времени.


          1. joger
            21.03.2024 08:18

            не надо генерации всего и вся. основную часть времени за непися думает "стандартный" скрипт. периодически подключаем "чатгпт", чтобы задать вектор. чем важнее непись, тем больше им рулит чатгпт


            1. Ascard
              21.03.2024 08:18

              Это пока, на первых этапах. А потом игрокам захочется бесконечного мира, непрерывного мира, который можно исследовать в любом направлении, с процедурной генерацией ИИ всего и вся, как в No Man's Sky, Minecraft или миллиардов звёзд Elite Dangerous. Пусть не в ближайшее время, но уже видно, что всё идёт к тому что такое появится. Отсюда и возникает мой вопрос - кто и как будет платить за этот банкет? Понятно что игроки (и рекламодатели, на каком-то эпапе), но как? И насколько велики будут суммы или часты микро транзакции? Ну, например, прилетел на планету, а тебе раз!, и заплати и планета сгенерится, а иначе просто виси на орбите, любуйся хайрез текстурой атмосферы под которой ничего не видно.


              1. h36p9m Автор
                21.03.2024 08:18
                +1

                На мой взгляд, самая большая проблема с такими проектами будет заключаться в ограниченном контексте нейросети. Она просто в какой то момент не сможет хранить всю информацию, полученную пользователями. Начнется неминуемая аппроксимация данных, вследствие чего качество выдаваемых нейросетью результатов станет хуже (например, можно прочитать про эту проблему в контексте работы Dreamio).

                Переучивать нейросеть на новые данные, чтобы она запомнила эти же данные в своей структуре, а не в контексте - нецелесообразно. Странно будет останавливать онлайн игру на неделю чтобы ее обучить)

                Ну и конечно же денежный вопрос. Внимательный читатель статьи заметит, что например, Dreamio требует покупку токенов для игры в нее. Несмотря, на современные методы монетизации игр, это очень дорогое удовольствие.

                Именно поэтому для работы с нарративной частью игры применяют более традиционные методы. 

                Например, в недавно вышедшей Helldivers 2, есть гейм-мастер, который руководит развитием галактической войной и реагирует на действия сообщества. Тут можно почитать об этом подробнее.

                Или например, в прошлой статье я рассматривал, какие игры поддерживают алгоритмы генерации истории. Если вам интересна эта тема, то могу посоветовать изучить работы на тему сценарного мастерства (“Морфология сказки”В.Я. Проппа, “Спасите котика” Блейка Снейдера), а после можно уже подумать, как натренировать нейросеть на создание истории с вводом от пользователя, но так, чтобы она не начала деградировать)


  1. joger
    21.03.2024 08:18

    .