Итак, модель диффузии, данные шумоподавления, пиковое отношение сигнал/шум, RL-агент, модель авторегрессии и термодинамика заходят в бар… И теперь мы можем играть в культовый классический шутер от первого лица 1993 года, DOOM,сгенерированный в реальном времени ИИ.
Некоторые ребята из Google и Тель-Авивского университета создали новый игровой движок под названием GameNGen, который полностью работает в реальном времени с помощью нейронной модели, также известной как искусственный интеллект.
Суть в том, что они обучили агента обучения с подкреплением (RL-агент) для игры в DOOM. Снова и снова этот RL-агент играл в игру, записывая и сохраняя каждую сессию, изучая, как не быть застреленным, съеденным или иным образом погибнуть, а также изучая, как просто взаимодействовать с окружающей средой.
Во-вторых, модель диффузии, которая фактически является моделью, которая учится разрушать в остальном идеальное изображение за много шагов с помощью шума, прежде чем шумоподавлять данные, чтобы восстановить изображение до его прежнего великолепия, что делает ее очень хорошей для прогнозирования и создания изображения. В этом конкретном случае это игровой движок, способный предсказать, каким должен быть следующий кадр игрового процесса, основываясь на предыдущем кадре.
GameNGen
Использование данных, полученных при наблюдении за тем, как RL-агент играет в DOOMснова и снова он может генерировать все текстуры, цвета, модели, скины и все остальное, что нужно для визуализации карт в DOOM.
Обычно текстуры, спрайты, модели, шейдеры, префабы и т. д. сохраняются локально и загружаются в начале каждого уровня. У каждого будет также предварительно загружено уникальное физическое взаимодействие.
Модель диффузора может предсказать и нарисовать, как должен выглядеть следующий кадр, скажем, когда стреляют из оружия, во что стреляют, и какие физические последствия будут иметь выстрелы дробовика для объекта, в который они попадают. Плохой парень? Теперь он мертв. Бочка с токсичной грязью? Теперь она взорвалась.
Добавьте немного пользовательского ввода, и вот у вас есть игра. Игра, которая генерируется и взаимодействует с ней в реальном времени без предварительной загрузки или кэширования. В этом примере использовался DOOM, но можно использовать любую игру. Даже то, что еще не существует. GameNGen теоретически может создать свою собственную игру, если задать некоторые параметры.
Все это было достигнуто с помощью одного тензорного процессора (TPU) — похожего на GPU для обработки графики, но разработанного специально для обслуживания ИИ, для обработки большого объема, с низкой точностью вычислений — и способного достичь 20 кадров в секунду. Далеко не 60 кадров в секунду для современных игр, но, как и с каждой новой технологией, он будет только улучшаться. Старая версия 1993 года работала со скоростью максимум 35 кадров в секунду.
При настройке с одним TPU память становится проблемой, и модель ИИ может «запомнить» только около трех секунд игрового процесса, прежде чем «забыть» его, когда пользователь проходит уровни. ИИ, тем не менее, может вывести большую часть данных, например, количество боеприпасов и то, прошли ли вы уже определенную область на карте, но при длине контекста около трех секунд это иногда приводит к ошибкам.
Другим примечательным фактом является то, что опора только на RL-агента для обучения также имеет свои недостатки; в отличие от использования RL-агента в попытке достичь максимального количества очков и найти все секретные локации, часто скрытые в играх FPS, он был обучен собирать данные о способах, которыми могут играть обычные люди. RL-агент имел доступ к своим предыдущим 32 действиям, которые он выполнил во время обучения.
«Наш агент, даже в конце обучения, все еще не исследует все игровые локации и взаимодействия, что приводит к ошибочному поведению в этих случаях», согласно whitepaper, выпущенному GameNGen.
Видеоигры всегда создавались людьми с миллионами написанных строк кода. GameNGen — первый, кто полагается на нейронную модель; потенциальный игровой переворот, простите за каламбур.
С тех пор, как я начал играть в облачные игры всего несколько лет назад, было здорово иметь возможность играть в игры на скоростях и разрешениях, которые мой старый Xbox или моя старая и хрустящая GTX 760 Ti просто не могут. Неважно, что я могу пропустить надоедливые загрузки по 160 ГБ, чтобы попробовать игру, которая мне даже не уверена, понравится ли.
От первоначального выпуска для DOS до генерации на ходу ИИ… кто бы мог представить себе такое более 30 лет назад? Будут ли игровые движки с генеративным ИИ? Мы просто купим коробку, подключенную к нашей голопалубе, и просто дадим ей несколько подсказок, чтобы начать играть в совершенно уникальные игры, подобранные под наши вкусы? Я знаю, что мне не терпится попробовать DOOM на объемном дисплее!
Doom на объемном дисплее
Если вы чувствуете себя особенно занудным, ознакомьтесь с полной версией документа здесь (PDF).