Genie 2 – A large-scale foundation world model Google DeepMind хвастаются своим игровым AI-движком на базе диффузионного генерат
Genie 2 – A large-scale foundation world model
Google DeepMind хвастаются своим игровым AI-движком на базе диффузионного генератора видео. Сейчас это модно назвать World Model, но давайте без булшита, друзья.
Imagen 3 (txt2img от GDM) генерирует картинку – типа начальное состояние игры. Затем, в привычной нам для img2video манере, картинку оживляют, превращая ее в игру, где дополнительным инпутом идет нажатие клавишь.
Пока что игра живёт лишь 60 секунд максимум (в среднем 10–20), но миры все крайне разнообразные и в абсолютно разных условиях. Я имею в виду вид от третьего лица, первого лица, сверху — и даже гонки можно сделать (и на лошади тоже), и просто бродилки, конечно же. Управление по классике: WASD (QE), пробел и мышь.
Также работает и взаимодействие с объектами, например, можно лопать шары, взрывать бочки и открывать двери на E. Там даже NPC-персонажей можно найти, если задать нужный входной “скрин“.
Архитектура
Каких-то технических деталей по Genie 2 особо нет — Google на такие вещи довольно скупы. Из моего представления - там тупо latent diffusion image2video модель, где каждый следующих кадр постепенно генерируется, исходя из контекста, состоящего из существующих кадров и нажатий на клавиатуру/мышку.
Черипики с сайта сасные в плане diversity, но не ахти по качеству картинки. Возможно, через год-два каждый сможет сгенерировать себе мир по душе, так же как сейчас генерируют музыку в Suno.
Очевидно, до статуса играбельно ещё далеко. И я тут даже молчу о скорости генерации (об этом не пишут, но, думаю, там не совсем риалтайм). Несмотря на то, что у авторов были горы TPU для обучения и тысячи часов записанного геймплея, качество видео пока хуже PlayStation 1, картинка размытая, и нет четкости в деталях. Ну, и мир сильно плывет после 10–20 секунд. Есть куда улучшать.
Скоро в эту нишу могут вкатиться другие серьёзные игроки (ждём ответку от Маска ). Вот тогда и посмотрим.
Блогпост
23 views
23
4
2 months ago 00:00:00 9
ШУРИК И ШАРИК — Возвращение Дяди Гены | 3 серия 2 сезон | Реакция
2 months ago 01:08:13 85
Клифф Блезински - забытый гений нулевых
2 months ago 01:05:41 3
ПРЕЖДЕ ЧЕМ УМЕРЕТЬ, посмотрите этот спор о смысле жизни (ИИ ПРОТИВ ЧЕЛОВЕКА)
4 months ago 00:19:12 1
Джеймс Кэвизел: Нежеланный актёр Голливуда
5 months ago 01:15:13 0
Гордон. Конец войны через неделю, зачем Фицо приперся к Путину, Януковича в Москве переполовинили
6 months ago 00:20:18 8
Jujutsu Infinite Got ANOTHER Massive Update + RELEASE DATE 🔥
7 months ago 00:09:46 0
Денис Фёдоров, Большая фуга на тему «В траве сидел кузнечик» и множество других тем.
7 months ago 00:05:09 0
FIT FOR AN AUTOPSY - Red Horizon (OFFICIAL MUSIC VIDEO)
7 months ago 00:15:40 1
САМА СЕБЕ ВИЗАЖИСТ/ Базы под макияж. Чем готовить кожу перед макияжем
7 months ago 10:30:08 0
Чудаков Александр - Ложится мгла на старые ступени (1 часть из 2). Читает Вячеслав Герасимов
7 months ago 00:10:52 0
4 ГЕНИЯ и 2 ЛУЖАЙКИ | Кооперативный Plants vs. Zombies Eco Mod
7 months ago 00:28:30 0
Андрей Купцов о правильном питании и не только ЧАСТЬ 2 18 08
7 months ago 00:23:08 0
Вирусолог о мировых эпидемиях и ваших сезонных простудах
7 months ago 00:16:55 0
US-WAHL: Die 200 herrschenden Familien
7 months ago 01:15:02 0
Серия 42. Ломоносов. Просто гений
7 months ago 00:08:08 0
Вы больше не будете есть хлеб после просмотра этого видео! 🙌
7 months ago 00:43:26 0
FIT FOR AN AUTOPSY - The Nothing That Is (OFFICIAL FULL ALBUM STREAM)
7 months ago 00:03:18 0
크루셜스타(Crucial Star) - Paris MV
7 months ago 00:17:50 1
A Contender for Best Case of 2024? Antec Flux Pro
7 months ago 00:18:51 0
Electric Scooter Race! Kaabo Wolf King GTR vs NAMI - InMotion RS - EMOVE Roadster
7 months ago 00:12:15 3
The English Teacher (2020) - AWARD WINNING Short Film | Drama
7 months ago 00:03:20 0
Les Pourquoi d’un Petit Génie - Ou l’innocence d’un enfant.