单张图生成可玩3D世界!谷歌虚拟世界生成器上线:还要和马斯克联手做AI游戏
12月5日消息,谷歌DeepMind日前推出了其最新的基础世界模型——Genie 2,通过一张图像或文字描述,就能生成可供人类或AI智能体游玩的3D场景。
谷歌表示,用户只需提供一张由Imagen 3生成的图像和相应的文字描述,Genie 2便能生成一个可交互的3D环境,用户可以通过鼠标和键盘在其中自由探索,最长可持续一分钟。
该模型不仅能够保持生成环境的一致性,还能在用户移动时准确呈现视野中消失的部分。
谷歌还表示,Genie2在生成过程中能够模拟物体交互、动画、光照、物理反射以及NPC的行为,许多生成的场景画质接近3A级别的游戏,甚至在物体视角一致性和场景记忆方面表现优异。
有人被这技术进步的速度震撼,称之为视频游戏的未来,甚至还有人看到了一切都被虚拟化的世界模型的更长远未来。
值得一提的是,Genie 2发布后,DeepMind CEO邀请马斯克一起制作AI游戏,马斯克则回复:Cool。
谷歌研究人员Jack Parker-Holder也给出了两个实例,其中,一张图上有一个红门和一个蓝门,向模型输入不同的语言指令,可以生成不同的3D场景,走向红门或蓝门。
在更复杂的三门场景中,Genie 2依然很好地理解了指令并生成了研究人员想要的3D动图。