事件:2月27日,谷歌Deep Mind团队发布110亿参数的全新AI基础世界模型Genie,表示其开启了“图/文生成交互世界”的时代,还将成为实现通用AI Agent的催化剂。
点评:1、Genie是一个11B参数的交互式环境生成模型,以超过20万小时的公开在线游戏视频数据集为训练素材,是第一个在无监督学习下从互联网视频中训练出来的可以生成交互环境的模型。通过Genie,仅需提供一张图片甚至草图,便可以生成一个可玩的交互式世界,类似游戏关卡,且用户可以对画面进行逐帧控制。
2、Genie与Sora最大的不同之处在于:1)生成的效果具备交互性,在提供文、图的基础上,Genie生成的不仅限于视频,而是可交互的2D虚拟世界,且虚拟世界自主可控。这也说明在生成过程中,模型能够在一定程度上理解空间和物体之间的互动关系。例如,在提供带有人物的静止图像时,Genie生成的动图中能看到图像里的人物与周围环境产生交互,人物在遇到障碍时能够做出一系列弹跳、躲避障碍的动作,且动作符合物理规律。2)Sora能够实现文字生视频,而Genie大部分情况下需要先用文生图模型来生成起始帧图片,再用Genie 生成视频,且视频在一两秒左右,偏向于动图。目前来看,Genie生成的视频较卡通化,主要的不足之处在于画质不高、时长短。官网也表示,虽然目前模型专注于 2D 平台游戏和机器人技术的视频,但方法通用,未来有望扩展到更大的互联网数据集,进一步扩大应用场景。
3、无监督训练生成式交互环境,赋能创作效率提升。不同于传统AI,Genie的训练在没有任何动作标签的情况下进行,这意味着Genie能够从训练素材中自行识别不同动作的特征和模式,大大降低虚拟世界的创作门槛,重塑开发生态,为游戏、影视作品等领域赋能,提升制作效率。我们认为Genie的发布主要利好三个方向:1)具备海量IP储备的公司,有望在游戏及影视作品制作效率提升过程中进一步挖掘IP价值,受益于IP变现,如【中文在线】【上海电影】【华策影视】【光线传媒】【阅文集团】;2)具备丰富研发发行经验的游戏公司,有望通过此类模型提高游戏制作效率,降低素材、关卡制作过程中的试错成本,如【三七互娱】【恺英网络】【神州泰岳】【吉比特】【完美世界】;3)具备大模型/AIGC创新技术或一定算力储备的公司,如【昆仑万维】【盛天网络】【汤姆猫】【紫天科技】等。
发布于:河北
相关推荐
魔珐科技:打造虚拟世界的基础设施,让创作虚拟内容更加简单
网易伏羲首席游戏AI技术专家陶建容:AI赋能游戏创造价值
从AI到视频特效,不咕剪辑让更多人踏入元宇宙的创作世界
知乎发布“知海图AI”中文大模型,未来将应用于创作的赋能
AI大模型赋能工业,从研发到售后能做多少事儿?
完美世界游戏CEO鲁晓寅:数智技术下的“AI+”迭代研发,创造游戏价值
联通在线精彩亮相2023世界VR产业大会
为什么说Sora是世界的模拟器?
侯明娟:骁龙新技术+生成式AI创新赋能顶级移动
胡志鹏:区块链和人工智能将是虚拟、现实世界破壁的加速器
网址: 谷歌发布AI世界模型:虚拟世界创作门槛降低,赋能游戏影视制作 http://m.xishuta.com/newsview110160.html