一觉醒来,AI世界又出王炸。
刚刚,人工智能公司OpenAI发布了首个视频生成大模型产品——Sora。
Sora是什么AI产品?
简单来讲,Sora可以根据提供的文本,自动创建长达60秒的高清视频。
以上视频由Sora生成
在AI行业,根据文本自动生成视频,不算新鲜事。
但是,Sora的问世,之所以被称为“王炸”,主要实现了以下几点突破:
1.多镜头,多视角(类比影视业,对摄影师的颠覆)
如何理解这一技术突破,打个比喻:
此前的AI自动生产视频,好比对同一场景,同时配备了几个水平参差不齐的摄影师,多个镜头拍摄,然后将每个人的镜头拼接在一起。
单视频,单镜头,看起来画面不连贯,风格不统一,违和感强烈。
Sora的出现,如同配备了多个技术高超且水平完全一致的摄影师,同时多镜头、多角度拍摄,能保证成品视频,既能一镜到底,也可以实现多角度镜头切换,并且还能保证场景与主体的完美一致性。
以上视频由Sora生成
2.长时间,高清还原(类比影视业,对摄影器材的颠覆)
如果说传统的AI视频生成,是用传统卡带摄影机拍摄视频。Sora的出现,则是直接替换成了高清数码摄影机。
首先是大幅提高了视频长度。
在大多数AI视频还在一个镜头3s时长努力时,Sora直接拉爆至60s,这也意味着AI视频创作,直接提升至作品级标准。
其次是视频质量的高清还原。
Sora创作的视频质量,无论是高清度还是还原度,都可谓极其逼真。
比如人物的眼睛,神情动态之难,往往成为AI创作的壁垒。Sora的世界里,人物眼睛直逼真人,几乎没有任何AI创作的破绽。
以上视频由Sora生成
这样细节直接拉满的视频,哪怕是顶级动画制作公司,制作下来也需要数日时间,而Sora几分钟就搞定了。
这就是技术震撼!这就是行业颠覆!
3.世界模型初具雏形(类比影视业,对演员理解剧本能力的颠覆)
传统的AI视频生成,只能一板一眼地照本宣科翻译提供的文案,而Sora的可怕在于它可以开始理解文案,并基于文案自己进行发挥和拓展。
Sora生成的视频中,可以看到充满了大量文案没有描述的细节,这些都代表Sora的大模型中,已经具备了对于现实世界模型的理解与认知。
以上视频由Sora生成
基于以上,Sora的出现,对传统AI视频生成的冲击,毫不夸张地讲,如同鸟枪换炮。一夜之间,引发了无数行业的焦虑。
电影制作公司,视频动画公司,美术公司,广告公司,甚至包括视频网红,都在担心Sora带来的冲击。
有人把AI的诞生比喻为当年的“工业革命”,无论是当年的蒸汽机还是如今的ChatGPT、Sora,本质上还是生产工具带来生产力的大幅提升。
生产力的提升,带来的是生产效率的提升,其中必然意味着有些岗位乃至行业面临淘汰。
从ChatGPT诞生之日起,我们的世界就正式进入了“AI时代”。从ChatGPT到Sora,可以看到AI时代的发展速度远超人们的理解与想象。
进入AI时代后,每一个人都应该问自己一个问题:我的饭碗,有没有被AI打破的可能?
尽管Sora的技术极具震撼性,但毕竟刚刚发布,缺点还是很明显。
Sora目前最大的缺点,还是无法理解现实世界的“因果关系”。
这个因果关系,包含物理上的因果关系,人情世故的因果关系,时间和空间的因果关系。
从某种意义上来看,对因果关系的理解,或许是AI虚拟世界与现实世界最后的一道屏障
发布于:重庆
相关推荐
曾经的颠覆者英特尔,也要被别人颠覆了
炸串也要出“第一股”,喜姐炸串能借着烟火气杀出重围?
元宇宙,不是现实世界的敌人
5G:颠覆整个世界
马斯克的火星飞船再试飞,SpaceX今天又炸了……
Uber即将上市,一代明星独角兽如何颠覆世界?
Office全家桶+GPT-4,微软向谷歌丢出“王炸”
AI独角兽CEO被告上法庭了
缺席了大半年的旗舰,一回来就是王炸,骁龙8 Gen2+240W
终于,A股市场把阿里巴巴也颠覆了
网址: 刚刚,AI再出王炸!现实世界真的要被颠覆了? http://m.xishuta.com/newsview108586.html