2024年开年,美国科技公司先后抛出AI王炸,AGI赛道新一轮大乱斗已经开启。
这只是巨头之间的游戏,还是新一代AI创业公司也能参与共建的游乐场?Sora、Gemini等模型的爆火,会彻底颠覆AI创业和投资的逻辑吗?
近期,“钛媒体AGI”系列对话,邀请到了硅谷知名科技投资人,Fusion Fund创始管理合伙人张璐做客直播间。
驻扎在硅谷,张璐团队与OpenAI和英伟达团队都保有密切联系。因而,在很早就看到了当前这一波AGI浪潮的萌芽。2017年起,张璐所管理的基金Fusion Fund就开始投资人工智能,2021年底,Fusion Fund出手了生成式人工智能的项目。而去年,Fusion Fund投资生成式AI的项目和资金规模,大于前几年的总和。
在张璐看来,硅谷早期投资生态非常活跃,优质项目会很快拿到超募,马太效应明显。同时,很多初创公司不需要融很多钱了,因为AI应用后,开发成本没有那么高、效率也提上来了,不需招那么多工程师。
今年以来,Sora的出现,依旧使张璐感到惊艳。她认为,Sora已经绝对领跑市面上其他的文生视频模型,并且,已经对物理世界的结构和规律的理解有了一定的深度。
AI基础创新阶段已经过去,现在已进入到应用创新大趋势。张璐表示,90%的C端的人工智能创新机会都将属于大型科技公司,剩下10%可能是初创企业的机会。
对于创投来说,机会的确不如以往那般丰富了。去年,大部分投资AI的资金涌向了C端的人工智能应用,但是今年将会急速萎缩。
但值得关注的是,由于AI的革命性颠覆,张璐认为,这次AI趋势带给整个产业升级和创新的量级比互联网时代还要大十倍,即便是只有30%-40%的机会属于创业公司,整个市场的体量和潜力也非常可观。
除了对技术变革和创投逻辑的理解之外,张璐还观察到,在生成式AI驱动行业变革的情况之下,现代公司的组织架构也会变化。
在她看来,以前科技公司的架构属于金字塔型,顶端是相对资深的创始人、CEO,下层是很多负责做产品的初级工程师。但现在,因为AI的发展,公司结构极有可能变成倒金字塔型,上层的创始团队是相对资深的人员,负责优化模型和产品,但下层就不需要太多初级工程师了。
以下是钛媒体AGI对话张璐实录,经钛媒体APP编辑:
华楠:OpenAI发布的文生视频大模型Sora,确实给世界带来了一场关于人工智能的震撼,也点燃了科技圈。您当时看到Sora的时候,第一反应是什么?之后采取了什么样的行动?您的团队又如何看待这一次的技术进阶革命?
张璐:事实上,我们和OpenAI的团队内部成员保持着紧密的联系,经常进行内部交流,所以也有一定的预期和期待。但是即使这样,Sora正式发布的时候,我们看了各种各样的视频,感到非常惊艳。在我看来,与市面上其他的一些文生视频相比,Sora无论是从效果、技术、连贯度、完整度、复杂度以及技术潜力,都不在一个量级上。很多视频都体现了,它的模型已经在某种程度上对物理世界的结构、规律有了一定的深度理解。
接下来我考虑的一个问题是,他到底花了多少资金和资源来开发这个模型?从科技和商业投资的角度来看,技术成本是很关键的一点。如果说它的技术成本是可控的,那么它本身对整个产业和内容视频行业的颠覆性影响,在近期可能都会显现出来。
这只是它的第一个版本,我们期待它的持续升级。因为现在你会看到一些视频内容并不是完全正确,就像被Meta攻击的一个视频中的蚂蚁有四条腿。因此,目前它是否有能力理解我们的物理世界,是讨论的核心点。
我觉得它已经具备了初步的理解能力。我们人类认知这个世界的过程,也是通过观察、学习和推理逐渐形成的。通过观察更多的信息和现象,归纳出物理的模型和物理的定律,然后再用这些物理模型和定律,更深入和直接地了解这个世界。所以这也是一个过程。从这个角度来看,基于Sora目前发布的视频,我还是觉得模型已经对物理世界有一定认知。
当然,我们也能看到,Sora发布的视频还是相对较短。从几十秒、到几分钟、到几个小时,其实时长的延伸,它背后需要的算力、资源、模型的优化,并非单纯的线性增长,而是指数型的增长。所以,现在能生成分钟级别的视频,不代表我们很快就能看到更长的视频。
从日常的文生视频或者说视频产业需求来看,短视频是一个巨大的市场,但并不是全部的市场。还是有很多的空间可以让我们期待技术下一步的发展。
我们一直非常看好开源领域,并在开源模型层面有所布局。从科技投资的角度,这种投入成本、算力成本、数据量成本要求极高的模型的基础设施投资,最适合由大公司来完成。在这个基础之上,大公司可以为初创企业提供一个很好的平台,让他们以更少的资源和更快的速度进行应用层的创新。
所以,现在我们可以看到前几年相对安逸的大型科技公司在互相卷,快速推出各种模型。我们又被打了一次鸡血,对于未来几个月整个产业的发展又有了更高的期待。
华楠:这一轮AI浪潮,对美国的创投圈又会产生哪些影响?
张璐:我们从2017年就开始投资人工智能,投资的第一个生成式人工智能是在2021年底,我们对这个产业也有比较深入的了解了,你不会看到我像别人一样超级兴奋,但其实我非常看好它。所有事情现在都是刚刚开始,无论是Sora,还是其他的各种各样的模型、开源社区的建设。
当然,从投资角度,我们从来不投C端,我们投的都是B端。有两类,一类是垂直领域的to B的人工智能应用,另一类是跨行业的AI基础设施的投资,从芯片层到边缘计算,再到数据隐私网络技术。
但是硅谷确实有很多的VC、创业者,核心是在做to C人工智能应用,特别是文生视频领域的公司有很多。Sora可以说是给大家带来一个激励,同时也会让很多公司思考自己未来发展的方向,以及竞争力所在。
一个重要的观点是,模型迭代的速度很大程度上依赖于数据。谁有海量的、高质量的数据,谁就可以更好地优化它的模型。而且,数据质量越高,可能需要的训练数据量就会越少。训练数据量少,也就意味着你的算力成本更低,耗电量更低,效能更高。
从这个角度看,大型科技公司,无论是在算力还是在C端用户数据的质量上,优势都是巨大的。所以,C端的人工智能应用面临的一个巨大挑战是,核心竞争力取决于谁手里掌握海量的、高质量的用户数据。但是高质量的用户数据,都在大的科技公司手中,这对于初创企业是一个很大的挑战。去年,大部分投资人工智能的资金涌向了C端的人工智能应用,但是今年这种情况会急速缩减。
Sora的出现,不仅对那些文生视频初创企业是一个警示,对那些专注于C端人工智能应用的VC来说也是一个警示。如果他们持续投资这个方向,还可能会持续面临大公司的迭代和挑战。这可能会对C端的人工智能应用的资本活跃度造成较大打击,因为可以看到大型科技公司及初创企业在量级和技术迭代层面上的差异。
华楠:您认为2024年它会是一个文生视频的元年吗?在这个领域,您比较看好哪些技术方向和创业公司?
张璐:我觉得去年其实从文生图开始,就开始有些文生视频的探索,甚至可以说去年是一个元年。今年,大家可以看到文生视频的质量以及复杂度有了显著提升。我记得有一个视频,是一艘船在一个流动的液体中航行,这已经相当于是一个非常复杂的视频生成了。如果说继续延展下去的话,可能会有更加复杂的视频生成,包括物理世界的理解和物理世界的构建。
对于初创企业,美国的C端市场还是比较难做的。我去年提过一句话,90%的C端的人工智能的创新机会都将属于科技大公司,剩下10%可能是初创企业的机会。对于初创企业和早期投资人,可能要非常明确和精细地去挑选到合适的机会然后投资。
当然,有一些公司做得很好或者做得比较早的话,会有一些并购的机会。但有足够的现金和资源去收并购的这些大公司已经有了模型,那它继续收并购的动力在哪里呢?因为做一个很好的demo很简单,但若想把它做成大规模的应用,首先,技术的成本要足够低;第二,不能有一些延迟;第三,技术本身要有很强的扩展性,可以大规模应用,而不只是在特定的最小范围的应用,这对技术的要求还是比较高的。
华楠:Sora这类文生视频工具的出现,您认为会对普通人的生活带来哪些影响?
张璐:还是回到最初的问题:人工智能的理念是什么?就是零代码人工智能平台。相当于,你想使用人工智能,不需要写一行代码,不需要懂一行代码。比如说,你要是做电影和视频的生成,原本需要一帧一帧把故事线切下来,这个工作可能要花几百万美金,但现在不需要了,只要写一段话,视频就可以出来。
这是技术最大的一个优势,它可以解放我们的创造力,降低大家成为创作者的准入门槛。你不需要有技术背景,只需要有一个好的想法,准确把它表达出来,就有平台和工具帮助你生成。
举一个简单的例子,在没有照相机之前,你需要有非常好的绘画技巧,才可以把眼前的美景画下来。有了照相机,你需要有特定的摄影技术去拍照。到后面,有“傻瓜相机”,摁一下就可以了。再到现在,每个人都有手机,自带相机质量非常好,拍摄非常简单。
但是,我们并没有消灭艺术家,反而促成了更多摄影艺术家的产生。如果你有一双发现美的眼睛,就可以通过简单的方式去捕捉美,创造美,成为一个艺术家,创造一些艺术的瞬间和艺术的作品。人工智能,尤其像Sora这样的工具,会赋能更多的人成为内容生成方面的艺术家和创造者。
可能大家想到文生视频,第一个想到的是对电影行业的影响。电影行业的核心是什么呢?是导演和编剧和观众的沟通,通过讲一个故事,影响别人的人生或者自我表达。但是,电影门槛是很高的。我们每个人身上可能都藏了一个好故事,现在是不是有一个很好的工具帮我们将它展现出来?
华楠:这一批AI相关的创业群体当中,您发现他们呈现出与以往哪些不同的特征呢?
张璐:确实能够看到比较大的转变。以我们投的项目来举例,去年我们在硅谷一共大约投了十个项目,去年可能是近几年我们投资最多的一年。然后,我们发现几个特点,我们投的2/3的项目,都来自于连续成功创业者,或者说非常有经验的创始人。
一方面,因为我自己也是连续成功创业者,本身的资源就比较强。另一方面,我们发现,很多很优质的、财富自由的连续成功创业者,在看到市场的机会和时机时,即使他们已经建立过一些非常优秀的企业,他们仍然愿意在当下抓住机会,再次下场创立一家新的公司。
同时,很多应用层的公司,哪怕是做to B的企业,核心的竞争力已经不再是算法或者模型了。因为大部分公司都在使用OpenAI的API或者开源模型,通过优化模型表现或使用高质量的数据,让模型更加快捷、高效。
比如说,一家媒体有海量的高质量的数据。这时有两个创业者来找你,一个是有经验的连续成功创业者,另一个是刚毕业的斯坦福学生,聪明又能干,非常年轻。他们都希望可以用你的数据去优化它的模型,从而创造一个为你服务的产品。这时公司大概率会把数据给谁?答案显而易见。所以,连续成功创业者,或者有经验的创始人,更容易拿到海量的高质量的行业数据。
另一方面,应用层面上的创新,相对来说年轻的创业者可能机会更多一点。因为需要有创新的想法,去改变现有的基础设施的设计。
第二个特点是,以前的公司架构通常是金字塔型,顶层是相对资深的创始人、CEO,下层需要招聘很多初级工程师把产品做出来。但现在,我们发现,去年有一家公司,团队只有7个人,却在一年收入实现了25倍增长,这家公司有一百多个客户,正式负责销售的VP都是去年底才刚招到。
未来,公司会逐渐形成一个倒金字塔架构。上层无论是创始人还是资深的人员,他们主要负责优化模型、训练产品应用,而下面那些相对简单和初级的工作,将不再需要那么多初级工程师了。可能以前你需要五个工程师,现在只需要一个,再加copilot就足够了。这意味着,创业成本会越来越低,变现周期也会越来越快。这对于创新生态,是一个非常大的优势和机会。
华楠:刚刚你也提到了一些年轻的团队,钛媒体也关注到了,现在硅谷年轻的华人引领了一波AI创业的风潮。不知道您怎么看这种现象?
张璐:我去年也投了好几个有华人背景的公司。其实在过去这十几年,在硅谷的人工智能领域,华裔是非常重要的有生力量。这一波生成人工智能浪潮,门槛还是比较高的,真正懂怎么去优化训练模型的人还是少数。这些人主要来自小的圈子,或者说,在硅谷这一个圈子里,正巧有很多中坚力量又是华人。这对华人创业者来讲是一个很好的机会。
华楠:驱动AI创业公司能够走更远的因素之中,算法、芯片和数据,您认为哪一个是相对最关键的?
张璐:这三个都很关键。但如果说短期内可能遇到的瓶颈,我觉得是算力的缺乏。英伟达的股票和财报为什么这么好?因为我们现在全球都缺算力。包括我在OpenAI的朋友,内部会半开玩笑地跟自己的老板说,不要给我升职,用这个钱去买多一些GPU吧,因为我们的GPU远远不够用。即使是谷歌,尽管他们自己有TPU,也有很多成员会去竞争使用TPU的机会。无论是英伟达、AMD还是TSMC都在扩建新的工厂,基本上这些工厂的竣工时间也是在2026年到2028年之间。
短期内,算力需求是巨大的。
在芯片层面上我们有很多探讨,包括是不是有一些新的芯片设计可优化,去帮助我们度过这一段的瓶颈期。但是根本上,我们还是需要更多的GPU,更多的芯片。
从长期来看,数据的需求也在不断迭代和演变。刚开始当然是海量的数据,但是在GPT3.5之后,你就会发现数据的质量比数据的量更重要,包括数据质量本身和数据的相关性。如果你的数据质量足够好,相关性足够强,那么在现有的模型基础上进行优化所需要的数据量就更少,这样算力成本更低、耗电量更低、效率更高。此外,数据的多样性,包括视频、音频、图片数据,也非常重要。
一些轻量级的语言模型的探索,可能是一个方向。这种小的模型不一定能覆盖所有场景,但是,如果说它能够服务某个行业和特定应用,也足够了。人工智能不应该仅仅追求更好表现,同时也要去优化它的成本和效能,才能可持续地发展。
目前大家看到的很多模型公司是不赚钱的,因为算力成本太高了。他们背后通常站着一个大型云服务公司,通过云服务来获得更多收入,进而支持模型的发展。但这是一个可持续的商业模式吗?
华楠:现阶段人工智能成本确实太高了。一些大公司还可以承受,一些中小的创业公司,是不是就没有什么机会了呢?
张璐:机会是存在的。我们看好的是垂直领域的应用机会。尤其,医疗行业是人工智能非常大的机会。在美国,医疗行业占GDP的20%,数据量很大,质量很高,应用场景非常多样。更重要的是,医院或者药厂通常不会把医疗数据分享给谷歌、Meta或者微软等大公司。医疗行业也需要数字战略和人工智能的整合和升级,往往他们会更愿意和初创企业合作。
凡是监管要求比较高的行业,企业都会比较谨慎,不愿意把自己的数据分享给大型科技公司,这包括医疗、保险、金融、物流、供应链等领域。
我们投资的好几家公司都是做这样的应用。其中,有一个针对制药行业的生成式人工智能的平台。一个大型药厂的科学家,可以直接问AI新药的临床试验怎么设计,AI会直接把答案生成出来,高度精准、高度专业、高度快捷。
还有另外一家公司做医疗影像。之前,病人可以做五分钟的低精度CT扫描,也可以做两小时的高精度CT扫描。现在,病人只需要通过五分钟的低精度扫描,生成式AI直接把它升级成高精度扫描,更快、更好、更便宜。
这样的应用很多,壁垒相对较高,初创企业在其中有非常强的竞争力。这次的人工智能趋势,是全产业数字化转型。整个产业升级和创新量级、创新的机会,比互联网时代还要大十倍。它的升级速度是非常快速的。所以它的量级如果比互联网时代大十倍,哪怕初创企业只有30%、40%的机会,也是非常大的市场量级和机会。所以还是有遍地开花的创新企业成长。
华楠:Sora的发布,国内是热情高涨的。甚至有人说,AGI的时代就要到来了。之前可能说要十年,现在有人认为,一年就可以实现了。您怎么看待这个观点?此外,AGI时代如果真的到来了,会不会出现类似微信或者是TikTok这样的超级应用呢?
张璐:首先,如果严格定义AGI,我们离实现还有相当的距离。当然也有人说学术界和产品界对于AGI的定义是不一样的。
人工智能现在训练的所有文本是人类提供给他的,是由我们人类生成的。比如说,你看一部电影或者听一首歌,心里可能会有很多很复杂的感受。对于这些复杂感受,你可以非常完整地写一段话或者画一幅画表达出来吗?这其实是一个很高的要求。鉴于我们对内心感受和信息的表达存在局限,提供给人工智能的信息自然也不会是完整的。
AI还是有很大的提升空间,我们在加速朝AGI的方向前进,这确实令人兴奋。但是由于我们对技术有深入的了解,也会更加客观地看到现阶段与真正的AGI之间的距离。所以,大家既不要神化AI,也不要神化技术。
未来会不会出现平台型公司?人工智能本质上是工具,把工具使用好,还要选对产业和应用。全产业都应该使用AI,但是不代表每个运用AI的产业和应用都会创造出十亿、百亿级别的公司和机会。有些只是驱动一下,有些可能会带来根本性的变革。
TikTok这样的科技公司,将会被AI第一个赋能,速度和效果比初创企业更好。某种程度上,人工智能加剧了现有的大型科技公司的垄断或者是绝对的领先地位,只要这些公司拥有合理的战略和快速迭代的执行效率,它们还会雄霸科技行业好多年。
华楠:我们一个用户,是一个高三的美术生,本来想学动画专业,结果AI崛起,想着就业可能难,就往戏剧美术设计专业上学,那时候觉得,做电影特效也不错。如今Sora来了,他对未来又迷茫了。您怎么看这样的现象?
张璐:近一段时间,Sora生成的视频的质量,与渲染的精品视频的成品来比,还是有一定的距离的。当然如果那位同学才高中的话,他的担忧其实是有道理的。因为AI替代一些工作,可能不会在短短一两年时间内发生,但在三到五年的时间里发生的可能性我们无法预知,技术的发展速度是未知的。
想成为一个内容创作者,核心是有好的想法、洞见和见解,创造故事的能力。人工智能现在的作用还是一个工具,工具替代掉的不是Job(工作),它替代的是Task(任务)。就比如,护士是一个工作,但一天可能有100个不同的小任务。
我们用人工智能的工具替代掉一些任务,而不是把工作完全替代掉。未来哪怕说你还是学美术,如果有一天Sora可以生成高质量的长视频,还是需要有人去审阅、编辑和进一步优化,所以人的价值是不可替代的。有危机感很好,但同时也不需要把技术过度神化。
华楠:是的,技术的进步确实可以为每个人所用,就看自己如何把握这个机会。最后一个问题,我们留给钛媒体直播间的用户。有一位用户在我们直播间评论说,AI的底层基础逻辑才是关键因素,需要大量的数学家和科学家,纯粹砸钱在这个领域已经失效了。作为投资人,您怎么看这个观点?
张璐:确实如此。单纯的资金投入带来最大的优势是算力优势。当然,无论你有多好的模型,都离不开算力,这是当下非常现实的一个问题。学术界现在最大的一个困境就是无法和工业界竞争算力。一个科技公司可以投入十亿美金、百亿美金去保证自己有足够的算力。但是一个学校,一个教授,一个实验室,不可能有这么强的资金得到足够的算力。
然而,正如该用户所说的,核心还是在于探索新型算法,使用更少的算力成本和能源成本,进行人工智能的优化。那个时候,对GPU层面上的需求可能会减少。对于这些新型模型而言,这将开启许多创新的机会。但在那之前,资金投入仍然是关键。
(本文独家首发钛媒体APP,作者|李程程,编辑|马金男)
发布于:河南
相关推荐
对话张璐:硅谷正在追逐两大赛道创新,融资降温但技术商业化更快了
半年1000亿,硅谷投资人“烧钱”造神
专访硅谷投资人张璐:5G是医疗产业新机遇,区块链未到成熟商用阶段 | 直击达沃斯
对话AWS生成式AI全球副总裁:解读AWS生成式AI服务的“三板斧”
专访SpaceX投资人张璐:商业航天是高风险领域,公司不能靠资本活下去|投资者说
知名硅谷VC解读:生成式AI赛道的19家潜力新星
亚马逊云科技中国峰会如期开幕,全面聚焦生成式AI新风口
投资人张璐:传统产业技术转型中的4大机遇和3大挑战
中国AIGC创新,一场“逆互联网”式创业
海外AI创投,已经开始关注“赚钱能力”了
网址: 独家对话硅谷投资人张璐:90%生成式AI创新属于科技巨头,创投应聚焦应用层 http://m.xishuta.com/newsview110553.html