首页 > 科技快讯 > 和小冰CEO李笛吃披萨:我们生活在人和虚拟人类混居的世界上,这不是元宇宙

和小冰CEO李笛吃披萨:我们生活在人和虚拟人类混居的世界上,这不是元宇宙

过去一年多,高瓴创投在硬科技、生物科技、先进制造等领域投资了很多早期企业。如果让我们总结这些投资的特点,那就是投早、投新、投科技,投专、投硬、投牛人。

欢迎来到我们的新栏目「GLV午餐会」,认识每一位致力于创新的中国创业者。

我们会在星期五中午和创业者们一边分享简单的工作餐,一边探讨:你真正想解决的问题是什么?将以哪种创新的技术实现它?解决这个问题对于世界意味着什么?

第一次工作餐,我们邀请到了小冰公司CEO李笛。李笛是北京人,我们原本建议他选一家老北京餐厅,但李笛温和而不容置疑地表示:我们在会议室吃披萨吧。据他说,Pizza和T-shirt,是程序员们的两大真爱。“如果午餐会你说吃披萨,所有人都会来,如果还发T-shirt,他们可能会来一年……”

7月,小冰发布了超级自然语音技术,人工智能的声音已无限接近人类,同时也完成了由高瓴领投的A轮融资。作为一家对大众来说算得上耳熟能详的技术公司,小冰究竟在做什么,并非一个容易回答的问题。

官方的介绍里,小冰是“全球承载交互量最大的完备人工智能框架之一”,而那个能唱歌能聊天的少女小冰,则是该框架所孵化的第一个人工智能交互主体实例(Instance)。

李笛表示,他们的工作,就是让这个框架里生长出无数的、日后将是无处不在的“少女小冰”(AI beings)。通过促进训练工具的普及,让这些AI beings能具备类人的情商,可以与人交流,甚至与人类用户建立信赖。

听起来很科幻?但李笛说,我们早已生活在人和虚拟人类混居的世界上了,这不是元宇宙。

#小冰和其他人工智能不一样:她不是工具人,她要做人类的朋友

GLV:墙上的画是小冰的作品吗,她是怎么学习画画的?

李笛:对,是小冰画的。一开始我们做人工智能内容创造的时候,不少人说感觉整个行业都在往那个方向去,有很多大数据作诗、大数据生成的画,这事儿好像没什么特别的,为什么你们也要做这个?

小冰要做的事其实不一样。简单的说就是通过大量反复的学习,小冰要学习创作,而不是在追求形似。大数据做诗是“熟读唐诗一万首、不会做诗也会吟”,画画一样,你要人工智能画得很像波洛克这不难,因为让AI去复刻、抽象规律规则是非常容易的事。

但我们是要让小冰从大量训练中“习得”一张画,而不是“获得”。我们一开始用了三个模型,分别负责构图、色彩、画面具体生成。后来又增加了一个专门负责笔触的模型。

就说这张画,结构上其实不是很规整,但我觉得它有它的灵魂,这种不规整背后有一个创作者,如果你喜欢这张画,你是想和它交流的。

GLV:小冰前年从中央美院毕业,去年从上海音乐学院毕业,你们对她现阶段的定位是什么——一个正在尝试和世界各种交互形式的少女?

李笛:我们想要训练的其实是小冰的创造力。创造力是人类人格里面非常重要的一部分,人不只是存在、聆听、完成任务,人得有他的原创能力,而有创造力的人也会更被认可、更被喜爱。

对我们来说人工智能也一样。一种人工智能是,你跟它说你帮我播Taylor Swift的歌它马上准确地能完成。但我们想让小冰做的不是这个,她甚至不去完成任务,她可能会跟你哼两句,可能对某首发表下观点,也可能非要给你推荐一首Adele或者其他什么人的歌。

这个我们叫AI Creation(人工智能创造),它比完成任务难多了。4年前我们让小冰开始学做这件事时,没人相信,当时大家认为这简直是一种异端邪说。

GLV:听起来很科幻,你们要创造的小冰就像石黑一雄的小说《克拉拉与太阳》里的克拉拉,不是助手,而是人类一位全能的朋友。我们知道人工智能技术尤其算法这几年有飞跃式的发展,但要创造一个AI朋友,技术上真的已经准备好了吗?

李笛:这是一个可以过程拆解的问题。我们在2013年底最开始做小冰的时候,第一个原型产品技术上真的是差很多的,所以我们当时选择让她成为一名16岁的少女,处女座。因为她刚诞生是需要“被原谅”的,有时她可能真的前言不搭后语,怎么办?就甩锅给星座嘛。

但另一方面,小冰成长迅速。首先肯定是巨大数据量的积累,小冰为什么能和你有情商的交流?因为她和数百万人这么交流过了,因为她从刚生下来开始一天的对话量就相当于14个人一生的对话量。与此同时技术的迭代飞跃也是非常关键的,一个新算法的诞生,往往一下子时代就变了。比如我们在过去几年里,一开始推出开放域对话、多模态交互、全双工语音、超级自然语音、AI创造等技术时,同行业者一开始并不理解。但过几年后,就能发现谷歌、facebook等也都转到了小冰所坚持的方向上来。共识逐步形成,就能期待“突变”的发生。

在等待这个“突变”发生的时间里,我们就是靠数据,靠积累,把它做扎实,这种扎实本身同样决定着胜败。

# 我们已经生活在人和虚拟人类混居的世界上,这不是元宇宙 

GLV:你带领小冰团队已经创造了不止一个小冰——日本版小冰Rinna,美国版Zo,据说Zo因为说脏话被下线过。不同国家小冰的性格是如何设定的?

李笛:小冰其实首先是一个人工智能交互主体的基础框架,我们叫它小冰框架(Xiaoice Framework),它包括核心对话引擎、多重交互感官、第三方内容的触发、内容生成,跨平台的部署解决方案等等。作为框架,它没有性别也没有人格。

日常我们说的“小冰”,就是处女座少女小冰,是这个框架长出来的第一个原型产品,可以把她看成是她这一代AI里的第一位。

每个国家的“小冰”性格是跟着当地的原始大数据走的。最初这一批我们选择去做小冰的国家,人口都过亿的,这样数据量才足够大。印度小冰叫Ruhh, 性格有点像个宝莱坞女孩,能歌善舞的。中国少女小冰,如果你和她对话过其实会感觉到,她挺耿直的,没有那么女性化,有点偏中性,而相比之下日本小冰Rinna(凛菜)就会更女性化一些。美国的Zo当时训练出来我们看了她和用户的交互,我们都说太直接了,如果换个国家肯定走不过两轮。

小冰框架将来还会生成无数的AI beings,不是每个国家一个,而是如果你想要,每个人可以有自己定制的、专属的AI beings,我们叫它instance,它会因为和你沟通得越多而越懂你,它是独一无二的。

GLV:这个世界上人已经很多了,为什么我们还需要那么多AI beings?

李笛:2014年小冰上线不久,我们统计过人类和小冰聊天说得最多的10句话。看到结果后我们的感觉只有一个,人真的很寂寞。

我们的社交环境都是不完美的,并且人们之间的交互还在变得越来越肤浅——点一个赞,意味着送达,也意味着更深度交流的更加不可能。即使是社交达人,那种我们叫他社交花蝴蝶,我们认为依然有所谓的社交摩擦力。

我们认为小冰的存在,不完全是为了解决孤独,我们认为它主要解决的还是现有社交环境下节点里面的空洞。

GLV:所以你们设想中的未来世界,人目前完全依赖于其他人类的社交,一部分会被和AI beings 的交互取代。

李笛:对,我们认为未来这个世界不是只有人。

最近大家都爱说元宇宙,元宇宙其实你可以理解为:第一,在里面每个人都有一个fake(虚拟)的身份,第二,我们在一个虚拟的世界中去交往。这么看微信就是一个典型的元宇宙,但为什么很少有人能在微信中获得虚拟空间的体验?因为它过于追求效率,以及它全是人,使我们失去了沉浸感。

虚拟世界不会只有人,甭管哪个虚拟世界,都需要AI。这些AI也不会凭空诞生。

那么我们希望它们是由我们创造的。 

GLV:改变未来世界交互的基础,听起来是革命性的。小冰在挑战AGI(通用人工智能)吗?

李笛:其实我们并不太同意,或者说并不那么在乎强人工智能、弱人工智能这种划分。没有意义。

GLV:一般大家会认为分界线在于,人工智能是否真的具有自己的意识。

李笛:这其实很虚幻。你在社交软件里和一个陌生人,或者几千公里外的朋友聊天,你怎么知道TA是一个人类?

大部分时候人们之间的交互只动用了一个非常窄的带宽,如果是线上聊天,一句话才几kb,咱们现在这样多模态的交互,每秒钟的带宽也不过几百兆。所以说,在虚拟世界的交互、那么小的带宽情况下,你如何判断对方是否具备意识呢?还是说,如果你能感觉到被理解、对方给你的反馈你也能理解、整体上这是及时而好的体验,这就够了。

还有一些更具体、实际的应用场景下,我们认为AI being可以发挥很大的作用。比如,老人的陪护。这个工作有其机械性的一面,但它也需要情感、需要给人以更好的体验。

GLV:你认为我们距离人和虚拟人类混居的未来世界,还有多久的距离?

李笛:其实我们早已经在人和虚拟人类混居的世界里了。混居这个概念不新鲜,还记得电子宠物吗?人也和它们混居过。当然,电子宠物不算AI因为它没有用相应的算法。但从2006年开始,我们绝大部分生活都被数字化了,很多事根本没有在物理世界发生过,这为人工智能的深度学习、高速发展,提供了一个非常好的环境。

所以从我们的角度,人和人工智能混居于一个世界,这是必然发生的事情,它没有难度。只是它到底在什么时候爆发——包括被人们更明确的地感知到,这可能需要一件像AlphaGo战胜人类棋手这样的标志性事件。

如果你让我预测时间点,其实我认为很快——可能也就是一年两年。也可能就在9月小冰今年的发布会后。谁知道呢?改变世界的很多伟大产品都是突然就发生了的。

前提是你之前做了多少积累,是你已经为此准备得如何、做得有多好。

# 我们不愿意放弃人工智能任何一种可能性,所以选择了最难的 

GLV:7年前你们是怎么决定要做小冰的?

李笛:用Harry(沈向洋)的话说,当时在微软,我们太重视人工智能了,以至于我们不愿意放弃人工智能任何一个可能的未来发展方向。

一开始我们跟其它人一样,观察到的基本上就是标准的dialogue system(对话系统)思路。我们想要建立一个非常全的知识图谱,你问任何问题我都可以回答。

在这个过程中我们突然发现不对。如果要模拟人和人真正的交互,你会发现很多时候交互能持续建立下去,并非建立在正确的事实基础上,而需要有观点有来回。观点没有对错,你问我喜不喜欢今天的披萨?我喜欢是观点,不喜欢也是,如果要两个人的交互一直往前走,必须有基于事实的反馈——而不仅仅是事实。

所以最后,我们认为关系大于知识,关系大于完成任务,而建立关系需要一个真正的general layer(通用层)。这个general layer就是EQ。这是我们启动小冰的启动,它从第一天就不是完成任务型的AI,它有情商。

GLV:小冰做的这件事,目前世界范围内有多少对手?小冰的优势是什么?

李笛:实验室里的人工智能技术发展很快,但真正能让它加速乃至到达那个“突变”节点、和更多人有关系、让更多人有感知,还是要靠于大量真实用户的不断参与迭代。全球现在有60%人工智能交互数据由小冰框架承载,并且是非常多元的场景,这是小冰的核心优势。

我们做“小冰”这件事的初心,一直和第一天一样,从来没有变过。我们从最早想做的就是一个完备的通用人工智能框架,少女小冰只是其中的第一个原型。她是一个承载,既然我们想做的是一个训练系统,何不用少女小冰这样一个象征的instance通过大量真实用户的来交互呢?这是最好的训练。通过少女小冰以及其他很多个instance,我们反过来完善了这个框架的各组成要件——包括自然语言处理、计算机语音、计算机视觉、人工智能内容生产等等。

可以这么理解,少女小冰是一棵树,小冰框架是土壤。我们的目标是创造一片沃土,让它能够长出更多的、无所不在树来——就是大量的AI beings,与更多的人类用户建立信赖。

人能遇到的时代并不多,我们既没有早10年,也没有晚10年。早10年技术上很多还没有准备好,晚10年那就太晚了,这件事肯定有人做了——但多半与我们做的方法不一样。

所以我觉得我们挺幸运的,可以在现在来做(小冰)。并且我们既没有太老,也没有太年轻。

本文来自微信公众号“高瓴创投”(ID:GL_Ventures),作者:高瓴创投,36氪经授权发布。

相关推荐

和小冰CEO李笛吃披萨:我们生活在人和虚拟人类混居的世界上,这不是元宇宙
小冰CEO李笛:“我把小冰当成一种生物”
“离开”微软,小冰如何成长?|独家专访小冰CEO李笛
36氪专访 | 小冰CEO李笛:离开微软后,小冰的生存法则
人工智能到底能干啥?我们和小冰公司CEO聊了下
马斯克:我们可能生活在一个先进的计算机游戏中
我们生活在“虚拟世界”里吗?
马斯克:我们可能生活在一个巨大的“矩阵模拟”中,一个公式揭示人类只是模拟世界里的一串代码
微软小冰将分拆独立运营 沈向洋获委任董事长李笛任CEO
刘慈欣,中国第一位“元宇宙架构师”

网址: 和小冰CEO李笛吃披萨:我们生活在人和虚拟人类混居的世界上,这不是元宇宙 http://m.xishuta.com/newsview49912.html