在见到戴玮之前,我并不相信“乐观主义者”的标签,会与一个岗位频繁调动的人有什么关系。
自2007年加入阿里巴巴,戴玮先后在淘宝、支付宝、OS事业群、阿里文娱等部门任职,并于今年4月正式担任集团旗下的斑马智行CEO。
作为新上任的掌门人,留给戴玮的好消息是,斑马智行这家公司有着极为高光的时刻,因为做出了业内最早的互联网车机系统,一度被视为国内智能座舱行业的黄埔军校;而坏消息是,上一次真正意义上的高光时刻,大概出现在8年前。
“元宝(戴玮花名)在我们内部,属于是专打逆风局的角色”,斑马智行的首席产品官蔡明如此评价道。
但面对如此开局,戴玮也只是面带微笑地表示,“其实也还好。”
“至少从行业来看,现在无所谓‘逆风’,过去技术迭代没那么快时,留给斑马的机会确实比较有限,但眼下新技术所孕育的机会太多了,我们一定要把握住。”戴玮向虎嗅表示。
基于这样的想法,戴玮在接到集团任命后,火速集结了一帮“老哥们”,又拉来了一批技术专家,开始了斑马智行的“二次创业”。
审视过去
在这一轮生成式AI爆发前,斑马智行可谓是“起了个大早,赶了个晚集。”
2016年,YunOS for car,即斑马1.0系统随上汽荣威RX5车型发布,驾驶员通过一句“你好,斑马”的唤醒语,即可通过语音指令完成对车辆的行车导航、娱乐影音、空调车窗等功能的控制。
图片备注:斑马1.0系统的语音操作界面
今时今日,这些功能早已屡见不鲜。但在当时,大多数的车厂根本没有智能座舱的概念,即便是改变世界线的Model 3,此时都没有进入正式量产阶段。
一年后,斑马系统的累计装机量达到了40万,这对于车厂来说已经足够优秀,但阿里的理想远不止如此。
2017年9月,阿里在整合原YunOS移动端业务后,正式推出操作系统AliOS——覆盖汽车、IoT终端、IoT芯片及工业领域,并整合原YunOS移动端业务。在这个庞大的设想中,斑马系统,或者说是这个系统的智能座舱部分,自然也与OS深度绑定。
但问题是,基于一个如此庞大的“物联网”操作系统,原本的斑马系统开始愈发臃肿,尽管OS技术储备不断加深,但斑马智行的产品创新却“肉眼可见地”慢了下来,直到今年“大模型上车”的计划正式加速。
在戴玮、蔡明等人回归斑马后,对公司的业务进行了多次深刻的讨论与梳理,并多次在高管中达成一致:All in AI。
首先公司内部明确的一点是,斑马必须扔掉沉重的包袱。为了让业务更加聚焦,未来只做智能座舱——在此之前,斑马智行秉承着明线发展“智舱”、暗线发展“智驾”的策略。
在蔡明看来,专注于智舱更加符合斑马智行的实际情况,原因在于目前智驾行业内各家的同质化已经比较严重,已经出现价格战趋势,而且智驾方案在卖给厂商后,也没有任何新的商业模式能够带来后向收入。
所以斑马现阶段必须要将资源集中在智舱上,因为智舱与应用的联动可以产生稳定的后向收入,考虑到斑马大部分人在阿里系的背景,他们更加了解生态该如何运营、维护,这属于斑马得天独厚的优势。
另外一点被明确的,就是智舱AI技术与OS的解耦。当然,这并不意味着要与Ali OS割席,而是分化为两条商业路径:
第一种,保持智舱AI技术与AliOS紧耦合,这样做的好处是数据打通能够更加顺畅,但客户相对受限。
另外一种就是对智舱及OS进行解耦,仅保留部分中间件,给客户提供大模型语音及Agent集成的平台体系,甚至是用对话式的小程序上车,无论客户的系统是基于安卓,还是Linux,都不影响智舱AI技术的向上框架。
在明确这两个问题后,戴玮和团队成员开始盘点手中所掌握的资源:较为扎实的OS系统框架、阿里通义大模型的支持、还有自YunOS时代就参与交互设计的团队,以及新“入伙”的一众AI研发人员。
戴玮接手斑马的一个月后,围绕“智能座舱AI技术”的开发工作,按下了加速键。
淘汰APP?
作为YunOS和斑马1.0“高光时刻”的亲历者,戴玮和蔡明并不满足于“让大模型上车”,他们更关心的是如何做出一款“好用的AI 操作平台”。
“智能座舱这事在行业里压根就没有做成。”在蔡明看来,通过装机量、渗透率去评估智舱发展毫无意义,决定生态能够跑通的只有服务数量及用户时长两个指标。
有调研机构曾做过统计,除了地图导航和音乐等少数APP外,在常见的互联网服务中,座舱端的年使用率(一年打开一次即作计数)差不多是全端的三分之一到五分之一。
这说明大多数APP在车上,根本无法触发高频应用,进而让车厂与互联网厂商同时陷入一个尴尬的境地:前者甚至愿意为“应用上车”而付费,这在移动互联网时代是无法想象的;而后者又不愿费时费力地适配应用,去换取车上本就不多的活跃用户。
因此,在斑马的产品开发团队看来,智能座舱AI技术,势必要去APP化,让服务和内容直达用户。
这里还有一个考量就是,APP有着严格规划的操作层级,如果使用传统的触控交互,在行车的过程中操作非常不便,因此在去APP化的同时,尽量使用语音交互,减少非必要的触控。
以上的技术设想,在产品开发的过程中,逐渐转变为两条基准原则:交互变革与服务重塑,并在此基础上开发出一款通用型智能座舱AI技术平台。
尽管斑马在智舱系统上有着不错的“底子”,但按照目标让大模型上车,基本相当于要做一次推到重做。
“就单讲语音,整个语音系统由四段组成,分别是前端声学、ASR(语音识别)、NLU(自然语言理解)、TTS(语音合成),除了第一段外,其他部分都需要用到不同的大模型,有些需要在云端做泛化,还有些则需要彻底的重构。”蔡明向笔者解释道。
图片备注:元神AI的语音演示Demo
而相比于技术问题,更难的其实是工程问题。
“我们之前做测试,可能同样一款车,仅仅是隔音层薄了一些,用户甚至根本感知不到,但语音系统就得全换,而我们还需要在不同的路面、不同的车内环境下做各种调优。”
作为产品和AI的负责人,蔡明为了协调各部门之间的进度,干脆把公司所有的P7职级以上的Leader聚在会议室中,用一整天的时间逐一跟进各部门遇到的问题。
四个月后,斑马智行如期交上了“AI上车”的第一份答卷。
智舱的iPhone时刻?
在前不久举办的云栖大会期间,斑马智行联合通义发布了全新智舱技术品牌“元神AI”。
元神AI基于通义大模型,以自然交流为基础,围绕感知场景、组织服务、认知进化构建AI技术体系,旨在解决传统座舱体验不佳、服务低频的问题。当前已基于英伟达Orin X平台与通义端侧多模态大模型做出了POC(产品概念化验证)。
在发布会现场,斑马智行演示了基于元神AI的典型Agent产品——与钉钉联合打造的“闪记车听”。
基于自然对话,用户可以在车内进行线上会议,拓展功能包括前序会议追溯、弱网参会、对话式摘要、自动设置日程与待办等功能。同时,斑马智行还对硬件配置做了AI算法优化,如阵列式降噪麦克风、头枕播报等。
有处细节是,在现场的演示Demo中,Agent产品大多是阿里巴巴集团旗下的应用,比如大麦、高德等,但是第三方应用愿意向斑马开放接口吗?
对于这个问题,蔡明认为,目前CP(内容提供商)/SP(服务提供商)在移动端或是桌面端的增量早已见顶,他们需要的是有人能够建立出新的场景,而智能汽车就是个很好的场景。
“假设放在几年前,比如之前滴滴、快的争抢市场的那种状态,那我们是无法完成应用聚合的。换句话说,当下做智舱的Agent,最大优势在于各行业也在摸索应用AI化的路径,我们有机会把用户常用的应用聚合在多任务列表里,让用户获得完整的AI体验。”戴玮补充道。
值得一提的是,随着元神AI的发布,斑马智行还为这套系统制定了一个非常有特色的目标,即“100次座舱服务调用不超过1次触控交互”。
与之对应的是,在元神AI智舱平台上,几乎所有的非驾驶操作都通过语音交互完成。
至于这个目标是否符合现在用户的普遍操作习惯?蔡明举了一个例子,在iPhone诞生时,大家都觉得它不符合传统T9键盘的输入方式,但现在不会有人再要求“手机要有打字手感”。
“只要交互体验做得好,用户是完全不会介意交互模式改变的。”在蔡明看来,交互变革和服务重塑,实际上就是在推动智能座舱“iPhone时刻”的到来。
相关推荐
智舱界的黄埔军校,为何开启二次创业?
AI人才「缺口」:智能安防最缺人,华为成了「AI界黄埔军校」
中国芯片“黄埔军校”又将收获一个IPO,小米、华为联手投资
科大讯飞脑智测评舱可测多模态数据科大讯飞脑智测评舱专利获授权
瞄准泛文旅场景,自动驾驶全栈服务商「易特智行」打造L4级机器人方舱
问界夺得销冠,智界交付延期,华为「两界」不同命?
燃动中国热泵展!科龙·龙焰无水地暖体验舱全国巡展正式开启
获得数百万美元投资,切入“亲老”家庭社交领域,百合网创始人开启二次创业
华为发布会再放大招:原生鸿蒙公测在即、智界R7“提前”上市
熄火240天,在线教育“二次创业”按下重启键
网址: 智舱界的黄埔军校,为何开启二次创业? http://m.xishuta.com/newsview127829.html