首页 > 科技快讯 > 极越CEO夏一平:大模型虽好,但不能迷信

极越CEO夏一平:大模型虽好,但不能迷信

一个在自动驾驶领域里争论已久的问题是:智能汽车到底用什么感知外部环境,是视觉算法还是激光雷达?

为什么这个问题值得争论?因为感知环节相当于人的眼睛和耳朵,只有通过感知环节搜集车辆周围环境数据并将其传输到决策层,也就是大脑,才能下达指令,完成动力供给、方向控制、车灯控制等动作。

马斯克是坚定的“纯视觉”派,他认为具有“自动驾驶能力”的汽车应该是可以像人类那样用眼睛来驾驶,而摄像头就是汽车的眼睛。当然,也有车企不相信单纯的视觉算法可以做好自动驾驶,从而坚定选择激光雷达。

各自背后有不同的考量。不过,近日“纯视觉”派又添了一位新玩家。

10月17日,在极越01正式上市前夕,极越发布了其国内首个BEV+Transformer“纯视觉”高阶智驾技术方案。

“虽然激光雷达的早期优势明显,但是从长期来看,不管是对于系统成本、后续的技术迭代,还是未来的数据闭环等方面,纯视觉方案都更有优势。”极越CEO夏一平向钛媒体App解释这一布局背后的考量。

效仿特斯拉的纯视觉方案

作为纯视觉派的“头一家”,梳理特斯拉的发展会发现,它也并非从一开始就走纯视觉路线,其在售车型也曾标配过毫米波雷达。

与特斯拉的纯视觉路线一样,极越的纯视觉技术方案也经历了迭代过程。

在1.0阶段,极越研发了“纯视觉为主+激光雷达”融合的高阶智驾方案。

虽然在团队搭建之初,出于成本的考虑,夏一平曾跟百度智能驾驶事业群组(IDG)首席研发架构师王亮探讨过纯视觉方案的可行性。但在讨论之后,出于对安全的考虑,仍然选择做一个冗余方案——在车上加两个激光雷达。“在早期系统设计能力不是很强的情况下,激光雷达的优势还是非常明显的。”夏一平说道。

随着底层AI视觉算法能力的快速升级,2023年年初,团队开始研发纯视觉技术方案,极越高阶智驾进入2.0阶段。也就不再借助激光雷达,并逐步降低对高精地图的依赖程度,从而基于BEV+Transformer的“纯视觉”技术方案进行研发。

从包含激光雷达的双系统到纯视觉方案,夏一平认为,转变的时机已到。

首先,从工程实践的角度,之前的“纯视觉为主+激光雷达”方案本质上仍然是两套硬件,也就需要两套算法,功能实现上并不高效。

其次,虽然现在激光雷达的成本已经从几万美元下探至几百美元水平,但相比百元级别的毫米波雷达和摄像头,依然很贵,这导致激光雷达仍普遍搭载在高端车型上。但是,如果想让高阶智能驾驶的普及程度更高,势必要能够进入到更多低价车里面,因此整个系统的成本就要不断降低。

除此之外,夏一平也透露,之所以选择路线的切换,还有一个原因是极越团队评估过纯视觉方案后发现,用户体验虽有下降的风险,但这个风险是可以通过后天的努力弥补的。

他坦言,在纯视觉方案使用最初,体验的确会有一点回退。不过,随着更多能力的投入,体验的提升也很快。

为进一步拉高“纯视觉”技术方案的能力上限,极越还与百度联合研发了OCC占用网络技术。

所谓占用网络技术(Occupancy Network),就是以视觉信号为基础,在传统3D目标识别能力之上,通过体素(Voxel)化的方式理解和处理空间信息。通过这一技术的加入,可以获取比激光雷达点云分辨率更高的三维结构信息,还能减少漏检、误检并弥补视觉所不具备的空间高度信息。

根据极越的官方资料,目前搭载了“纯视觉”高阶智驾技术方案的点到点领航辅助PPA已经跑通了上海城区主要核心道路。今年年内,还将扩展到3个城市可用。 

大模型虽好,但不能迷信

除了智能驾驶,智能座舱也是当下智能汽车角逐的重点。

在10月17日的百度世界大会上,百度董事长兼首席执行官李彦宏还现场演示了极越01的座舱交互能力,其表示:“基于百度AI底层能力全面开放赋能的极越01,将成为目前最聪明、最懂你的汽车机器人。”

极越01的智能座舱最大程度取消了物理按键,用户仅使用语音指令就能操控整车几乎所有功能。此外,极越01的语音交互不仅覆盖车内车外、四路同说、连续对话等复杂场景,还融合语音、手势、视觉识别等多模态交互。未来,极越01还将搭载车端语音大模型,即使再模糊的指令也能表现出最聪明的交互结果。

而关于大模型,夏一平表示,科研类的探索跟工程类的探索还是有很大区别的,“大模型虽好,但不能迷信。”他承认,自动驾驶值得用大模型的方式重写一遍,但是,这个事情可能是未来3~5年之内要做的事情,绝对不是明天就要做的事情。

而当下对于极越来说,最重要的是在10月底极越01上市之后,能够有好的交付表现。至于智能驾驶,还是智能座舱,这些都是一台车上锦上添花的东西,是卖点之一而不是全部。

因此,夏一平在沟通中不断强调,技术发展需要一个过程,作为即将上市的产品,极越01不可能因为过于激进的技术迭代导致整个产品体验下降。

极越01在智能化上会提供给用户当下最优的解决方案,但不会一味去追逐前沿技术的应用而丧失一些产品体验。

那么,未来汽车终极竞争的核心能力是什么?关于这个问题,夏一平透露,在极越成立之初,其就曾和李彦宏进行过讨论。

讨论最后得出的共识是,虽然车的底盘操控、三电、供应链制造仍然很重要,但在未来并不是决定胜负的关键。当汽车在向智能化发展的过程中,背后需要的是一个非常强大的生态执行团队,来整合算法、算力以及对数据的处理能力。

而在生态体系能力上,极越背后的百度有算法,有算力,有AI,还有地图以及数据处理能力,只是如何把这些能力串起来,从而变成后方的“发动机”是关键。

随着大模型的集中“上车”,后续车企在智能化上竞争,或将呈现出新的格局。就算用的是同一个大模型,不同车企由于积累的数据与对场景的理解不同,最终呈现出的效果也会有明显差别。

不管是智能驾驶,还是智能座舱,谁有更多数据,谁的技术就会迭代更快,带来的产品体验就会更好。而这对于新品牌极越而言,接下来极越01的上市表现,将显得尤为重要。

(本文首发钛媒体App,作者|韩敬娴,编辑|张敏)

发布于:北京

相关推荐

36氪专访丨集度汽车CEO夏一平:智能化不是“搞噱头”,好产品用户教育成本很低
集度更名极越,李彦宏松了一口气
极越发布其国内首个“纯视觉”智驾方案 已跑通城区道路
夏一平加盟,百度造车之路会是一路坦途吗?
二手车赛道虽好,生意难做
大模型赛道:风浪越大“鱼”越贵
大模型的未来在哪?
“腰部”大模型,活在故事里
周鸿祎参加AGI Playground大会 分享垂直大模型创业方法论
中国大模型“顶流群聊”笔记

网址: 极越CEO夏一平:大模型虽好,但不能迷信 http://m.xishuta.com/newsview94684.html

所属分类:行业热点