首页 > 科技快讯 > 鉴智机器人推出3D感知新范式BEVDet ,提供以视觉雷达为核心的自动驾驶方案

鉴智机器人推出3D感知新范式BEVDet ,提供以视觉雷达为核心的自动驾驶方案

北京鉴智机器人科技有限公司(以下简称为“鉴智机器人”)成立于2021年8月,公司基于软硬协同优化,专注自动驾驶传感器计算与下一代自动驾驶方案的研发和应用。成立2月内,鉴智机器人完成数千万美元天使轮和Pre-A轮融资,其天使轮融资由Atypical Ventures领投,地平线战略跟投,金沙江创投跟投;Pre-A轮融资由五源资本领投,全体老股东持续增持。

根据东吴证券的数据,预计到2025年,全球自动驾驶(辅助)功能的汽车出货量(包含L1~5级)为6332万辆,其中L1为3900万辆,L2为2320万辆,L3+为60万辆;2020~2025年的CAGR为17.8%。与单车自动驾驶相关的革新性部件,其市场总额会从2020年的171亿美元大幅提升到2025年的781亿美元,2020~2025年的CAGR可达35.8%。

在鉴智机器人联合创始人都大龙看来,随着自动驾驶等级从L2向L3的提升,责任主体由人到车,在三维空间中运行的自动驾驶车辆对行车环境的信息理解能力亟待提升,从仅对关键信息(人/车等)的感知到行车环境事无巨细的3D层面的感知和理解。当前的自动驾驶方案均没有达到L3的等级,80%以上的自动驾驶事故来自于感知,由于对于行车道路空间结构不理解、非标异形等集外物体未识别等原因导致,比如追尾异形特种车辆、撞入马路隔离带等情况。一种很直接的方式是通过激光雷达解决形成环境3D理解的问题,但激光雷达存在远处目标点云分辨率低、高速行车下帧率不足、受外界环境影响大等问题,当前普遍使用的激光雷达点云分辨率远小于图像。

鉴智机器人选择构建眼脑协同的基于视觉雷达思想的自动驾驶感知框架,通过视觉为主的stereo camera和周视camera恢复整个空间的立体结构,并直接在立体空间中进行感知与理解。

鉴智将自动驾驶视觉感知分为两个层面,low level vision和high level vision,前者关注图像成像和3D立体视觉的计算,将推出双目/多目的视觉雷达标准硬件产品,而后者则聚焦基于视觉雷达3D感知预测和规划,将形成视觉为主的强单车智能的高级别自动驾驶方案。相关自动驾驶眼/脑产品均会在2022年上半年推出。

视觉雷达是可扩展的模块化眼脑协同3D感知范式

日前,在自动驾驶权威评测集nuScenes上,鉴智机器人提出的纯视觉自动驾驶3D感知新范式BEVDet,获得纯视觉3D目标检测世界第一的成绩。NuScenes数据集是自动驾驶领域使用最广泛的公开数据集之一,也是目前最权威的自动驾驶纯视觉3D目标检测评测集。此前参与nuScenes纯视觉3D目标检测评测的厂商包括丰田研究院(TRI)、华为、理想汽车、商汤科技、MIT、清华大学、香港中文大学、CMU、加州大学伯克利分校等国内外知名企业和研究机构。

参与nuScenes纯视觉3D目标检测评测的厂商

对于鉴智日前提出纯视觉自动驾驶3D感知新范式BEVDet。都大龙和算法合伙人黄冠表示,这是首个公开的同时兼具高性能、扩展性和实用性的BEV空间3D感知范式,以BETDet为核心的系列技术,将有希望解决纯视觉自动驾驶量产解决方案中视觉雷达、4D感知、实时局部地图等关键核心问题,未来将应用于鉴智机器人以视觉雷达为核心的高级别自动驾驶等核心产品和解决方案中,为自动驾驶的大规模量产和推广使用发挥关键的作用。

BETDet为核心的系列技术

在技术优势上,该范式具有三个优势:一,BEVDet框架具有高度的扩展性,未来鉴智机器人将基于BEVDet进行扩展,进一步实现视觉雷达、4D感知、实时局部地图等纯自动驾驶关键核心模块;二,BEVDet相比特斯拉等使用的Transformer进行image-to-bev投影的方式,BEVDet拥有更优的泛化性能和更少的数据量需求,预计可大幅度降低对于数据量的需求;三,BEVDet通过更低的算力需求达到同样或者更好的算法效果,可大幅度提高实际自动驾驶系统的算力利用效率。

BEVDet框架拍摄图片

当前自动驾驶技术的发展已经进入下半场,一方面需要解决关键性问题(成像问题、3D问题)推动自动驾驶等级的提升,另一方面需要构建更优的范式充分利用规模化的数据并进行持续升级迭代。

鉴智机器人的业务模式也与其基因匹配,一方面推出双目和多目视觉雷达硬件形成标准化的量产产品,另一方面则基于视觉雷达思想形成强单车智能的高级别自动驾驶软件方案,在推出标准化硬件产品的同时,将软件方案做厚,随时间不断推高公司壁垒,并软硬产品和方案结合从而保证未来利润。公司产品将主要用于乘用车和商用车上。都大龙认为,未来视觉雷达硬件产品和自动驾驶软件方案的整体价格将会在千到数千量级,市场空间巨大。

在商业合作中,鉴智机器人定位于同时面向主机厂和一级方案供应商,提供高性价比、高可靠性的标准化产品、软件解决方案和差异化服务,并已经在与各主机厂、一级方案供应商洽谈相关合作。

鉴智机器人创始团队均来自国内头部AI算法、AI算力和自动驾驶公司。

联合创始人都大龙博士是清华大学创新领军工程博士和中科院计算所硕士,曾任前百度研究院架构师、前地平线算法总监,在百度将CNN以及LSTM序列学习实现突破与大规模落地,两次荣获百度工程师最高荣誉——百度最高奖。其在地平线期间参与定义并大规模落地首款AI芯片,并实现AI解决方案的大规模落地,在AI算法、算力工程化、产品落地方面有丰富的经验。

商务合伙人刘竞秀是清华大学电子工程系学士、硕士和清华大学经管学院工商管理硕士,曾任Xilinx人工智能业务市场总监和深鉴科技商务VP,在Xilinx负责汽车等行业的业务推广,并面向全球头部车厂和主流零部件商提供自动驾驶AI计算方案。

算法合伙人黄冠是中科院自动化所硕士,曾担任多家AI科技公司算法和感知等方向负责人,在国内最早开始深度学习在视觉感知方向的系统性研究和应用,多次获得全球权威AI和自动驾驶比赛冠军。

鉴智机器人已经搭建起在北京和上海搭建起100人规模的完整团队,算法、规控、软件、硬件、算力设计和产品负责人均来自著名AI明星公司和自动驾驶公司。

文末附BEVDet技术报告链接:https://arxiv.org/abs/2112.11790

相关推荐

一场“隔空操控”的营销背后:手机3D视觉产业链真相
自动驾驶的视觉密码,一场隐秘的战事
聚焦工业智能化市场,「微链科技」提供高精度、低成本3D机器人视觉解决方案
最前线 | Mobileye执行副总裁Erez谈纯视觉:高级别自动驾驶要用融合方案
「于万智驾」加速布局无人环卫,资深感知技术专家刘煜加盟任CTO
36氪首发 | 「MYNT AI小觅智能」获蜂网投资千万级pre-B轮追加融资,加速3D视觉感知技术落地
洛微科技开年宣布获A轮融资 基于硅光的激光雷达力求成为终极的产品方案
推动超声波雷达发展,机器视觉公司「导向视觉」已服务新松机器人、达闼科技等客户
依赖国外供应商不是长久之计,「安智汽车」自主研发77GHz毫米波雷达和单目智能摄像头
将视觉感知与运动规划技术结合,「如本科技」要大幅提高机器人的易用性

网址: 鉴智机器人推出3D感知新范式BEVDet ,提供以视觉雷达为核心的自动驾驶方案 http://m.xishuta.com/newsview56313.html