2016年,AlphaGo击败李世石,第三次AI产业化浪潮迎来高潮。如今,五年时间过去,基于深度学习算法的语音识别、人脸识别技术早已进入产业化阶段,在智能安防、智能家居、智慧零售等多个领域广泛落地。
当下,在感知型AI的基础上,AI产业的下一个爆发点,正在逐渐转向认知与决策。语义理解、决策AI成为产业前沿,AI与其他新技术的产业整合,也在持续推进。
在今年的WAIC 2020大会上,国内外科技企业再次齐秀AI肌肉。受疫情影响,WAIC 2020大会在云端举办,未能像往年一样落地上海。然而,在这次大会上,上海却迎来了一项重磅级的AI项目落地。
在WAIC 2020大会期间,商汤科技宣布,上海“新一代人工智能计算与赋能平台”临港超算中心启动动工。该项目是上海市“新基建投资”项目之一,计划于2021年内投入使用。
商汤科技上海超算中心效果图
商汤在上海投入建设的AI超算中心,究竟有多强?
商汤科技官方资料显示,该算力中心占地面积近80亩,总投资金额超过50亿元人民币,一期将安置5000个等效8000W的机柜。算力中心建成并投入使用后,总算力规模将超过3700P FLOPS,可同时接入850万路视频,1天即可完成23600年时长的视频处理工作。
与国内其他超算中心相比,商汤本次投建的AI超算中心,也有所不同。
以往,大多数超算中心的主要应用场景是科学计算,因此,它们大多以CPU作为底层算力单元。如果将这些超算中心用于AI模型训练、推理,其运行效率并不理想。而商汤的超算中心服务于视觉AI算法训练,以GPU作为基础算力单元,在国内,这类形态的超算中心并不多见。
而在软件层面,超算中心需要大规模、分布式、高效率并行的训练平台,以及一整套配套软件体系,如存储系统、数据标注和管理系统等,以实现算法训练、推理一体化的自动部署、评估、测试。杨帆介绍称,这一体系完全由商汤自主研发。
在人工智能行业,业界普遍认为,企业筹建AI超算中心,意味着其亟需获得大量算力资源,才能满足自身业务需求。这也意味着企业将进入AI大批量商业落地阶段。而杨帆则表示,商汤上海超算中心的开工,意味着商汤的AI产业赋能进程进入了新的阶段——从业务商业化到产业开放化。
以超算中心的庞大算力为基础,商汤未来可以有能力为客户及合作伙伴输出更多的底层AI核心能力。“要想让AI赋能产业,不能只靠AI公司一己之力,单打独斗,而是应该开放整个产业生态,让更多人参与到AI改造传统行业的课题中去。”因此,商汤上海超算中心未来也将逐步开放能力,为高校、科研院所及各类合作伙伴提供软硬一体的AI算力支持。
在本届WAIC大会上,除了已经破土动工的超算中心,商汤公布的另一大开放计划,是算法开源。
2018年年中,商汤科技与香港中文大学联合启动了OpenMMLab开源计划,开始将一部分自研AI算法开源化。在本届WAIC 2020世界人工智能大会上,商汤再次宣布将OpenMMLab战略升级为“人工智能算法开放体系”。目前,OpenMMLab人工智能算法开放体系已经开放了100余个算法与600余个训练模型,涵盖10个以上的研究方向。
在本届WAIC上,商汤全新发布了多个开源算法库,包括全新版本的MMDetection物体检测工具箱和MMAction2行为理解工具箱、MMDetection 3D点云感知工具箱等。这些算法适用于高精度高速物体检测、视频理解、抠图、图像修复、人体关键点定位等多个场景。而这些场景,也是目前视觉AI领域最受关注的重点方向。
两年来,商汤的OpenMMLab开源框架已经形成了较为完整的体系和组织架构,可以提供开放的基础技术支持、接口标准和算法框架。这些开源成果也受到了业界的广泛认可。如今,商汤的开源计算机视觉基础库MMCV已经成为视觉深度学习领域最重要的开源库之一。
在开发友好度上,OpenMMLab开源体系提供了丰富的有代表性的算法,使得研究人员复现baselines并与之进行比较的时间和难度大大降低。
在本届WAIC大会上,商汤方面表示,未来还将继续开源更多算法。不难看出的是,商汤目前公开的开源算法大多来自其最擅长的视觉领域。这些算法的开源化,也能让业界避免陷入“重复造轮子”的尴尬境地。
商汤科技成立于2014年,以视觉算法起家。而今,商汤也在尝试探索更多视觉算法之外的AI前沿领域。电竞AI,就是其中之一。
电竞游戏,看似与AI行业相距甚远,但实则紧密相连。训练AI打电竞,也成为了众多AI企业的前沿焦点。例如,DeepMind公司在围棋领域击败人类后,便迅速进入电竞领域,并将目光锁定了暴雪旗下的RTS(即时战略类)电竞游戏《星际争霸2》。
在电竞领域,以《星际争霸2》为代表的RTS类电竞游戏是公认的难度巅峰。玩家既要操控大量前线部队直接作战,还要同时运营后方的基地采矿、造兵、升级科技。因此,RTS电竞游戏对玩家的大局观、战略战术技巧提出了巨大的挑战。
与此同时,RTS电竞游戏也是AI的绝佳练兵场。让AI打电竞,首先要让AI理解游戏画面的内容,这就需要电竞AI具备高效、准确的视频语义理解能力。此外,在理解游戏画面后,电竞AI还要谋划运营策略、攻守时机和部队阵型,这就需要电竞AI具备极强的决策分析能力。
2019年11月14日,DeepMind旗下电竞AI AlphaStar的最新进展登上知名学术期刊《Nature》杂志封面。《Nature》编辑在卷首写道:“《星际争霸2》已经成为人工智能的一个关键挑战,它的复杂性和多玩家竞技模式,让它可以在现实世界形成对照。”
在7月10日的WAIC商汤企业论坛上,商汤也举办了一场主题为“从电竞到AI”的圆桌对话。商汤科技研发执行总监石建萍指出,电竞游戏是一个非常好的决策场景,游戏可以为AI提供非常直接的决策反馈——输或赢。这些决策反馈机制,未来也可以映射到现实世界中。例如,在自动驾驶场景下,车辆遇到了拥堵路段,是选择超车,还是继续跟车等待?这些问题,都需要AI做出决策。
WAIC 2020商汤企业论坛“从电竞到AI”圆桌对话
而商汤也开始在这一前沿领域加以投入。今年5月,有媒体报道称,《星际争霸2》中国冠军选手周航(iA)已入职商汤科技,成为一名AI研究员。“我的简历上写着‘中国冠军’,但没能成为世界冠军。我希望用自己训练的AI,在将来战胜我以前没有战胜的对手。”在当天的圆桌对话中,周航表示。
在电竞之外,商汤选取的另一个AI前沿场景,是融合了虚拟与现实的MR技术(混合现实)。日前,商汤宣布推出了融合AI、MR(混合现实)的增强现实平台SenseMARS,为MR从业者提供AI算力赋能。
例如,在本次WAIC 2020大会上,商汤科技就打造了一个MR展区。参会人员可以通过平板电脑等设备,在开幕式外的走廊区域看到现实中“并不存在”的虚拟展区。这一虚拟展区的“照片墙”上呈现出了历届WAIC精彩演讲等画面,还有虚拟的MR座头鲸在场馆内遨游跳跃。受疫情影响,本届WAIC大会并未设置实体展区,但基于MR技术的云展区,却可以让观众获得近乎实景的观展体验。
WAIC 2020上的MR展区
此外,商汤科技的AI技术还为本次大会带来了更多“虚拟”能力。例如,商汤为WAIC主办方提供了“AI背景助手”解决方案,让与会嘉宾在远程演讲时可以形成统一的视频背景画面,或通过全息影像的形式出现在大会现场。该技术通过AI实现画面检测,并自动识别人物与背景,以便进行背景替换。马云、苏世民等嘉宾都是通过全息投影的方式参与了开幕式环节,极大提升了现场观众的参会体验和观看感受。
与此同时,商汤科技还定制了一座实体“数字人”展台。在这一展台上,商汤的数字人导览员“小糖”搭载了AI深度学习能力,可以通过AI仿真动画技术,模仿真人生成惟妙惟肖的会话表情、动作。
WAIC 2020上的数字人展台
不难看出的是,无论是MR展区、AI背景助手还是“数字人”展台产品,都得益于视觉AI算法、MR虚拟现实技术等多项前沿技术的产业落地。而这种“底层技术-前沿探索-产业赋能”的全链路模式,也正在成为商汤科技未来探索的方向。
在底层技术上,商汤近年来积攒了大量核心算法。在今年的视觉AI顶会CVPR 2020上,商汤已有62篇论文入选。商汤本次在电竞AI、自动驾驶等决策型AI领域的探索,正展现了其更广泛的技术创新方向和应用布局。
而在产业赋能上,随着AI超算中心的动工及后续投产,商汤将获得澎湃动力加持。从底层的算力、算法积累,到OpenMMLab开源计划及决策型AI等前沿应用探索,商汤科技已经打通了整个产业生态链条。当人工智能进入新的产业阶段,商汤也将继续推动AI在各个产业的持续商业落地。
相关推荐
建超算中心、开源核心算法,商汤开辟AI开放战场
北京五道口风云:中关村、华强北之外的“AI新贵战场”
PE投资人:我为什么不投商汤科技
百度CTO王海峰:开源开放是人工智能时代重要发展方向
基础软件+开源,为什么是现在?
从算力、数据、算法、工程化等维度看AI的未来
旷视落子天元:深度学习框架开源,是成为伟大AI企业的第一步
“AI第一股”花落谁家?
旷视为何加入“开源之战”?
2019年不可错过的45个AI开源工具,你想要的都在这里
网址: 建超算中心、开源核心算法,商汤开辟AI开放战场 http://m.xishuta.com/newsview26804.html