12月13日-15日,36氪WISE2021新经济之王峰会在上海举行,今年我们以「硬核时代」为主题。“硬核”是当下时代和大环境带给中国新经济企业的挑战和机遇,一方面要求企业关注技术创新,找到自身“硬核”壁垒;另一方面要求企业回馈社会,展现更多“硬核”责任与担当。在从商业模式创新的“应用时代”迈向技术创新的“硬核时代”之际,我们与上百家硬核企业汇聚一堂,聚焦宏观政策、智能制造、半导体、新能源、新消费等热门赛道,全方位探讨各领域如何构建以创新驱动的硬核竞争力。
在WISE 2021峰会上,商汤科技联合创始人、副总裁杨帆分享了他对 AI 产业的最新洞察,他谈到,如今产业对人工智能提出的需求已经愈发深入和细化,比如对高铁上零部件缺陷做检测以实现提效,“这是3、5年前我们所不敢想象的极其细颗粒度的需求”。
随着需求侧在大量的碎片化、复杂化,另一方面,数据的供给侧正在成为一种全新的生产要素。整个社会积累的、沉淀的数据量正在保持极大的快速上升势头,如何面对这种全新的生产要素、怎么去定义它的所有权和使用权,是行业需要解答的共同问题。
为了应对数据的爆发式增长,科研界正在尝试将通用的预训练的大模型与更多海量的数据整合在一起,然后用更加复杂的网络架构去训练AI的模型。
商汤科技联合创始人、副总裁杨帆
杨帆认为,过去几年,算法生产就像流水线被导入了整个生产体系。这条流水线会变得更加自动化和智能化,并以更加通用的模型去提供基础性的支撑。“从数据的收集到算法的生产,再到整个应用的闭环体系,通过大量的自动化工具,让整个成本产生量级的下降,支撑它的效率得到进一步提升。”杨帆谈到。
这也是商汤在着力推动的通用基础设施建设:商汤打造人工智能的通用基础设施SenseCore商汤 AI大装置;其中,在上海在建的基础设施商汤智算中心AIDC,很快将于今年年底投入试运营,其3740 Petaflops(1 petaflop等于每秒1千万亿次浮点运算)的峰值训练算力,将对未来AI算法的创新和服务的提供非常大的基础支撑。
“我们相信通过人工智能大型的基础装置,能助力AI产业不断的技术升级,将更大范围的群体、行业场景纳入这样一个闭环体系中来,加速整个社会人工智能产业的发展。”杨帆说到。
杨帆:尊敬的各位朋友,大家好!
很荣幸今天能够有机会借36氪的邀请,来跟大家分享一下,商汤在人工智能这个领域,也结合市场近几年的一些发展和变化,我们的一些思考,对未来趋势的一些理解,以及为此我们所做的一些工作。
刚刚牛总介绍里也有提到,如果我们去看中国最近的五年,整个科技创新,其实拔高到了一个前所未有的高度上,这一点实际上也是跟整个国家的经济环境,经济进一步发展所需要的核心的硬核技术息息相关。
在这一点上,其实我们可以看到,人工智能一直以来到最近的一轮产业化浪潮,都被大家认为是助力全产业链提升、经济要素生产率提升关键的工具型的技术。为什么这么定位呢?一方面是因为我们能够看到人工智能技术的应用会非常的广泛。另一方面我们也会看到中国今天发展AI,有着大量的优势。
不仅仅是在政策上的优势,它对于各个产业都能够形成这样一个巨大的杠杆, AI产业的发展也会助力到其他产业的持续发展,我相信这也是过去的6、7年整个AI受到社会各界高度的关注、重视的一个很重要的原因。
在这个基础上,我们看看走到今天,人工智能产业面临什么样新的趋势或者说挑战,下一步我们需要解决的问题是什么?首先我们可以看到,今天伴随着人工智能产业技术应用的逐步深化,其实我们在各个行业、各个产业越来越多地去进行着更加深入的渗透。
我们可以看到,今天行业中对于人工智能技术所提出的这样一些需求,已经越来越深化和细化了。比如我举的这个例子,高铁上零部件缺陷做检测,去实现它整个的提效。这是3、5年前我们所不敢想象的极其细颗粒度的需求;再比如说智慧城市,这也是国家在过去十年重点强调的、推动的,为了让整个城市更加有温度,能够给人民带来更好的一种宜居的环境,它所推动的这样一些系统化的工程。在这个中间我们其实也会看到大量的、多场景、散碎需求的存在。
我们今天看到人工智能经过五年的一个快速发展,我们看到伴随着它产业的需求进一步深化、渗透的提高和需求的复杂化和细化,那我们今天面临的挑战是什么?一方面,当你的场景更加的复杂化和细化之后,技术的通用性不够好,就需要更多的、更大量的对于这种细碎技术的研发和生产。另一方面,今天人工智能的技术整体的生产成本还是很高的,很多时候一些需求没有办法得到满足,最根本的一个原因是成本太高了,作为一个企业,去做这件事儿不划算,算一算账算不过来。
我们再把这一点展开去讲一讲。
第一个我们去看需求的复杂性,这一张照片中解读出的信息,看起来已经很多了。但实际上我们去想一个人每天能接触600个物品,假设我们把3个物品组合成一个动作的话,一个人每天可以去被定义出来的动作有3000多万种组合方式。我们今天人工智能的技术对于这样量级的问题的理解和解决的能力,实际上还是有着非常大的差距的。
包括说我们在各个场景中其实也可以看到长尾的技术需求,我们今天如果要更好的去解决行业中的问题,会面临大量的应用场景很细碎,但是又很重要、不得不去解决的这种技术问题。
另一个方面,大家都知道今天数据的成本首先就很高,标注数据需要大量的成本,收集数据也需要大量的成本。
除了数据的成本,还有算力的成本,今天伴随着技术进步,我们对于算力的消耗,也存在上升的趋势。
刚才讲的是需求侧我们看到的趋势,一方面是需求在大量的碎片化、复杂化,另一方面是我们今天解决这个问题的成本仍然非常高昂。我们再换个角度看看,供给侧几个典型的趋势,第一数据的供给,一方面是数据量。今天我们都知道说人工智能时代或者说科技时代,数据正在成为一种全新的生产要素,有别于农业时代的土地、工业时代的能源、IT时代或者说智能时代的数据正在成为一种全新的生产要素。
一方面,今天整个社会积累的、沉淀的数据量在保持一个极大的快速的上升的势头,但另一方面,面对这样一种跟过往所有的生产要素都同的全新要素,我们到底应该怎么去定义它?怎么定义它的所有权?怎么定义它的使用权?我们怎么有效的去使用它有效的保护它?其实这些都是在今天业内没有达成一个共通性结论的问题。
过去的土地作为生产要素,它是不可以被轻易复制的;能源作为生产要素,它也是不可以被轻易复制的。数据这个东西很有意思,它的生产成本很高,但是它的复制成本非常低,它的流通和交换可以极大的把它的要素的价值带来一个指数级的提升。这样的一些特点都是过去生产关系中的要素所不具备的。
这种情况下,我们怎么样面对数据这样全新的要素,怎么更好的去定义它、更好的去使用它,在企业、高校、政府各个组织之间,我们怎么让它更有效的去流通?这是我们未来一定会去面临的新的挑战和课题。
除了数据,我们讲算法,AI最核心的供给、AI最核心的价值就是算法。算法在过去的3年一个很明显的趋势,就是我们需要更加通用化的算法,我们希望人工智能它除了去解决特定的问题之外,它对于更加通用、更加泛化的问题能够给出更好的结论。
而实际上我们可以看到,科研界也已经找到了方向,就是通用的预训练的大模型就是我们把更多海量的数据整合在一起,然后用更加大更加复杂的网络架构去训练AI的模型,这样的模型对于更加通用化的问题可以形成一个表达,最典型的GPT-3,我们知道今天的自然语言理解,它通过GPT-3这样的模型,已经可以跟人类去进行非常自如的信息的交换。
包括商汤,包括业内一些同仁也在做的,比如说在视觉上,对通用的外部环境的感知和理解上,我们是不是也同样存在着这样通用性的超级的大模型,能够帮助我们去解决前面所讲的场景碎片化的问题。这个实际上是学界最近几年的一个共识,也是产业界在高速推进的方向,这种通用大模型,它的一次性成本很高,但是当你真正用它去解决成千上百个细碎问题的时候,它的成本会被极大的摊薄,我们希望通过它能够有效的解决今天算法生产或者今天技术创新成本太高的问题。
另外一个AI重要的要素就是算力,它应对数据的爆发式增长,要对算法规模的持续规模化,很重要的就是算力一方面保持高速的增长,一方面需要整个算力成本的快速下降。
我们可以看到,过去摩尔定律说每18个月集成电路上半导体晶体管的数量翻一倍,那人工智能的算法它所需要的算力,在过去的五年,每三个多月都要翻一倍,所以对于算力的需求,其实是一个极大的增长。
我们也在说未来的科技创新,需要更多的计算的资源作为承载它的一个基础设施,同时在这个过程中,我们要不断思考的是怎么样规模化的计算资源它的成本更低、它的效率更高、它的能源使用更经济更环保。
前面讲了,如果去看AI的产业在过去三年我们看到的一些趋势,一方面在需求侧整个需求的碎片化和多样化,以及今天的生产成本、技术创新的成本仍然非常高。另一方面在供给侧,我刚刚着重讲了数据、算法和算力三个维度的一些增长。同样,我们看到的是产业的分化在加剧这种细分场景的应用类企业去寻找到一些更好的空间,包括整个行业中会有更多的人、更多的企业逐步的去理解AI这件事情,能够参与到产业分工中来。
面对这样的趋势我们应该做什么?我这里列了两件我自己认为非常重要的事情,今天的时间关系,我主要就讲讲第一件,这也是商汤其实从去年开始在去着力推动的一件事情,就是我们人工智能的通用基础设施SenseCore AI大装置。这个通用基础设施它能够实现什么价值呢?
我打一个比方,今天我们把科技创新、把算法生产如果比做一个工业时代的织布,我们实际上是经历了三个阶段,或者说工业革命实际上我们是经历三个阶段的。
从最开始手工式的、家庭工厂作坊式的生产,这个应对到科研创新和算法生产,就是十年前去搞一个技术创新可能是高校一个大学老师带着几个学生做一个课题,一做做一年做两年,最后是不是能够在特定的时候拿到这样一个结果,存在很大的不确定性,时间周期也很长,而且是分散化的。
过去的五年我们经历了什么?算法生产变得专业化了,大数据、大算力、平台化的方式能够去支撑到这样一些算法生产,它就像流水线被导入了整个的生产体系。
未来的趋势是什么?我们对未来的理解,那就是这条流水线它将变得更加自动化和智能化,就是我们刚才讲的,用更加通用模型去提供基础性的支撑,我们对于从数据的收集到算法的生产,再到它整个应用的闭环体系,通过大量的自动化工具,让它整个成本有量级的下降,支撑它的效率能够进行进一步的提升。
这个是我们定义说人工智能的大装置所具备的价值,当然商汤做了自己的大装置,业内的一些其他同仁也有做类似的平台和系统,我们一般理解这个东西会分几个层面:底层的基础设施、中间核心的大规模的软件工具体系以及上层海量的模型和算法的应用。
这里面我们认为最有价值的,或者说最具备创新想象力的实际上是上面大规模的模型和算法的应用。因为人工智能本身就是一个通过海量模型去对各个行业提供应用服务的这样一种技术,只有我们把更多的算法和模型变成积木一样的模块组件的时候,它实际上对于未来,我们更多在各个场景中去提供技术创新、去提供价值创造,它才能够形成这样一个更好的积淀和沉淀。
这个是我们在上海在建的一个底层的基础设施商汤智算中心AIDC,在今年年底马上就会投入试运营,3740 Petaflops(1 petaflop等于每秒1千万亿次浮点运算)的峰值训练算力,它会对未来AI算法的创新和服务的提供非常大的基础支撑。目前已经建成国内最大的应该是1000 P,3740应该也是整个亚洲从规模体量来讲,最大的专用的人工智能计算中心。
同样,我刚才讲说平台层,需要平台的系统化去支撑大的模型、大的系统,以及整个完善的系统工具链,就是人工智能的一个算法生产从数据开始到训练,再到把它部署到各种不同形态的硬件上,去完成大量的适配工作,让它真正能够被用起来,实际上是一个长链条的、多环节的一整套的流水线工作,那我们怎么能够让这件事情更加的自动化、更加的低成本,去带来更大的效率提升。
对于上层大量的算法,商汤花了非常多的精力我们去做算法的开源,像OpenMMLab开源大概两年左右的时间,它实际上已经给业内非常多的同仁和朋友,提供AI技术创新的一些支撑和能力。而这样一些开源的算法体系,我们相信在未来对于整个产业的创新更大规模的一个扩散和辐射,一定会带来更好的价值。
当然商汤去做这样人工智能的大装置,很重要我们一开始就是自己内部,我们这么多的不同的业务单位,他们在内部的一整套的工具体系,我们今天所做的大量行业场景中的应用创新,都是依赖于自身这样一整套的工具和系统。通过我们大量的这种业内的一些迭代和打磨,今天会发现伴随着产业进入到一个新的阶段,其实有机会把这样的人工智能大装置这样一些核心系统开放给更多产业的合作方和合作伙伴,去发挥更多的价值。
这里我简单列了几个,我们今天已经在去探索和尝试的新的价值。比如说今天我们会发现越来越多新的行业的科研,或者其他领域的科研,它们在用人工智能的方式去帮助加速它本领域科研成果的快速产出。中国我们也有很多大型的科研机构在做类似的事情。
另外比如说企业大规模的数字化转型、智能化转型,它其实同样也需要这样一整套完善的基础工具体系,加上闭环式的服务,去帮助它更好的实现它的AI的创新。
我们相信通过人工智能大型的基础装置,能助力整个AI产业不断的技术升级,更大范围的群体、更大范围的行业场景,能够被纳入这样一个闭环体系中来,去加速整个社会人工智能产业的发展,去加速各个行业利用人工智能技术去推动自身的产业效率提升的步伐和步调。我相信在未来的5-10年,AI这个领域的科技创新将会是各行业关注的硬核科技。
谢谢大家!
相关推荐
WISE2021 新经济之王系列榜单暨中国新经济独角兽企业榜单重磅启动!
商汤科技的“无节制”融资与IPO焦虑症
平安医保科技吴东辉:智能技术在医疗健康保障中的应用 | WISE2020 新经济之王医疗创新峰会
专访商汤科技联合创始人林达华:一名AI人才,需要多少栽培?
36氪独家|前「深鉴科技」创始人姚颂发起SEE Fund,瞄准硬科技早期投资
滴普科技董事长兼CEO赵杰辉:滴普科技的数据智能实践丨WISE2021企业服务生态峰会
海松资本陈立光:创业者要如何把握硬核科技创业的黄金时代?
AI巨兽“商汤科技”冲刺港股:三年半累计亏损242亿,首次披露自研AI芯片
印象笔记副总裁刘璨:第二大脑再升级——布局智能硬件新趋势 | WISE2020 新经济之王新消费峰会
元璟资本田敏:科技驱动的医疗器械变革 | WISE2020 新经济之王医疗创新峰会
网址: 商汤科技联合创始人、副总裁杨帆:AI领域的科技创新将会是各行业关注的硬核科技| WISE2021新经济之王峰会 http://m.xishuta.com/newsview55801.html