编辑:石亚琼
**
5月14日晚,英伟达再次祭出新“核弹”。AI云端芯片市场风云再起。
创始人兼首席执行官黄仁勋在家中厨房举行了GTC 2020 “厨房演讲”,带来英伟达新一代以电流之父(Apmere)命名的GPU架构Ampere,也从厨房烤箱中取出了第一款采用Ampere架构的GPU芯片NVIDIA A100 GPU。
此次发布的NVIDIA A100 GPU,可以说是数据中心级别计算中的“怪兽”。
图片来源:英伟达官网
从GTC2020演讲的摘要可以看出,此次发布的新品定位于加速数据中心级别的计算,NVIDIA A100是 Volta架构的V100 GPU的后继产品。A100的产品核心为台积电7nm,这也远远强于V100使用的12nm,除此之外A100具有542亿晶体管也远远超过V100的211亿。相比于Volta架构的640个Tensor Core,A100减少至432个,但A100支持TF32运算,浮点性能156TFLOPS。显存方面,A100搭载HBM2显存,频率从1.75Gbps提升到了2.4Gbps,位宽较V100增加了1024bit达到5120bit,容量也达到了40GB。从计算能力、显存大小等方面对比,A100已经称得上是“怪兽”。
AI运算由云端训练开始,其后是以FPGACPUGPU+云计算为核心的云端推理过程最后导向设备端推理。英伟达的张量核心技术对AI产生了显著的加速效果,通过A100将AI的云端训练时间从数周直接降至以小时计算,希望为云端推理过程带来了巨大的加速度。
黄仁勋表示,云计算和人工智能的强大趋势正在推动数据中心设计发生结构性的转变。
NVIDIA A100带来计算能力的巨大提升将 提高数据中心的整体运算能力从而降低整个数据处理中心的成本。A100已经进入微软协助语言模型的搭建,后期也将会进入世界领先的高等教育机构以及云计算领域的各个巨头。
此次A100发布,距离上次V100发布已经过去4年时间。
2017年5月,加州圣何塞,一年一度的NVIDIA GTC大会。CEO黄仁勋穿着标志性的皮夹克,带来了当时被成为”史上最强显卡“ 的NVIDIA Tesla V100 。作为当时深度学习上游训练端的大杀器,也为NVIDIA 带来丰厚商业回报。公开信息显示,2019年底再度刷新季度销售记录。
与英伟达NVIDIA Tesla V100赚的盆满钵满相对比的是,搭载这款处理器的服务器售价超高昂,既基本闭源,又基本难以提供人力支持。一时间,AI开发者 ”苦NVIDIA Tesla V100 久矣“。
36氪了解到,虽然A100主要面向AI领域,但国内大部分AI科研机构对于A100高昂的价格望而却步,本次推出的DGX的Ampere服务器,每台售价为19.9万美元。一位香港中文大学计算机视觉科研人员告诉36氪,“大部分高校科研机构还是比较追求性价比的。AI研究中诸如需要在神经网络中使用3D卷积等技术的项目会比较苛刻的计算负载要求,A100可以带来很大的的帮助。但是比如我们的实验室就在使用几十张RTX2080Ti,也基本可以满足我们的云端训练要求。”
事实上,以中国为代表的亚洲市场,AI产业快速发展。伴随着人工智能应用场景的多元化,新算法、新模型不断涌现,模型中的参数数量呈指数级增长,因而对算力的需求越来越大。根据Tractica调研预测全球AI芯片市场规模将在2025年达到726亿美元,增长率达到46.14%。OpenAI预估算力需求每3.5个月翻一倍,每年近10倍。
过去几年,中国国内的AI芯创行业近年来热度不减AI芯片一直是近年来国内人工智能领域的热门方向,包括阿里、腾讯、百度、华为等巨头,商汤、旷视、依图等专注CV的公司,寒武纪、地平线、深鉴科技等芯片初创公司在内的众多企业均有入局。
在云端训练芯片市场,英伟达凭借优秀的产品生态以及计算能力占据头部位置,英特尔、亚马逊、阿里云等企业在下一环节的云端推理中占据一定市场份额。国内目前云端训练芯片的主要玩家包括华为、寒武纪、燧原科技等。寒武纪主要从AI云端推理芯片切入,燧原科技从AI云端训练芯片切入。华为昇腾910芯片架构采用7nm+ EUV工艺、32核达芬奇,半精度达到256TFOPs,功耗为350W,针对包括边缘计算、自动驾驶车载计算、训练等场景,对英伟达V100系列产品构成了一定的威胁。2019年国内部分通讯企业选择了华为昇腾910,与此同时,昇腾910也从印度的科研、企业等方向开展海外拓展。
事实上,NV和黄仁勋也十分注重亚洲市场,他说:“目前,亚洲是世界上对数据中心需求最大的地区。PC 革命、企业运算都发源于美国,美国也曾受益于企业运算,美国赶上了所谓的时机。而云计算和移动计算发源于亚洲,中国的云计算和移动计算是非常先进的。例如中国有腾讯、阿里巴巴、美团、抖音等这些大型企业。”
图片来源:英伟达官网
有人认为,过去四年,NV一直未升级V100,主要原因是市面上并未出现新的进展对手。但去年开始,形势正在发生变化。2019年8月,华为推出全新昇腾910芯片,国产芯片性能上有了极大的提升。补充华为晟腾910的进度。近日,中国移动发布了2020至2021年人工智能服务器产品集中采购候选人情况,华为以第一份额中标1000台Atlas 800 AI服务器,华为昇腾910芯片击败英伟达V100为中国移动人工智能提供算力支撑。外界认为,这些也在一定程度上给到NV压力。
不过, A100问世,国内AI芯片公司尤其是云端AI芯片公司迎来强敌。AI方面,华为昇腾910半精度 (FP16)算力为256 Tera-FLOPS,整数精度 (INT8) 算力达到512 Tera-OPS,两者均低于NVIDIA A100 312Tera-FLOPS及624Tera-FLOPS。昇腾910达到规格算力所需功耗仅为310W低于设计规格的350W,而A100则达到400W。
根据以往惯例,这种冲击可能仍有一段缓冲期。一方面,目前A100仍处于较高的价位,近20万美金的售价目前也只有不缺钱的大企业以及实验室可以进行更换,这也许可以给国内企业迭代一个档口期。另一方面,提供本地化服务是中国AI公司的优势。
网址: 焦点分析 | 英伟达推出“算力怪兽” A100 , 国产云端AI芯片们如何破局 http://m.xishuta.com/newsview23058.html