编者按:本文来自微信公众号“甲子光年”(ID:jazzyear),作者:王学琛,36氪经授权发布。
作者 | 王学琛
编辑 | 火柴Q
2020年以来,在全球经济羸弱的大环境下,也有一些赛道脱颖而出,为长线布局的资本和创业者带来结构性机遇。
一个动向是,此前在中国市场不被看好的开源以及数字基础设施层的项目,成为不少科技赛道投资人的关注焦点。
这里的数字基础设施,指云计算基础设施、基础层数据存储与处理、云原生代表技术,且这类公司和产品多以开发者为用户,即做的是to D市场,开源是常见模式。
尽管外部环境萧瑟,一些国内外“数字基础设施”类项目仍频频传出逆势融资的消息。
2020年4月,物联网大数据平台涛思数据(Taos Data)宣布完成超过1000万美元的A轮融资,这是其今年完成的第二轮融资;云管理软件及服务提供商骞云科技,同样在2020年第一季度完成两轮融资。
AI、5G、IoT等技术革新不仅带来应用层的创新,也会带来数据感知、传输、存储、处理等基础层技术变革。而数字基础设施领域更容易诞生通用机会。
算法的投资热潮正在过去,基础软件的投资热正在来临。
这背后,也是整个AI、数据技术投资逻辑的变化。
今天的文章,我们会分析造成这种转向的各种因素。
历来中国VC都有跟风美国的“习惯”。目前基础软件在国内火也有这个因素。
我们先来看看美国基础软件市场欣欣向荣的现状及其崛起环境。
美国市场经历了完整的信息化、云化、智能化浪潮,基础软件设施领域已经跑出了很多公司。
已上市的公司中,MongoDB和Elastic两家明星开源公司股价一路飞涨。
数据库公司MongoDB在2017年10月上市,截止2020年5月26日市值已超126亿美金,2020财年的收入超过4.2亿美金。即使在疫情期间美股遭受史诗级重创的情况下,MongoDB依旧保持了20倍以上的PS(市销率)。
在2019年4月,MongoDB还斥资3900万美元收购了面向应用程序的开源数据库Realm,扩充自己的移动解决方案工具库。
数据搜索公司Elastic 2018年10月在纽交所上市,市值已超50亿美金。Elastic成立于2012年,因其开源搜索产品 Elasticsearch而闻名。
未上市的公司同样表现不错。
2020年5月,开源数据库Cockroach Labs收获D轮8700万美元融资,至此CockroachLabs已经累积了超过1.951亿美金的融资。
开源平台Confluent也在2020年4月完成了E轮2.5亿美元融资,至此Confluent累积融资额已突破4.559亿美元,是行业内未上市企业中累积融资额最高的企业。
成立于2012年的云计算自动化平台HashiCorp在2020年3月获1.75亿美元的E轮融资,估值达51亿美元。
HashiCorp称其收入已经连续四年同比增长超100%,每年的客户数量也在翻倍,有超过100个《财富》500强公司在使用他们的产品。而HashiCorp有85%的员工分布在全球各地进行远程工作。
美国市场的蓬勃离不开大数据与云计算的背景。可以说,整个基础架构的增量和变革都在美国率先发生。
2003、2004年Google发布的GFS和MapReduce论文,全面揭开了大数据的时代序幕。
亚马逊最先入局云计算,AWS已上线16年。
云的普遍使用带来了程序运行环境的升级,技术创新潮流一波接一波,包括集群技术,流计算,数据库,容器技术和机器学习等。
最先的潮流是云计算基础设施,主要集中在容器和kubernetes技术。
容器好比IT世界里的“运输集装箱”。上云第一步就是要将物理资源虚拟化,在容器技术出现之前,虚拟化都是用虚拟机来完成,容器是轻量级的虚拟化,最常见的容器引擎就是2013年崛起的Docker。
除了 Docker 对容器进行创建外,还需工具对容器进行编排, kubernetes就是这个工具。Kubernetes 源于 Google 内部的Borg项目,Google使用Go语言重写后将其命名为 Kubernetes,并在2014 年6月开源。之后,Kubernetes在众多厂商和开源爱好者的共同努力下迅速崛起。
与此同时,作为基础设施的数据处理框架也在完善。
Google的论文催生了大数据计算框架Hadoop,Spark从Berkeley大学的AMPLab实验室诞生,Kafka从LinkedIn诞生,Facebook也把大数据查询引擎Presto开源出来。
此外是深度学习框架以及配套工具。研究热潮之下,开源深度学习框架层出不穷,如Google在2015年开源的深度学习框架Tensorflow, Facebook开发的PyTorch、Caffe。中国互联网企业也推出了自己的框架,如百度的PaddlePaddle、小米的MACE、腾讯的ncnn等。
从资本层面看,一个重要的触发点则是近两年开源原厂和IaaS大厂之间的长期矛盾,甚至在近年发生了一些纠纷事件。
例如云服务商“一哥”亚马逊接连受到不少创业公司的质疑,并在去年发生了开源创企“六大门派围剿光明顶”事件——2019年4月,7家创业公司在硅谷召开会议,主题就是如何针对亚马逊提出反垄断诉讼。
原因是亚马逊复制其他科技公司开创的软件,并集成到AWS,AWS自己作为IaaS厂商收到了钱,但是费用并未分给原厂。
也是在这个长期矛盾之下,很多开源原厂修改了其开源许可证,从开源变为“源码可用”,不能集成到云等服务中,目的就是防止云服务商“薅羊毛”。
IaaS厂商和开源原厂的博弈和上述游戏规则的变化,一方面导致大厂开始自研数字基础设施技术,但另一方面也出现了一个对创业公司的利好——开源基础软件的退出窗口豁然打开,因为大厂开始通过“买买买”补充生态。
一个有力的买方首先是IaaS大厂。例如微软以75亿美元收购GitHub,IBM在以334亿美元收购Linux巨头RedHat(红帽)。
另一类买方是志在云转型的to B巨头,如Salesforce此前以65亿美元收购集成平台服务提供商MuleSoft。
实际上,一直以来,开源软件做大之后对大公司来说都有很好的并购价值,最典型的案例就是Android之于Google。
而今基础架构的革新,对创业公司和VC来说都是一轮基础软件的新机会。
转眼看中国市场,基础软件创业热确实有跟风全球趋势的因素,但也存在本土逻辑。
和全球趋同的是,云计算普及和开发者数量的增加也是中国市场不可阻挡的趋势,且中国的发展速度和未来空间冠绝全球。
根据IDC发布的报告,2019-2023年中国公有云IaaS年均复合增长率将达46%,预计到2023年中国IaaS市场规模将达到2087亿元人民币。
到2024年,50%的大型中国企业将在容器、开源和云原生应用开发方面依赖于第三方服务提供商。
此外,开源项目的商业价值正在逐渐被中国资本市场认可。
这一方面是因为欧美已跑出了成功的商业模式。
目前开源的收费方式大概包括以下3几种:
一是提供技术支持及咨询服务,如Red Hat(红帽)。这家成立于1993年的公司主要出售基于开放源代码Linux操作系统的软件和服务,主要盈利方式为红帽免费提供开源软件,但向客户收取维护、支持和安装等服务费用。
不过这种商业模式是项目制,很难规模化,“红帽模式”并不容易复制。
更为常见的方式是是Open-Core,即核心代码开源,商业版套件收费。
因为大部分企业客户在下载源代码后都需要购买额外功能才可规模化使用,这种方式相当于用免费的代码吸引开发者,来取代传统软件业的营销投入,再卖付费的其他功能。
最后一种是云服务的Hosting(托管)模式——开源厂商将其服务托管在公有云平台上,开发者付费给IaaS厂商,IaaS厂商再分一部分给开源原厂。
这种模式的问题是,实际上作为渠道的IaaS厂商最初过于强势,比如AWS改改源代码就说是“新产品”,自己收钱。但在经过原厂的强硬抵制后,云托管已逐渐规范,成为行业惯例。
数据公司Databricks、开源软件服务公司Acquia都是这种模式。
开源项目被中国资本市场认可的另一原因是,国内IaaS大厂也有收购开源项目的意愿。
例如早在2017年阿里巴巴投资欧洲开源数据库MariaDB,有分析称这是阿里巴巴“在海外领域最引人注目的云交易”。
而本土利好因素之一则是,中 美贸易摩擦下的国产替代。
中国市场每年进口3000多亿美金的底层技术,自主可控和进口替代为底层技术投资带来机会。
例如数据库领域国产替代正如火如荼,一家独大的Oracle数据库的阵地正在被侵蚀。
在数据库技术社区墨天轮的国产数据库排行榜中,已有 PingCAP研发的TiDB、阿里体系下的OceanBase和PolarDB等国产数据库开始占据重要份额。
墨天轮国产数据库排行榜
关系型数据库之外,从新型的图数据库、到向量搜索引擎、深度学习框架等领域,也涌现了一批中国的基础软件团队。
其中有创始人刚刚当选Linux AI 基金会新一届董事会主席的数据处理公司Zilliz,他们目前主打的产品是向量搜索引擎Milvus;
即将发布开源深度学习框架OneFlow的一流科技;
由Apache 软件基金会项目Apache Kylin核心团队创建的AI增强数据仓库公司Kyligence;
今年三个月内完成两轮千万美元融资的物联网数据服务商涛思数据;
新一代云数据仓库偶数科技;
处理和存储知识图谱的图数据库Neo4j;
容器PaaS服务商DaoCloud道客云、灵雀云、飞致云、时速云;
私有云服务商EasyStack和聚焦IaaS层的ZStack。
……
另外是“新基建”政策红利。
“新基建”概念2018年底首次被提出,并于2020年4月20日被明确范围。其中信息基础设施包含:以5G为代表的通信基础设施,以云计算、AI为代表的新技术基础设施,以IDC为代表的算力基础设施。
各个互联网巨头开始摩拳擦掌。阿里云刚在今年4月20日宣布未来三年将投2000亿元,用于云操作系统、服务器、网络、芯片等核心技术研发和数据中心建设。
一个月后,腾讯云也在5月26日对外宣布,五年投5000亿元,剑指新基建。
在昨天(5月28日)最新公布的腾讯AI新基建架构中,其包涵了全域安全、加速网络的“云基支撑”层和包涵了算法核心框架、深度学习工具组件等的“算法平台”层,就是对应着数字基础设施的建设。
腾讯云公布了AI新基建的整体布局,即“一云三平台”架构,一云是指腾讯云,三平台包括算法平台、服务平台以及开放平台。
5G也是中国市场的变量——5G可能会带来无人驾驶、VR/AR、远程医疗、工业物联等新应用,也会带来数据感知、传输、存储、处理等底层技术的变革。
开源在大数据时代曾在美国市场繁荣,如AI、5G、IoT的浪潮是中国的机会。
基础设施公司创业潮,也显示出近两年AI创投的动向:从应用层往基础层迁移。
CSDN论坛,alice_tl:《AI的架构与核心》
在起于2016年的这一波AI创业热潮中,中国市场最初最受追捧的是以算法为核心的公司。
它们多以通用算法起家,如以人脸识别起家的商汤、旷视,以语音技术起家的云知声、思必驰等。
不过从商业上看,在走向市场的过程中,算法本身面临很大挑战。
这首先是因为当前的深度学习仍是弱人工智能,其表现非常依赖数据环境,而AI的训练测试数据跟实际场景中的数据有很大落差,这就导致预训练的算法真的落地具体场景时,做不到“开箱即用”,需根据不同场景的数据特征做调参。
所以,做通用算法的公司,除了在一些个别场景——如安防领域大规模的人脸识别等——领域能有用武之地,很难再开拓新市场。
而当AI公司迫于生存和市场压力,从通用算法转向深入场景,踏实做行业产品和服务后,又面临难复制、难以规模化的瓶颈。
因为在核心的算法能力之外,AI公司还不得不处理场景里纷乱的数据,开启“设置框架、喂数据训练、调参数、喂数据训练、再调参数”的循环,派驻工程师驻场,养起人数众多的实施、部署、服务部门。
这直接影响的是AI公司的毛利率。
硅谷顶级风投机构Andreessen Horowitz(A16z)曾调查发现,毛利率低几乎是全球 AI 公司的共性——AI企业毛利率通常在 50-60%,远低于 SaaS 企业 60-80%以上的毛利率。
另一方面,如今算法能力已不再稀缺。
各大科技巨头和学术会议每年产生着大量的开源通用算法——自然语言处理(NLP)领域,Google在2018年发布的BERT预训练模型已在多项任务上取得了优异效果;“科创板AI第一股”计算机视觉算法提供商虹软科技也在2018年推出虹软视觉开放平台时就宣布永久免费。
可以说,算法类的创业公司,确实偏离了资本最初对平台型、通用型发展机会的预期。这中间,是投资人被忽悠了,还是从业者自己也雾里看花?
相比而言,数据理解、数据处理等更基础的环节,理论上能诞生跨行业的通用型机会。这也是现在大家开始“跟风”看这个领域的原因之一。
但处于发展早期的中国基础软件市场,也面临很多不确定性。
不确定性首先在于,中国的to D市场很不成熟。
To D其实可以算to B的一个子类,虽然使用者是开发人员,但付费方还是开发者所在的机构。
而中国市场付费能力最强的机构是政府和大型企业,其中还有不少国企,它们更偏好私有云或行业云,对公有云上的开源系统有安全性等顾虑。
另一方面,基础软件创业也受限于中国的低信息化水平。
从比例上看,较于美国,中国开发者数量仍然很低。波士顿咨询发布的报告数据显示,美国每万人AI人才密集度约为中国72倍。
此前我们在与一位阿里云业务负责人交流时,他就提到国内除互联网和金融之外,国内别的行业的信息化水平与国外“天差地别”。
比如中国某Top3的大型钢铁企业,一共没几个能做IT开发的人,这在国外成规模的制造业企业是不可想象的。
所以,“基础软件+开源”虽在国外已有先例,但国内能否复制还要打个问号。
其次,基础软件创业公司的成长周期长,非常考验公司持续融资能力。
也因此,现在活跃在此领域的投资机构多为存续期长的美元基金。
总的来说,这条以往少有人走的路,正吸引着人才和资本跃跃欲试,想象空间不小。
相关推荐
基础软件+开源,为什么是现在?
开源:用To C时代网络效应的打法做To B基础软件
基础架构软件的创业之道
互补品与V型战略:为什么商业公司这么舍得投入开源软件?
黑客暗网叫卖Zoom账号密码,17年前开源软件现在又火了
36氪独家|「Zilliz」获4300万美金全球开源基础软件最大单笔B轮融资
开源是自由的,永远
36氪专访 | 云启资本陈昱:开源模式是用多倍杠杆撬动企业服务赛道
36氪首发 | 开源网安完成数千万元A轮融资,聚焦软件安全产业
为什么在AI领域,不开源会被骂?
网址: 基础软件+开源,为什么是现在? http://m.xishuta.com/newsview24140.html