作为2020年最具热度的大数据话题,“隐私计算”持续得到社会各界的关注 — 这种可以使数据真正成为生产要素的技术手段,既提升了数字经济的想象力,同时也让众多企业在保护数据源隐私的前提下得以真正发挥大数据的价值。
在需求的推动下,不到两年的时间里行业已出现许多家隐私计算公司,均在讲述让数据“可用不可见”的故事。
其中,华控清交信息科技(北京)有限公司(以下简称华控清交)的特点略有不同 — 该公司是由清华大学于2018年6月通过转化姚期智院士和徐葳教授的科研成果而发起成立的校办企业,前高盛全球合伙人张旭东先生出任CEO,清华大学徐葳教授担任首席科学家。该公司是专注于研究、开发和建设基于现代密码学和博弈论的大数据安全融合与流通技术、标准和基础设施的企业。
从过往经验看,在多数行业中打造基础设施都不是一件易事,这对公司的技术、产品以及行业生态的思考均提出考验。在日前与36氪的一次交流中,华控清交CEO张旭东解答了外界关于隐私计算深层价值以及华控清交切入方式的一些问题,同时也分享了公司两年多以来的进展。
数字经济时代到来,大数据人工智能等前沿科技不断涌现,全球数据量和数据节点数量呈现爆发性增长的趋势;海量数据的价值已经无可厚非。在政策端,数据也被作为新型生产要素写入文件,与土地、劳动力、资本、技术等传统要素并列为要素之一。
但数据作为生产要素,存在前置的限制条件。尤其是明文数据,复制成本低,传播速度快。明文数据一旦被泄露或复制,就无法限制其用途和用量,无法杜绝数据被滥用的现象。明文数据在传递和使用过程中的无限供应和无限使用使其供需曲线无法形成单一交点,导致明文数据很难通过市场供需进行定价,并形成大规模的市场流通。再者,当数据需要大规模流通,关于权责利的划分也是另一个问题,这使得各方不愿不敢不能共享数据,从而造成数据孤岛现象。因此,在传统的明文计算体系下,明文数据流通是个无解的伪命题。
科技是第一生产力,隐私计算技术的发展让数据流通成为可能。根据大众对隐私计算的了解,这个新兴技术包括了基于密码学、安全性经过严格数学证明的多方安全计算技术,数据脱敏、差分隐私和联邦学习等明文体系下的数据隐私保护技术,以及基于对执行计算的硬件信任的可信计算技术。
其中多方安全计算技术早在上个世纪就已经被提出,然而仍然停留在理论阶段。自从2014年,清华交叉信息研究院徐葳教授就开始带领学生研发基于姚期智院士奠基的多方安全计算理论的密文计算体系,通过技术手段将数据的可见的具体信息和不用看见就可以进行计算的使用价值分离,实现了数据“可用不可见”和用途“可控可计量”。这里包含几层意思:首先,“可用不可见”防止了数据在使用过程中的信息泄露,使其无法被非授权复制和传播;第二,结合用途“可控可计量”,使数据的具体使用权和使用价值与数据所有权分离;第三,这样数据的使用价值就具体地体现在它的计算结果上了,定价的不再是数据本身,而是针对具体应用场景的计算结果。因此,通过市场供需进行定价和大规模流通的既不是明文数据,也不是数据所有权,而是得到计算结果所需的数据特定使用权。
数据流通的本质不是数据特定使用权的直接转手或传递,而是通过一个市场配置与整合多方数据资源(包括算法、模型、参数),通过算力和带宽进行加工,将计算结果交给结果需求方的过程。在数据流通过程中具体定价和交付的是计算结果,就是为了防止计算结果需求方把明文数据原料拿回家使用时进行复制、传播和滥用。
数据流通所需的数据“可用不可见、可控可计量”技术开发要求较高,在使用时需要消耗较大的计算和通讯资源;实现单一应用的技术门槛和建设使用成本往往高于使用收益。建设数据流通的基础设施才能大幅降低数据流通的技术门槛和使用成本,实现规模经济。举个例子,消费面包和蛋糕最简单和便宜的方法是去面包房买而不是自己在家做。
基础设施,意味着底层、通用和大规模。华控清交从底层原理和实现技术架构层面做了大量工作,主要集中在两个方面:通过对密码学理论实现、底层协议、分布式计算、系统、编译、算法和芯片等全方位的持续优化和创新,把多方安全计算的性能耗费从明文的5-6个数量级降低到了目前的10-50倍,并创造了明文和密文的混合运算。根据公司介绍,这带来的效果是大幅提高计算性能和应用灵的活性,大幅降低多方计算的应用成本(时间耗费),实现了多方计算实用化,同时创造了一套用于开发制造隐私计算应用的通用平台,较大程度降低了开发隐私计算应用开发的技术门槛,使掌握通用编程语言的普通程序员就可以像在明文环境里一样开发“数据可用不可见”的隐私计算应用。据介绍,华控清交在工程上实现了每小时几十个TB级的纯密文多方安全计算规模,正在向PB级进发。
据了解,2019年9月中国国际服务贸易会期间,华控清交自主研发的多方计算平台及其应用就已低调展出。日前,华控清交首席科学家徐葳教授在公开论坛发言中也提到,这支团队已经实现了从密文计算协议延伸到不同类型的计算协议,并支持国密标准、可扩展性和自动化运维等一套完整的平台。只需开发一套多方计算的框架,数据、算法和算力解耦,就可以适配各领域不同的应用场景。
既然是底层基础设施,就需要有相应的上层应用。为了让系统更容易对接,最大程度降低开发学习曲线,让不懂密码学的开发人员能够直接调用基于密文的计算函数和分析工具。华控清交多方计算平台封装了约400个密文计算函数库,这些函数库涵盖了各种逻辑函数、深度学习和联邦学习等基本操作。同时,该平台支持SQL、Python编程接口以及SDK客户端,能够自如开发,灵活对接数据,其积木式拖拽建模也大幅降低了使用门槛。
当通用产品平台降低应用门槛,隐私计算大量普及也成为了可能。从这个角度,华控清交的又像是一家提供隐私计算“产品流水线”的公司,将来能够为更多的隐私计算厂商提供服务。例如,专注于开发上层应用的隐私计算公司可以在华控清交提供的基础设施之上进行开发。
基础设施也会帮助建设健康有序的生态。每个新兴领域的发展都离不开来自于行业内部的推动。根据介绍,在不久前由中国人民银行发布的《多方安全计算金融应用行业标准》,华控清交全程领导参与撰写,希望促进金融行业MPC应用的持续健康发展。这一金融行业标准的发布为各金融机构间及机构内部进行安全的数据共享、联合查询、联合统计、联合建模、联合预测以及精准营销等提供了依据。
不仅如此,华控清交也在积极探索隐私计算技术在各行各业的实践应用。比如,早前中国互联网金融协会发布的金融业数据要素融合应用研究报告中有关于理财合格投资者认证的典型金融应用场景正是通过华控清交的多方计算平台来实现的。在这个场景中,个人投资者在购买资管产品时,必须对投资经验和所持金融资产进行声明承诺,因而需要向金融机构申请开具资产证明、收入证明等进行合格投资者身份认证。而这一过程,不仅会涉及个人资产数据隐私泄露,同时还给金融机构带来巨大人力审核成本,并且存在监管风险隐患。华控清交实现了在保护申请者数据隐私的前提下,自动联合计算金融资产或收入状况信息,判断投资者所开具的资产证明信息是否属实,同时全流程可验证、可追溯、可解释、可审计、可监管。在帮助金融机构减少人工成本,提升风控能力的同时增强合格投资者认证监管的穿透力和有效性,提高监管效能。
在金融行业中,数据往往具有极高的价值和敏感度,华控清交多方计算平台可在人脸识别支付环节起到保护人脸隐私的作用,“在人脸数据库里查询人脸信息时,查询方和数据库运营方互相不暴露自己的信息,避免人脸特征数据库信息泄露的风险,从而使人脸数据拥有方能够放心地将数据分享出来共同使用。”公司介绍。至于联合建模,可以帮助多家金融机构将彼此的信息融合,一起进行人工智能分析和监测,从而获得更完整、细致和精准的欺诈“画像”,提升金融机构反欺诈能力。
此外,在政务领域,华控清交多方计算平台也广泛应用于穿透式监管、政务数据开发利用等实际场景,帮助政府实现各部门间数据共享交换安全不泄密,推动跨地区跨部门和跨行业的信息共享合作等。
结合上文介绍,华控清交现阶段生产制作具体应用的目的更多是为了树立“标杆应用和标杆客户”,即向市场和行业展示和证明华控清交隐私计算“生产流水线”的作用和效果。“只有把隐私计算做成‘白菜价’,它的的社会价值才能真正实现。”这是张旭东的观点,也是华控清交希望为市场和行业做的事情。
相关推荐
华控清交:打造通用平台,提供隐私计算“生产流水线”
华控清交CEO张旭东:数据“可用不可见”和“规定用途用量”,让数据真正成为生产要素
华控清交:解析数据安全融合平台的运作逻辑以及应用场景
打造隐私云计算平台,锘崴科技想让医疗、金融数据安全分享
36氪研究 | BAT都不放过的淘金机会,隐私计算能长出平台吗?
潮科技 | 隐私计算应用场景详解
提供智能语音解决方案,「华控智加」专注服务2B&2G客户
从生产到采购,「华秋电子」围绕电子工程师打造产业互联网平台
保险业“富士康”调查:流水线生产保险规划师,培训5天就上岗
36氪首发 | 「洞见科技」完成2000万元天使轮融资,隐私计算领域再入新兵
网址: 华控清交:打造通用平台,提供隐私计算“生产流水线” http://m.xishuta.com/newsview38403.html