即将爆发,2021年隐私计算进入商业落地元年
隐私计算(Privacy Computing)又称隐私增强计算(Privacy-Enhancing Computation)或机密计算(Confidential Computing),隐私也即是信息安全中的机密性。
按照普遍定义,“隐私计算”是指在处理和分析计算数据的过程中能保持数据不离开本地环境保障安全性,同时让数据需求方获得计算结果,有利于突破数据保护与产业应用的难题。 在Gartner发布的2021年9项重要战略科技趋势中,“隐私增强计算(Privacy-Enhancing Computation)”无疑是较为亮眼的一项。
Gartner认为,到2025年至少有一半的大型企业机构使用隐私计算,以在不受信任的环境和多方数据分析用例中处理数据。这意味着巨大的市场潜力正在酝酿。
隐私计算成为新风口
据毕马威推出的《2021隐私计算行业研究报告》显示,隐私计算受大数据融合应用和隐私保护的双重需求驱动,中国市场规模迎来快速发展期。预计3年后技术服务营收有望达到100亿元至200亿元的规模。
隐私计算行业的发展意味着新投资赛道的诞生。如今,头部互联网企业、金融机构、区块链公司、初创型科技公司等“玩家”已纷纷入局,探索隐私计算技术。 目前,各互联网巨头企业均在隐私计算领域加快布局,形成跨业务、多团队、强支撑的发展态势。2019年,蚂蚁金服、腾讯、百度纷纷推出了各自的MPC(安全多方计算)产品。其中比较有代表性如:腾讯、微众银行分别在今年推出了自己的隐私计算平台。
2021年4月,腾讯发布了自研第四代数智融合计算平台“天工”,采用自研隐私计算技术。凭借该技术,腾讯大数据相关团队获得iDash 2020世界隐私计算大赛冠军。据了解,金融级安全强度的腾讯隐私计算技术已广泛应用在医疗、金融风控、数字政务等众多领域。
今年5月,微众银行发布了最新大数据隐私计算平台WeDPR-PPC,其最大特点是具备亿级数据集处理能力、毫秒级端到端响应延时和敏捷低代码可视化编程功能。
巨头之外,初创型科技公司正在成为隐私计算赛道的主力选手
从投资机构布局来看,不少VC、PE已入局,包括红杉中国、IDG资本、基石资本等。据天眼查App数据不完全统计,从2020年至今,至少已有8家隐私计算企业获得融资,大多集中在B轮融资及之前。
例如:洞见科技在今年年初完成数千万元Pre-A轮融资,投资方包括心元资本、元起资本等。星云Clustar于今年5月份完成1100万美元A+轮融资,投资方包括基石资本、华泰创新等。融数联智于今年6月完成了新一轮融资,贵州云上大数据基金参与了该轮投资。
图片来源于中国软件网整理
值得关注的是,不久前北京国际数据交易所(简称“北数所”)宣布成立,这也是国内首家新型交易范式的数据交易所。除北数所外,还有不少有地方政府背景的数据交易所也在酝酿新的动向。
隐私计算进入商业落地元年
从技术角度看,隐私计算最大的特点是实现数据的“可用不可见”。目前隐私计算领域主流的技术路线包括三类,即多方安全计算(MPC)、联邦学习、可信执行环境(TEE)。其中,前两种方式主要是在软件和算法层面实现隐私计算,而可信执行环境则是基于硬件实现。
相关政策的发布,也让隐私计算的重要性愈发凸显。
工业和信息化部早在2016年年底发布的《大数据产业发展规划(2016-2020年)》中就已经提出,支持企业加强多方安全计算等数据流通关键技术攻关和测试验证。
工信部《工业大数据发展指导意见(征求意见稿)》也提出在工业领域积极推广MPC技术,促进工业数据安全流通。 2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将数据和土地、资本、劳动力提升至同样的生产要素高度,明确指出了市场化改革的内容和方向。
这一系列“组合拳”下来,极大地推动了基于“隐私计算”的数据共享产品的应用落地。如今,隐私计算技术的应用场景越来越多,尤其是在金融、医疗和政务领域。
在金融领域,国内隐私计算产品主要应用于金融风控和获客,即多家金融相关机构在不泄露客户个人信息的前提下,对客户进行联合画像和产品推荐,在多头借贷等场景下能有效降低违约风险。
以洞见科技为例,去年与中诚信征信联合发布了见智安全计算平台,以“零缓存”理念升级其征信数据服务,同时开放安全多方计算和联邦学习等功能给其智能风控客户。合作的内容主要是联合数据提供方,在各方数据不出私域的情况下,进行联合风控建模和联合营销筛选。
医疗行业也成为隐私计算关注重点。隐私计算能够有效助力医学影像识别、疾病筛查、AI辅助诊疗、智能问诊咨询等。例如多家医疗机构可以通过横向联邦学习联合构建目标检测模型,用于辅助通过医疗图像的疾病检查(如肺部X光片检查等)。
此外,通过隐私计算技术,医疗机构与保险公司之间也可以在不共享原始数据的情况下,分析投保者的健康信息。 政务行业有望成为隐私计算下一个应用重点。隐私计算提供了政府数据与电信企业、互联网企业等社会数据融合的解决方案,有助于政府数据开放,实现精准施策。
例如在某地,通过腾讯安全提供的联邦学习平台,实现了政务、银行、企业的三方的协作建模。在疫情期间对小微企业进行了精准画像,模型的AUC提升了40%,实现了企业综合评估、银行授信和政府贴息全闭环,大大降低了信息不对称导致的成本,提升了资金流转的效率,促进了产业政策精准落地。
此外,一些隐私计算服务商还与政府机构合作,例如地方城市的数据能力开放平台建设和面向中小微企业的融资服务对接平台建设等,通过隐私计算和区块链计算,提供安全合规的平台建设方案。
有业内分析人士指出,在保护数据隐私的背景下,2020年成为隐私计算的技术元年,2021年则是隐私计算的商业落地年。
隐私计算发展仍面临挑战
虽然市场潜力巨大,但隐私计算整体还处于初期阶段。与此同时,隐私计算作为新兴技术,也面临着一些亟需解决的现实问题。
首先,隐私计算技术性能还难以满足大规模商用要求。 虽然目前隐私计算的性能已经大大提升,但由于其加密机理复杂、交互次数多,当流通的数据量较大或结构较为复杂时,计算效率问题仍然未能解决,特别是对于复杂算法的联合建模效率仍然难以令人满意。
其次,隐私计算技术市场难以迅速培育。
相对于其巨大的市场前景,目前隐私计算技术的市场还远未成熟,而市场环境的培育也呈现出较大的难度。一方面,由于隐私计算技术复杂且常常呈现“黑盒化”现象,大部分用户对隐私技术难以理解和信任。另一方面,隐私计算处理的对象往往是敏感的数据资产,试错成本大,从而更加增加了用户的接受成本。
再次,目前大部分企业的数据规范性和数据质量难以支撑隐私计算技术。
由于隐私计算算法敏感度较高,因此对参与方的数据规范性和数据质量要求也较高。此外,隐私计算多用于跨企业甚至跨行业的数据流通,会有包括数据使用方、提供方等在内的多方参与主体,对参与方的数据一致性也提出了较高要求。
最后,现有法律法规未对隐私计算地位进行明确定位。 例如,《中华人民共和国网络安全法》中规定“未经被收集者同意,网络运营者不得向他人提供个人信息”,同时设置了“经过处理无法识别特定个人且不能复原”的例外条款。
将个人信息用于隐私计算是否属于这一例外条款,法律法规及相关标准等并无明确界定。
然而,由于隐私计算仅仅避免了原始数据转移的过程,但仍然完成了基于多方数据的计算,使得其在某种程度上依然破坏了消费者的隐私。这正在成为制约隐私计算发展的无法回避的问题。
整体来看,目前整个隐私计算相关技术处于最初期阶段,在数据安全、基础建设、商业模式等方面,仍存在诸多难题和挑战。
但不可否认的是,隐私计算行业的市场潜力巨大,未来发展不可估量,无论是监管部门、第三方机构还是技术参与方,都在共同筑造数据价值和数据安全共享的生态圈,很可能会在未来几年迎来爆发期。