投资企业新闻

启明星 | 新基建下什么是面向未来的核心科技?隐私计算

2020/05/07 | 福布斯中国

编者按:大数据隐私计算平台公司锘崴科技创始人、隐私计算科学家王爽日前在福布斯中国撰文称,在当下的“新基建”时代,我们不仅强调掌握数据的重要性,更强调“盘活”数据的重要性,也就是数据共享的必要性。但更为重要的是,在扩大数据共享的时候,推进数据隐私保护也同等重要。

史上最大一笔针对数据隐私的罚款日前尘埃落定。社交网络巨头Facebook因剑桥分析公司(Cambridge Analytica)滥用数据丑闻,被美国政府处以50亿美元的罚款。
 
25亿用户源源不断地为Facebook创造数据,这些数据是Facebook成为今天的Facebook的制胜法宝。接下来Facebook必须实施更为严格的数据隐私策略,以确保不再重蹈覆辙。
 
可以预见的是,只有隐私计算技术才能实现数据分享流转中“可用不可见”,实现数据资产可确权、可共享和可复用。
 
01/
越来越凸显的数据孤岛
 
事实上,随着“互联网+”的飞速发展,不管是从全球,还是中国来看,类似Facebook这样的用户,也存在于我们周围,甚至就是我们自己。们每天都会在搜索引擎、社交媒介、电商平台上留下超乎想象的数据体量。同样地,企业端、政府机构等也在不断地产生数据。
 
然而,主要是出于自身信息安全保护的考虑,内部零散的数据资源与外部无法融合,加上物理连接缺失,数据库和数据结构彼此无法兼容,这些原本有价值的数据被束之高阁。
 
新冠肺炎疫情爆发初期,疫情信息无法快速有效地被追踪统计以供决策,在物资调用分配中全国有大面积地区的医用防护服、医用口罩以及护目镜等重点物资难以得到满足。
 
之所以会形成这种局面,最重要的因素便是数据信息链上下游的“数据孤岛”效应,使得市场信息无法快速精准地反馈到全局统筹决策调度部门,导致生产企业不能真切地捕捉到各地的应急需求,从而形成市场供需的短期错配,以及对物资在运输过程中遗失风险的难以把控。
 
由此可见,如果我们能在数据共享协同治理这一短板方面有所突破,我国产业数字化势必会迎来质的飞跃,传统产业的转型升级乃至国民经济的更高质量增长,都将因此而提速。
 
而这一愿景,恰恰呼应了4月9日中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》中强调应“加快培育数据要素市场”中所阐述的三个部分,即推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护,这一切都表明我们正迎来一个全新的浪潮。
 
02/
新基建,让数据活起来
 
在当下的“新基建”时代,我们不仅强调掌握数据的重要性,更强调“盘活”数据的重要性,也就是数据共享的必要性。
 
在我们看来,无法共享的孤立数据仅仅是数据,能够流转的数据才能成为数据资产。谁能打破数据孤岛壁垒,让数据流转起来,谁就掌握未来数据资产时代的密钥和先机。
 
让“孤岛”之间相互连通并不难。然而,这样的构建下存在着极大风险。举个例子,某信贷机构需要对客户进行授信评估,它依赖于外部大数据公司进行联合建模,得到信贷的风控模型。然而,在信贷机构、大数据公司和第三方沙箱环境共享数据的过程中,有极大的可能性造成用户信息泄露和模型暴露,对企业的信誉和资产造成损失的同时也可能侵犯个人隐私权。除此之外,仅仅链接“孤岛”而不维护这条通路不仅会造成“用数据难”的矛盾,还存在共享效率低、有实时性差等缺点。
 
因此,如何让“孤岛”链接得更好,让数据共享更精准、更有效率,才是这个时代赋予数据共享的真正命题。
 
03/
硬币的两面:扩大数据共享与加强隐私保护
 
我们必须意识到,在扩大数据共享的时候,推进数据隐私保护也同等重要,因为它起到为数据大规模共享保驾护航的作用,只有两者并重才能真正做到互相扶持、齐头并进。想要共享数据,就必须承担数据泄露或权益无法保障的风险;如若不然,则只能守着有限的数据资源望洋兴叹。
 
现阶段,锘崴信隐私云计算平台已经能较好解决这一困局。它能够在确保企业或数据源权益的同时,打破数据孤岛,为数据赋能,高效、安全、充分地实现大数据全面流转,守护并解锁数据的价值。其核心技术使原始数据“足不出户”(不离开数据源边界),只传输加密的中间计算结果,成功分离了数据的所有权和使用权,既保证了数据的安全性,又保证了 “数据可用而不可见”的效果。
 
比如,最近通过锘崴信隐私云计算平台的支持,以上海某三甲医院为牵头的多家医院全国首次实现了在个体基因数据不需要给出各参与方医院的前提下,进行基于多中心的强直性脊柱炎的基因数据的联合精准分析。基因数据的隐私敏感性远远高于其他生物医学数据(如临床数据或医学图像数据),这是因为单纯的数据脱敏和信息去身份化并不能有效阻止病人敏感的基因信息的泄露。科学杂志的研究表明只要几十个统计学上独立的基因位点就可以被用来唯一的确定一个个体的身份。不仅如此,对于基因数据来说,一旦被泄露,受害的则不止被信息被泄露的当事人,还包括他们的血亲,因为他们拥有相似的基因片段。因此,基因数据的隐私保护在数据共享中的重要性和难度可见一斑。锘崴信隐私云计算平台所支持的该强直性脊柱炎多中心基因数据分析研究成果刚刚被生物信息学顶级期刊Briefing in Bioinformatics接受。该成果证明锘崴信隐私云计算平台在保护数据隐私和推动不同疾病的协同基因组研究方面的巨大潜力。(作者王爽为锘崴科技创始人、隐私计算科学家)

 

来源 | 福布斯中国