Hi!请登陆

大数据产业迎来隐私保护法规,该如何解决

2021-3-1 37 3/1

隐私保护与大数据之间的矛盾

近几年大数据产业发展越来越快,各行各业都在将大数据应用于自身的发展之中,同时这个时期也诞生了很多数据采集和收集的公司。诚然,大数据确实对人类的生活产生了很大影响,使得社会发展更加高效和进步,但是这在一定程度上也涉及到了人们的生活隐私的利用和泄露。

大数据的隐私保护是很多人所关注的,一方面隐私数据需要被收集并加以研究,以改善用户的体验水平,另一方面个人隐私数据也需要得到保护,很显然这是一个很难调和的矛盾。即使一些人愿意贡献出自己的隐私数据,但是这只是一部分样本,缺乏完整的参考,而那些有着强烈隐私意识的人,则在生活中遇到不少的麻烦,无法高效的获得自己想要的东西,因而处于不断抱怨之中。

传统隐私保护技术的缺陷

隐私保护是一个讨论比较多的话题,在法律层面上来说,个人的隐私是受法律保护的,因此在实际生活中,人们也不断探索隐私保护和数据利用双赢的解决方案。

对于企业来说,可能会想到设置隐私数据访问权限,并设置一系列规章制度来实现,但是这也存在着流程过于繁琐。虽然这些方法可能也会在大数据分析方面带来一些效果,但是目前应用场景有限,同时这些年来针对这种方式的隐私保护也逐渐形成了一套比较系统的破解方法,比如利用整体统计数据变动带来的差异性,从而推算出个人的隐私信息,这样就使得部分数据能够被泄露出来。

比如你知道了一个10个人的小公司所有人平均年龄是30岁,但是你却不知道每个人的年龄,之后公司里进来了一个新员工,平均年龄变成30.27岁,那么就可以知道新来的那位员工年龄为33岁。如果只是隐藏每个人的年龄,不做其他数据改变的话,是没有任何效果的。

差分隐私技术解决隐私与大数据利用的问题

差分隐私技术(也称为DP技术)是近几年来发展的一项比较新的隐私技术,主要就是为了应对隐私数据被破解而诞生的。差分隐私主要的原理是通过在数据中添加拉普拉斯分布的噪声来保护原始数据的,这个噪声就相当于干扰数据。

拉普拉斯噪声是有一定规律的一组数据,通过这种方法可以使破解难度有很大的提升,由于添加拉普拉斯噪声的数据使整个数据结构发生了比较大的变化,从而使得个体数据难以被破解。

具体的结果就是在查询数据的时候由于噪声的干扰,从而无法泄露个体信息,但对于整体数据而言,由于大数据研究的是大样本,具有一定的规律性,应用于大数据产业中还是有用的,数据所反映的真实情况并没有因为添加噪声而受到干扰或误导,因此即使查询到的数据不够精确,也不会产生明显的影响。因此在大数据研究的时候,这些数据进行一定的处理之后就可以直接使用了。

Oasis Lab 差分隐私技术的应用

由于差分隐私技术对隐私保护和大数据利用方面有着非常好的效果,目前Oasis Lab利用这项技术并结合区块链已经提出了完整的相关解决方案,并且适用于主流的SQL数据库。这样就使得传统SQL数据库应用商可以将自己的系统使用Oasis Lab的差分隐私控制功能,从而实现隐私数据的管理。

差分隐私技术应用场景非常广泛,比如在汽车等复杂的工业领域,近几年来人工智能自动驾驶成为一个热门领域,对于自动驾驶的研究需要搜集大量的驾驶数据,并进行AI训练,但是随着欧洲的隐私保护法规的实行,数据的保护也成为一个不可忽视的问题,隐私保护和数据利用成为了一个重点探索的课题,而利用差分隐私技术,就可以实现隐私数据的AI训练应用,并且还能够保护数据不被泄露出来,同时结合区块链技术,使得数据的查询和使用都加以规范化,并记录在区块链上,使得无法篡改,这样做就可以为数据的使用进行溯源,以便后期方便审查而不出现泄露事件。

总结

虽然隐私保护和大数据利用本来是两个矛盾的事物,但是在差分隐私和区块链的融合之下,Oasis Lab最终能够做出完整的解决方案,这不仅仅对于汽车行业来说有积极的作用,而且对于各行各业的研究和应用都有很大影响,可以期待的是这也将对人类生活水平的提升有很大促进作用。

相关推荐