DxChain中文博客

DxChain: 建立数据安全新生态


编者按:11月30日,中国主流媒体金色财经发布了关于DxChain的专访内容,深入探讨了DxChain对于数据安全的看法以及如何构建数据安全新生态。请参考下面的采访内容。
(金色财经专访内容)

数据泄露猛如虎。

8月28日,华住集团旗下连锁酒店发生用户数据泄露。有人在暗网出售1.3亿华住旗下酒店入住用户数据包,泄露数据总数达到5亿条。数据来源包括华住官网注册资料,酒店入住登记信息以及酒店记录三类。信息主要类型为姓名、身份证号、家庭住址、内部ID号以及1.3亿人身份证等信息。

“如果我们详细想一下华住的数据泄露事件,就能发现,泄露数据的范围可能集中在在外工作打拼的年轻人身上。”DxChain创始人Allan对金色财经记者说到。随后Allan又举了几个近期发生的安全事件。

9月28日,Facebook表示该网站近日遭到黑客攻击,涉及近5000万用户。而在今年3月,Facebook就曾卷入剑桥分析公司不当取得用户个人信息的调查中。

11月2日汇丰银行发布公告,在2018年10月4日到2018年10月14日之间,汇丰银行检测到部分客户账户遭遇未授权的访问,随后暂停该部分账户的在线访问并通过电话或电子邮件通知用户,协助用户更改在线访问凭证。知情人士表示,此次泄露影响了约1%的美国账户,且主要原因可能是撞库。泄露的数据包括部分客户的姓名、账号、电话号码、电子邮件地址、出生日期、余额、账户类型、收款人账户信息、交易记录、账单历史记录等敏感信息。根据,汇丰银行声明称将为受影响的客户提供为期一年的信用监控和身份识别防护服务。

(图源CNN)

“从硅谷到中国,针对数据泄露问题,许多公司都尝试过非常多的解决方案,但都没有完全成功。”Allan补充到。

如今,我们身处互联网社会,信息化程度越来越高,每天通过各类渠道产生的数据多如牛毛,这样庞大的数据量级其中存在着巨大的商业价值,也因此,在数据安全的基础上完成数据行业的生态建设是最好的结果,DxChain团队正致力于将这种愿景实现。

为什么会需要数据防护?

数据安全的重要性目前在用户的认知中差异化较大,但为什么需要数据防护呢,其中的前因后果如何?Allan做出了详细解释。

在我们的互联网商业社会中,巨头公司的产品遍布我们生活的方方面面,整个国际上都是如此,国际的Facebook、Google、Amazon,国内的BATJ、TMD等,其产品在功能上的巨大支撑之一就是数据。

在现代社会中,数据可以看做是石油。在我们生活中,我们的消费记录、行为消息、手机安装软件情况、朋友圈等数据都具备巨大的价值挖掘潜力,尤其对于巨头公司。

例如,腾讯的社交产品作为最主要的数据产生源头,其数据在经过不断的筛选匹配后与其业务可以产生极为细节的关联,而对于其商业联盟则更为重要,微信的各方面数据与京东的消费推荐、网盟广告等都有相互关联的数据支持。

巨头需要数据,所有依托互联网的公司也同样需要,这样,问题就暴露出来了。无论是巨头还是普通公司,其使用数据时,外部会有安全防护,但内部浏览使用时一定不会是加密的,其中处理数据的技术人员可以自己下载数据,这就产生了灰产以及数据泄露的原因之一。

此外,因为数据巨大的商业价值,个人黑客或黑客集团的不断攻击也是数据泄露的重要原因,“因此,对于公司内部服务器的数据,无论宣称有多么好的运维团队防护,备份恢复用了什么方式,技术人员是如何经过训练,这些都难以杜绝数据安全问题的发生。”Allan说到。

数据安全的行业思考

互联网发展的这些年,从原有的单机到局域网,再从互联网到移动互联网,最后是物联网的万物互联。混合式的万物互联时代,每一个接入的节点都是数据生产者,其余的角色则是数据的购买方和收集方。

在拥有数据的企业看来,数据是互联网社会企业的本质竞争力,例如2017年兴起的AI风口,其能力完全来自于对于数据的深度学习。“一个互联网企业的宿命,就是越来越依赖数据。”Allan补充到。

企业是可以选择数据的,或者说可以选择对于数据的安全防护能力,而对于完全的C端用户,则是尴尬的。对于普通用户来讲,只要生活在信息化社会,数据就难以属于自己,并且,对于数据安全的能力几乎为零。用户对于各公司产品和服务的依赖,会让数据的收集越发集中,马太效应过后,一旦出现数据泄露事件,则规模将越来越大,损失越来越严重。

Allan说到:“目前,最需要的就是完成具有数据收集能力和存储能力的企业数据的防护,以及将数据的归属权和使用权还给数据生产者。”

DxChain解决数据安全问题

据Allan介绍,DxChain采用了多链结构,主链在结构中承担了打包、验证、驱动智能合约等功能;而两条侧链分别为存储侧链和计算侧链,存储侧链承担数据存储能力,计算侧链负责处理交易并将交易结果传回主链验证。

在这样的结构设计上DxChain的理论模型可以完全被验证。当用户通过类似百度网盘一样的数据储存方式将数据上传后,DxChain将数据分割成小块,并将每一个块的数据加密,加密获得的key再通过加密算法进行加密,最后加密的数据块和加密的key同时在链上存储。加密算法将数据的归属权固定给数据生产者,数据生产者持有的私钥可以对数据进行解密。

在DxChain上,数据生产者对于数据的管理被写成了智能合约,当数据的购买者和收集者需要数据时,可以通过智能合约和数据生产者进行联系,当双方达成一定条件共识,智能合约即执行,则数据的使用权被数据需求方获得,但数据的归属权仍旧在数据生产者手上。

这样,即使在通过攻击获得了数据包,但没有用户私钥的授权,攻击者仍旧无法使用数据。并且每个数据包都拥有加密,如果需要大量数据的话,其解密工作量会成倍增加,攻击成本直线抬高。

DxChain还有一个精巧的设计,对于数据和资产来说,DxChain将资产层设计在了数据层外围,并且数据和资产都用钱包的加密方式做了加密,如果一旦钱包被解密,按顺序先得到的是可以带走的资产,相比于攻击者的诉求来说,这样的设计可以让黑客忽略数据。

在这样综合的设计下,Allan向金色财经记者描述了DxChain的生态场景。

“在DxChain中,不会存在寡头,而更多的是个体的数据生产者,他们通过智能合约和代币的交易完成数据交换,例如,如果华住需要用户数据,在智能合约的帮助下,用户同意执行,双方的条件都满足,用户则可以将数据传给华住,但华住并未获得使用权和所有权。”

数据的上传方式会让用户有无感的体验,就像一个网盘上传数据一样。而在不同节点或不同矿工角度上,DxChain还将提供大量的调度性的经济激励。“如果在P2P网络中,一个节点的数据包有10备份文件在节点中储存,但其中5个备份文件无法查询到了,为了保证备份数量和传递效率,需要更多的节点来部署备份,主链将发起激励策略,帮助产生更多的备份。”Allan解释到。这也是在P2P存储网络中一直未解决的问题,在区块链的激励机制下,这样的方案已具备可行的能力。

结语

目前,DxChain的测试网Alpha版已上线,主链的出块能力稳定,两条测试链中的存储侧链Beta版已经在内部测试中。Allan还透露,为了适应未来可能面临的生态调整,对于DxChain的开发方式上,已将DxChain的主链侧链等能力全部部署在一个开发堆栈中,这样,每个节点可以选择此节点的功能,更灵活的完成开发目标,同时DxChain也可以通过激励调整每个部署节点中矿工提供存储、计算、验证等能力的变化。

Allan一直从事安全领域的创业,对数据安全充满着憧憬和信心,采访最后,Allan对金色财经记者总结到,“数据安全的解决方案,尤其是针对数据泄露,业界已经有非常多的尝试,但都不够成功,区块链技术对于数据安全的改变一定是巨大的,因为从密码学和IT技术的角度,这个思路我们可以想的非常明白。数据安全是众多行业的死结,以数据为基础的区块链是真正可以解决问题的。”

Author image

About DxChain

DxChain is the world’s first decentralized big data and machine learning network powered by a computing-centric blockchain.