当区块链遇上GDPR

 人工智能的未来     |      2018-07-24 17:42

本文将简单介绍GDPR对数据的赋权与当责,并讨论GDPR与区块链特性之间的关系,以及如何看待在不同类型的区块链上,数据处理者的角色。

2012年起,欧盟针对新兴科技提出数据保护草案,避免个资被企业滥用,规定凡在欧盟境内的成员国都须遵循规范以保障公民隐私,一但违法,罚款可高达2000万欧元或该企业全球年营收的4%,两者取最高金额,该法案称为一般数据保护规范(The European General Data Protection Regulation),下文将以GDPR进行代称。

什么是GDPR?

GDPR于2016年5月24日 生效,但法定有2年过渡期,将自2018年5月25日起开始施行。因此,只要企业经营面对的对象是全球市场,都有可能遇到与欧洲国家生意往来的机会,而必须遵循GDPR。

身为信任机器的区块链,或称全球分布式账本,由于节点之间彼此互通互连,数据也以副本的方式存放在每一台机器上,因此GDPR的相关问题,区块链上也会遇到。本文将简单介绍GDPR对数据的赋权与当责,并讨论GDPR与区块链特性之间的关系,以及如何看待在不同类型的区块链上,数据处理者的角色。

▲分布式账本Chang-Wu Chen

还权于民

GDPR强调用户拥有数据的存取权(Right to Access),数据的被遗忘权(Right to Be Forgotten)以及数据的迁移权(Right to Data Portability)。为了保护个人数据的使用,数据的拥有者必须掌握谁能存取数据,从哪里存取数据,而数据又移转了给谁,而他又能存取哪些数据。简言之,当企业要使用个资时,必须清楚描述数据的使用范围,且有义务进行数据保护,而用户有权要求删除数据或停止使用其数据,甚至决定是否授权数据共享给其他方。

个人数据

首先来看个人数据的定义,只要数据具备与个人相关或可被识别为自然人的条件,就需要被保护。与个人相关的数据像是姓名、地址、电子邮件、电话号码、血型、医疗纪录等。除此之外,Cookie ID,设备ID、MAC地址等都属个人可识别信息(Personally Identifiable Information, PII)。简言之,任何假名数据(Pseudonymous Data)都属PII,只有完全匿名(Anonymous)的数据不受此限。那如果将数据进行Hash或加密运算后才写到链上呢?由于数据在写入时,会与一个账号或地址产生链接性,故匿名数据仍属PII。

跟区块链有什么关系

一:数据的不可变性

区块链天生的特性,使得数据一但上链后,数据就成为链上所有人无法抹灭的共同记忆,想要修改,只能再追订数据。而若要符合定义的数据的被遗忘权,数据又该如何被删除?

二:透明性

区块链上的透明性可从两个角度来分析

(1) 区块链上数据完全透明吗?不一定(2) 区块链上数据都加密吗?不是

你到底在说什么?以下将举以太坊上的一笔交易来进行说明

区块链上的交易会由所有节点所验证或看过,这是什么意思?由于区块链不存在第三方的角色,没有一个中心的角色对数据进行验证与比对,乃交由矿工(Miner)或验证者(Validator)的角色来验证。因此,为了验证一笔交易,交易的发送方是否有足够的金额可以转送,矿工必须要能够看到金额的数量,才能确认这笔交易没有被重复消费过,使得账本具有透明性。又或者,一笔智能合约的交易,由于交易本身必须符合合约的逻辑与规则,因此矿工知道规则为何,使得与合约相关的利益关系人能够互信。因此,交易的金额与合约的逻辑对于验证者角色是具透明性的。

那数据加密的说法又是什么?交易本身除了能进行转账,尚可用于储存数据,而储存的数据可选择明文存放,亦可选择加密后存放。相当于你到银行进行汇款,行员只会检查你的户头余额是否足够转账,至于收据上你要留言什么给收方看,行员并不在乎,留言可以透明,也可以是你们之间约好的暗号。

▲支票内容Chang-Wu Chen

故若要符合数据的保护权?黄色备注栏的部分,又或是绿色转账金额的部分,该如何设计呢?

上述的部分,系以交易的内容来看数据保护,进阶一点再问,如果在合约语言Solidity中,若数据可见范围宣告为private,但没加密,数据是否可存取呢?答案是肯定的

之前我们曾谈到,数据在区块链中是以副本的方式存放在每一台机器上,因此每台机器上都有相同的数据。从程序的逻辑上,确实合约可以检查谁可以存取并修改数据;但从数据存放的角度上,只要能够从硬盘中抓出数据,并且译码,同样能够取出数据,只是没有权利从系统的角度上去进行修改。

三:去中心化与区块链类型

在谈区块链的类型之前,我们先了解数据控制者(Data Controller)或数据处理者(Data Processor)这两个角色。数据控制者系指拥有数据的个人、组织、或联合机构,定义数据处理的方式与目的,而数据处理者系指代表数据控制者如何处理数据的行为。

由于在原生的区块链中,没有中心化的角色,从公链 (Public Chain) 的角度上,找不到数据控制者的角色,但若从 DApp 应用的角度上,由于数据操作的逻辑与目的定义均在合约中,因此合约的组织方是为数据控制者,因此有义务针对个人数据进行保护与删除。

在联盟链(Consortium Chain)上,由于矿工或验证者是经由联盟成员所授权,换言之,数据控制者为这些联盟成员,并且能掌握数量,故数据的保护与删除,需要由这些联盟成员共同协作与处理。

四:如何处理?

了解GDPR与区块链应用的关系之后,为了遵循GDPR的规范,需要考虑:

    采用的是公链还是联盟链? 数据要不要上链? 数据上链后是否需要做对应的处理?例如加密或是去识别化 如何消除账号与数据之间的关联性?断掉数据与账号的链接 是否可改变数据流的方式,由个人主动来发起数据的授权与撤销流程 针对不同数据属性,亦可采取不同的手段。先去解析,数据是属统计数据?还是属于个人数据?如何从效用的角度去保护数据,也同时维护数据的效用度(Utility)?

一些可用的手段:

    Zero-Knowledge Proof Proxy re-encryption Differential privacy

五:结论

GDPR的施行影响范围甚广,为了望眼未来,加上我门公司AMIS提供的业务为BaaS(Blockchain as a Service),我们将继续探索如何提供合规的区块链业务。