第14卷第6期 智能系统学报 Vol.14 No.6 2019年11月 CAAI Transactions on Intelligent Systems Nov.2019 D0:10.11992/tis.201905058 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.tp.20190909.1300.004.html 基于区块链的公共数据电子证据系统及关联性分析 李萌2,刘文奇2,米允龙3 (1.昆明理工大学理学院,云南昆明650500;2.昆明理工大学数据科学研究中心,云南昆明650500;3.中国科 学院大数据挖据与知识管理重点实验室,北京100190) 摘要:针对公共部门提供电子证据时,必须保证数据的真实性和证明力,同时要尽量保护当事人隐私和他人 利益,而从公共数据库中提取电子数据并形成有效电子证据,既是法律难题也是技术难题这一问题,本文在电 子证据可信性的影响因素分析基础上,提出了自动生成中国公共数据库电子证据系统的区块链模型的取证技 术体系,并从司法角度出发,提出了公共数据治理的电子证据生命周期、内容关联、载体关联和智能串并分析 方法。本文的研究在一定程度上保证了司法、公证和公共事务中电子证据的可信性,并实现了从公共数据库中 自动生成证据知识的原型系统。 关键词:公共数据库;电子证据:区块链;关联分析:智能串并 中图分类号:TP391文献标志码:A文章编号:1673-4785(2019)06-1127-11 中文引用格式:李萌,刘文奇,米允龙.基于区块链的公共数据电子证据系统及关联性分析J.智能系统学报,2019,14(6): 1127-1137. 英文引用格式:LI Meng,LIU Wenqi,,MI Yunlong.An electronic evidence system based on blockchain and correlation analysisJ. CAAI transactions on intelligent systems,2019,14(6):1127-1137. An electronic evidence system based on blockchain and correlation analysis LI Meng,LIU Wenqi2,MI Yunlong' (1.Faculty of Science,Kunming University of Science and Technology,Kunming 650500,China;2.Center of Data Science,Kun- ming University of Science and Technology,Kunming 650500,China;3.Key Laboratory of Big Data Mining and Knowledge Man- agement,Chinese Academy of Sciences,Beijing 100190,China) Abstract:When the public sector provides electronic evidence,the authenticity and proof of the data must be ensured, and meanwhile,the privacy of the concerned parties and the interests of others should be protected as much as possible. Therefore,forming effective electronic evidence by extracting electronic data from public databases is not only a legal problem but also a technical problem.Based on the analysis of the influencing factors of the credibility of the electronic evidence,the automatic blockchain model of an electronic data system based on the Chinese public database is pro- posed in this paper.In addition,the methods of life-cycle management,content association,carrier association,and intel- ligent string-concatenation for electronic evidence based on public data are put forward from the legal viewpoint.To a certain extent,this research guarantees the credibility of electronic evidence in judicial,notary,and public affairs,and implements a prototype system for automatically generating evidence knowledge from public databases. Keywords:public database;electronic evidence;blockchain:correlation analysis:intelligent serial and parallel 中国公共数据库系统发展到一定阶段,公共 主数据,并且依法有序地提供给公共部门、公众、 数据资源将成为国家战略资产。有效的数据治理 企业和社会组织综合运用的过程。 是数据资产形成和高效利用的必要条件山。公共 为公众提供优质的公共数据库数据服务是公 数据治理是指在公共部门、公民、企业和社会组 共数据当局的首要任务,提供高可信度的电子数 织所提供的零散数据基础上形成统一的、可信的 据是最重要的任务。其中有一大类电子数据将用 收稿日期:2019-05-28.网络出版日期:2019-09-10. 作相应的公共产品的证据要件,如居民户籍证 基金项目:国家自然科学基金项目(61573173) 通信作者:刘文奇.E-mail:liuweng22l5@sina.com 明、婚姻证明等,乃至司法和仲裁等维护社会公
DOI: 10.11992/tis.201905058 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20190909.1300.004.html 基于区块链的公共数据电子证据系统及关联性分析 李萌1,2,刘文奇1,2,米允龙3 (1. 昆明理工大学 理学院,云南 昆明 650500; 2. 昆明理工大学 数据科学研究中心,云南 昆明 650500; 3. 中国科 学院 大数据挖掘与知识管理重点实验室,北京 100190) 摘 要:针对公共部门提供电子证据时,必须保证数据的真实性和证明力,同时要尽量保护当事人隐私和他人 利益,而从公共数据库中提取电子数据并形成有效电子证据,既是法律难题也是技术难题这一问题,本文在电 子证据可信性的影响因素分析基础上,提出了自动生成中国公共数据库电子证据系统的区块链模型的取证技 术体系,并从司法角度出发,提出了公共数据治理的电子证据生命周期、内容关联、载体关联和智能串并分析 方法。本文的研究在一定程度上保证了司法、公证和公共事务中电子证据的可信性,并实现了从公共数据库中 自动生成证据知识的原型系统。 关键词:公共数据库;电子证据;区块链;关联分析;智能串并 中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2019)06−1127−11 中文引用格式:李萌, 刘文奇, 米允龙. 基于区块链的公共数据电子证据系统及关联性分析 [J]. 智能系统学报, 2019, 14(6): 1127–1137. 英文引用格式:LI Meng, LIU Wenqi, MI Yunlong. An electronic evidence system based on blockchain and correlation analysis[J]. CAAI transactions on intelligent systems, 2019, 14(6): 1127–1137. An electronic evidence system based on blockchain and correlation analysis LI Meng1,2 ,LIU Wenqi1,2 ,MI Yunlong3 (1. Faculty of Science, Kunming University of Science and Technology, Kunming 650500, China; 2. Center of Data Science, Kunming University of Science and Technology, Kunming 650500, China; 3. Key Laboratory of Big Data Mining and Knowledge Management, Chinese Academy of Sciences, Beijing 100190, China) Abstract: When the public sector provides electronic evidence, the authenticity and proof of the data must be ensured, and meanwhile, the privacy of the concerned parties and the interests of others should be protected as much as possible. Therefore, forming effective electronic evidence by extracting electronic data from public databases is not only a legal problem but also a technical problem. Based on the analysis of the influencing factors of the credibility of the electronic evidence, the automatic blockchain model of an electronic data system based on the Chinese public database is proposed in this paper. In addition, the methods of life-cycle management, content association, carrier association, and intelligent string-concatenation for electronic evidence based on public data are put forward from the legal viewpoint. To a certain extent, this research guarantees the credibility of electronic evidence in judicial, notary, and public affairs, and implements a prototype system for automatically generating evidence knowledge from public databases. Keywords: public database; electronic evidence; blockchain; correlation analysis; intelligent serial and parallel 中国公共数据库系统发展到一定阶段,公共 数据资源将成为国家战略资产。有效的数据治理 是数据资产形成和高效利用的必要条件[1]。公共 数据治理是指在公共部门、公民、企业和社会组 织所提供的零散数据基础上形成统一的、可信的 主数据,并且依法有序地提供给公共部门、公众、 企业和社会组织综合运用的过程。 为公众提供优质的公共数据库数据服务是公 共数据当局的首要任务,提供高可信度的电子数 据是最重要的任务。其中有一大类电子数据将用 作相应的公共产品的证据要件,如居民户籍证 明、婚姻证明等,乃至司法和仲裁等维护社会公 收稿日期:2019−05−28. 网络出版日期:2019−09−10. 基金项目:国家自然科学基金项目 (61573173). 通信作者:刘文奇. E-mail:liuwenq2215@sina.com. 第 14 卷第 6 期 智 能 系 统 学 报 Vol.14 No.6 2019 年 11 月 CAAI Transactions on Intelligent Systems Nov. 2019
·1128· 智能系统学报 第14卷 平正义的一类公共产品中的电子证据。与一般的 力是电子证据的4个维度。根据刘品新)的研 商业数据治理相比,公共数据治理更多地涉及法 究,在司法实践中电子证据被质疑的几率是比较 律适定性问题。公共数据库数据的电子证据功能 高的。在司法实务中,电子证据的攻防成效令人 涉及很多方面,比如电子证据的生命周期管理以 堪忧,司法运用电子证据尚未形成成熟的机制。 及电子证据存储和归档格式、电子证据与案件事 鉴于电子证据易受质疑,中华人民共和国最高检 实的关联性等。这类具有电子证据性质的公共数 察院对电子数据和视听资料的审查、认定和是否 据产品的基本要求是真实可信性及其与现实案件 作为定案依据有明确的规定,严格要求对电子数 的高度关联性。因此,构造多层的、分布式且防 据和视听资料结合案件的其它证据审查其真实性 篡改算法和安全的电子证据取证系统是基于公共 和关联性。 数据库的电子证据的关键技术。以求解拜占庭将 由此可见,电子证据的关联性和真实性是电 军问题的算法为基础发展起来的区块链技术在去 子证据在法庭上是否被采信的关键性指标。作为 中心化安全技术领域已经取得一定成效,如比特 一种虚拟空间的证据,电子证据用于定案必须同 币区块链技术、能源互联网区块链技术等。此 时满足内容上以及载体上的关联性和真实性。互 外,在医疗保健中广泛地实施区块链以提高 联网、物联网与大数据的出现和发展在极大提高 数据隐私性、互操作性和可扩展性1。在司法和 公众和公共部门数据交互效率的同时,也为保障 公共安全信息技术领域,分布式的电子证据广泛 电子证据的真实性、关联性带来了新的挑战。由 存在,急需建立更加严密的电子证据信任技术 于公共部门以维护社会公平正义为目的,因此公 体系。 共数据库的电子证据从内容到载体都应该是电子 按物证说的观,点,相对于传统物证而言,电子 证据中最为可信的。 证据产生和存在的方式有很大的区别,主要体现 传统的公共数据库中数据的应用需求主要包 在电子证据的符号化、易篡改性、可删除性、可分 含公共产品供给和消费过程的记录。但是随着网 离性、易复制性、易破坏性,使得电子证据在收集 络和智能终端的日益普及,公共数据的边界日益 和使用过程中真实性会发生改变。狭义的电子证 扩大,大量的公共数据的电子化,纳入了海量的 据是指以存储于介质载体中的电磁记录或光电记 机器数据,这将带来公共数据库中的电子数据证 录并对司法案件审理、仲裁等事实起证明作用的 据功能复杂化。随着公共数据库数据边界的扩 电子数据(含视听资料)及其附属物。除了具有 张,公共数据库的电子证据功能将成为公共数据 证据的客观性和可知性之外,电子证据还具有非 库主要功能之一。如公共安全数据库中的涉案物 直观性和多态性、电子物理和诉讼证据的多重属 品记录、消防数据、环境监测、宾馆饭店住宿记 性。为了保持电子证据的客观真实性,在获取电 录、出租车定位记录以及医疗健康数据库中的电 子证据时,应采用取证专用的数据拷贝机和电子 子病历、防疫检疫记录等。 证据勘验取证技术,附加上时间戳数据,一次性 公共数据库的电子证据系统的应用与法律密 提取和固定介质载体中的全部电子数据。广义的 切相关,可信性是必然要求。在中国的法律框架 电子证据是指,用于公共管理、认证认可、司法、 之下,数据必须满足:1)及时性,数据必须是及时 仲裁、公证等事务的电子数据及其附属物。广义 收集的;2)过程性,过程的数据必须被记录;3)不 的电子证据与狭义的电子证据相比,应用范围更 可篡改性,所收集及存储的数据必须证明没有被 宽、取证过程相对简单。 篡改过。 电子证据与传统证据相比,最突出的特点是: 其中不可篡改性是电子证据的特性,也是电 1)它需要借助一定的介质存储,通常存储于电子 子证据系统设计的关键技术难点。不可篡改性有 设备的存储器中;2)电子证据不能直观查看,必 两个环节:)公共数据库内部的电子证据生成过 须借助适当的电子系统软硬件环境显示后才能查 程的不可篡改性,即电子证据的保障品质,或保 看;3)由于电子证据存在于虚拟空间,所以可以 质;2)电子证据的外部转移与再现过程的不可篡 迅速传播并且精确复制;4)电子证据中的数字证 改性,即电子证据的保障安全,或保全。 据很容易被修改或删除,并且不易找到更改“痕 在中国的法律中,电子数据、电子证据概念 迹”;5)有些电子证据有时限性,可能随时间而 经常混合使用。在司法、仲裁和行政案件处理实 消失。 务中,虽然可以作为证据使用(电子证据、电子书 电子数据的真实性、合法性、关联性和证明 证或视听电子材料),但是单一的电子证据并不能
平正义的一类公共产品中的电子证据。与一般的 商业数据治理相比,公共数据治理更多地涉及法 律适定性问题。公共数据库数据的电子证据功能 涉及很多方面,比如电子证据的生命周期管理以 及电子证据存储和归档格式、电子证据与案件事 实的关联性等。这类具有电子证据性质的公共数 据产品的基本要求是真实可信性及其与现实案件 的高度关联性。因此,构造多层的、分布式且防 篡改算法和安全的电子证据取证系统是基于公共 数据库的电子证据的关键技术。以求解拜占庭将 军问题的算法为基础发展起来的区块链技术在去 中心化安全技术领域已经取得一定成效,如比特 币区块链技术、能源互联网区块链技术等[2-3]。此 外,在医疗保健中广泛地实施区块链以提高 数据隐私性、互操作性和可扩展性[4-5]。在司法和 公共安全信息技术领域,分布式的电子证据广泛 存在,急需建立更加严密的电子证据信任技术 体系。 按物证说的观点,相对于传统物证而言,电子 证据产生和存在的方式有很大的区别,主要体现 在电子证据的符号化、易篡改性、可删除性、可分 离性、易复制性、易破坏性,使得电子证据在收集 和使用过程中真实性会发生改变。狭义的电子证 据是指以存储于介质载体中的电磁记录或光电记 录并对司法案件审理、仲裁等事实起证明作用的 电子数据 (含视听资料) 及其附属物。除了具有 证据的客观性和可知性之外,电子证据还具有非 直观性和多态性、电子物理和诉讼证据的多重属 性。为了保持电子证据的客观真实性,在获取电 子证据时,应采用取证专用的数据拷贝机和电子 证据勘验取证技术,附加上时间戳数据,一次性 提取和固定介质载体中的全部电子数据。广义的 电子证据是指,用于公共管理、认证认可、司法、 仲裁、公证等事务的电子数据及其附属物。广义 的电子证据与狭义的电子证据相比,应用范围更 宽、取证过程相对简单。 电子证据与传统证据相比,最突出的特点是: 1) 它需要借助一定的介质存储,通常存储于电子 设备的存储器中;2) 电子证据不能直观查看,必 须借助适当的电子系统软硬件环境显示后才能查 看;3) 由于电子证据存在于虚拟空间,所以可以 迅速传播并且精确复制;4) 电子证据中的数字证 据很容易被修改或删除,并且不易找到更改“痕 迹” ;5) 有些电子证据有时限性,可能随时间而 消失[6]。 电子数据的真实性、合法性、关联性和证明 力是电子证据的 4 个维度。根据刘品新[7] 的研 究,在司法实践中电子证据被质疑的几率是比较 高的。在司法实务中,电子证据的攻防成效令人 堪忧,司法运用电子证据尚未形成成熟的机制。 鉴于电子证据易受质疑,中华人民共和国最高检 察院对电子数据和视听资料的审查、认定和是否 作为定案依据有明确的规定,严格要求对电子数 据和视听资料结合案件的其它证据审查其真实性 和关联性。 由此可见,电子证据的关联性和真实性是电 子证据在法庭上是否被采信的关键性指标。作为 一种虚拟空间的证据,电子证据用于定案必须同 时满足内容上以及载体上的关联性和真实性。互 联网、物联网与大数据的出现和发展在极大提高 公众和公共部门数据交互效率的同时,也为保障 电子证据的真实性、关联性带来了新的挑战。由 于公共部门以维护社会公平正义为目的,因此公 共数据库的电子证据从内容到载体都应该是电子 证据中最为可信的。 传统的公共数据库中数据的应用需求主要包 含公共产品供给和消费过程的记录。但是随着网 络和智能终端的日益普及,公共数据的边界日益 扩大,大量的公共数据的电子化,纳入了海量的 机器数据,这将带来公共数据库中的电子数据证 据功能复杂化。随着公共数据库数据边界的扩 张,公共数据库的电子证据功能将成为公共数据 库主要功能之一。如公共安全数据库中的涉案物 品记录、消防数据、环境监测、宾馆饭店住宿记 录、出租车定位记录以及医疗健康数据库中的电 子病历、防疫检疫记录等。 公共数据库的电子证据系统的应用与法律密 切相关,可信性是必然要求。在中国的法律框架 之下,数据必须满足:1) 及时性,数据必须是及时 收集的;2) 过程性,过程的数据必须被记录;3) 不 可篡改性,所收集及存储的数据必须证明没有被 篡改过。 其中不可篡改性是电子证据的特性,也是电 子证据系统设计的关键技术难点。不可篡改性有 两个环节:1) 公共数据库内部的电子证据生成过 程的不可篡改性,即电子证据的保障品质,或保 质;2) 电子证据的外部转移与再现过程的不可篡 改性,即电子证据的保障安全,或保全。 在中国的法律中,电子数据、电子证据概念 经常混合使用。在司法、仲裁和行政案件处理实 务中,虽然可以作为证据使用 (电子证据、电子书 证或视听电子材料),但是单一的电子证据并不能 ·1128· 智 能 系 统 学 报 第 14 卷
第6期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1129· 够作为判定事实的根据,电子证据需要跟其他证 种全过程的科学技术,其检验结果可作为法庭证 据一起使用,并且可以相互印证,因此组成证据 据或案件侦查线索。 链条来证明案件事实。电子证据有效的前提是电 电子证据正面认定的审查需要以下环节: 子数据本身是可信的。区块链技术在解决共享经 1)生成环节,即电子证据中的数据是如何生 济中的信任问题方面颇具潜力,在某种程度上区 成的。这一环节审查电子证据数据是设备采集还 块链适合取代第三方的信任8。 是人工录人。如果是设备采集的则进一步确认是 公共数据库是公共产品,公共部门是其供给 由人工使用设备采集还是设备自动采集。如果是 者。公共部门有义务依法从其主导的公共数据库 人工使用设备采集,则需要确认采集者是否具备 中提供公民和法人所需要的一切电子证据(证 采集资格和设备是否正常。如果是机器自动采集 明)。当公民和组织必须需要公共数据库中的电 数据,则需认定设备是否正常。采集人员和设备 子数据维护自身权益的时候,公共部门必须向他 是否正常,则需要合法的第三方认定或检测机构 们提供具有完整法律效力的电子证据。这些电子 相关电子文书。 证据的运用可能不仅限于司法事务。在公共部门 2)获取的方式。审查内容包括:采集过程是 提供电子证据时,必须保证数据的真实性和证明 否合法,采集方法是否科学、可靠,采集过程是否 力,同时要尽量保护当事人隐私和他人利益。因 得到被采集方认可。 此,从公共数据库中提取电子数据并形成有效电 3)传输环节。审查电子证据的数据形成过 子证据既是法律难题也是技术难题。 程和传输过程中使用的计算机网络或专用设备 本文将构建自动生成中国公共数据库电子证 是否正常,传输过程中电子证据的数据是否可 据系统的区块链模型及其取证技术体系,在一 能被修改,传输过程中数据是否被非法复制、 定程度上保证了司法、公证和公共事务中电子证 截取。 据的可信性。最后提出了公共数据治理的电子证 4)存储环节。该环节审查电子证据数据是怎 据生命周期管理并对电子证据的关联性进行了 样存储的,是否科学,存储介质与存储过程是否 分析。 安全可靠,是否以加密形式存储,存储后是否有 访问权限上的漏洞,存储中是否有非法篡改和销 1电子证据可信性的影响因素分析 毁的风险。 电子证据的不可篡改性包括数据的保质和 2电子证据系统的区块链数据模型 保全,它与传统证据的有效性与证据保全相对 应,具体体现在电子证据的数据攫取、固定、保 关于电子证据系统的保质问题,我国迄今为 管、转移等各个环节。但与传统证据相比,电子 止没有法律规定,也没有完整的行政规范。为了 证据的产生和存在的形式完全不同。由于电 解决公共数据库中可能用于电子证据的数据的可 子数据科技含量高、易篡改、可分离等特点,使之 信性,必须建立公共数据库的全局信任机制。有 非常容易被修改、伪造和删除,加大了电子证据 效的解决办法是在公共数据库中建立区块链系统 的保质和保全难度,仅仅通过法律措施和公证机 的“智能合约”层,即建立一种无法被篡改和操控 关很难有效控制电子证据的法律效力。从普通 的“代码合同。智能合约并非法律所界定的合 证据学的原理来说,司法实践中对传统证据认定 同,而是执行在区块链上的代码,故也称作“链上 普遍采用正面认定法和侧面认定法,其中正面认 代码”。为了实现中国公共数据库中用于提供电 定法是主要方法。参照传统证据的认定,电子证 子证据的部分数据的法律效力,这种链上代码必 据的正面认定须保证电子数据的可靠性,在其运 须遵从不可篡改性和法律上的可验证性。电子证 行的各个环节都有辅助证据(如数据标签、时间 据系统在公共数据库数据生产过程中提取的数据 戳)加以证明,形成电子数据保管锁链。由于电 在数据博弈参与者之间形成区块链,其分布式账 子数据通常是潜在的且与大量的无关信息纠缠 本将保证数据的一致性、不可篡改性和合法性。 共存,有时甚至已经被删除,故需要通过专门的 在事务方式上,电子证据系统的区块链的每个节 技术手段发现和获得有价值的证据信息,这就是 点上都有自己的本地数据库。 电子证据检验技术。电子证据检验技术是对电 根据电子证据系统的上述要求,我们构建一 子设备中存在的电子数据(电子证据)进行识别、 种基于区块链的数据安全共享网络体系,如图1 发现、提取、保存、恢复、展示、分析和鉴定的一 所示
够作为判定事实的根据,电子证据需要跟其他证 据一起使用,并且可以相互印证,因此组成证据 链条来证明案件事实。电子证据有效的前提是电 子数据本身是可信的。区块链技术在解决共享经 济中的信任问题方面颇具潜力,在某种程度上区 块链适合取代第三方的信任[8-9]。 公共数据库是公共产品,公共部门是其供给 者。公共部门有义务依法从其主导的公共数据库 中提供公民和法人所需要的一切电子证据 (证 明)。当公民和组织必须需要公共数据库中的电 子数据维护自身权益的时候,公共部门必须向他 们提供具有完整法律效力的电子证据。这些电子 证据的运用可能不仅限于司法事务。在公共部门 提供电子证据时,必须保证数据的真实性和证明 力,同时要尽量保护当事人隐私和他人利益。因 此,从公共数据库中提取电子数据并形成有效电 子证据既是法律难题也是技术难题。 本文将构建自动生成中国公共数据库电子证 据系统的区块链模型及其取证技术体系,在一 定程度上保证了司法、公证和公共事务中电子证 据的可信性。最后提出了公共数据治理的电子证 据生命周期管理并对电子证据的关联性进行了 分析。 1 电子证据可信性的影响因素分析 电子证据的不可篡改性包括数据的保质和 保全,它与传统证据的有效性与证据保全相对 应,具体体现在电子证据的数据攫取、固定、保 管、转移等各个环节。但与传统证据相比,电子 证据的产生和存在的形式完全不同[10]。由于电 子数据科技含量高、易篡改、可分离等特点,使之 非常容易被修改、伪造和删除,加大了电子证据 的保质和保全难度,仅仅通过法律措施和公证机 关很难有效控制电子证据的法律效力。从普通 证据学的原理来说,司法实践中对传统证据认定 普遍采用正面认定法和侧面认定法,其中正面认 定法是主要方法。参照传统证据的认定,电子证 据的正面认定须保证电子数据的可靠性,在其运 行的各个环节都有辅助证据 (如数据标签、时间 戳) 加以证明,形成电子数据保管锁链。由于电 子数据通常是潜在的且与大量的无关信息纠缠 共存,有时甚至已经被删除,故需要通过专门的 技术手段发现和获得有价值的证据信息,这就是 电子证据检验技术。电子证据检验技术是对电 子设备中存在的电子数据 (电子证据) 进行识别、 发现、提取、保存、恢复、展示、分析和鉴定的一 种全过程的科学技术,其检验结果可作为法庭证 据或案件侦查线索。 电子证据正面认定的审查需要以下环节: 1) 生成环节,即电子证据中的数据是如何生 成的。这一环节审查电子证据数据是设备采集还 是人工录入。如果是设备采集的则进一步确认是 由人工使用设备采集还是设备自动采集。如果是 人工使用设备采集,则需要确认采集者是否具备 采集资格和设备是否正常。如果是机器自动采集 数据,则需认定设备是否正常。采集人员和设备 是否正常,则需要合法的第三方认定或检测机构 相关电子文书。 2) 获取的方式。审查内容包括:采集过程是 否合法,采集方法是否科学、可靠,采集过程是否 得到被采集方认可。 3) 传输环节。审查电子证据的数据形成过 程和传输过程中使用的计算机网络或专用设备 是否正常,传输过程中电子证据的数据是否可 能被修改,传输过程中数据是否被非法复制、 截取。 4) 存储环节。该环节审查电子证据数据是怎 样存储的,是否科学,存储介质与存储过程是否 安全可靠,是否以加密形式存储,存储后是否有 访问权限上的漏洞,存储中是否有非法篡改和销 毁的风险。 2 电子证据系统的区块链数据模型 关于电子证据系统的保质问题,我国迄今为 止没有法律规定,也没有完整的行政规范。为了 解决公共数据库中可能用于电子证据的数据的可 信性,必须建立公共数据库的全局信任机制。有 效的解决办法是在公共数据库中建立区块链系统 的“智能合约”层,即建立一种无法被篡改和操控 的“代码合同” [11]。智能合约并非法律所界定的合 同,而是执行在区块链上的代码,故也称作“链上 代码”。为了实现中国公共数据库中用于提供电 子证据的部分数据的法律效力,这种链上代码必 须遵从不可篡改性和法律上的可验证性。电子证 据系统在公共数据库数据生产过程中提取的数据 在数据博弈参与者之间形成区块链,其分布式账 本将保证数据的一致性、不可篡改性和合法性[12]。 在事务方式上,电子证据系统的区块链的每个节 点上都有自己的本地数据库。 根据电子证据系统的上述要求,我们构建一 种基于区块链的数据安全共享网络体系,如图 1 所示。 第 6 期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1129·
·1130· 智能系统学报 第14卷 。日标主机 (CA服务器 公共数据 区块进行共识:最后,一旦共识成功,对区块进行 区块链 链接,形成完整的区块链。通过共识算法来保证 用户账本之间的一致性,即分布式记账核心。将 具体的区块加入区块链过程如图36。 defmain(); P2P电子证据网路 book=TransactionBook(); P2P电子证据网路 #1.从学校将学生数据从数据库加载进区块链中 pint(~1.开始从学较停息将学生数据伽载进区块链内!")月 student=StudentO: 位 allReconds=student.getAll(); 数据识别服务 数据识别服务 for stuNo in allReconds; If stuNo 个 个 data=student.getAll.getOne(stuNo): 一公共数据区块班 公共数据区块链 b=Transaction(来有学度系统,data): 个 book.addBlock(b): 互联网 互联网 print(book ) print(学号:/的同学已径m我成功!“.format(stuNo0D: else: print("“此学生不存在!“方 图1电子证据区块链结构 图3数据加入区块链 Fig.1 Blockchain structure of the E-evidence system Fig.3 Data is added to the blockchain 1联盟区块链构建。 该体系依赖于现有的数据仓库架构,将 机构1:校级 已经收到信息! 电子数据作为一种资产进行统一标识,利用区块 加载区块信息,请稍后! 链技术将数据进行分布式存储,通过设计高效分发 校验成功! Hah:0000297e7Afd64a41632hs469a386070399acdf0657641b8413a2585605 协议,实现数据在参与者之间的自主对等的P2P电 StudentChains 系统的法律要求,并且将部分公共数据库系统事 学号:200818008629002的同学已经加载成功1 己经收到信息! 务流程去中心化。本质上讲,电子证据系统是 加载区块信息。请稍后! 校验成功 将法规所要求部分公共电子数据本地备份并形成 共识节点。P2PIEN的具体内容参见文献[16]。 图4校级联盟区块链 例1学历认证的电子证据系统原型的核心 Fig.4 School-level alliance blockchain 机构2:省级 区块链。学历认证的电子证据区块链系统原型主 己经收到信息! 加载区块信息,请稍后! 要由从教育公共数据库(目前包括校级、省级及 校验成功们 国家级数据库)中自动获取数据、形成区块并将数 Hash:0000e218a43057ea3ale3a4c5ccc08d3cf43a318f3c4b64el6658347d9560494 StudentChains 学号:200818008629001的同学己经加载成功! 据加载进区块链中及进行学历认证过程3部分组成。 己经收到信息! 1)获取数据阶段:将学生信息按学号自动从 加载区块信息,请稍后! 校验成功! 数据库提取出来,提取出的同一学生的不同粒度 Hash:000016c2b0ca5472d5899c2717H7b0ba30e0b9220bbca416cl9887fed909 StudentChains 的记录将会起到相互佐证作用。获取公共数据库 学号:200818008629002的同学己经加载成功1 己经收到信息! 记录部分源码如图2。 加载区块信息,请稍后! 校验成功! class Student: def init (self): 图5省级联盟区块链 self.helper=MysglHelper(); def getOne(self,stuNo:#外面传人参数 Fig.5 Provincal-level alliance blockchain 机构3:国家级 sql="selectfrom t_school where stuNo=%s"; 已经收到信息! params=(stuNo,); 加载区块信息,请稀后! return self.helper.getOne(sql,params); 校验成功! def getAll(self,#获取所有学生数据 Hash:000037a8a54cc82d46482a43e4e2dc8919888b2cl64c35870b833623d0d9 sql="select stuNo from t school". StudentChains 学号:200818008629002的同学己经加载成功! 已经收到信息! 图2获取数据部分源码 加载区块信息。请稍后! Fig.2 Get the data part of the source code 校验成功! 2)数据加入区块链阶段:首先,将提取的每 图6国家级联盟区块链 条学生信息形成一个区块;其次,各用户对该 Fig.6 National-level alliance blockchain
目标主机 CA服务器 P2P电子证据网络 数据识别服务 数据识别服务 公共数据区块链 公共数据区块链 互联网 互联网 P2P电子证据网络 公共数据 区块链 图 1 电子证据区块链结构 Fig. 1 Blockchain structure of the E-evidence system 该体系依赖于现有的数据仓库架构[13-14] ,将 电子数据作为一种资产进行统一标识,利用区块 链技术将数据进行分布式存储,通过设计高效分发 协议,实现数据在参与者之间的自主对等的 P2P 电 子证据网络 (peer to peer i-evidence network,P2PIEN)。 该电子证据网络依托于公共数据库网络的物理系 统和数据博弈覆盖网络,在逻辑上遵从电子证据 系统的法律要求,并且将部分公共数据库系统事 务流程去中心化[15]。本质上讲,电子证据系统是 将法规所要求部分公共电子数据本地备份并形成 共识节点。P2PIEN 的具体内容参见文献 [16]。 例 1 学历认证的电子证据系统原型的核心 区块链。学历认证的电子证据区块链系统原型主 要由从教育公共数据库 (目前包括校级、省级及 国家级数据库) 中自动获取数据、形成区块并将数 据加载进区块链中及进行学历认证过程 3 部分组成。 1) 获取数据阶段:将学生信息按学号自动从 数据库提取出来,提取出的同一学生的不同粒度 的记录将会起到相互佐证作用。获取公共数据库 记录部分源码如图 2。 class Student: def _init_(self): self._helper=MysqlHelper(); def getOne(self,stuNo); #外面传入参数 sql= “select*from t_school where stuNo=%s”; params=(stuNo,); return self._helper.getOne(sql, params); def getAll(self); #获取所有学生数据 sql= “select stuNo from t_school”; return self. Helper.getAll(sql); def checkValidate(self, stuName,stuNo): sql=“select * from t_school where stuName=%s and stuNo=%s”; params=(stuName, stuNo); return self._helper.getOne(sql, params); 图 2 获取数据部分源码 Fig. 2 Get the data part of the source code 2) 数据加入区块链阶段:首先,将提取的每 一条学生信息形成一个区块;其次,各用户对该 区块进行共识;最后,一旦共识成功,对区块进行 链接,形成完整的区块链。通过共识算法来保证 用户账本之间的一致性,即分布式记账核心。将 具体的区块加入区块链过程如图 3~6。 def main(); book=TransactionBook(); #1.从学校将学生数据从数据库加载进区块链中 print ( ): student=Student(); allReconds=student.getAll(); for stuNo in allReconds; if stuNo: data=student.getAll.getOne(stuNo); b=Transaction( , data); book.addBlock(b); print(book); print( .format(stuNo[0])); else: print( ); “1.开始从学校信息将学生数据加载进区块链内!” “来自学校系统” “学号:{}的同学已经加载成功!” “此学生不存在!” 图 3 数据加入区块链 Fig. 3 Data is added to the blockchain 1.联盟区块链构建。 机构1:校级 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:0000297e77f1fd64a41632b5469ca386070399aacdaf0657641b8413a2585605 StudentChains 学号:200818008629001的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:0000685fa261abcc29alc240b5a093d56f501a5402eab5dba9aaff71674daf17 StudentChains 学号:200818008629002的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! 图 4 校级联盟区块链 Fig. 4 School-level alliance blockchain 机构2:省级 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:0000c218a43057ea3ale3a4c5ccc08d3cf43a318f3c4b64el6658347d9560494 StudentChains 学号:200818008629001的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:000016e2b0ca5472d5899cl2717fl7b0ba30e0b9220bbca416cl9887fed909aa StudentChains 学号:200818008629002的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! 图 5 省级联盟区块链 Fig. 5 Provincal-level alliance blockchain 机构3:国家级 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:000037a8a54ce82d4648fl2a43e4c2dc8919f888b2el64c35870b83362f3d0d9 StudentChains 学号:200818008629001的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:00009c3e2c01c378ffl3e5a4567532c9d0a61bal2af49b520a46faac31431c6f StudentChains 学号:200818008629002的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! 图 6 国家级联盟区块链 Fig. 6 National-level alliance blockchain ·1130· 智 能 系 统 学 报 第 14 卷
第6期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1131· 3)进行学历认证过程:一方面,尽管任何一 除已形成的区块的数据,将导致其他用户账本对 级的数据库中的数据可以被管理员进行修改/删 应的区块信息不一致,这是不允许发生的。图7~ 除,但是修改后的数据记录只能以新的区块形式 8显示的是区块链中的数据与某账本改变区块数 加入对应的链条中去;另一方面,当试图修改/删 据失败验证。 2.机构读取区块链中的信总。 时间:2006-11-0907:14:47:来自学校系统:学生信息: (1, 200818008629001, 李小路',0,datet1me.date(2008,9,11) 时间:2006-11-0907:14:48:来自学校系统:学生信总: (2, 2006-11-0907:14:49:来自学校系统:学生信息: ,200818008629002',,张周,1,datet1me.date(2008,9,11), 时间: (3, 1200818008629003', 萧然 ,0,datet1me.date(2008,9,11), 时间:2006-11-0907:14:51:来自学校系统:学生信总: 200818008629030',,白易 ,1,datet1me,date(2008,9,11), 时间:2006-11-0907:14:51:来自省级系统:学生信息: 1 1200818008629001', ,李小路,datetime.date(2008,9,11), 时间:2006-11-0907:14:51:来自省级系统:学生信总: (2, '200818008629002',,张周',datetime.date(2008,9,11),'101 时间 2006-11-0907:14:53:来自省级系统:学生信息: 3, "200818008629003',,萧然,datetime.date(2008,9, 11),10 时间:2006-11-0907:14:53:来自省级系统:学生信总: (4, 200818008629030',,白易',datetime.date(2008,9,11), 1101 时间 2006-11-0907:14:54:来自省级系统:学生信总: 5, 200917008627020',,张丽:,datet1me.date(2009,9,11),·10 时间:2006-11-0907:14:54:未自省级系统:学生信息 006-11-0907:14:55:来自国家级信总系统:学生信息 '201717008627020',·王成',datet1me.date(2017,9,11), ,101 时间: (1, ·200818008629001', 李小路, 云南省,·10674, 毕业 时间:2006-11-0907:14:55:来自国家级信总系统:学生信总: (2 200818008629002', 张周·,云南省,10674·,毕业) 时间: 2006-11-0907:14:56:来自国家级信息系统:学生信息: (3, 200818008629003·,萧然,云南省, 10674', ,毕业) 时间:2006-11-0907:14:56:来自国家级信总系统:学生信总: (9 200818008629030', 白易· 云南省·,·106741,退学) 时间:2006-11-0907:14:57:来自国家级信息系统:学生信息: (5, *200917008627020', 张丽,云南省,·10673', ,毕业*) 时间:2006-11-0907:14:57:来自国家级信总系统:学生信息: (6,201717008627020',王成·,云南省",·10673',·在校) 图7读取区块链中的信息 Fig.7 Read the information in the blockchain 3.机构欲修改区块链中信息。 原信息为:'200818008629030',,白易,1,datetime.date(2008,9,11),,计算机应用扶术:,昆明理工大学,退学 欲修故信息为:('200818008629030',·白易·,1,datet1me.date(2008,9,11),计算机应用技术,·昆明理工大学,毕业) 正在校验! 修改信急失败! 图8修改信息失败 Fig.8 Modifying information failed 3电子证据取证系统 3)工作主机:将安装系统客户端软件,供用 户登录系统,也是U盘取证工具端与CA服务器之 3.1电子证据取证系统的构成 间交互的桥梁,为二者提供通信和数据传输服务。 电子证据包括取证任务生成、物理介质、取 4)U盘取证工具端:工具端是安装WinPE操 证认证、电子数据和电子证据提交。电子证据本 作系统的导引U盘,内置的WiPE操作系统镜像 质上仍然是计算机产生的数据,在传输和存储过 集成了为提取目标主机的计算机取证信息的数据 程中表现为0和1构成的字符串。在电子证据取 采集软件,同时以外部数据形式放置取证任务证 证和保全过程中,需要设置CA服务器。通过运 书。通过U盘取证终端提取到的电子证据经过 用信息安全技术生成对电子证据本身具有证明作 签名和加密处理,以U盘为载体将数据转移至目 用的辅助证据,形成电子证据的链锁。电子证据 标主机。 采集和保管系统由一个C/S架构的软件系统和相 WinPE系统是一个组件精简版的操作系统内 应的硬件部署,外加便携式U盘取证工具组成。 核镜像,其工作原理是将镜像加载至内存后以解 硬件部署包括CA服务器、数据库服务器、工作主 压的方式将操作系统安装在内存中,而不用启动 机、U盘取证终端。 主机自身的操作系统。目标主机的硬盘对于WiPE 1)CA服务器:提供对系统用户(如法院、检 来说就是一块完整的外部硬盘。因此,WinPE系 察院等)的注册和认证,项目和任务的认证和授 统启动过程中并不使用主机的任何硬盘数据。从 权,任务证书的生成、签发,电子证据加密密钥和 而保持了目标主机硬盘的完整性,避免了一些高 签名密钥的生成和发放等服务。 科技犯罪行为利用程序设置非本人进入的使用销 2)数据库服务器:提供对系统用户数据库、 毁程序毁灭关键证据。同时,目标主机中的病 项目任务数据库和电子证据数据库的服务支持。 毒、木马无法影响到取证工具端中的WinPE系统 其中电子证据数据库是公共数据库中区块链的本 和文件,从而在一定程度上保证了整个电子证据 地数据服务器,负责相应各级数据提供者的数据 取证系统的安全性。公共数据库电子证据取证流 变更和本地备份,将受到智能合约的控制。 程如图9
3) 进行学历认证过程:一方面,尽管任何一 级的数据库中的数据可以被管理员进行修改/删 除,但是修改后的数据记录只能以新的区块形式 加入对应的链条中去;另一方面,当试图修改/删 除已形成的区块的数据,将导致其他用户账本对 应的区块信息不一致,这是不允许发生的。图 7~ 8 显示的是区块链中的数据与某账本改变区块数 据失败验证。 图 7 读取区块链中的信息 Fig. 7 Read the information in the blockchain 图 8 修改信息失败 Fig. 8 Modifying information failed 3 电子证据取证系统 3.1 电子证据取证系统的构成 电子证据包括取证任务生成、物理介质、取 证认证、电子数据和电子证据提交。电子证据本 质上仍然是计算机产生的数据,在传输和存储过 程中表现为 0 和 1 构成的字符串。在电子证据取 证和保全过程中,需要设置 CA 服务器。通过运 用信息安全技术生成对电子证据本身具有证明作 用的辅助证据,形成电子证据的链锁。电子证据 采集和保管系统由一个 C/S 架构的软件系统和相 应的硬件部署,外加便携式 U 盘取证工具组成。 硬件部署包括 CA 服务器、数据库服务器、工作主 机、U 盘取证终端。 1) CA 服务器:提供对系统用户 (如法院、检 察院等) 的注册和认证,项目和任务的认证和授 权,任务证书的生成、签发,电子证据加密密钥和 签名密钥的生成和发放等服务。 2) 数据库服务器:提供对系统用户数据库、 项目任务数据库和电子证据数据库的服务支持。 其中电子证据数据库是公共数据库中区块链的本 地数据服务器,负责相应各级数据提供者的数据 变更和本地备份,将受到智能合约的控制。 3) 工作主机:将安装系统客户端软件,供用 户登录系统,也是 U 盘取证工具端与 CA 服务器之 间交互的桥梁,为二者提供通信和数据传输服务。 4) U 盘取证工具端:工具端是安装 WinPE 操 作系统的导引 U 盘,内置的 WinPE 操作系统镜像 集成了为提取目标主机的计算机取证信息的数据 采集软件,同时以外部数据形式放置取证任务证 书。通过 U 盘取证终端提取到的电子证据经过 签名和加密处理,以 U 盘为载体将数据转移至目 标主机。 WinPE 系统是一个组件精简版的操作系统内 核镜像,其工作原理是将镜像加载至内存后以解 压的方式将操作系统安装在内存中,而不用启动 主机自身的操作系统。目标主机的硬盘对于 WinPE 来说就是一块完整的外部硬盘。因此,WinPE 系 统启动过程中并不使用主机的任何硬盘数据。从 而保持了目标主机硬盘的完整性,避免了一些高 科技犯罪行为利用程序设置非本人进入的使用销 毁程序毁灭关键证据。同时,目标主机中的病 毒、木马无法影响到取证工具端中的 WinPE 系统 和文件,从而在一定程度上保证了整个电子证据 取证系统的安全性。公共数据库电子证据取证流 程如图 9。 第 6 期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1131·
·1132· 智能系统学报 第14卷 门提交视频监控设备和消防设备的传感数据的法 律效力展示。 3)压缩公共数据并将其存档,降低信息技术 USB取证工具 成本和提高公共数据资源应用绩效。公共数据当 工作主机 目标主机 CA服务器 局需要压缩静态公共数据,并将其归档,以降低 存储成本,提高应用绩效。这些静态数据可能存 在于数据仓库的某个环节,或分布式数据库的某 个节点,包括文件系统、NoSQL数据库,甚至包 括Hadoop中的智能电表读数、传感器数据、RFID 数据库服务器 数据和网络日志。在数据周期管理中,公共数据 图9公共数据库电子证据取证流程图 当局必须考虑数据归档适用于所有属地法规。例 Fig.9 Forensics process of the E-evidence network 如,税务部门的数据当局在进行数据压缩和存档 3.2电子证据数据的生命周期管理 过程中,必须以电子表单生成在存档过程中保留 随着公共数据库数据规模的急速膨胀,公共 原有格式,而不是将结构化数据转为PDF格式, 部门数据资产的持有成本也迅速增长,导致公共 其目的是让涉税案件中方便税务审计员确定某家 财政中信息技术和管理预算压力持续增加。一方 公司是否有偷税漏税行为。否则,税务审计员必 面,与其他公共产品供给一样可以通过适度市场 须从头到尾查看成千上万的PDF文档。在公共 化来缓解财政预算压力。另一方面,过度的收集 数据库生命周期管理中,对一大类分布式监测数 和囤积数据造成的财政资源浪费则需要制定合理 据,如环境监测、道路视频监控、消防、特种设备 的公共数据生命周期政策,从而降低法律风险和 运行监测等,数据当局在Hadoop和非Hadoop环 信息技术成本。公共数据生命周期政策的基本目 境下对其数据归档时必须考虑可达到的压缩程 标包括: 度。就目前而言,LZO、Gzip和RainStor是较流行 1)基于法律和制度要求,明确公共数据保留 的高效数据压缩技术。 时间表。国家必须出台有关数据保留时间的法 4)管理实时数据流的生命周期。对公共数据 规。例如,电信数据包含有关人际关系和位置的 库中的高速实时数据流,数据当局必须明确其保 丰富知识,对执法和反恐等公共产品具有极大作 存价值,即是否需要永久保存这些数据流。这种 用,很多国家和地区对电信用户姓名、出生日期、 高速数据流往往由机器(含传感器)自动产生,当 计费地址、绑定银行卡号、电话号码、国际移动设 机器数据产生异常行为时需要存储该异常事件发 备识别码、主叫号码、被叫号码、通话时长、地理 生前后的每一个读数。例如,网络监测系统异常 位置、登录时间、下线时间、P地址、发件地址、 事件的数据流获取中公安局网监大队需要确定保 访问的URLs等有明确的电信保留时间。中国公 存在内存中的数据应该是多少,可供选择的方案 共数据库的数据保留时间并无明确的规定,更无 为内存中保存2小时的NetFlow记录并每隔一分 完善的法律和制度。 钟将记录保存于硬盘一次,以备历史分析之用。 2)提供法律和制度保留区,并支持电子数据 5)保留适量社会团体和商业机构数据交互记 显示。随着公民意识的增强,大多数公共部门和 录,并支持电子证据展示。随着公民社会的日益 非政府组织将面临要求保存证据的起诉和调查。 临近,公共部门将逐步退出某些领域,如科学技 在公共数据周期管理中心,为了应对证据收集和 术奖励评审、职称评审、信用管理、社会公证等, 分析,公共数据治理计划必须控制法律风险,提 这些领域的公共数据管理也将伴随公共事务移交 供必要的电子证据展示。例如,2015年8月12 给社团组织,如工会、政党、行业协会、公众企亚 日,位于天津市天津港的瑞海公司危险品仓库发 (如大学、医院、BAT、华为技术公司、国家电网公 生火灾爆炸事故,造成165人遇难。该事故的调 司等),相应的公共数据资源也将转移到这些社团 查报告显示,通过调取分析位于瑞海公司北侧的 组织和商业机构。但是,法律仍然赋予了这些组 环发通讯公司监控视频、提取比对现场痕迹证 织一定的公共管理职能,如邮政公司有义务承担 据、分析集装箱毁坏和位移特征,认定事故最初 偏远农村地区物流、信函投递等。伴随这些非政 起火部位为瑞海公司危险品仓库运抵区南侧集装 府组织的公共服务职能的公共数据管理也必须支 箱区的中部。这个案件调查过程中,需要公安部 持电子证据展示。例如,人民银行数据当局要求
工作主机 CA服务器 USB取证工具 目标主机 数据库服务器 图 9 公共数据库电子证据取证流程图 Fig. 9 Forensics process of the E-evidence network 3.2 电子证据数据的生命周期管理 随着公共数据库数据规模的急速膨胀,公共 部门数据资产的持有成本也迅速增长,导致公共 财政中信息技术和管理预算压力持续增加。一方 面,与其他公共产品供给一样可以通过适度市场 化来缓解财政预算压力。另一方面,过度的收集 和囤积数据造成的财政资源浪费则需要制定合理 的公共数据生命周期政策,从而降低法律风险和 信息技术成本。公共数据生命周期政策的基本目 标包括: 1) 基于法律和制度要求,明确公共数据保留 时间表。国家必须出台有关数据保留时间的法 规。例如,电信数据包含有关人际关系和位置的 丰富知识,对执法和反恐等公共产品具有极大作 用,很多国家和地区对电信用户姓名、出生日期、 计费地址、绑定银行卡号、电话号码、国际移动设 备识别码、主叫号码、被叫号码、通话时长、地理 位置、登录时间、下线时间、IP 地址、发件地址、 访问的 URLs 等有明确的电信保留时间。中国公 共数据库的数据保留时间并无明确的规定,更无 完善的法律和制度。 2) 提供法律和制度保留区,并支持电子数据 显示。随着公民意识的增强,大多数公共部门和 非政府组织将面临要求保存证据的起诉和调查。 在公共数据周期管理中心,为了应对证据收集和 分析,公共数据治理计划必须控制法律风险,提 供必要的电子证据展示。例如,2015 年 8 月 12 日,位于天津市天津港的瑞海公司危险品仓库发 生火灾爆炸事故,造成 165 人遇难。该事故的调 查报告显示,通过调取分析位于瑞海公司北侧的 环发通讯公司监控视频、提取比对现场痕迹证 据、分析集装箱毁坏和位移特征,认定事故最初 起火部位为瑞海公司危险品仓库运抵区南侧集装 箱区的中部。这个案件调查过程中,需要公安部 门提交视频监控设备和消防设备的传感数据的法 律效力展示。 3) 压缩公共数据并将其存档,降低信息技术 成本和提高公共数据资源应用绩效。公共数据当 局需要压缩静态公共数据,并将其归档,以降低 存储成本,提高应用绩效。这些静态数据可能存 在于数据仓库的某个环节,或分布式数据库的某 个节点,包括文件系统、NoSQL 数据库,甚至包 括 Hadoop 中的智能电表读数、传感器数据、RFID 数据和网络日志。在数据周期管理中,公共数据 当局必须考虑数据归档适用于所有属地法规。例 如,税务部门的数据当局在进行数据压缩和存档 过程中,必须以电子表单生成在存档过程中保留 原有格式,而不是将结构化数据转为 PDF 格式, 其目的是让涉税案件中方便税务审计员确定某家 公司是否有偷税漏税行为。否则,税务审计员必 须从头到尾查看成千上万的 PDF 文档。在公共 数据库生命周期管理中,对一大类分布式监测数 据,如环境监测、道路视频监控、消防、特种设备 运行监测等,数据当局在 Hadoop 和非 Hadoop 环 境下对其数据归档时必须考虑可达到的压缩程 度。就目前而言,LZO、Gzip 和 RainStor 是较流行 的高效数据压缩技术。 4) 管理实时数据流的生命周期。对公共数据 库中的高速实时数据流,数据当局必须明确其保 存价值,即是否需要永久保存这些数据流。这种 高速数据流往往由机器 (含传感器) 自动产生,当 机器数据产生异常行为时需要存储该异常事件发 生前后的每一个读数。例如,网络监测系统异常 事件的数据流获取中公安局网监大队需要确定保 存在内存中的数据应该是多少,可供选择的方案 为内存中保存 2 小时的 NetFlow 记录并每隔一分 钟将记录保存于硬盘一次,以备历史分析之用。 5) 保留适量社会团体和商业机构数据交互记 录,并支持电子证据展示。随着公民社会的日益 临近,公共部门将逐步退出某些领域,如科学技 术奖励评审、职称评审、信用管理、社会公证等, 这些领域的公共数据管理也将伴随公共事务移交 给社团组织,如工会、政党、行业协会、公众企业 (如大学、医院、BAT、华为技术公司、国家电网公 司等),相应的公共数据资源也将转移到这些社团 组织和商业机构。但是,法律仍然赋予了这些组 织一定的公共管理职能,如邮政公司有义务承担 偏远农村地区物流、信函投递等。伴随这些非政 府组织的公共服务职能的公共数据管理也必须支 持电子证据展示。例如,人民银行数据当局要求 ·1132· 智 能 系 统 学 报 第 14 卷
第6期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1133· 商业金融机构保留通过社交网站与顾客的交流记 我们以公安数据库为例,阐述公共数据库的电子 录,这些数据有的还涉及数据业务承包商的控 证据的串并逻辑。该逻辑体系主要有以下几个 制。因此,公共数据生命周期管理必须考虑到司 方面: 法、仲裁等公共事务对这些外围数据的电子证据 1)人员要素串并逻辑:人员要素信息是公共 需求,并制定相应的政策或法律。 安全工作的基础,它涉及公安业务的方方面面。 6)按照法律和制度要求,定期处置不再需要 各业务部门数据几乎都涉及到人员信息,包括常 的公共数据。很多公共部门认为永久保留公共数 住人口、暂住人口、流动人口、关押人员、犯罪嫌 据是对法律和公众质询最好的应对之策。但是, 疑人等,总计40多种,涉及的部门众多,包括治 任何一项数据资源的持有都将产生财务成本,而 安、交管、刑侦、禁毒、监管、外管等。 且法律对违法案件都有一定的追溯期限.实际上已 2)物品要素串并逻辑:在公安业务处理过程 经将一部分公共数据确定为负资产。按照法规, 中,凡涉及物品的业务数据,都是物品要素关联 对这部分丧失电子证据作用的公共数据资源做出 的范围,包括证件、枪支、爆炸物品、机动车、涉 适当处置是公共数据生命周期管理的重要环节。 案物品等。 3)事件要素串并逻辑:事件要素关联的范畴 4电子证据的关联 包括公安业务中凡是跟案件有关的处理过程和数 电子证据是存在于虚拟空间的证据,它离不 据,如治安案件、案事件笔录等。 开由电子设备和信息技术所营造的特殊环境,这 4)机构要素串并逻辑:组织要素包含范围涵 种环境的特殊性决定了它与传统人证、物证相比 盖公安日常业务管理涉及的机构和涉案机构,包 显然不同。首先,电子证据的虚拟空间通常不是 括旅馆、特业机构、涉枪机构、涉爆机构、房屋出 真实的物,而是由某种信号的方式存储的信息"叨。 租机构、单位犯罪等。 其次,电子证据所存在的虚拟空间非常繁杂,无 5)地点要素串并逻辑:地点要素是快速反 论是网络、云盘,还是光盘、硬盘、U盘等电子信 应、快速定位的关键,凡是涉及地点或地址的数 息空间,人们都无法触及。通常这些虚拟空间和 据都是地点要素关联的范畴。 案件事实存在的物理空间须经过某种转换才能建 6)时序逻辑:公共安全案件必须反映整个作 立相应的联系。这种联系即为内容关联性与载体 案过程,时间是整过演化过程必不可少的参量, 关联性。内容关联性即电子证据的数据内容与案 因此电子证据数据之间必须具备严格的时序逻辑 件事实之间的关联性,载体关联性即电子证据的 关联。 信息载体同当事人或其他诉讼参与人之间的关联 4.2电子证据的载体关联性 性。因此,法庭是否必须对电子证据作出双重的 对于电子证据的载体关联性,司法实践中几 关联性判断取决于这种双联性原理。只要缺少对 乎找不到完全相同的两起案件,从结构上来说, 任一关联性的认定或是对任一种认定的结论是否 任何案件都是由人、事、物、时、空构成的,对应 定的,都会导致法庭不采纳电子证据。 于虚拟空间的身份、行为、介质、时间、地址。也 4.1电子证据的内容关联性 就是说,在司法实务中,法庭要通过确认涉案信 在公共数据库的电子证据的关联性研究方面 息载体的身份、行为、介质、时间、地址关联性, 可供借鉴的成果还很少,问题也更加复杂,而且 将物理空间与虚拟空间的案件事实关联起来。 具有很强的实务性。从电子证据的内容关联方面 1)身份关联性。在虚拟空间中,人的关联性 讲,就涉及到高度复杂的数据智能串并分析。例 体现在人的身份上,主要表现为各类电子账号。 如,在公共安全数据库中,为了提高破案的成功 在具体案件事实中,需要能够证明案件所涉及的 率,必须要对案件库进行智能案件串并分析,即 电子账号归当事人或其他诉讼参与人所属或所 以人、事件、物、机构、地点等要素对各业务部门 用。这种身份关联性的构建必须排除涉案电子账 综合应用加以涵盖和抽象,在此基础上提出数据 号共有、共用或者案外人使用、冒用的情况。这 的关联串并要求,并最终形成数据链,作为证据 实际上是证明当事人或其他诉讼参与人就是虚拟 提供给检察院、法庭和仲裁庭等。由于这些电子 空间中以某个特定身份行事之人。2)行为关联 数据将作为证据的一部分,其本身也涉及法律适 性。案件事实涉及的各种法律责任一般发生在物 定性。因此,作为电子证据的公共数据链必须遵 理空间,但在虚拟空间中的案件事实则需确认当 从严格的逻辑关系,包括要素逻辑和时序逻辑。 事人或其他诉讼参与人是否实施相关行为,比如
商业金融机构保留通过社交网站与顾客的交流记 录,这些数据有的还涉及数据业务承包商的控 制。因此,公共数据生命周期管理必须考虑到司 法、仲裁等公共事务对这些外围数据的电子证据 需求,并制定相应的政策或法律。 6) 按照法律和制度要求,定期处置不再需要 的公共数据。很多公共部门认为永久保留公共数 据是对法律和公众质询最好的应对之策。但是, 任何一项数据资源的持有都将产生财务成本,而 且法律对违法案件都有一定的追溯期限,实际上已 经将一部分公共数据确定为负资产。按照法规, 对这部分丧失电子证据作用的公共数据资源做出 适当处置是公共数据生命周期管理的重要环节。 4 电子证据的关联 电子证据是存在于虚拟空间的证据,它离不 开由电子设备和信息技术所营造的特殊环境,这 种环境的特殊性决定了它与传统人证、物证相比 显然不同。首先,电子证据的虚拟空间通常不是 真实的物,而是由某种信号的方式存储的信息[17]。 其次,电子证据所存在的虚拟空间非常繁杂,无 论是网络、云盘,还是光盘、硬盘、U 盘等电子信 息空间,人们都无法触及。通常这些虚拟空间和 案件事实存在的物理空间须经过某种转换才能建 立相应的联系。这种联系即为内容关联性与载体 关联性。内容关联性即电子证据的数据内容与案 件事实之间的关联性,载体关联性即电子证据的 信息载体同当事人或其他诉讼参与人之间的关联 性。因此,法庭是否必须对电子证据作出双重的 关联性判断取决于这种双联性原理。只要缺少对 任一关联性的认定或是对任一种认定的结论是否 定的,都会导致法庭不采纳电子证据。 4.1 电子证据的内容关联性 在公共数据库的电子证据的关联性研究方面 可供借鉴的成果还很少,问题也更加复杂,而且 具有很强的实务性。从电子证据的内容关联方面 讲,就涉及到高度复杂的数据智能串并分析。例 如,在公共安全数据库中,为了提高破案的成功 率,必须要对案件库进行智能案件串并分析,即 以人、事件、物、机构、地点等要素对各业务部门 综合应用加以涵盖和抽象,在此基础上提出数据 的关联串并要求,并最终形成数据链,作为证据 提供给检察院、法庭和仲裁庭等。由于这些电子 数据将作为证据的一部分,其本身也涉及法律适 定性。因此,作为电子证据的公共数据链必须遵 从严格的逻辑关系,包括要素逻辑和时序逻辑[17]。 我们以公安数据库为例,阐述公共数据库的电子 证据的串并逻辑。该逻辑体系主要有以下几个 方面: 1) 人员要素串并逻辑:人员要素信息是公共 安全工作的基础,它涉及公安业务的方方面面。 各业务部门数据几乎都涉及到人员信息,包括常 住人口、暂住人口、流动人口、关押人员、犯罪嫌 疑人等,总计 40 多种,涉及的部门众多,包括治 安、交管、刑侦、禁毒、监管、外管等。 2) 物品要素串并逻辑:在公安业务处理过程 中,凡涉及物品的业务数据,都是物品要素关联 的范围,包括证件、枪支、爆炸物品、机动车、涉 案物品等。 3) 事件要素串并逻辑:事件要素关联的范畴 包括公安业务中凡是跟案件有关的处理过程和数 据,如治安案件、案事件笔录等。 4) 机构要素串并逻辑:组织要素包含范围涵 盖公安日常业务管理涉及的机构和涉案机构,包 括旅馆、特业机构、涉枪机构、涉爆机构、房屋出 租机构、单位犯罪等。 5) 地点要素串并逻辑:地点要素是快速反 应、快速定位的关键,凡是涉及地点或地址的数 据都是地点要素关联的范畴。 6) 时序逻辑:公共安全案件必须反映整个作 案过程,时间是整过演化过程必不可少的参量, 因此电子证据数据之间必须具备严格的时序逻辑 关联。 4.2 电子证据的载体关联性 对于电子证据的载体关联性,司法实践中几 乎找不到完全相同的两起案件,从结构上来说, 任何案件都是由人、事、物、时、空构成的,对应 于虚拟空间的身份、行为、介质、时间、地址。也 就是说,在司法实务中,法庭要通过确认涉案信 息载体的身份、行为、介质、时间、地址关联性, 将物理空间与虚拟空间的案件事实关联起来。 1) 身份关联性。在虚拟空间中,人的关联性 体现在人的身份上,主要表现为各类电子账号。 在具体案件事实中,需要能够证明案件所涉及的 电子账号归当事人或其他诉讼参与人所属或所 用。这种身份关联性的构建必须排除涉案电子账 号共有、共用或者案外人使用、冒用的情况。这 实际上是证明当事人或其他诉讼参与人就是虚拟 空间中以某个特定身份行事之人。2) 行为关联 性。案件事实涉及的各种法律责任一般发生在物 理空间,但在虚拟空间中的案件事实则需确认当 事人或其他诉讼参与人是否实施相关行为,比如 第 6 期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1133·
·1134· 智能系统学报 第14卷 是否收发了一条短信、一封邮件,是否修改了某 签名:警官A的签名、警官B的签名、警官 个文档或下载了某个网页等。这些行为将影响对 C的签名(至少3名警官签名):现场目击证人 当事人等主体法律责任的最终认定。3)介质关联 签名,现场被问询人签名。 性。电子证据需由硬盘之类的电子介质承载,因 说明:假定警官A负责电子证据采集,他将 此需要确认此类介质同当事人或其他诉讼参与人 发布警情记录表,同时发给每一个参与人(签名 的关系,若存在该电子介质为当事人或其他诉讼 者)。由于警情是会变化的,所以后续每个时间戳 参与人共有或共用的情况,那么需确立电子介质 下的电子证据记录的事项是会改变的,因此不一 中的数据同当事人或其他诉讼参与人之间的对应 定每次都是由警官A负责电子证据发布,甚至有 关系。4)时间关联性。物理空间的时间与机器时 新的警官或涉案人员、证人加入电子证据区块 间具有一定的对应关系,但又不完全一致,虚拟 链,故可有新的警官进行电子证据发布。执法记 空间的时间通常是机器时间。时间关联性就是要 录仪必须符合公安部的认证、在有效使用期限内 确立物理时间与机器时间是否一致以及其对应关 并且各项功能正常,执法记录仪的电子证据提取 系如何,从而确定在案发时间人的行为产生的相 有自动提取和和手工提取2种方式。电子证据的 应电子证据。在司法实务中,时间是定案的关键 自动提取或手工提取必须使用执法记录仪自带的 要素,如果出现物理时间与机器时间不同,就会 操作系统,多余的电子材料也只能系统定期自动 带来时间关联性问题。5)地址关联性。虚拟空间 覆盖,不能进行人工操作(合法的执法记录仪必 有独特的地址概念。大多数电子证据产生后都带 须有此项功能)。智能型执法记录仪截取的电子 有地址信息。这就要求确认这些地址信息与当事 证据需满足必要的清晰度并具有证据意义,手工 人或其他诉讼参与人之间的关系。 提取电子证据必须考虑电子证据的关联性。所获 上述身份、行为、介质、时间、地址的关联性 取的电子证据依法存档并进入办案大厅信息平台 均立足于虚拟空间,共同构成了电子证据的载体 中的对应区块。更重要的一点是,为了保证电子 关联性。在具体案件中,只有存在争议的关联性 证据的可信度,要让每个参与者(签名者)独立确 问题才具有实际意义,这正是电子证据关联性独 认电子证据区块链的变化,前提是2/3以上参与 特之处。 者同意区块链上删改或新增的内容。为什么要这 5 电子证据区块链系统原型系统概 样呢?为了达到证据共识,需要大多数人承认电 子数据的真实性。但是,为什么区块链系统不要 述 公安执法记录区块链为例 求所有的人都要签名呢?因为这会让少数缺席或 从公安民警接警、处警、立案、破案、结案到 拒签者危及整个共识的形成,尤其是可能的涉案 检察院起诉和法院判决过程中,电子证据的证据 嫌疑人的抵赖行为影响电子证据的形成,也可以 作用越来越大。其中既包括处警过程中自动数据 避免个别参与者因故不能及时签名或警员回避而 采集系统获取的电子数据(如道路视频监控、楼 导致案件续侦过程中电子证据的伴随生成。同 宇安防视频监控等)、警用执法记录仪及平台获取 时,这样做会避免在电子证据中给予某个人太大 的处警过程电子数据、办案大厅出入门禁(A/B 的权利。之所以需要2/3多数而不是过半多数签 门)、电子手环数据、问询笔录电子扫描件和音/视 名才有效,是因为如果只是过半多数签名有效的 频电子媒介及其承载的电子数据,也包括立案后 话,按Byzantine将军算法,可能会形成两个相互 侦查过程中获取的人证、物证的相关电子数据。 矛盾的电子证据版本。 为了提高整个办案过程中形成的电子证据的可信 度,本节提出了一个去中心化的警用电子证据区 时间戳n 块链系统原型。该电子证据系统的目的是形成不 内容:办案大厅门禁系统电子记录(A/B门)、 可更改并且保持所有办案环节所呈现的电子证据 办案区涉案人员电子手环记录、涉案人员身份查 内容关联一致性,称之为证据共识。区块链的形 证(身份证、免冠正面照、生物特征等),问询影响 成如下: 录音电子数据和笔录签名扫描件等。 时间戳1 签名:警官E的签名、警官F的签名、警官 内容:报警记录,处警任务单,警用车辆号 G的签名…警官A的签名、警官B的签名、警 牌,执法记录仪编号,执法记录仪获取的音视频 官C的签名、被询问人签名、现场目击证人签名, 电子资料,归档的电子材料。 现场被问询人签名
是否收发了一条短信、一封邮件,是否修改了某 个文档或下载了某个网页等。这些行为将影响对 当事人等主体法律责任的最终认定。3) 介质关联 性。电子证据需由硬盘之类的电子介质承载,因 此需要确认此类介质同当事人或其他诉讼参与人 的关系,若存在该电子介质为当事人或其他诉讼 参与人共有或共用的情况,那么需确立电子介质 中的数据同当事人或其他诉讼参与人之间的对应 关系。4) 时间关联性。物理空间的时间与机器时 间具有一定的对应关系,但又不完全一致[18] ,虚拟 空间的时间通常是机器时间。时间关联性就是要 确立物理时间与机器时间是否一致以及其对应关 系如何,从而确定在案发时间人的行为产生的相 应电子证据。在司法实务中,时间是定案的关键 要素,如果出现物理时间与机器时间不同,就会 带来时间关联性问题。5) 地址关联性。虚拟空间 有独特的地址概念。大多数电子证据产生后都带 有地址信息。这就要求确认这些地址信息与当事 人或其他诉讼参与人之间的关系。 上述身份、行为、介质、时间、地址的关联性 均立足于虚拟空间,共同构成了电子证据的载体 关联性。在具体案件中,只有存在争议的关联性 问题才具有实际意义,这正是电子证据关联性独 特之处。 5 电子证据区块链系统原型系统概 述—公安执法记录区块链为例 从公安民警接警、处警、立案、破案、结案到 检察院起诉和法院判决过程中,电子证据的证据 作用越来越大。其中既包括处警过程中自动数据 采集系统获取的电子数据 (如道路视频监控、楼 宇安防视频监控等)、警用执法记录仪及平台获取 的处警过程电子数据、办案大厅出入门禁 (A/B 门)、电子手环数据、问询笔录电子扫描件和音/视 频电子媒介及其承载的电子数据,也包括立案后 侦查过程中获取的人证、物证的相关电子数据。 为了提高整个办案过程中形成的电子证据的可信 度,本节提出了一个去中心化的警用电子证据区 块链系统原型。该电子证据系统的目的是形成不 可更改并且保持所有办案环节所呈现的电子证据 内容关联一致性,称之为证据共识。区块链的形 成如下: 时间戳 1 内容:报警记录,处警任务单,警用车辆号 牌,执法记录仪编号,执法记录仪获取的音视频 电子资料,归档的电子材料。 签名:警官 A 的签名、警官 B 的签名、警官 C 的签名······(至少 3 名警官签名);现场目击证人 签名,现场被问询人签名。 说明:假定警官 A 负责电子证据采集,他将 发布警情记录表,同时发给每一个参与人 (签名 者)。由于警情是会变化的,所以后续每个时间戳 下的电子证据记录的事项是会改变的,因此不一 定每次都是由警官 A 负责电子证据发布,甚至有 新的警官或涉案人员、证人加入电子证据区块 链,故可有新的警官进行电子证据发布。执法记 录仪必须符合公安部的认证、在有效使用期限内 并且各项功能正常,执法记录仪的电子证据提取 有自动提取和和手工提取 2 种方式。电子证据的 自动提取或手工提取必须使用执法记录仪自带的 操作系统,多余的电子材料也只能系统定期自动 覆盖,不能进行人工操作 (合法的执法记录仪必 须有此项功能)。智能型执法记录仪截取的电子 证据需满足必要的清晰度并具有证据意义,手工 提取电子证据必须考虑电子证据的关联性。所获 取的电子证据依法存档并进入办案大厅信息平台 中的对应区块。更重要的一点是,为了保证电子 证据的可信度,要让每个参与者 (签名者) 独立确 认电子证据区块链的变化,前提是 2/3 以上参与 者同意区块链上删改或新增的内容。为什么要这 样呢?为了达到证据共识,需要大多数人承认电 子数据的真实性。但是,为什么区块链系统不要 求所有的人都要签名呢?因为这会让少数缺席或 拒签者危及整个共识的形成,尤其是可能的涉案 嫌疑人的抵赖行为影响电子证据的形成,也可以 避免个别参与者因故不能及时签名或警员回避而 导致案件续侦过程中电子证据的伴随生成。同 时,这样做会避免在电子证据中给予某个人太大 的权利。之所以需要 2/3 多数而不是过半多数签 名才有效,是因为如果只是过半多数签名有效的 话,按 Byzantine 将军算法,可能会形成两个相互 矛盾的电子证据版本。 ······ 时间戳 n 内容:办案大厅门禁系统电子记录 (A/B 门)、 办案区涉案人员电子手环记录、涉案人员身份查 证 (身份证、免冠正面照、生物特征等),问询影响 录音电子数据和笔录签名扫描件等。 签名:警官 E 的签名、警官 F 的签名、警官 G 的签名······警官 A 的签名、警官 B 的签名、警 官 C 的签名、被询问人签名、现场目击证人签名, 现场被问询人签名。 ·1134· 智 能 系 统 学 报 第 14 卷
第6期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1135· 说明:设置办案大厅是公安执法规范化的基 签名:侦查警官甲、侦查警官乙、侦查警官 本要求。除非特殊情况,公安民警处警过程中, 丙…同案嫌疑人A、同案嫌疑人B、同案嫌疑 必须将涉案人员带回规范设置的办案大厅进行问 人C…证人A、证人B、证人C…委托证物检 询和进一步取证。办案大厅的功能多样化,一方 定人A、委托证物检定人B、委托证物检定人 面可以有效避免警务人员滥用职权、刑讯逼供、 C·证言证物登记人A、证言证物登记人B、证 伪造证据等,以此保护涉案人员的公民权利,也 言证物登记人C…检察官A、检察官B…警 可以有效保护办案警务人员的人身安全、被诬 官H、警官I…警官E的签名、警官F的签名、 陷;另一方面,也是更为重要的方面,通过办案大 警官G的签名、警官A的签名、警官B的签名、 厅可以有利于证据的获取和提高证据的采信度, 警官C的签名、被询问人签名、现场目击证人签 其中也包括电子证据的获取、固定和保存,以此 名,现场被问询人签名… 提高电子证据的可信性。因此,办案大厅设置及 时间戳n+m+2 软硬件设计必须有利于提高电子证据的可信度。 内容:结案申请和批准。提交结案申请表、 目前已有的办案大厅基本采用了传统的中心化数 结案材料、卷宗副本交接等。若结案申请被批 据库和加密措施,但是这种的中心化数据库和加 准,则建立卷宗、办理结案手续;若结案申请被退 密措施并不能保证电子证据材料的不可更改性, 回,则进人补充侦查阶段。 仍然有可能被篡改或删除。为此,本文在办案大 签名:检察官甲、检察官乙…侦查警官甲 厅的各个环节的电子证据取证过程中运用区块链 侦查警官乙、侦查警官丙…同案嫌疑人A、同 技术。 案嫌疑人B、同案嫌疑人C…证人A、证人B、 证人C…委托证物检定人A、委托证物检定人 时间戳n+m B、委托证物检定人C…证言证物登记人A、证 内容:立案卷宗(不予立案归档),立案程序电 言证物登记人B、证言证物登记人C检察官 子记录,涉案人员拘押程序电子记录等。 A、检察官B…警官H、警官I…警官E的签 签名:检察官A、检察官B、警官H、警官 名、警官的签名、警官G的签名、警官A的签名、 I…警官E的签名、警官F的签名、警官G的签 警官B的签名、警官C的签名、被询问人签名、 名、警官A的签名、警官B的签名、警官C的签 现场目击证人签名,现场被问询人签名 名、被询问人签名、现场目击证人签名、现场被问 时间戳n+m+3 询人签名…。 内容:补充侦查阶段,案件侦查中人、事、物 说明:经过在办案大厅的初步调查,视情况进 补充关联和补充取证,高危人群特征智能比对校 行下一步程序。若警情达不到立案条件,则办理 准和更正,多案智能串并分析等,获取更多的证 归档手续,释放涉案人员:若已经具备立案条件, 据,完善证据链,并产生相应的电子证据材料。 则启动立案程序。立案程序中包括公安部门内部 签名:侦查警官金、侦查警官木、侦查警官 程序和外部程序。外部程序中包括向检察院提报 水…新证人甲、新证人乙…侦查警官甲、侦 涉案人员拘押、批捕申请和向法院提报的财产保 查警官乙、侦查警官丙…同案嫌疑人A、同案 全、相关场所查封申请等。 嫌疑人B、同案嫌疑人C…证人A、证人B、证 时间戳n+m+1 人C…委托证物检定人A、委托证物检定人B、 内容:侦查阶段,案件侦查中人、事、物关联 委托证物检定人C…证言证物登记人A、证言 和取证,获取更多的证据,并产生相应的电子证 证物登记人B、证言证物登记人C…检察官A、 据材料。电子证据的关联包括高危人群特征数据 检察官B…警官H、警官…警官E的签名、 智能比对、刑满释放及在逃人员数据比对、挂失 警官F的签名、警官G的签名、警官A的签名、 物品登记数据智能比对、车辆及驾乘人员登记数 警官B的签名、警官C的签名、被询问人签名、 据比对、车辆维修记录比对、宾馆及娱乐场所消 现场目击证人签名,现场被问询人签名 费记录数据比对、多案智能串并分析等结果的电 时间截n+m+4 子记录。其中部分电子证据关联分析须经有经验 的警务人员或聘用的专业机构及个人进行人工干 结束语 预,则须加入技术检定人员资格认定和参与过程 记录。 本文建立了中国公共数据库电子证据系统的
说明:设置办案大厅是公安执法规范化的基 本要求。除非特殊情况,公安民警处警过程中, 必须将涉案人员带回规范设置的办案大厅进行问 询和进一步取证。办案大厅的功能多样化,一方 面可以有效避免警务人员滥用职权、刑讯逼供、 伪造证据等,以此保护涉案人员的公民权利,也 可以有效保护办案警务人员的人身安全、被诬 陷;另一方面,也是更为重要的方面,通过办案大 厅可以有利于证据的获取和提高证据的采信度, 其中也包括电子证据的获取、固定和保存,以此 提高电子证据的可信性。因此,办案大厅设置及 软硬件设计必须有利于提高电子证据的可信度。 目前已有的办案大厅基本采用了传统的中心化数 据库和加密措施,但是这种的中心化数据库和加 密措施并不能保证电子证据材料的不可更改性, 仍然有可能被篡改或删除。为此,本文在办案大 厅的各个环节的电子证据取证过程中运用区块链 技术。 ······ 时间戳 n+m 内容:立案卷宗 (不予立案归档),立案程序电 子记录,涉案人员拘押程序电子记录等。 签名:检察官 A、检察官 B、警官 H、警官 I······警官 E 的签名、警官 F 的签名、警官 G 的签 名、警官 A 的签名、警官 B 的签名、警官 C 的签 名、被询问人签名、现场目击证人签名、现场被问 询人签名······。 说明:经过在办案大厅的初步调查,视情况进 行下一步程序。若警情达不到立案条件,则办理 归档手续,释放涉案人员;若已经具备立案条件, 则启动立案程序。立案程序中包括公安部门内部 程序和外部程序。外部程序中包括向检察院提报 涉案人员拘押、批捕申请和向法院提报的财产保 全、相关场所查封申请等。 时间戳 n+m+1 内容:侦查阶段,案件侦查中人、事、物关联 和取证,获取更多的证据,并产生相应的电子证 据材料。电子证据的关联包括高危人群特征数据 智能比对、刑满释放及在逃人员数据比对、挂失 物品登记数据智能比对、车辆及驾乘人员登记数 据比对、车辆维修记录比对、宾馆及娱乐场所消 费记录数据比对、多案智能串并分析等结果的电 子记录。其中部分电子证据关联分析须经有经验 的警务人员或聘用的专业机构及个人进行人工干 预,则须加入技术检定人员资格认定和参与过程 记录。 签名:侦查警官甲、侦查警官乙、侦查警官 丙······同案嫌疑人 A、同案嫌疑人 B、同案嫌疑 人 C······证人 A、证人 B、证人 C······委托证物检 定人 A、委托证物检定人 B、委托证物检定人 C······证言证物登记人 A、证言证物登记人 B、证 言证物登记人 C······检察官 A、检察官 B······警 官 H、警官 I······警官 E 的签名、警官 F 的签名、 警官 G 的签名、警官 A 的签名、警官 B 的签名、 警官 C 的签名、被询问人签名、现场目击证人签 名,现场被问询人签名······ 时间戳 n+m+2 内容:结案申请和批准。提交结案申请表、 结案材料、卷宗副本交接等。若结案申请被批 准,则建立卷宗、办理结案手续;若结案申请被退 回,则进入补充侦查阶段。 签名:检察官甲、检察官乙······侦查警官甲、 侦查警官乙、侦查警官丙······同案嫌疑人 A、同 案嫌疑人 B、同案嫌疑人 C······证人 A、证人 B、 证人 C······委托证物检定人 A、委托证物检定人 B、委托证物检定人 C······证言证物登记人 A、证 言证物登记人 B、证言证物登记人 C······检察官 A、检察官 B······警官 H、警官 I······警官 E 的签 名、警官的签名、警官 G 的签名、警官 A 的签名、 警官 B 的签名、警官 C 的签名、被询问人签名、 现场目击证人签名,现场被问询人签名······ 时间戳 n+m+3 内容:补充侦查阶段,案件侦查中人、事、物 补充关联和补充取证,高危人群特征智能比对校 准和更正,多案智能串并分析等,获取更多的证 据,完善证据链,并产生相应的电子证据材料。 签名:侦查警官金、侦查警官木、侦查警官 水······新证人甲、新证人乙······侦查警官甲、侦 查警官乙、侦查警官丙······同案嫌疑人 A、同案 嫌疑人 B、同案嫌疑人 C······证人 A、证人 B、证 人 C······委托证物检定人 A、委托证物检定人 B、 委托证物检定人 C······证言证物登记人 A、证言 证物登记人 B、证言证物登记人 C······检察官 A、 检察官 B······警官 H、警官 I······警官 E 的签名、 警官 F 的签名、警官 G 的签名、警官 A 的签名、 警官 B 的签名、警官 C 的签名、被询问人签名、 现场目击证人签名,现场被问询人签名······ 时间戳 n+m+4 ······ 6 结束语 本文建立了中国公共数据库电子证据系统的 第 6 期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1135·
·1136· 智能系统学报 第14卷 区块链模型,较好地解决了公共部门运用公共数 LIU Pinxin.Relevance of electronic evidence[J].Chinese 据库自动提取数据并生成不可更改或删除的电子 journal of law,2016.38(6):175-190 证据的关键技术,并通过电子证据取证系统有效 [8]MA Zhaofeng,HUANG Weihua,GAO Hongmin.Secure 防范取证过程及证据转移过程中可能发生的电子 DRM scheme based on blockchain with high credibility[J]. 证据改变,提出运用数据生命周期管理持续改进 Chinese journal of electronics,2018,27(5):1025-1036. 公共数据库电子证据的证据效力。更进一步,从 [9]HAWLITSCHEK FLORIA,NOTHEISEN BENEDIKT. 法律的角度,讨论了电子证据运用环节的电子证 TEUBNER TIMM.The limits of trust-free systems:A lit- 据关联性,初步给出了载体关联、内容关联、案件 erature review on blockchain technology and trust in the 串并的一般原则。 sharing economy[J].Electronic commerce research and ap- 由于公共数据治理的复杂性,在某些方面研 plications,2018,29:50-63. 究尚不充分。在基于中国公共数据库的电子证据 [10]YUAN Hang,ZHANG Shibin.Study on design and ap- 关联性分析中,必须把司法实务中的专业领域知 plication of electronic evidence preservation pro- 识与电子证据信息相结合,构成“人-机”结合的时 gram[C]//Proceedings of 2011 International Conference 空关联、载体关联和内容关联的知识自动化系统 on Internet Technology and Applications.Wuhan:IEEE. 模型。 2011:1-4. [11]蔡维德,郁莲,王荣,等.基于区块链的应用系统开发方 参考文献: 法研究).软件学报,2017,28(6:1474-1487 [1]LEE Y W.PIPINO LL,FUNK J D,et al.Journey to data TSAI WT,YU Lian,WANG Rong,et al.Blockchain ap- plication development techniques[J].Journal of software, quality[M].Cambridge,Massachusetts:The MIT Press, 2017,28(6):1474-1487. 2006. [12]TIAN Zhihong,LI Mohan,QIU Meikang,et al.Block- [2]袁勇,王飞跃.区块链技术发展现状与展望几.自动化学 DEF:A secure digital evidence framework using block- 报,2016,42(4):481-494 chain[J].Information sciences,2019,491:151-165. YUAN Yong,WANG Feiyue.Blockchain:the state of the [13]刘文奇.复杂网络上的公共数据演化博弈与数据质量 art and future trends[J].Acta automatica sinica,2016, 控制[J].中国科学(信息科学),2016,46(11): 42(4):481-494. 1569-1590. [3]张宁,王毅,康重庆,等.能源互联网中的区块链技术:研 LIU Wengi.Public data evolution games on complex net- 究框架与典型应用初探[】.中国电机工程学报,2016, works and data quality control[J].Scientia sinica informa- tionis..2016,46(11):1569-1590. 36(15):4011-4022. [14]刘文奇.中国公共数据库数据质量控制模型体系及实 ZHANG Ning,WANG Yi,KANG Chongqing,et al. 证).中国科学信息科学),2014,44(7):836-856. Blockchain technique in the energy internet:preliminary LIU Wenqi.Modeling data quality control system for research framework and typical application[J].Proceed- Chinese public database and its empirical analysis[J].Sci- ings of CSEE,2016,36(15:4011-4022 entia sinica informationis,2014,44(7):836-856. [4]EDWARD MEINERT.ABRAR ALTURKISTANI.KIM- [15]ELISA NOE,YANG Longzhi,CHAO Fei,et al.A frame- BERLEY A FOLEY,et al.Blockchain implementation in work of blockchain-based secure and privacy-preserving health care:protocol for a systematic review[J].JMIR re- E-government system[J].Wireless networks,2018:1-11. search protocols,2019,8(2):153-159. [16]王继业,高灵超,董爱强,等.基于区块链的数据安全共 [5]GUO Rui,SHI Huixian,ZHAO Qinglan,et al.Secure at- 享网络体系研究[).计算机研究与发展,2017,54(4): 742-749. tribute-based signature scheme with multiple authorities WANG Jiye,GAO Lingchao,DONG Aiqiang,et al. for blockchain in electronic health records systems[J]. Block chain based data security sharing network architec- IEEE access,2018,6:11676-11686. ture research[J].Journal of computer research and devel- [6]王桂强.电子物证检验).刑事技术,2003(4)3-7. 0 oment,.2017,54(4):742-749. WANG Guiqiang.Examination of electronic evidence[J]. [1刀王电.公安信息化概论M).北京:清华大学出版社 Forensic science and technology,2003(4):3-7. 2011. [7]刘品新.电子证据的关联性[.法学研究,2016,38(6): WANG Dian.An introduction to public security informa- 175-190. tion[M].Beijing:Tsinghua University Press,2011
区块链模型,较好地解决了公共部门运用公共数 据库自动提取数据并生成不可更改或删除的电子 证据的关键技术,并通过电子证据取证系统有效 防范取证过程及证据转移过程中可能发生的电子 证据改变,提出运用数据生命周期管理持续改进 公共数据库电子证据的证据效力。更进一步,从 法律的角度,讨论了电子证据运用环节的电子证 据关联性,初步给出了载体关联、内容关联、案件 串并的一般原则。 由于公共数据治理的复杂性,在某些方面研 究尚不充分。在基于中国公共数据库的电子证据 关联性分析中,必须把司法实务中的专业领域知 识与电子证据信息相结合,构成“人-机”结合的时 空关联、载体关联和内容关联的知识自动化系统 模型。 参考文献: LEE Y W, PIPINO L L, FUNK J D, et al. Journey to data quality[M]. Cambridge, Massachusetts: The MIT Press, 2006. [1] 袁勇, 王飞跃. 区块链技术发展现状与展望 [J]. 自动化学 报, 2016, 42(4): 481–494. YUAN Yong, WANG Feiyue. Blockchain: the state of the art and future trends[J]. Acta automatica sinica, 2016, 42(4): 481–494. [2] 张宁, 王毅, 康重庆, 等. 能源互联网中的区块链技术: 研 究框架与典型应用初探 [J]. 中国电机工程学报, 2016, 36(15): 4011– 4022. ZHANG Ning, WANG Yi, KANG Chongqing, et al. Blockchain technique in the energy internet: preliminary research framework and typical application[J]. Proceedings of CSEE, 2016, 36(15): 4011– 4022. [3] EDWARD MEINERT, ABRAR ALTURKISTANI, KIMBERLEY A FOLEY, et al. Blockchain implementation in health care: protocol for a systematic review[J]. JMIR research protocols, 2019, 8(2): 153–159. [4] GUO Rui, SHI Huixian, ZHAO Qinglan, et al. Secure attribute-based signature scheme with multiple authorities for blockchain in electronic health records systems[J]. IEEE access, 2018, 6: 11676–11686. [5] 王桂强. 电子物证检验 [J]. 刑事技术, 2003(4): 3–7. WANG Guiqiang. Examination of electronic evidence[J]. Forensic science and technology, 2003(4): 3–7. [6] 刘品新. 电子证据的关联性 [J]. 法学研究, 2016, 38(6): 175–190. [7] LIU Pinxin. Relevance of electronic evidence[J]. Chinese journal of law, 2016, 38(6): 175–190. MA Zhaofeng, HUANG Weihua, GAO Hongmin. Secure DRM scheme based on blockchain with high credibility[J]. Chinese journal of electronics, 2018, 27(5): 1025–1036. [8] HAWLITSCHEK FLORIA, NOTHEISEN BENEDIKT, TEUBNER TIMM. The limits of trust-free systems: A literature review on blockchain technology and trust in the sharing economy[J]. Electronic commerce research and applications, 2018, 29: 50–63. [9] YUAN Hang, ZHANG Shibin. Study on design and application of electronic evidence preservation program[C]//Proceedings of 2011 International Conference on Internet Technology and Applications. Wuhan: IEEE, 2011: 1–4. [10] 蔡维德, 郁莲, 王荣, 等. 基于区块链的应用系统开发方 法研究 [J]. 软件学报, 2017, 28(6): 1474–1487. TSAI W T, YU Lian, WANG Rong, et al. Blockchain application development techniques[J]. Journal of software, 2017, 28(6): 1474–1487. [11] TIAN Zhihong, LI Mohan, QIU Meikang, et al. BlockDEF: A secure digital evidence framework using blockchain[J]. Information sciences, 2019, 491: 151–165. [12] 刘文奇. 复杂网络上的公共数据演化博弈与数据质量 控制 [J]. 中国科学(信息科学), 2016, 46(11): 1569–1590. LIU Wenqi. Public data evolution games on complex networks and data quality control[J]. Scientia sinica informationis, 2016, 46(11): 1569–1590. [13] 刘文奇. 中国公共数据库数据质量控制模型体系及实 证 [J]. 中国科学(信息科学), 2014, 44(7): 836–856. LIU Wenqi. Modeling data quality control system for Chinese public database and its empirical analysis[J]. Scientia sinica informationis, 2014, 44(7): 836–856. [14] ELISA NOE, YANG Longzhi, CHAO Fei, et al. A framework of blockchain-based secure and privacy-preserving E-government system[J]. Wireless networks, 2018: 1–11. [15] 王继业, 高灵超, 董爱强, 等. 基于区块链的数据安全共 享网络体系研究 [J]. 计算机研究与发展, 2017, 54(4): 742–749. WANG Jiye, GAO Lingchao, DONG Aiqiang, et al. Block chain based data security sharing network architecture research[J]. Journal of computer research and development, 2017, 54(4): 742–749. [16] 王电. 公安信息化概论 [M]. 北京: 清华大学出版社, 2011. WANG Dian. An introduction to public security information[M]. Beijing: Tsinghua University Press, 2011. [17] ·1136· 智 能 系 统 学 报 第 14 卷