2. 北京环丁环保大数据研究院,北京 100083;
3. 北京大学工学院,北京 100871
2. Beijing Huanding Environmental Big Data Institute, Beijing 100083, China;
3. College of Engineering, Peking University, Beijing 100871, China
区块链是一种在互联网上由多方共同维护,使用密码学保证传输和访问安全,能够实现数据一致存储、难以篡改、可追溯的记账技术,也称为分布式账本技术。典型的区块链把数据块以链式结构进行分布存储,从本质上讲,区块链是一种分布式网络数据库[1]。区块链作为一种在不可信的竞争环境中低成本建立信任的新型计算范式和协作模式,凭借其独有的信任建立机制,正在改变诸多行业的业务机制和运行规则,在数据可信、存证溯源、交易信任等需求场景具有内在的技术优势[2]。
区块链作为“信任的钥匙”,将改变数字化经济下社会价值的传递方式,是数字经济时代产业数字化的重要基础设施,是未来发展数字经济、构建新型信任体系、建立新型政府管理机制、建设智慧城市等不可或缺的技术之一[3]。我国已将区块链作为国家核心技术自主创新重要突破口,各省级政府都出台了区块链专项行动计划或发展规划。区块链已初步应用于金融、政务、民生、司法等领域[4, 5],应用于生态环境领域也是未来发展的必然趋势。
环境监测是环境质量保证及环境管理的根本基础及重中之重,没有真实的环境监测数据,就谈不上污染治理,更无法保证生态环境的管控。2017年9月,中共中央办公厅、国务院办公厅印发了《关于深化环境监测改革提高环境监测数据质量的意见》。意见指出:“环境监测是保护环境的基础工作,是推进生态文明建设的重要支撑。环境监测数据是客观评价环境质量状况、反映污染治理成效、实施环境管理与决策的基本依据。”在意见的要求和指导下,我国的环境监测质量控制体系已经基本建立[6, 7],但干扰现场采样、违规操作、数据失真、人为篡改等违规违法行为仍时有发生。据生态环境部官网消息,2021年前10个月,全国共查处重点排污单位自动监测数据弄虚作假案件达270起。因此,推进环境监测新技术、新方法研究,健全生态环境监测技术体系[8],提高环境监测的数据质量,确保监测数据真实可信,实现环境监测数据真准全的需求迫切、任务艰巨。
综上所述,环境监测数据质量面临的数据可信问题正是区块链技术的优势应用场景,开展区块链在环境监测中的应用研究具有重要的现实意义。
1 区块链技术简介 1.1 区块链技术的发展历程2008年11月9日,中本聪在Sourceforge.org注册了bitcoin项目,2009年1月9日,发布了开源的0.1版比特币客户端。比特币的出现,标志着第一代区块链技术体系的形成。比特币开创了去中心化密码货币的先河,充分检验了区块链技术的可行性和安全性,奠定了区块链技术的基础。比特币是区块链技术的初始版本,存在协议的扩展性不足、脚本语言功能有限等应用缺陷。2013年末,以太坊创始人Vitalik Buterin发布了以太坊初版白皮书。以太坊是第二代区块链技术的典型代表,它借助了比特币的核心思想,解决了比特币的缺陷,加入了智能合约,增强了扩展性和灵活性,但还存在处理能力不足、智能合约成本高的缺陷。
比特币和以太坊都是以数字货币为主要应用的区块链技术,很难与现实的应用结合。第三代区块链以联盟链为主要特征,将链式记账、智能合约和实体领域深度结合起来,实现去中心化的自治,发挥区块链的应用价值。自此,区块链技术进入区块链治理时代。我国具有自主知识产权的“长安链”是第三代区块链的杰出代表,具有灵活装配、软硬一体、开源开放的特点,目前已经广泛应用到银行、电力、通讯等关乎国计民生的多个行业。
1.2 区块链技术的应用区块链技术的应用场景日益广泛,从金融、产品溯源、政务民生、电子存证、知识产权到数字身份与供应链协同,应用场景不断深入和多元化,在供应链金融、政务大数据共享、智慧城市、物流溯源、司法存证、信贷审核等方向上已经有很多应用系统在运行并取得了较好的效果,显示出区块链技术的重大意义和极为广阔的发展空间。
2021年1月,北京微芯区块链与边缘计算研究院发布国内首个自主可控的区块链软硬件技术体系——“长安链”,它具有全自主、高性能、强隐私、广协作等特性。同年6月,全球首创的96核区块链专用加速芯片发布,该芯片采用专用处理器内核,保障核心技术自主可控,以芯片为核心打造的超高性能区块链专用加速板卡,区块链转账类智能合约处理速度提升50倍。此外,该芯片还具备强大的数据隐私保护能力,为实现“数据可用不可见”提供了自主可控、高效实用的方案。“长安链”正持续推进在重大民生、经济、社会治理等场景的应用,如数字人民币企业支付、电子政务跨省通办、冷链防疫、绿色减碳、司法存证等。长安链生态联盟成员达50家,囊括了27家央企、28家“世界500强”企业。可以看到区块链已经越来越频繁地被应用于各行各业。
2 人为影响环境监测数据质量的主要手段环境监测业务分为采、测、传、存、管、用等环节,每个环节都可能存在干扰数据质量的风险,在不同环节,人为干扰环境监测数据质量的手段和方法各不相同,下面结合实际案例进行说明。
2.1 干扰采样环境案例1:自2017年上半年起,山西某市生态环境部门为降低该市环境污染指标数据,授意相关人员伙同部分运维人员对该市6个国控环境空气自动监测站进行人为干扰。作案人员采用堵塞采样头、喷水或氢氧化钠中和等方式,同时或交替对市域内6个国控站点细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)采样设备进行人为干扰,导致监测数据严重失真。为防止作案过程被视频监控拍摄,作案人员对视频监控进行了远程屏蔽。
案例2:2019年12月,浙江某国家地表水自动监测站相关人员将塑料水管从河边自来水龙头接到自动监测站采水管,采用自来水稀释和间断性放水的手段降低地表水污染物浓度,导致监测数据严重失真。
案例3:2018年起,河北某钢铁有限公司采取拔掉自动监测设备上污染物取样管的方式,给未在现场的生态环境部门以工厂已经停产的假象,扰乱了应急响应时的整体部署。
干扰采样环境是环境监测数据造假的主要手段,造假手法多样,本质上都是从采样端造假,改变了样品的特征,让传感器接触不到真样品[9]。
2.2 干扰监测设备案例1:2018年6月,河南某碳素制品有限公司修改量程、斜率等可以影响最终排放数据的参数,进行监测数据造假。
案例2:2021年上半年,河北某公司运维人员与当地某板材有限公司相关人员通过手机修改在线监测数据。
干扰监测设备是环境监测数据造假手段之一,主要通过修改监测设备关键参数或监测数值的方法实现。这种方式技术要求较高,一般需要与设备厂家或运维公司合谋,其本质是通过特殊代码或后门程序修改监测设备中的数据[9]。
2.3 篡改数据案例1:2017年5月,湖北某陶瓷有限公司在系统端篡改伪造二氧化硫排放量。
案例2:2019年2—7月,浙江省某县污水处理公司技术员因担心考核不达标被扣工资,两次关掉监控系统,重置相关检测仪器,导致数据失真。
在系统端篡改数据是前几年常见的环境监测数据造假方式之一[9],这种方式简单粗暴,非常容易得手。但由于现在的监测系统都具有较为完备的日志文件,这种造假方式较容易被发现和锁定责任人,近两年类似的违法行为越来越少。
2.4 违规运维案例1:2021年5月,湖南某建材公司2021年以来自动监测设备无运维记录,所用的标准气体已过期,导致自动监测数据出现连续性恒值情况。
案例2:2021年1月,河北某焦化公司未按规范要求对设备进行定期维护,导致自动监测设备出现冷凝器故障、采样管路多处积水等问题,造成监测数据失真。
违规运维通常是业主或供应商为了节省成本,在监测系统的运维中偷工减料,导致设备不能正常运行而影响监测数据质量,这种数据造假方式在现实中较为常见[9]。
3 区块链保障环境监测数据质量的技术方案针对上述人为影响环境监测数据质量的手段,可采用区块链、大数据、人工智能(AI)、可信计算等技术,从采样环境保真、监测数据可信、数据防篡改、设备全生命周期可信管理等方面开展技术方案研究[10]。
3.1 采样环境保真与监测数据可信 3.1.1 监测监控设备的可信监测设备的参数或监测数据被后门程序修改、监控设备被干扰或屏蔽,这些现象都说明监测监控设备自身的可信性没有得到有效保障。显然,设备自身的可信是解决采样环境保真与监测可信的基础,就像中央派出的环保督察组一样,他们一定要讲真话,把看到的问题真实地记录下来并可靠地反馈回来,如果不能做到这一点,督察工作的效能便无从谈起。因此,如何保证监测监控设备“讲真话”是提高环境监测数据质量首先要解决的问题。
区块链与可信计算技术相结合是解决监测监控设备可信问题的有效途经。可信计算是一种主动免疫的新型计算模式,具有身份识别、状态度量、保密存储等功能,是保障关键信息技术基础设施自主可控、安全可信的核心关键技术[11]。可信计算是通过一个可信计算模块来实现的,像网卡的物理地址一样,每个可信模块都有一个唯一的标识码[11]。采用了可信模块的监测监控设备具有硬件化的唯一标识码,可以接受区块链CA(Certificate Authority)认证管理,成为区块链的一个轻节点,实现监测监控数据及参数的上链。可信监测监控设备的逻辑结构[12]如图 1所示。
可行监测监控设备通过ETPM(Embedded Trust Platform Module)实现设备可信环境度量[13]。设备加电后,ETPM首先启动,以可信根为起点,首先对BIOS(Basic Input Output System)进行可信度量,度量通过后启动BIOS,BIOS首先对系统的存储(如FLASH或磁盘分区等)进行安全度量,度量通过后,BIOS再对OS Loader进行度量,度量完成后把控制权交给OS Loader,OS Loader再去度量监测设备的操作系统,就这样依次把可信传递下去,直到系统参数、应用配置参数、其他与监测值形成相关的可配置参数以及应用程序。通过可信链的传递,保证了监测监控设备的软、硬件环境和参数的可信性[14],杜绝了后门程序和特殊代码,从而保证监测监控数据的可信性。可信监测监控设备的引导过程如图 2所示。
在监控、安防等设备可信的前提下,通过以下两个方面实现采样现场的保真:
(1)设备被干扰、屏蔽时异常报警与状态存证。当设备被干扰、屏蔽或非法侵入时,设备的参数会发生异常,可信设备的软、硬件安全保障机制会发现这一异常,及时进行报警并通过区块链对状态进行存证,为设备的异常归因和责任追溯保留证据。
(2)结合大数据、AI技术进行场景异常识别[15]。当监测设备记录下采样环境后,通过融合多源数据进行智能研判,判别当前场景是否被人为干扰。例如,某个站点的可信环境监控设备监测到站点湿度异常,可通过当地气象数据、相邻站点数据、视频监控数据、新闻舆情数据等多源数据进行综合研判,及时发现对采样头喷水等行为。结合大数据、AI等技术实现环境采样现场保真的逻辑如图 3所示。
可信的监测设备保证了设备软、硬件与参数的安全性,使监测设备能够真实地记录采样环境。除此之外,监测设备从区块链系统获取可信数据进行边缘智能分析也是实现监测数据可信的一种手段,如图 4所示。监测设备通过链上链下数据比对、时序数据异常分析、多参数关联分析、同行业排放置信区间分析等方法识别监测数据异常,防范监测数据造假。
监测数据篡改一般发生在数据传输和数据应用这两个环节。下面分别介绍区块链技术在这两个环节上防篡改的原理和方案。
3.2.1 数据传输过程中防篡改可信监测设备的数据以加密的形式存储在可信设备中,如何可靠地进行数据传输是实现数据可信的一个重要环节。实现数据的可靠传输要解决两个问题,一是监测设备如何接入区块链系统,二是数据传输过程的可靠。
监测设备一般是嵌入式设备,具有算力低、存储空间小、网络带宽低的特点,不能满足作为区块链节点的性能需求。本文提出了代理上链的方案,巧妙地解决了监测设备接入区块链系统的问题。可信监测监控设备接入区块链及数据上链过程如图 5所示。
区块链技术的非对称加密技术与数字签名技术保障了数据传输过程的安全可靠,在区块链网络中,数据的传输就是一个签名—传输—签名验证的过程,数据可靠传输示意如图 6所示。
当可信监测数据被区块链存证后,根据区块链的特性,数据是不可以被篡改的。由于区块链通过分布式一致性存储、交易共识、数字签名等机制来保证数据的安全,其效率和吞吐量必然受到影响,为了保证应用系统的效率,在许多区块链应用系统中都采用双通道存储机制,即数据既存储到区块链上,也保存到传统的数据库中。篡改和伪造数据的行为只能发生在传统数据库中,因此只要在数据应用中用区块链数据进行校验就能遏制篡改和伪造数据行为。区块链数据校验实现流程[16]如图 7所示。也可以在应用访问基础监测数据或关键参数时同时访问区块链和关系数据库,经校核一致后,方可作为应用的有效数据。
环境监测系统虽然有集中化的设备运维管理平台,但设备的全生命周期管理还有不完善的地方,供应商和运维机构在利益的驱使下,还存在设备运维偷工减料、篡改运维数据、人为变更运维流程的现象。另外,监测设备的巡检方式仍处于数字化/ 智能化转型过程中, 巡检数据的自动采集、可信存储、记录溯源、智能分析等全流程管控技术仍不完备。区块链的智能合约技术适用于业务流程管控,能确保业务流程不被人为干预、对业务流程数据进行区块链存证,对解决监测设备运维工作中面临的不足具有突出的技术优势。
针对环境监测设备运维管理方面的不足, 本文利用区块链数据可信、流程可控的特征,结合物联网、大数据、AI等技术, 为环境监测系统运维和设备全生命周期管理设计了技术方案,方案的功能架构如图 8所示。
以其中的设备运维管理部分为例,通过把设备及配件的校验、入库、安装、调试、运行、维修、下线全生命周期流程智能合约化,结合相应的可信数据采集设备,把流程执行的每一个步骤产生的数据都存证在区块链上,实现业务流程的不可干预。采用区块链进行监测设备运维管理流程控制的方法如图 9所示。
前述介绍了区块链在环境监测中应用方案,方案中涉及的采样环境保真和监测数据可信都需要更换现有的监测监控设备,这需要较大的成本和较长的过程。针对现有环境监测系统,本文以空气质量监测系统为例,提出了基于软、硬件结合的区块链智能数据质量控制器进行数据核验和存证的方式进行系统改造,从而提高监测数据质量的技术方案。
区块链智能数据质量控制器是一个边缘计算设备(图 10),采用国内自主研发的“长安链”作为底层平台,具有较强的计算能力和较大的存储空间,可以作为区块链的节点,也可以进行AI模型计算,在系统中完成实时数据上链、边缘计算、链上权限管理、分布式存储等功能。
现有监测系统一般通过数据采集传输仪(以下简称“数采仪”)管理前端监测设备,数采仪负责监测设备的参数管理、数据缓存[17]。区块链数据智能数据质量控制器通过USB与数采仪连接,从数采仪中读取监测参数、系统运行参数和监测数值。控制器的业务功能与流程如图 11所示。
本文以区块链智能数据控制器为基础,以系统最小耦合为原则,以基本不影响原来系统的业务、功能和流程为前提,提出了对现有空气质量监测系统进行区块链化改造的解决方案,为现有的空气质量自动监测系统增加数据防篡改、数据存证与溯源、运维流程监督等功能。改造方案主要包括以下4个方面:
(1)关键数据上链。关键数据包括监测设备参数、监测值、监测设备运行记录、关键过程数据等。区块链智能数据质量控制器从数采仪获取数据后对数据进行数字签名、加盖签名时间戳,利用自身通讯模块将签过名的数据广播至分散在不同监测子站的控制器和后台数据中心共同组成的区块链网络,并同步更新网络中各节点的数据账本。实现关键数据的存证、可追溯、防篡改[18]。
(2)数据异常发现与异常归因。针对空气自动监测站的大气常规6项污染物(SO2、NO2、O3、CO、PM10、PM2.5)以及固定污染源监测站的非甲烷总烃(NMHC),以高时间分辨率周期性记录污染物监测数值和仪器各类参数,并将数据采集系统运行记录按日汇总。基于数据异常诊断算法,利用实时监测数据、仪器参数数据、运维操作数据,并结合历史可信数据,对污染物浓度变化趋势进行预测。基于污染物浓度趋势,采用箱线图判定法、LSTM阈值判定法等数值预测方法,对当前监测数据合理值进行分析预测,给出监测值置信区间,得到监测数据异常概率。通过监测数据时序分析、环境参数交叉比对、多设备设置参数交叉验证、系统参数修改分析、外部设备接入分析等方法进行数据异常归因。
(3)监测设备全生命周期健康管理。设备健康是监测数据质量保证的前提,本文采用3.3节的方案,通过区块链进行设备运维管理,存证运维过程数据,结合设备重点参数、设备运行状态的监控数据。以设备运维过程、设备状态两类指标来描述设备的健康状况,采用基于定基指数的动态权重仪器健康指数算法进行设备健康评价。通过设备运维流程智能合约化进行运维业务流程控制。通过可信运维过程数据记录进行运维过程数据存证。综合以上方法实现监测设备全生命周期健康管理。
(4)监测数据追溯与查询。环境监测数据造假手段多样、行为隐蔽,具有多源头协同干扰、上下游串联的突出特点,仅依靠相关人员经验和结合有关数据综合判断的监管方式难以高效、全面地发现异常问题;对于发现的疑似监测数据异常,难以完整地还原在监测数据疑似异常出现时段监测设备的运行状况。针对上述问题,本文以区块链智能数据质量控制器的数据存证为基础,提出结合大数据、AI技术,追溯和查询包括数据篡改、数据突变、设备健康报警、采样口异常等状况的方案,完整地还原在疑似监测数据异常出现时段监测设备的运行状况,增强异常数据的追溯和查询能力。
研究团队实现了基于区块链数据质量控制器的现有空气质量监测系统改造方案,并在北京空气质量监测系统上进行了试点示范。试点示范共部署了5个点,点位部署如表 1所示。
试点示范共持续了6个月,在试点示范期间,通过双盲测试和实际运行案例,共发现设备异常、篡改参数、堵塞采样口、篡改数据等状况16起,例如:2021年4月14日10—15点,系统通过链上数据交叉核验,识别到车公庄站点因柳絮进入探头引起PM2.5监测仪器异常;2021年3月30日,识别到亦庄站点SO2监测仪器健康值过低;2021年1月29日,识别到亦庄站点PM10监测设备运维异常等等。试点示范验证了区块链能助力空气质量监测系统实现多类数据篡改行为和数据异常的自动识别,可有效防止监测造假、篡改数据、违规运维等行为,能显著提高空气质量监测的数据质量。
5 结论与建议区块链作为引领全球新一轮技术变革和产业变革的信息技术,正在被引入到越来越多的行业中,在溯源、存证、信任等方面的应用中表现出了突出的优点。环境监测行业数据质量控制所面临的主要问题也是溯源、存证和信任的问题。因此,区块链在环境监测中具有良好的应用前景和可操作性。
原生区块链监测系统以可信监测设备为基础,需开发可信监测、监控设备来保证环境保真、监测可信与传输可靠。通过数据校验机制、数据防篡改机制、智能合约流程控制技术实现监测系统数据可信和流程可控,可以全面提高环境监测的数据质量,但需要全面更换现有的监测监控设备,具有较大的成本压力。
针对现有监测系统,以具有边缘智能、数据存证、交叉核验、自适应组网等功能的区块链智能数据质量控制器为基础进行改造升级,可以实现监测数据及关键参数的存证、多类数据篡改行为和数据异常的自动识别与归因、监测监控设备的全生命周期可靠管控,可有效提高环境监测的数据质量。通过在北京市生态环境监测中心的试点示范,证明了方案的可行性和先进性。
区块链已经被确定为我国信息技术领域的战略发展方向,在环境领域广泛深入应用是大势所趋,是保证精准治污、依法治污的关键“钥匙”。因此,抓住机遇,做好布局,积极行动,大力推进区块链在环境监测乃至环境管理中的应用具有重要意义。
[1] |
邹均, 张海宁, 唐屹, 等. 区块链技术指南[M]. 北京: 机械工业出版社, 2016.
|
[2] |
中国信通院. 区块链白皮书[EB/OL]. [2022-03-25]. http://www.caict.ac.cn/kxyj/qwfb/bps/201809/P020180905517892312190.pdf.
|
[3] |
中国信通院. 区块链赋能新型智慧城市白皮书[EB/OL]. [2022-03-25]. http://www.caict.ac.cn/kxyj/qwfb/bps/201911/t20191108_269147.htm.
|
[4] |
工业和信息化部信息中心. 2018年中国区块链产业白皮书[EB/OL]. [2022-03-25]. http://www.ce.cn/culture/whwx/tu/201805/28/P020180528390616322095.pdf.
|
[5] |
腾讯研究院. 2019腾讯区块链白皮书[EB/OL]. (2019-10-19). https://www.idcbest.com/idcnews/11004040.html.
|
[6] |
夏新, 米方卓, 冯丹, 等. 国家环境监测网质量体系的构建[J]. 中国环境监测, 2016, 32(4): 35-38. |
[7] |
中国环境监测总站. 关于印发《国家环境监测网环境空气自动监测质量管理办法(试行)》的通知[EB/OL]. (2014-12-03). http://www.cnemc.cn/gzdt/wjtz/201412/t20141203_648604.shtml.
|
[8] |
国务院办公厅. 国务院办公厅关于印发生态环境监测网络建设方案的通知[EB/OL]. (2015-07-26). http://www.gov.cn/zhengce/content/2015-08/12/content_10078.htm.
|
[9] |
环境保护部. 关于印发《环境监测数据弄虚作假行为判定及处理办法》的通知[EB/OL]. (2015-12-29). https://www.mee.gov.cn/gkml/hbb/bwj/201512/t20151230_320804.htm.
|
[10] |
郭婷. 监测数据的真实性如何保障[N]. 中国环境报, 2017-08-30(03).
|
[11] |
邹德清, 羌卫中, 金海. 可信计算技术原理与应用[M]. 北京: 科学出版社, 2018.
|
[12] |
刘建伟, 程东旭, 李妍. 移动终端高安全可信计算平台架构[J]. 中兴通讯技术, 2015, 21(03): 11-15. DOI:10.3969/j.issn.1009-6868.2015.03.004 |
[13] |
刘明达, 周懿, 拾以娟. 基于硬件虚拟化TCM的信任链扩展方法[J]. 小型微型计算机系统, 2019, 40(1): 117-120. |
[14] |
张少敏, 王志男, 王保义. 基于可信计算的用电信息采集终端完整性检测方案[J]. 电力自动化设备, 2017, 37(12): 60-66. |
[15] |
王春迎, 潘本峰, 吴修祥, 等. 基于大数据分析的大气网格化监测质控技术研究[J]. 中国环境监测, 2016, 32(6): 1-6. |
[16] |
IBM. HyperLedger Fabric[EB/OL]. [2022-03-25]. https://hyperledger-fabric.readthedocs.io/en/latest/whatis.html#.
|
[17] |
李娟, 王湜. 环境空气自动监测质量管理框架体系研究[J]. 环境监控与预警, 2016, 8(1): 60-63. |
[18] |
冯翔, 刘涛, 吴寿鹤, 等. 区块链开发实战: Hyperledger Fabric关键技术与案例分析[M]. 北京: 机械工业出版社, 2018.
|