大数据的发展已经成为当今社会发展的重要领域,大数据战略上升为国家战略。近年来,国务院、各部委、各地方陆续出台和实施了与大数据相关的各项政策文件、专项、行动计划等。大数据正从概念和理论逐渐走向应用和落地,大数据正在成为促进政府管理转型的新动力、经济发展的新动能。但大数据如何实施、如何落地、如何在行业中发挥真正的价值仍存在众多的难点。
1969年,IBM(国际商业机器公司,International Business Machines Corporation)的研究员Niklaus Wirth提出采用“自顶向下逐步求精、分而治之”的原则进行大型程序设计,即从需要解决的问题出发,自顶向下将复杂问题逐步分解成一系列相对独立的子问题,每个子问题可以再进一步分解,直到问题简单到可以很容易地解决[1]。随后该概念被西方国家广泛用于军事和社会学领域,甚至成为政府统筹制定国家发展战略的重要分析方法[2-6]。本文通过对顶层设计方法的研究,提出了生态环境大数据顶层设计的总体框架。
大数据、云计算、物联网等信息技术的迅速发展促进了政府管理模式的变革,推动了政府管理现代化的进程,同时也对政府管理提出了巨大的挑战[7, 8]。信息化面临的主要问题已从孤立、个体转向整体、共性,需要从全局角度统筹规划;以需求为驱动的信息化建设虽然大大加快了信息化建设和实施的速度[9],但也带来了应用协同、数据共享和可扩展性差等方面的问题;“重实施、轻规划,重技术、轻管理”的普遍误区使得信息化建设缺乏清晰的主线。尤其是在高度重视共享、协同、融合和集约化的大数据时代,上述问题所带来的影响将更加凸显,运用科学、合理的顶层设计显得尤为重要。
1 顶层设计的理念 1.1 顶层设计的基本概念和特征顶层设计是一种有目标和有计划的创作行为,是衔接价值理念和操作实践的蓝图[1],即运用理念一致、架构统一、共享协同、标准化的系统论方法[6],从全局的角度出发,对任务涉及的各方面、各层次、各要素统筹规划,集中有效资源,高效、快捷地实现既定目标。顶层设计必须具备以下特征:一是要对影响业务全局性、整体性的内容进行明确阐述,避免所属单位依据自身理解来开展信息化工作;二是要从业务的视角梳理系统边界以及从组织的维度加以明确,同时要建立各部分间的关联关系、匹配共性,实现互联互通、业务协同和资源共享;三是对跨组织、跨业务领域的大型、综合性系统的技术架构要定义清晰、规范统一,明确技术标准;四是要制定清晰、明确、可行的实施路径;五是要有制度保障,确保顶层设计的贯彻实施。
1.2 顶层设计的原则大数据是大型、复杂的综合性信息工程,在理论、应用、技术层面尚有不确定性,还需开展大量的探索和实践工作,在设计时必须遵循现有的实际情况,因地制宜、因势利导地开展设计工作。
承前启后,统筹全局。需要考虑与现有信息化设施的衔接问题,还需要兼顾如何适应未来的新理念、新技术,确保可持续发展,同时还要适应相关单位的需求。
实用适用,创新发展。要坚持实用性和适用性原则,以满足业务要求为核心,以应用驱动为导向,同时鼓励创新应用。
广泛调研,精准对标。在设计理念、技术路线选择、应用场景设计等方面,需要开展大量的调研和行业对标,积极吸纳成功经验,结合业务特点和行业现状。
注重运维,持续优化。在设计时需要打破传统的以项目为核心的建设模式,注重建立大数据的长效机制,不以完成建设为任务,应以促进业务发展为目标,加强建设后的运行维护和持续改进,适应不断变化的业务发展需要。
统一标准,强化安全。采用统一的标准规范体系,注重标准的落地实施,减少由于平台、标准的不统一所造成的系统间互联互通的障碍;高度重视系统安全。
强化服务,减少强制。强化服务能力,注重关键环节的管控,尽量减少所谓的强制要求,避免面面俱到的技术管理模式,将建设重点由技术驱动转变为应用驱动。
1.3 顶层设计的方法结合生态环境领域实际情况,把握大数据时代特征,围绕生态环境大数据的主要目标,以系统、多视角的方法,进行全面的框架设计,达到统一架构、共享资源、规范业务的目的。
掌握现状。详细梳理现有的业务现状和信息化现状,包括自身存在的痛点、难点问题和外部期望的热点、重点问题。
明确目标。明确期望借助大数据解决的实际业务问题、达到的预期目标以及信息化建设的主要指标,目标的设定要明确、合理,具有可实施性。
设计架构。借鉴成熟的体系结构方法(Zachman、TOGAF、FEA[7]-[9]等),基于调研分析成果,设计业务架构、应用架构、数据架构、技术架构,形成有机联动的信息化架构资产。
制定路线。划定实现目标的清晰、合理的实施步骤和进度、资金安排,将主要目标的实现细分为阶段性目标。
强化基础。在技术架构设计时,对基础性、综合性的平台进行专题设计,强化基础平台建设,为实现业务目标做好技术储备,形成公共信息服务,避免因信息化基础不牢而增加业务目标的实现难度。
长远管控。为了保证顶层设计能被贯彻落实,需要具有完善的工作机制和组织保障,并设定强有力的管控机制,通过制度将顶层设计的执行固化,不能随意地超越和偏离原有路线。
顶层设计方法如图 1所示。通过对业务现状和信息化现状的分析,设定目标,设计并分析架构后通过一定手段实现业务、技术架构对数据架构和应用架构进行补充和完善,明确实施步骤后规定进度安排及资金安排,实现业务、信息化的改进和优化。
计算机应用于一个组织的管理中,一般要经历从初级到不断成熟的成长过程,图 2的诺兰模型可以帮助管理人员解释成长阶段的含义以及企业的成长阶段对信息技术的意义。诺兰模型的六个阶段分别是初始阶段、普及阶段、控制阶段、整合阶段、数据管理阶段和成熟阶段。任何组织在实现以计算机为基础的信息系统时都必须从一个阶段发展到下一个阶段,不能实现跳跃式发展。
诺兰模型是一种逐步发展成熟的模型。1947年,美国管理信息系统专家诺兰和吉布森(Nolan,Gibson)提出一个理解信息技术的使用与管理的模型,称为成长阶段模型(stages of growth model)[10]。他们又于1979年,在经过实践进一步验证和完善后,将其调整为六阶段论,分为初始阶段、普及阶段、控制阶段、整合阶段、数据管理阶段和成熟阶段。其中数据管理阶段的特点是:组织的数据量显著增长并且成为组织的重要资源,基本实现资源整合、信息共享,信息资源规划和利用效率显著提高;成熟阶段的特点是:信息化建设已经满足组织各层次的需要,从简单的事物处理转变为支持高效管理的决策,把信息化与管理过程结合,提升组织的竞争力和发展潜力。
通过诺兰模型可以很清晰地看出,早在20世纪70年代,数据在信息化中的作用就已经得到了信息化从业人员的共识,并将其纳入信息化的发展阶段中。大数据建设覆盖了诺兰模型的第四、五、六阶段,甚至在其上可以衍生出第七阶段,即大数据阶段。诺兰模型总结了信息化发展的一般规律,指出模型中各个阶段都是不能跳跃的,只有做好了前序阶段的工作,才能有效地实施大数据战略。大数据的顶层设计可以说是信息化顶层设计的一种升华,大数据建设本质依然是信息化,只是在目标层面上更加关注数据的价值和作用,更加重视数据改善和变革业务的能力。大数据顶层设计就是要重新梳理目前信息化工作的问题,以新的视角重新规划设计的目标。
2 业务架构设计 2.1 设计方法业务架构设计是整个顶层设计的核心部分,业务架构设计的目标是:掌握了解业务部门当前和未来的信息化需求,设定顶层设计的总体目标;明确系统间关系,解决业务流程衔接不畅问题,促进系统间的互联互通;明确业务归属、系统边界和责任分工,避免需求的重复提出和重复建设。
业务架构设计分为五个阶段:一是划分业务域。从宏观上对业务进行划分,形成相对独立的业务领域,一般情况下应在组织架构的基础上进行划分。二是梳理业务流程。描述业务功能所属的流程与子流程,包含每个业务中包括的业务活动/子流程,每个活动的先后关系,从一个活动跳转到另一个活动的条件、每个活动的责任主体(角色或组织单元)、每个活动的类型(如人工、系统等)等。三是确定业务活动。业务活动指具体的业务步骤、输入/输出信息。业务规则、每个活动的责任主体。对业务信息的操作以及涉及的非功能性需求。四是明确业务角色和业务信息,明确所涉及的收集本项目涉及的组织单元和角色,形成组织单元清单和角色清单;收集涉及的所有业务信息,如表单、报表、文档等业务信息,以及这些业务信息的内容和校验规则。在完成业务架构的基础上开展应用架构设计,应用架构描述了业务应用划分、应用组件构成,业务应用与业务能力、业务流程之间的关系,业务应用间及业务应用内部各部分间的集成关系,业务应用部署模式等内容。
2.2 生态环境大数据业务域划分根据《国民经济和社会发展第十三个五年规划纲要》的总体设计,“十三五”期间生态环境保护工作思路主要体现在以下方面:以提高环境质量为核心;实行最严格的环境保护制度;打好大气、水、土壤污染防治三大战役;环境管理向系统化、科学化、法治化、精细化、信息化“五化”转变。
根据以上要求,结合生态环境大数据的总体目标和环境保护部门的“三定”方案,共分为环境监管、科学决策和对外服务三大业务域,其中环境监管包括环境质量管理、自然生态管理、污染源管理、核与辐射管理、环境管理等;科学决策域包括形势分析、危机处理、综合分析、预测预警和整体评估等;对外服务包括国际合作、宣传教育、行政审批、信息公开和举报投诉等。
根据生态环境大数据的顶层设计,对环境保护领域的业务划分如图 3所示。
根据国内外成熟的架构设计理论,生态环境大数据顶层设计的总体架构基本分为五大体系:大数据创新应用及技术保障体系、工作机制保障体系、标准规范体系、安全运维体系和数据资源整合共享体系。总体框架图如图 4所示。
大数据建设的工作机制保障体系主要包括组织协调、项目审批和绩效考核等方面。大数据是一个全新的治理理念,强调信息的融合和共享,传统的金字塔式的纵向管理结构将向强调横向传播的网络式模式倾斜[11],需要建立业务部门和信息化部门共同参与、高效集中的权威管理部门,协调推进大数据规划、建设、运行、共享等环节。加强项目审批制度的建设,一是严格把控项目立项审批,对信息化基础设施和通用性应用软件的建设原则上不予审批;对使用范围小、频度低、仅以服务个别部门司局或处室的项目原则上不予审批;重点支持以重点业务领域为管理、服务对象的综合性应用项目建设。二是实行项目代建[12],审批部门做决策、应用部门提需求,代建部门进行项目建设实施,代建部门既对审批部门负责,又要满足应用部门需要,保证项目在建设上规范统一、资金使用高效安全。加强对项目的评估和审计,在应用效能、用户满意度、资源共享、业务协同等方面对项目进行综合评估,评估结果要与奖惩措施相结合, 并建立相应的激励约束机制。
2.3.2 制约:标准规范体系生态环境大数据标准规范体系的主要目标是实现应用、平台的标准化设计、开发和运维,实现数据的标准化使用,由技术标准、管理标准和工作标准三大部分构成。其中,技术标准包括数据编码、传输交换、服务、图示表达四类[13]。数据编码规范信息或数据的分类、编码和表达,主要用于解决信息语义一致性问题;传输交换规范解决同级或上下级间数据的传输和交换;服务用于规范公共服务平台、产品的输入输出方法和集成方法;图示表达用于生态环境领域相关对象、要素等的规范化表达,避免因表达形式不同而造成理解差异。管理标准规范大数据项目的管理流程,由项目规划、建设、运维、安全、绩效考核等组成。工作标准由工作制度标准、岗位工作标准、工作流程、应急处置标准构成。同时,在标准规范的实施过程中,需要建立有效的抓手促使标准规范落地,尤其是技术类标准规范,不可能依靠手工工作逐条审核,只能依靠具有约束性质的统一平台,利用技术手段约束和监督标准规范落地。
2.3.3 核心:大数据创新应用及技术保障体系大数据创新应用及技术保障体系分为基础设施层、数据资源层、统一应用集成服务框架和大数据应用层四个层面,设计的基本出发点是“集而不中、统而不一、分而不散”。基础设施层主要包括云计算资源池(计算及存储资源)、网络环境(内网、专网和互联网)以及物联网感知层(自动监测/监控设备),设计上应以集中管理、集中使用为出发点,利用先进的信息化技术对早期分散建设的机房、网络、软硬件等基础设施统一管理、统一调度,用技术手段屏蔽空间和技术上的差异,将空间上不集中的和技术路线上有差异的基础软硬件设施纳入集中管理和使用。数据资源层包括环境质量、生态环境、污染源、核与辐射和环境管理等基础数据集和在此基础上抽取形成的综合分析和交换共享数据集,以及与外部进行数据交换的接入组件,设计上数据资源层应遵循“分而不散”的原则,即核心数据集中存储、一般数据分散存储、各类数据统一应用。核心数据在纵向上实现自下向上的集中,建设国家级的生态环境数据资源中心;横向上实现各业务部门的数据联动,一数一源、一数多用,避免数据的重复采集和口径不一,以用促质,以数据的多角度应用,促进数据质量提高。一般数据以本地存储为主,向上汇聚各类统计、分析结果,以其提炼出的数据产品为核心数据。统一应用集成服务框架是应用系统建设、运行和集成整合的基础性平台,应用系统的规划、设计、开发、应用及运行维护应在统一的思路和架构下逐步开展,运用统而不一的设计理念,利用统一的基础平台,在访问、用户、认证、审计、接入、服务、运维、数据交换和共享、基础空间信息、检索查询、数据代码等具有共性的信息化基础设施层面实现统一建设和应用,统一管控应用系统并提供统一的集成整合服务,利用一体化平台实现标准落地、集中应用、统一管理、综合服务,为业务协同和数据共享提供基础平台。大数据应用层分为协同应用和集成应用两类,协同应用以服务生态环境保护业务领域或综合性管理工作为主要目标,以专业性、综合性的应用系统为主体,杜绝“小散乱”的应用系统建设模式;集成应用以服务决策管理和统一对外服务为主,集成各类业务数据和信息,从宏观角度进行生态环境形势综合研判、环境政策措施制定和评估、环境风险预测预警、重点工作会商评估等工作,并以“一站式”窗口向社会公众提供行政审批、信息公开、监督举报、国际合作等服务。
2.3.4 保障:安全运维保障体系大数据环境下,安全体系除通用的技术体系、组织体系和管理体系外,主要分为云平台安全、数据安全、接口安全以及利用大数据技术实行安全防御。云平台是大数据的主要承载设施,基础设施层安全以云平台安全为主。数据安全主要解决数据采集、传输、存储、使用、共享过程中以及隐私数据保护所带来的安全问题;接口安全主要解决数据在不同的提供方、接收方之间的数据接口面临的安全问题。同时,安全管理中也可以用大数据技术开展安全方面的大数据分析和挖掘,提高安全防护水平。
大数据时代的运维工作与传统运维工作有较大的不同。传统运维工作基本上以信息化部门为主,以基础设施和应用系统的正常运行为主要目标,大数据背景下,运维工作的整体目标除强调传统运行工作外,更加重视数据的运维。数据运维主要包括数据质量管理、数据资源管理、业务级支撑等内容。数据质量管理强调业务部门和信息化部门的共同参与、协同辅助,主要有两部分内容:一是业务部门的数据质量控制,包括业务数据含义与规则制定和数据的及时性、完整性、准确性的审查;二是信息化部门的数据质量统计,定期或动态地对各个业务系统的数据进行质量统计,并及时通知管理部门。数据资源管理主要包括数据资源总体/分类统计、数据字典和元数据、统一编码和资源目录的管理和动态更新等。业务级支撑是数据运维的核心目标,运维团队要了解各系统的核心功能,掌握业务流程和制度,用大数据方法进行数据统计和分析,促进业务协同并开展绩效考核。
2.3.5 基础:数据资源整合共享体系数据资源整合共享体系是实现生态环境大数据应用的基础。数据资源整合共享体系的核心内容是数据治理(data governance)[14],即以实现数据标准化为目标,通过组织、管理和技术相结合,实现全面、高效的数据管理。组织上需要建立战略层、管理层和执行层三个层次,战略层负责制定数据治理的目标和规划等,解决数据治理过程中各部门的权、责、利问题;管理层负责制定跨部门的协作流程和管理办法,以及工作计划和考核办法等,落实战略层提出的决策和要求;执行层通过运用技术手段,把数据治理目标转化为具体行动。管理上需要建立相关的数据标准、管控机制、绩效评估、安全管理制度等。数据规范通过制定跨部门、跨系统的语义规则,解决数据管理生命周期中的语义冲突问题;管控机制使相关人员明确在数据产生、存储、应用整个生命周期包含的工作内容和工作流程;绩效评估通过建立量化的考核机制、设定考核目标和定期公开考核结果,推动数据问责机制的落实;安全管理包括数据生成及传输、数据存储、数据处理及应用、数据销毁四个方面,安全管理制度主要用来规范日常工作中安全地使用数据,并且指导技术人员如何实施数据安全工作。技术上数据治理涵盖了从前端业务应用系统、后端业务数据库到终端的数据分析,从源头到终端再回到源头形成一个闭环的负反馈系统,包括元数据管理、主数据管理、数据仓库、大数据技术、数据总线技术等,主要目的是通过技术手段建立统一的数据视图、承载相关流程,同时支持监控预警、故障处理、知识总结、评估优化等管控工作。
3 总体框架的落地总体框架的设计不是科研课题而是实践问题,不能落地的设计是没有任何价值的,设计没有绝对的对与错,重要的是各方能够遵循总体框架并不断地修正和完善,坚定不移地沿着制定的方法、路线实施。
3.1 实行“垄断主义”+“联邦制”的管控模式Information politics[15]一文研究了信息管理的五种模式:“技术空想主义”“无政府主义”“封建主义”“垄断主义”和“联邦制”,并从信息的完整性、存取保障、质量和管理效果等方面进行了综合评价,“联邦制”获得了最高的评价。“联邦制”的管控模式强调信息部门与业务部门在职责明确的前提下共同参与。信息部门侧重于信息标准化、信息基础架构、信息系统建设、信息系统运行维护等工作;业务部门侧重于提出业务需求,反馈业务发展变化。垄断主义是指领导个人决策,是在信息部门或业务部门一方过于强势,偏离既定路线之后,能坚定地执行总体框架。只有两者结合,才能统筹信息化和业务发展规划,发挥协力优势。
3.2 制定合理的工程项目总体框架的最终着力点是工程项目,项目是落实总体框架最直接的手段,这就要求立项审批部门必须是框架管控的第一责任人,对于不遵循框架甚至游离于框架之外的项目一定要在立项阶段坚决杜绝。确定工程实施的关键路径,对基础设施、基础性平台、试点应用等优先安排资源、压缩建设时间;制定年度工程目标、实施计划和验收标准,确保工程的有序推进。
3.3 注重横纵关系的协调总体框架设计是一项全局性的工作,覆盖的是生态环境保护全领域,涉及多级机构,各级单位对顶层设计的了解程度、接受程度和信息化建设水平差异较大,管理模式、技术架构等存在多样性,会给框架的推广带来难度,故在框架的推广实施过程中需要建立一种合理的横纵协调机制,将框架设计的理念、路线层层传递,确保框架层层落地。
4 结论生态环境大数据是在生态环境保护研究和实践工作中采用大数据技术或大数据思想对传统生态环境保护工作进行改革、扩展和深化的新兴交叉学科,其最重要的作用是让决策者更加注重数据的价值,把大数据的理念、方法与环境管理有机融合,通过大数据引发对信息化的重视,以大数据带动信息化的整体发展。本文对生态环境大数据总体框架进行了初步的研究和探讨,希望能对生态环境大数据建设起到参考作用。
[1] |
于施洋, 王璟璇, 杨道玲, 等.
电子政务顶层设计:基本概念阐释[J]. 电子政务, 2011(8): 2-7.
|
[2] |
CHRISTIANSEN P E, GØTZE J.
Trends in governmental enterprise architecture:reviewing national EA programs[J]. Journal of enterprise architecture, 2007, 3(1): 8-18 |
[3] |
SEIFERT J W. Federal Enterprise Architecture and E-Government: Issues for Information Technology Management[R]. Congressional Research Service, 2008.
|
[4] |
夏斌.
关于"顶层设计"的思考[J]. 重庆理工大学学报(社会科学), 2012, 26(4): 1-5.
|
[5] |
王秀琴, 陈传忠, 赵岑.
关于加强环境监测顶层设计的思考[J]. 中国环境监测, 2014, 30(1): 187-190.
|
[6] |
肖能德, 李恩敬.
"顶层设计"在电子政务建设中的应用[J]. 福建建材, 2010(3): 122-124.
|
[7] |
ZACHMAN J A.
A framework for information systems architecture[J]. IBM systems journal, 1987, 26(3): 276-292 DOI:10.1147/sj.263.0276 |
[8] |
Forum TOGA. The Open Group Architecture Framework:Enterprise Architecture Framework, Enterprise Architecture, Information Architecture, Architecture Framework, The Open Group[M]. Betascript Publishing, 2010.
|
[9] |
CIO Council. Federal enterprise architecture framework version 1. 1[S/OL]. [2016-12-09].
|
[10] |
陈玉霞.
基于诺兰模型的图书馆文献信息资源共享系统建设的分析[J]. 图书馆学研究, 2005(5): 61-63.
|
[11] |
樊博.
跨部门政府信息资源共享的推进体制、机制和方法[J]. 上海交通大学学报(哲学社会科学版), 2005, 16(2): 13-20.
|
[12] |
杜庆昊.
理顺电子政务项目建设体制探索门户型建设管理机制[J]. 电子政务, 2008(5): 94-97.
|
[13] |
曾焱, 程益联.
水利信息化技术标准及其体系研究[J]. 水利信息化, 2016(1): 6-9, 13-13.
|
[14] |
朱琳, 赵涵菁, 王永坤, 等.
全局数据:大数据时代数据治理的新范式[J]. 电子政务, 2016(1): 34-42.
|
[15] |
DAVENPORT T H, ECCLES R G, PRUSAK L.
Information politics[J]. Sloan management review/Fall, 1992, 34(1): 53-65 |