大数据作为互联网、云计算、物联网、移动计算之后 IT产业又一次颠覆性的技术变革,已经在政府公共管理、医疗服务、零售业、制造业、以及资源环境等领域得到了广泛应用,并产生了巨大的社会价值和产业空间 [1]。2015年 9月,国务院新出台了《促进大数据发展行动纲要》,旨在推动大数据的发展和应用,建立经济运行新机制,打造社会治理新模式。
“大数据”这一术语从 2008年开始在科技领域中出现。目前,大数据研究和应用已引起学术界的广泛研究兴趣 [1]。2008年和 2011年,《 Nature》与《Science》杂志分别出版专刊“Big Data: Science in thePetabyte Era”和“Dealing with Data”,从互联网技术、互联网经济学、超级计算、环境科学、生物医药等多个方面讨论大数据处理和应用专题 [2, 3]。世界各国政府也高度重视大数据领域的研究和探索,并从国家战略的层面推出研究规划以应对其带来的挑战。
2012年 3月,美国奥巴马政府投资 2亿美元启动“大数据研究和发展计划”,致力于提高从大型复杂数据集中提取知识和观点的能力,并服务于能源、健康、金融和信息技术等领域的高科技企业; 2012年 7月,日本推出“新 ICT战略研究计划”,其中重点关注“大数据应用”。同年,美国国家科学基金会(NSF)与国家卫生研究院( NIH)联合推出“促进大数据科学与工程的核心技术”项目,旨在促进对大规模数据集进行管理、分析、可视化并从中提取有用信息的核心科学技术的发展。 2015年 7月,中国国家自然科学基金委员会投入 1.6亿元人民币启动了“大数据驱动的管理与决策研究”重大研究计划项目,执行期限 2016—2023年,该项目由管理科学部牵头、信息科学部、数理科学部和医学科学部参与,多个科学部共同完成。
虽然大数据研究已在全球范围内成为热点和焦点,但是目前国内外资源环境领域大数据相关的研究仍处于起步阶段,面向资源环境的大数据管理与应用研究则更是刚刚兴起。
1 资源环境大数据面临的问题与主要研究方向 1.1 区域大气污染防治与污染物减排研究改革开放以来,我国高消耗、高排放和高污染的粗放型发展模式,带来经济持续快速发展的同时,也造成了严重的生态环境污染。据《 2014中国环境公报》显示,全国 161个开展空气质量新标准监测的地级及以上城市中,空气质量达标的城市比例仅为 9.9%。2014年我国的中东部大部分地区被雾霾笼罩,特别是京津冀、长三角、珠三角城市群的区域成为“重灾区”。各级政府纷纷出台大气污染防治政策与规划,2012年环境保护部、国家发展与改革委员会、财政部联合印发《重点区域大气污染防治“十二五”规划》的通知(环发〔 2012〕130号);国务院于 2013年 9月 12日发布了《关于印发大气污染防治行动计划的通知》。为响应国家大气污染防治行动计划,从 2015年 1月 1日开始,全国 338个地级及以上城市共 1436个监测点已全部开展空气质量监测,并建立全国城市空气质量实时发布平台,向社会发布实时数据。
大气污染数据同时具有空间性和时间性两个特征,随着地理信息系统( GIS)、遥感( GS)和全球定位系统( GPS)等技术的发展,大气污染数据逐渐呈现出复杂的时间和空间关系,而且数据量非常大,如环境监测数据、经济统计数据、气象数据、交通流量数据等。传统的数据分析方法处理大气污染的时空数据面临较多困难和局限。因此,大气污染的时空数据分析一直是国内外的研究难点和热点。
区域大气污染防治与污染物减排研究,主要涉及大气污染物的动态时空演进过程建模与分析、大气污染时空数据的挖掘与分析、区域大气污染联防联控机制与对策、大气污染监测与预警研究、区域大气污染治理模式研究、极端气象灾害应急管理研究、以及二氧化硫等污染物减排策略研究等领域和方向。
1.2 资源与能源市场的复杂性研究中东地区持续动荡的局势和复杂的国际地缘政治关系变化,进一步加剧了国际资源与能源市场的复杂性,重要资源与能源价格的波动,对社会经济产生较大影响,尤其是国际油价“过山车”式的剧烈波动,使得国际能源市场成为大数据研究分析的新热点。石油期货市场的快速发展使得石油的金融属性不断凸显,石油已经成为新的金融投资载体,石油市场的复杂性与石油金融已经成为新的研究领域。但是与传统的金融市场相比,石油市场有其独特的复杂性特征和规律,石油市场更易受到地缘政治因素的影响,这使得石油市场的系统性风险更大。 2011 年的利比亚战争,对全球金融市场的影响很微弱,但对石油市场的影响巨大,导致油价剧烈波动,市场风险加大,这一特点能够反映 Web 数据的传染效应和对市场情绪的影响。
国内外关于资源与能源市场复杂性研究,主要集中在市场风险测度与风险管理理论、基于 Web数据的风险分析与预测理论、不同资源物价指数的测算、物价指数与其他经济指标的关系研究、以及物价指数的波动与溢出效应等方面。
大数据背景下,凸显了信息竞争和网络优势的重要地位,高频监测与交易、复杂的地缘政治关系变化、市场舆情分析等成为引领石油贸易的新因素。针对复杂多变的国际能源市场,国内外学者对于市场经济条件下的能源价格指数行为分析进行了深入、持续的研究,研究的焦点集中在能源价格波动与预测,能源价格的经济与金融溢出效应这三个方面。运用方法包括财富最大方法、数理统计方法、博弈论方法、计量经济学方法以及组合预测方法等。
1.3 智能电网的大数据研究电力作为社会经济发展和人民生活最密切的能源,电网蕴含了巨大的数据资源,据估算,电网的运行、管理、用户、计量、资产等方面的数据已达到20PB,大数据为智能电网的发展和运营提供了全景性视角和综合性分析方法。智能电网实现了各类分布式能源、新能源、各种储能系统、以及需求侧系统的接入,并借助信息通信系统对其进行综合集成,实施高效的管理与决策。借助大数据分析技术,对电网运行的实时数据和历史数据进行深层挖掘分析,实现对电网运行的最优管理与决策,提高智能电网的经济性、安全性与可靠性[4]。
近年来,智能电网大数据已经得到了国内外的广泛关注,自 2008 年开始,美国电力研究协会(EPRI)、美国能源信息署( EIA)等机构,法国、德国等电力公司,先后围绕发电、输电、配电、用电以及基于电网信息的政府管理与决策等领域的智能电网大数据问题开展了大量的实证研究和示范应用。国际电工委员会( IEC)研究并发布一系列统一的信息模型标准和接口标准,为电网大数据的流通共享与信息交换奠定了基础。国内的一些专业机构和高校也开展 了智能电网大数据理论和技术研究。
智能电网大数据研究主要集中在电网系统的故障预测技术、故障诊断分析技术、电网系统的大数据故障诊断分析与预测建模、智能电网的需求侧管理与决策研究、智能电网的大数据挖掘与分析技术、智能电网运行状态的监测与预警研究等领域和研究方向。
1.4 资源开发利用的大数据管理研究金属矿产、煤炭、石油、天然气等资源的开发利 用是一项复杂的系统工程,生产过程中面临很多不确 定的安全隐患和恶劣的生产环境。我国每年都会发生 多起资源开发利用过程中的重大安全生产事故,造成 人员伤亡和经济损失的同时,油气等安全生产事故还 会造成严重的生态环境破坏。随着机械化和信息化生 产线的大量使用,数字化矿山和数字化油气田越来越 多,我国资源开发利用过程中的大数据分析研究也开 始起步。发达国家矿产资源开发利用的机械化水平较 高,很多大型机械装备都装有芯片,大大提高了矿山 和油气田的数字化程度,开展了大量的数字化矿山管 理和大数据分析研究。
矿产资源开发利用的大数据研究主要涉及资源安全生产监测与预警研究、基于大数据的资源开发流程的优化与决策研究、数字化矿山生产事故的智能预测与预警系统、基于大数据分析的一体化数字化矿山管理系统等领域和研究方向。
1.5 全球气候变化与温室气体减排研究近年来,全球气候变化已成为国际社会与学术界共同关注的热点问题,气候变化研究是一个涉及气象与大气科学、地球科学、环境科学、管理科学、以及经济学等多学科交叉的领域。气候变化及其引发的极端灾害事件,对农业、水资源、人居环境和健康等已造成诸多不利影响,国际上气候变化研究的热潮始于 1992年《联合国气候变化框架公约》发布之后,1997年《京都议定书》的签订,引起了各签约国、易受气候变化影响的小岛国家、碳排放大国的政府和学术界对气候变化领域研究的重视,一些国际组织和研究机构的学者从政策、技术、建模等不同领域和方向开展了大量的研究。 2009年我国提出到 2020年单位 GDP的二氧化碳排放比 2005年下降 40%~ 45%的减排目标,一时间气候变化问题成为我国政府和学术界共同关注的热点问题,国家发展和改革委员会、科技部、环境保护部、中国科学院等部门纷纷启动了一批关于气候变化与碳减排政策的科技专项,国家自然科学基金委员会在气候变化领域资助的项目数量也大幅增加。
全球气候变化与温室气体减排领域的研究,主要集中在气候变化影响与适应的综合评估研究、气候变化政策建模、碳减排策略与政策、碳排放权分配方案与碳价、碳减排的经济影响与碳税、国际贸易隐含碳测算、低碳技术综合评价等领域和研究方向。
除了上述几个比较大的研究领域之外,资源环境领域的大数据研究还涉及水资源的资源优化配置管理、区域水资源冲突管理(如南水北调)、区域水资源污染监测与治理、污染物泄漏的监测与治理等领域。
2 大数据驱动的管理与决策研究的申请与资助情况为了推动我国大数据的基础研究和应用基础研究的发展,促进大数据研究更好的为社会经济发展服务,国家自然科学基金委员会于 2015年 7月正式启动了重大研究计划“大数据驱动的管理与决策研究”。该重大研究计划以大数据驱动的管理与决策为研究对象,充分发挥管理、信息、数理、医学等多学科合作研究的优势,着重研究大数据驱动的管理与决策理论范式、大数据资源治理机制与管理、大数据管理与决策价值分析与发现、大数据分析方法与支撑技术,并围绕总体目标集成相关研究成果。希望通过该重大研究计划的执行,使我国在大数据驱动的管理与决策研究相关领域跻身国际前列,为国家在相关领域的管理决策和智库建设提供支持。
2015年该重大研究计划共收到 395份申请书(培育项目 347项,重点支持项目 48项),研究领域涉及管理、信息、数理、医学等 6个科学部,如图1所示。经过同行评议和会议评审,该重大研究计划 2015年度共资助了 3项重点支持项目(面向管理决策的非结构化大数据分析方法与关键技术、金融大数据统计学习理论与方法及在互联网金融中的应用、基于大数据的 MSM艾滋病管理和决策范式研究)、25项培育项目,平均资助率 7.08%,资助的项目主要集中在公共管理、大数据挖掘的理论方法与分析技术、医疗健康、商务和金融等领域,大数据共享与治理技术领域资助的项目最少,详细的分布情况如图2所示。
该重大研究计划在公共管理的资源环境领域申请了 21项培育项目,约占申请量的 5.3%,研究方向涉及大气污染防治、能源市场风险管理、温室气体减排、智能电网、污染物泄漏监控与管理、环境治理与保护、以及水资源管理等 7个研究领域,详细如图3所示。资源环境领域有 3项培育项目获得资助(支持应急决策的气象灾害大数据融合的方法研究、大数据驱动下石油市场微观机理与风险管理范式研究、基于大数据的微观宏观行为综合分析),资助率 14.3%,主要是研究气象灾害与大气污染的应急管理、国际石油市场风险管理和能源市场复杂性等公共管理问题。
资源环境管理是国家自然科学基金委员会管理科学部一个比较大的研究领域,每年资助的面上项目、青年基金项目和地区基金等自由探索项目几十项,研究方向也涵盖了本文中所列出的所有领域,随着大数据的兴起,越来越多的项目利用大数据分析方法开展资源环境管理研究。因此,资源环境领域的大数据研究主要是应用研究,对应于重大研究计划“大数据驱动的管理与决策研究” 4个典型示范应用领域的公共管理研究。
该项目是国家自然科学基金委员会在大数据领域设立的第一个重大研究计划项目,针对国内外大数据环境下管理与决策基础理论及其应用领域研究与发展的现状和进一步发展所面临的挑战,面向国家重大战略需求,本着有限目标的原则,该重大研究计划重点围绕管理与决策范式转型机理与理论、大数据资源协同管理与治理机制设计和领域导向的大数据价值发现理论与方法三个关键科学问题展开。同时,在公共管理、商务、金融和医疗健康等领域开展典型示范应用研究,总体结构如图4所示。
改革开放以来,我国经济的持续快速发展,给资源环境的可持续发展带来了严峻的挑战,随着工业化和信息化进程的推进,通过开展资源环境领域大数据的研究,基于大数据的全景式管理模式将有助于缓解资源环境对我国经济持续快速发展的约束,同时将有利于实现资源环境的可持续发展,优化管理路径。
[1] | 徐宗本等. 大数据驱动的管理与决策前沿课题. 管理世 界, 2014(11):158-163. |
[2] | Frankel, F., Reid, R. Big Data: Distilling Meaning from Data. Nature, 2008, 455(7209): 30. |
[3] | Science Staff, "Challenges and Opportunities". Science, 2011, 331(6018): 692-693. |
[4] | 李皎. 大数据时代到来对电力行业发展提出新要求. 华北 电业, 2012 (4):82-83. |