对地观测大数据开放共享:挑战与思考

搜狐科技
水土保持之点滴
科学大数据成为驱动地球科学创新与知识发现的新引擎[1],作为科学大数据重要组成部分的对地观测数据已成为国家基础性和战略性资源,在国民经济、社会发展和国家安全中发挥着不可或缺的作用。全球对地观测已具备大气...

科学大数据成为驱动地球科学创新与知识发现的新引擎[1],作为科学大数据重要组成部分的对地观测数据已成为国家基础性和战略性资源,在国民经济、社会发展和国家安全中发挥着不可或缺的作用。全球对地观测已具备大气、海洋和陆地高精度、高时空分辨率的数据获取能力,对地观测领域已经步入大数据时代[2-4]。

据统计,截至2017年8月,全球共发射了4635颗卫星,仅2017年上半年就发射了357颗[5,6]。目前,1738颗卫星在轨正常运行,其中对地观测卫星596颗,约占目前在轨正常运行卫星的1/3[5,6]。近年来,以Planet LabsFlock、“吉林一号”等为代表的微小卫星、多星星座逐渐成为遥感市场的新热点,开启了对地观测大数据获取的新时代,如2017年2月15日,88颗Planet LabsFlock卫星就通过一箭多星的方式搭载升空[7]。

01

国际对地观测数据开放共享的现状及趋势

科学大数据是科学发现与知识创新的新引擎,它将改变人类生活及对世界的深层认知与理解[2]。作为科学大数据重要组成部分的对地观测大数据在国家战略、行业应用、科学研究等方面发挥了重要作用。对地观测大数据的开放共享推动了全球尺度的科学和环境监测产品的研究与发展,驱动学科创新,促进人类可持续发展。2008年美国地质调查局(USGS)实施的Landsat系列卫星数据开放共享使得全球尺度30米分辨率的森林覆盖、水体、火烧迹地、土地覆盖分类等专题产品的生产成为可能[8-11]。郭华东[12]在Nature发表题为《构建数字丝路》的评论文章中指出,为满足庞大且日益快速增长的“一带一路”地球大数据应用需求,既要建立能够共享数据、代码、方法的开放平台,实现对已有对地观测数据的科学分析及未来卫星数据的集成应用,提高“一带一路”数据共享和互通互用能力;又要探索大数据驱动的科学研究新范式,推广地球大数据应用服务,服务于全球可持续发展。

国际上,许多国家日益重视对地观测数据共享政策的制定。以美国和一些欧洲国家为代表的发达国家先后制定了国家或行业对地观测数据开放共享的政策,以提高国际竞争力和规范国内市场。美国对政府拥有和资助生产的数据采取“完全开放”的共享管理机制,同时提出了边际成本补偿原则以保护数据提供者的利益;对商业公司投资生产的数据采取“平等竞争”的市场化管理机制[13-15]。这种分级式的共享管理机制极大地促进了对地观测数据的开放共享和广泛应用。欧洲的对地观测数据政策强调以共享为核心,欧洲航天局(ESA,以下简称“欧空局”)发布了修正的ESA对地观测数据政策,将遥感数据使用分为自由使用和有限使用两类,2013年发布的GMES“哨兵”数据政策则明确了“无歧视性访问”原则,所有用户均可免费获取[16,17]。

1991年由美国国家航空航天局(NASA)牵头,多国参与建立的地球观测系统(EOS)计划的提出和实施掀起了对地观测技术发展的浪潮,该系统由ACRIMSAT、Aqua、Terra、Landsat7、Jason-1等多颗卫星组成,在大气、海洋、陆地、生物等多学科领域进行综合应用[18,19]。其中NASA的EOSDIS系统提供了MODIS TERRA和AQUA卫星数据及相关产品的共享服务,在国际遥感科学研究中发挥了重要作用[20,21]。2003年,欧空局实施了“哥白尼计划”(GEMS,原称“全球环境与安全监测计划”),强调对地观测平台数据的协调和使用。2008年,美国地质调查局(USGS)开始提供全球陆地卫星数据的共享和下载服务,近年来逐步提供高时空一致性的ARD(Analysis Ready Data)产品共享,便于用户直接分析使用[22,23]。2013年欧空局开始实施Sentinel系列卫星数据的共享,为欧洲乃至全球的可持续发展、环境治理以及安全政策提供高质量的数据、信息和知识[24]。

21世纪以来,对地观测数据迅猛增长,对地观测数据的共享呈现出资源整合全球化、技术规范标准化、共享服务信息化等发展趋势,国家之间大规模的共享体系开始形成,如全球综合对地观测系统(GEOSS)等[25]。GEOSS通过全球范围的数据整合与集成实现对地观测数据全球性开放共享,并向用户提供数据、信息和知识3大类产品和技术服务[26-28]。

纵观全球对地观测大数据的发展态势,在需求牵引、政策驱动和技术推动下,对地观测数据的流动性在逐步提高,对地观测数据开放共享的深度和广度都在不断加强。但由于政策、制度和技术等多方面的原因,对地观测数据的共享程度和数据应用深度还有较大提升空间,对地观测大数据的潜在价值还没有被充分挖掘出来。随着对地观测领域进入大数据时代,对地观测数据开放共享从单纯的数据共享模式转变成以“谷歌地球引擎”(Google Earth Engine)和澳大利亚地球科学“数据立方体”(Data Cube)为代表的新型对地观测数据开放共享服务。Google Earth Engine将全球历史存档的长时间序列的多源遥感数据整合在一起,用户不仅可以免费下载数据,还能对大规模影像进行在线分析(如变化检测、趋势分析等)[29]。Data Cube实现了澳大利亚多源对地观测数据的无缝整合、时间序列快速分析以及定量信息产品的应用[30]。

02

我国对地观测数据开放共享的现状

自1970年4月24日发射第一颗人造地球卫星“东方红一号”以来,我国在轨运行的卫星已超过200颗,仅对地观测领域目前就已形成了“风云”“海洋”“资源”“高分”“遥感”“天绘”等多个体系[31,32]。近年来,我国在对地观测领域的投入不断增长,对地观测科技创新能力与水平不断提升,对地观测数据呈现出“井喷式”增长,且质量大幅提高。

目前,我国已发射10余颗民用高分遥感卫星,逐步形成了高空间分辨率、高时间分辨率、高光谱分辨率的对地观测系统。高分一号卫星作为高分辨率对地观测系统的首发星,截至2018年6月,已获取存档数据230余万景,每天新增约1 TB数据[33]。2018年3月31日以“一箭三星”方式发射高分一号02、03、04卫星,标志着我国首个民用高分辨率光学业务星座正式投入使用,可实现3星15天全球覆盖、2天重访,以及长期、连续、稳定、快速地获取全球2米全色、8米多光谱影像[34];2018年5月9日、6月2日和7月31日,高分五号、六号和十一号又先后升空。除国产卫星,1986年建成的中国遥感卫星地面站还持续接收和处理了包括Landsat系列、SPOT系列、THEOS、ERS、ENVISAT在内的近20颗国外对地观测卫星数据,形成了目前我国最长时间的多种对地观测卫星数据档案库[4]。

政策上,我国采取了中低分辨率遥感数据免费分发、高分辨率遥感数据授权发放的措施,以推动对地观测数据资源共享和有效利用,提高卫星遥感应用和服务水平。但总的来说,我国的数据共享生态系统还有待进一步健全,有些共享计划往往缺乏长期性和持续性。通过多年的实践与摸索,国家认识到数据共享生态平衡的重要性,开始从国家层面开展数据共享政策的顶层设计,以期建立更健康、更可持续的数据共享环境[35]。

相比对地观测数据的获取,数据的开放共享工作相对滞后。目前,各种卫星系统如气象、陆地、海洋等获取的遥感数据分散在不同的部门或数据中心。气象卫星形成了较为完整的数据共享体系,而有些国产对地观测卫星数据仅对部分用户开放,或对公众仅提供部分数据的开放共享。2011年,中国遥感卫星地面站面向全国用户开展了“对地观测数据共享计划”,首次将接收存档的中等分辨率卫星数据面向全国用户提供免费共享服务;2013年中科院计算机网络信息中心利用其高速网络、海量存储、分布式计算等技术优势,构建了地理空间数据云(GSCloud),提供数据共享服务;为了减少用户的数据处理负担,中科院遥感与数字地球研究所中国遥感卫星地面站建立了RTU(Ready To Use)产品库,向用户提供标准化、系列化和多样化的高级数据产品,便于用户直接应用[4,36]。另外,我国也积极参与GEOSS的建设,科技部国家遥感中心组织建立了国家综合地球观测数据共享平台,成为我国以及国际地球观测数据共享的重要窗口。

国务院于2015年发布的《促进大数据发展的行动纲要》中明确提出了“积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步开放共享”的重要目标[37],中科院2018年启动的战略性先导科技专项(A类)“地球大数据科学工程”致力于提升中科院乃至国家层面地球科学领域海量数据的集成共享水平,积极推动地球科学数据的开放共享。中国对地观测数据共享正迎来新的机遇,但同时也面临着数据政策壁垒、数据规范与质量、大数据时代数据共享模式的转型等诸多挑战。

03

我国对地观测数据开放共享的几点思考

综上所述,我国从对地观测领域的“数据大国”向“数据强国”转变的过程中还面临一些问题。一方面,对地观测大数据作为一种重要的战略资源,其开放共享就有特殊性和困难性,当人们意识到对地观测数据具备资产属性时,数据共享往往就成为伪命题。另一方面,受制于数据开放共享的政策措施、基础设施以及技术支撑和服务能力的不足,对地观测数据还未实现真正意义上的流通。一种不能很好流通的数据,其潜在的价值也难以得到最大程度的挖掘和利用。因此,必须建立可执行的对地观测数据管理政策,重塑数据的价值观,特别是要创新数据共享的模式和技术方法,从而打破对地观测数据共享的瓶颈,实现数据流通和应用。

01

加强数据治理体系建设,夯实对地观测数据开放共享的基础

首先,应打破对地观测数据共享的政策壁垒。2018年4月国务院办公厅印发的《科学数据管理办法》中明确规定,“科学数据管理遵循分级管理、安全可控、充分利用的原则,明确责任主体,加强能力建设,促进开放共享”[38]。从宏观上,我国对地观测数据的分发还存在一定程度的开放共享与经济利益不脱钩、定密笼统等问题。一方面,政府投资的对地观测数据的申请和审批过程往往比较繁琐,用户难以方便地获取对地观测数据。另一方面,《遥感影像公开使用管理规定》对分辨率优于10米(尤其是优于0.5米)的卫星影像的分发和获取做了较为严格的流通限制[39],使得高分辨率对地观测数据的开放共享存在较大的障碍。因此,应进一步厘清对政府投资和企业投资所获取的对地观测数据界限,打通数据中心、数据分中心的壁垒,扩大政府预算资金资助形成的对地观测数据的共享范围,使对地观测大数据实实在在地流通起来。另外,还应与时俱进,进一步研究有利于数据流通的对地观测数据安全等级的划分。

其次,应完善数据共享评价体系,建立数据共享指标等可操作的知识产权保障机制和激励措施。知识产权的保障和健全的激励机制是决定数据生产者进行数据共享主观意愿的重要因素[40]。强制汇交项目成果数据或者经费奖励的方式[38],虽可保障国家经费支持下所产生数据的汇交共享,但仍无法充分调动科研人员共享数据的积极性。数据出版是保障数据知识产权的有效手段之一;然而,对地观测数据通常被作为中间数据使用,从最终数据成果中难以判断其使用的对地观测数据的来源,甄别数据侵权行为的难度较大。此外,作为图像的一种,对地观测数据的查重相比传统的基于文本的文献查重也更加困难。这些都是保障知识产权所面临的挑战。为此,应加强对地观测数据出版的创新性工作,考虑引入众包模式、数据索引用指数等方式解决数据出版前的质量和知识产权等问题。

另外,需进一步提升对地观测数据的质量和规范,确保共享数据的真实性、准确性和时效性,保证数据可发现、可访问、可交互、可重用、可引用[41]。同时,增强对地观测数据的共享服务能力,加强跨学科、跨领域的对地观测数据共享的人才队伍建设,促进对地观测大数据与其他科学数据的交叉融合和综合应用。

02

制度和技术并重,构建良好的数据共享生态系统

2014年,大数据首次写入政府工作报告,从此,大数据逐渐成为各级政府关注的热点。2015年,国务院正式印发了《促进大数据发展的行动纲要》。2017年,国家先后出台了《政务信息系统整合共享实施方案》《政务信息资源目录编制指南(试行)》等多项政策文件,推进政府数据汇聚、共享、开放,取得了诸多进展[37,42,43]。2017年12月,十九届中共中央政治局就实施国家大数据战略进行了集体学习,习近平总书记深刻分析了我国大数据发展的现状和趋势,提出了5个方面的要求。2018年,国务院办公厅印发了《科学数据管理办法》[38]。

虽然国家在战略和战术层面对数据共享的政策均有部署,但对地观测数据共享要达到完全的开放原则、责权利一致原则、可用原则、可持续原则以及创新驱动原则的要求,实现“谁拥有,谁负责”“谁使用,谁负责”“谁流转,谁负责”“谁开放,谁受益”的数据生态,在实践中仍面临一些障碍和挑战,需要相关的技术体系支撑和保障,在有些情况下,技术决定着数据共享的实现程度和可能性[35,38,44]。

数据流通是实现对地观测数据共享以释放数据价值的关键环节。然而,对地观测数据流通也伴随着权属、质量、合规性、安全性等诸多问题,这些问题成了制约对地观测数据流通的瓶颈,如前文提到的知识产权对数据共享积极性的影响。区块链、安全多方计算等应用于数据流通的技术或技术框架为解决数据流通过程中的问题提供了富有启发性的解决方案[45]。通过这些新技术的应用,有望促进数据共享流通全流程的可监可控可追溯,降低知识产权受侵害的风险,解决对地观测数据资源拥有者不愿、不敢共享的问题。

03

创新对地观测数据共享服务模式,促进学科交叉、知识发现和综合应用

对地观测领域步入大数据时代促使其数据共享的模式发生着深刻的变革,主要表现为从单纯数据共享向服务共享、信息共享、主动共享的方向转型,步入到以数据深度挖掘和融合应用为主要特征的智能化阶段。在这种新型服务模式下,数据共享服务提供方将在新数据产生的第一时间主动按需向用户推送可定制、多样化、高层次的数据,甚至信息产品,从而打通从对地观测数据接收、处理到信息提取和共享分发的完整链路[4],提高数据流通、数据挖掘的效率。云计算、人工智能的发展为创新大数据时代的对地观测数据共享模式提供了技术支撑。国际上目前已经出现了以美国的Google Earth Engine、澳大利亚的Data Cube以及欧空局的Copernicus等为代表的新型对地观测数据共享服务系统。

党的十九大报告高屋建瓴地提到“推动互联网、大数据人工智能和实体经济深度融合”。中国科学院战略性先导科技专项“地球大数据科学工程”正在建设的CAS Earth Data Bank系统,就是将互联网、人工智能和对地观测大数据深度融合,打造一种数据、计算、服务一体化的数据共享新模式。这种模式共享的不仅仅是数据,也提供信息和服务。未来,用户不但可以利用CAS Earth Data Bank系统的数据资源、算法资源和计算资源,还可以上载他们的数据、模型和算法,为其开展特定应用服务。同时,这种平台即共享的服务模式,有利于打破对地观测数据和信息壁垒,进一步加强数据流通过程的追溯能力,保障知识产权不受侵害,提高数据生产者的共享积极性;同时,实现多源对地观测数据的整合,有效促进对地观测数据与其他学科数据的交叉融合和地学知识发现,深化对地观测数据的综合应用。

04

结语

对地观测大数据的开放共享是大数据时代的必然趋势。我国对地观测大数据共享仍然面临数据共享政策壁垒、数据规范与质量问题以及数据共享模式的转型等诸多挑战。我国要实现从对地观测领域的“数据大国”向“数据强国”转变,实现真正意义上的对地观测大数据共享和流通,需要从数据治理体系建设、良好共享生态系统构建和数据共享服务模式创新3个方面开展研究工作,形成可持续的对地观测数据共享新环境。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论