大数据反腐的发展历程、优势和阻力

2020-03-24 09:06:49
徐敏子 程竹汝
大数据
大数据相较于传统数据,具有Volume(数量庞大)、Variety(种类繁多)、Velocity(产生迅速)、Value(价值大但密度低)等“4V”特点。大数据技术主要是指对互联网所产生的海量数据的获取、分析和应用技术。近些年,大数据技术逐渐应用于反腐领域,是电子政务发展到一定阶段的产物,具有高效率、低成本、可预测等优势,同时也面临“数据孤岛”、数据泄露等发展阻力。

一、引言

“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……”维克托·迈尔-舍恩伯格和肯尼思·库克耶在其所着的大数据通俗读物《大数据时代——生活、工作与思维的大变革》的引言中如是说。我们所生活的时代已经在各个方面被大数据技术影响和塑造,我们正在享受越来越多来自大数据技术的益处。同时,习近平总书记在十九大报告中提出:“人民群众最痛恨腐败现象,腐败是我们党面临的最大威胁。”自党的十八大以来,我们党保持了反腐的持续高压态势,将反腐工作作为重点任务持续推进。如何将正在深刻改变我们生活的新兴技术应用于党和国家所关注的反腐事业,便成为促进国家治理体系和治理能力现代化的重要课题之一。

大数据反腐是电子政务发展到一定阶段的产物。中国政府早在1999年就正式启动了“政府上网”工程,这一工程标志着我国政府信息化开始步入互联网时代。大数据反腐是互联网大数据技术运用的子领域。尽管大数据的概念在十数年来,尤其是近几年来已经得到了较为广泛的传播,但大数据反腐对很多人来说仍然较为新颖。本文将结合具体的案例,在分析大数据相关概念和理论的基础上,对大数据反腐的发展历程、主要机制及其优势和阻力进行梳理。

二、大数据反腐的概念与理论背景

和传统数据相比,大数据最显着的特点是数量巨大。大数据时代,数据以指数级增长,数据的总量级别不停刷新人类认知,从拍字节(一般记作PB,等于250B),到艾字节(一般记作EB,等于260B)再到泽字节(一般记作ZB,等于270B),机器所记录的数据总量迅速跨越我们经常在天文学领域中看到的不同量级。数量巨大也是大数据最本质的特征。人类在信息时代产生、储存的数据呈现爆发性增长,这些数据开始深刻改变人类生活的各个方面:人类开始寻找全新的方法分析传统问题,开始用全新的技术处理经济事务,开始转变对于事物的传统认知思维……根据维克托·迈尔-舍恩伯格和肯尼思·库克耶在《大数据时代———生活、工作与思维的大变革》中的总结,大数据从思维、商业和管理等三个方面深刻改变着人类的生活。他们认为,“大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来的必然改变”。

1.大数据的概念

按照普遍的观点,大数据具有“4V”的特征:Volume(数量庞大)、Variety(种类繁多)、Velocity(产生迅速)、Value(价值大但密度低)。

首先,从数据数量来看。近20年来,互联网使用的普及以及互联网技术的进步导致网络世界产生了数量巨大的数据。根据国际数据公司(IDC) 报告,2011 年全球被创建和复制的数据总量为1800EB,而且预计这一数字将至少每两年翻一番。2010年,淘宝网拥有会员3.7 亿,在线商品8.8 亿件,每天交易超过千万笔,单日数据产量超过50TB(50×1012B),存储量达40PB。2011 年,据Internet World 统计,互联网用户近20亿;Facebook注册用户超过8.5 亿,每年上传照片3 亿张,每天生成日志数据300TB;新浪微博每天有数十亿的外部网页和API 接口访问需求,每分钟都会发出数万条微博;百度数据总量接近1000PB,存储网页数量接近1 万亿,每天要处理约60 亿次搜索请求、几十PB 数据。2014年,互联网巨头Google 每月处理的数据超过400PB,Youtube 每天上传的视频达7 万小时。

其次,从数据种类来看。互联网时代的网络数据包含了文字、图片、音频、视频等多种形式,这意味着需要处理数量巨大并且种类繁多的数据,才能找出数据之间的内在关联。

再次,从数据产生速度来看。网络时代的数据可以说是瞬息万变。2000 年天文学项目“Slaon Digital Sky Survey”启动,其位于新墨西哥州的望远镜在几周之内搜集的数据,就已经超过了天文学历史上搜集的所有数据之和。

最后,从数据的价值来看。网络数据的总体价值越来越高,但数据价值的密度却很低。大数据时代,挖掘数据的价值就像是沙里淘金,需要花费巨大的成本来寻找真正有价值的数据。2012 年,Twitter 公司每天都会发布超过4 亿条微博,这些巨量的微博是高达1.4 亿的活跃用户在不同时间和不同地点发布的,想要从用户发布的数据中整理出可以利用的资源,是一项需要想象力和付出巨大努力的工程。

2.大数据技术的概念

大数据技术本质上就是对大数据进行处理的技术,其具体步骤依次为数据采集、数据处理与集成、数据分析、数据解释。大数据数量大、种类多、产生速度快等特点,决定了其采集方式必然是多样的。目前常见的数据采集手段有传感器收取、无线射频识别(RFID),或是借助数据检索分类工具如百度和谷歌等搜索引擎、条形码技术、移动软件和社交网络等。数据处理与集成主要是对数据进行筛选,去除无效数据,提高数据的相关性和稳定性。数据分析是大数据处理的核心部分,通过数据分析,数据的价值被挖掘出来,诸如数据挖掘、数理统计、机器学习、智能算法等传统数据分析技术已经不能够满足处理大数据的需要,云计算技术等全新的数据分析技术出现,提高了数据分析的效率和准确性。数据解释即将数据分析的结果向大众进行说明和展示,使其被大众所理解和认可。目前较为有效和流行的展示手段包括“数据可视化”等。(见图1)

大数据技术的运用范围十分广泛。大数据技术可以使企业制订的生产、运营和营销方案更具针对性,同时增强企业把握市场、行业现状以及预测发展前景的能力;大数据技术能帮助非企业机构根据服务对象的特点定制个性化方案,或是在解决问题时更加有效地筛选出所需数据,节约成本和精力。刘智慧、张泉灵总结了大数据运用的四个主要领域,分别是商业、金融、医疗和制造业;而张引等则归纳出了科学计算、金融、社交网络、移动数据、物联网、Web数据和多媒体等七个具有代表性的大数据运用领域。可见,商业和科研领域是目前大数据技术的主要运用领域。

3.大数据反腐的概念

大数据反腐指的是大数据技术在反腐领域的应用,这一应用建立在几个前提之上。首先,数据库为大数据技术发现和预防腐败提供数据基础。电子政务的发展、公职人员及相关人员的网络参与使政府部门产生了海量的数据,其种类、数量和规模都在不断扩展,相关数据库的建设和维护已经成为政府部门的日常工作之一。其次,云计算和云服务、量子计算等新兴技术的不断成熟使处理海量数据的时间极大缩短,同时成本大大降低,为大数据技术在反腐领域的运用提供技术支撑。大数据技术经过一定时间的发展,已经具有了相对稳定和成熟的基础技术和运用模式,计算机高速的计算能力和强大的储存能力,结合由诸多巧妙算法构成的专业软件的使用,能够大大缩短数据处理的时间,提高数据处理的准确性。另外,党和政府反腐败的决心,为大数据技术在反腐败领域的运用提供有利的政治环境。十八大以来反腐工作成为党和国家重点关注和落实的领域之一,《习近平新时代中国特色社会主义思想学习纲要》提到,“腐败是社会毒瘤,是我们党面临的最大威胁。如果任凭腐败问题愈演愈烈,最终必然亡党亡国。……党的十八大以来,我们党以猛药去疴、重典治乱的决心,以刮骨疗毒、壮士断腕的勇气,坚定不移‘打虎’、‘拍蝇’、‘猎狐’”。

从目前的发展来看,大数据反腐的主要机制包括产生反腐需求、建设反腐数据库、反馈腐败证据、更新反腐体系等。反腐需求的产生主要源于腐败现象的出现,部分源于预防腐败发生的预警心理。建设反腐数据库是大数据反腐的关键环节,正是在这一环节上,大数据技术充分体现了其技术特点和应用价值。从搜集海量数据、建设数据标准、构建数据结构到更新数据内容,大数据技术将原来似乎无用的海量数据以一种不可思议的方式高效整合起来,并且能针对性地检测和预防腐败问题。反馈腐败证据是在数据库建设的基础之上,运用处理腐败信息的分析逻辑来发现腐败现象的存在。更新反腐体系是为了形成大数据反腐机制的长效性,主要包括对数据库数据的准确性和实效性的维持,以及对利用数据库数据分析腐败现象的逻辑的反思。

收藏
免责声明:凡注明为其它来源的信息均转自其它平台,由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本站联系,我们将及时更正、删除,谢谢。联系邮箱:xiali@infoobs.com