千万不要将“大数据”神化

千寻生活
佚名
近年来,大数据发展的如火如荼,各企业纷纷发力大数据产业。确实,大数据为"信息获取"开辟了无数的通道,以往实现不了的如今通过大数据都可以实现。但“大数据”不是万能的,伴随着大数据的应用...

近年来,大数据发展的如火如荼,各企业纷纷发力大数据产业。确实,大数据为"信息获取"开辟了无数的通道,以往实现不了的如今通过大数据都可以实现。但“大数据”不是万能的,伴随着大数据的应用,越来越多的数据被“滥用”,数据泄露事件日益凸显,大数据安全岌岌可危。

大数据的"无所不能"

无论是传统工业时代,还是大数据时代,信息是决策的基础:更优的决策,需要更多、更及时的信息--大数据的价值核心,是"消除信息不对称",即提升人或程序对事物的认知。

因此,大数据可以做很多事情:

除了以上为企业带来切实利益的大数据应用,伴随着机器学习、人工智能的发展,大数据也为我们展开了更宏伟的蓝图:

一言概之,大数据为"信息获取"开辟了无数的通道,引领我们一路高歌猛进,依靠大数据,我们对周围的世界、对自身、对事物之间的关系都有了更深入的认知,也有了以前想都不敢想的各种处理方案,让我们"无所不能"。

但理想总是"丰满",现实却是"骨感",看上去"无所不能"的大数据,本身就带着诸多的"无能为力"。

大数据的"无能为力"

数据质量

伴随"多"的是"无序",伴随"更多的信息"而来的,可能是"信息冗余"。数据质量,是数据应用之初与生俱来的问题。

要判断移动设备的常驻城市,可能从数据源A得到的是北京,从数据源B得到的天津,而我们压根儿没有明确的标准,来判断数据源A和B到底哪个正确,因为,正是因为不知道才需要寻求外部数据源帮助!

也许你会说,找已知样本测试就可以了。但事实上,很多数据且不说能不能找得到样本,即便能找得到,用作标准的样本本身有多大可信性,也是一个需要验证的问题。

隐私与安全

伴随着大数据的应用,越来越多的数据被"滥用",隐私被泄漏的问题被曝光。数据应用的程度越高,经过的验证和磨砺越多,准确性越高,所受的监管也就越强,使用过程中所受限制就越多。

对于数据应用方来说,面临的可能是不断的寻找数据源、验证数据有效性、接受监管并调整、寻找新的数据源的过程。

站在数据应用方角度,面临客户隐私与数据安全,会时不时的有深深的"无力感";但站在整个社会责任的角度,数据隐私与安全则是必须要守住的底线。

边界与壁垒

我们数据应用中的很多设想,都建立在各方数据可无缝打通和关联的基础上,但实际数据应用中,因为数据产生于不同的企业主体、有不同的处理流程和架构,"关联"并不是"无缝"的。

如何减少大数据的"无能为力"

首先,建立数据流通标准。"标准"可以在很大程度上解决"质量"的问题,也可以让供需双方更好的对话,降低数据流通的成本;

其次,划定数据安全基线。有"基线",就有了"基线"范围内的自由和法律保护,将"隐私与安全"作为每一个市场玩家的底线,就不会在安全加码时束手无措倍受打击;

再次,构建数据流通平台。"平台"可以有效承载数据流通的标准,同时更好的打破供需双方的边界壁垒,实现供需有效结合。

TalkingData智能数据服务商城,致力于为数据供应方和数据需求方提供平台,实现数据流通过程中的标准化交付、质量评估、实时计量等公共能力,降低数据交易流通成本。

让理解照进现实,实现大数据的"无所不能",我们一直在努力。

(原标题:大数据的"无所不能"与"无能为力")

THEEND