“大数据”这个词相信你已经听了无数遍。如今无论是IT圈儿里人还是圈外人都在谈论大数据,仿佛你不说点有关大数据的东西,那么你就与这个 世界脱轨了,然而在这众多讨论者中真正了解大数据的人却是少之又少。
本人从事数据分析多年,有着自己的理解,今天就简单说说自己的看法,让你三分钟读懂大数据。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。这是百度的说法。
大数据,就是信息量多的爆炸,以前的处理方法已经玩不转,才有新方法去处理大量数据,这一系列相关的统称为大数据。
大数据,不是字面上的很大的数据,它是一个集合,包括对数据收集、存储、传输、利用等一系列的方法理论和工具。
为什么会成为大数据呢?而不是叫别的呢?现在社会的信息爆炸,增长非常快,有研究报告表明,2020年全球新建和复制的信息量达到40ZB(2010年是1.2ZB),1ZB大家肯定没什么概念,40ZB=4X10^23字节,换算成1G一部的电影,就是4X10^15部电影,够你看到地球爆炸。这个就是最直接的数据特征,信息量非常的庞大,就直接叫大数据。(还有其他的特征,如高速、多样、低价值密度、真实性)。
有人会说,大数据只是信息集合,不包含那个理论和工具,我个人认为把信息集合和工具分开,单独谈大数据,没什么意义,不能产生价值,单纯是个名词。而集合在在一起,能定义,能处理,有价值,更合适。
(原标题:三分钟知晓大数据是什么)