人工智能不过就是一种高级的现代统计学?

精雕细课
我们日常使用电子产品,定期都会清理一下内存,因为有许多数据属于垃圾信息,对我们毫无用处。然而随着大数据和人工智能技术的发展,许多公司却越来越热衷于收集以往被我们视为垃圾的信息。
我们日常使用电子产品,定期都会清理一下内存,因为有许多数据属于垃圾信息,对我们毫无用处。然而随着大数据和人工智能技术的发展,许多公司却越来越热衷于收集以往被我们视为垃圾的信息。
 
为什么在今天这些数据突然变得重要起来了呢?且看知名媒体人吴伯凡老师如何为你答疑解惑,带你洞悉大数据和人工智能的本质。
 
实际上,很多数据都相当于是交易垃圾。什么叫垃圾?我完成这个事的时候,额外产生、跟我的目的没有什么关联的一些所谓的资源。但是,垃圾你也可以把它当燃料来烧,也是一种资源。所以过去那句话说得很对,没有垃圾,只有放错位置的资源。
 
现在人类每一年产生的数据,可能是在此之前所有年代产生数据的总和,但产生这些数据是不需要什么成本的。比如对你来说,你每天产生了很多数据,这个东西,你是在顺带着产生的。比如说你一天走了多少步,你从哪到哪,所有这些数据,你都不是有意去生产出来的,是自然而然附带着产生出来的。问题在于,谁来收集这些数据?
 
另一方面,光收集是没有意义的。数据最重要的作用是,将它作为一种原料。这就依赖于极其专业的数据分析、挖掘技术,然后从中提炼出有用的东西来。
 
 
▲大庆油田采油现场
 
就像石油一样。北宋的时候就有人发现有石油这个东西,就是从石头缝里头冒出来的一些油。这个油毫无用处,因为如果你点灯的话你是点不好的,火都点不出来,然后非常难闻的气味,熏得到处都是黑的。所以这个东西当时只是记载了,地底下有一种油,它没有用。
 
为什么没有用?其实它有大用。关键是:第一,你有没有大量开采这个石油的能力;第二,你有没有提炼石油的这个技术;第三,即使提炼出来了,这个用途在哪?
 
其实在汽车出现之前,美国人就已经开始利用石油。当时只是把它当成是一种化工原料,从中提炼出了需要的东西之后,会顺带着出现一种油,也就是汽油。人们发现这种油非常可怕,易燃,你保存得不好的话,就会导致很大的危险,属于危险品。
 
所以产生的这些油怎么办?你用它来点灯是很危险的,那怎么办?他们就把这些油偷偷地倒进河里,这是违法的,也很危险。因为如果它在水面上一遇到火,说不定把船只都给烧了。也就是说,当时处理这些油都是要成本的,还冒着风险。后来有了汽车,才知道这种油的用途在哪里。
 
 
▲针对少数个人的数据,没有太大用处
 
大数据也是一样,少量的数据是没有用的。比如说针对你个人,你每天产生的这些数据,其实没有多大的用处。除非你是一个很重要的人物,某个人想针对你,对某个间谍机构你的这些数据才有意义。但对大多数人来说,这些数据没有意义。
 
但是,如果这些数据汇入到一个整体的数据库当中,一家生产服装的公司,生产鞋的公司,或者生产任何什么东西的那些公司,有能力对这些数据进行挖掘,就可以对消费者的需求进行预测和判断。就是说,资源依赖于你的开发能力,以及你能够把它放在什么样的位置。还是那句话,所谓垃圾就是放错位置的资源。这几个条件不满足的话,数据就是没有意义的。
 
我再总结一下,第一,一定是海量的非结构性数据才有意义,单个人或少量的数据是没有意义的;第二,大数据的运用需要强大的数据挖掘能力,这依赖于现代强大的计算能力。在这个基础上,它能够进行挖掘,能够提炼出真正的有价值的信息、知识甚至是智能;第三,它有没有用场?为什么现在大数据的运用只是在零售业比较有用,其他的地方用得还很少?也许是这些数据,它生成的这些智能,在其他的地方我们还没有找到应用场景。在零售业呢,它很快地能够从这些数据中获知消费者的偏好,以及流量,等等,这样一些信息和知识,它马上就能够用。
 
 
▲“云计算”是大数据的基础
 
我们说ABC时代,A就是AI;B就是big data,注意是BIG data,是大数据;C是cloud computing,云计算。这个云计算是基础,是所有的数据采集,数据产生,汇聚,挖掘的基础设施。为什么今天数据突然变得特别重要?是因为有这个云,拥有近乎无限的存储能力和计算能力。
 
但是,我们一般人是感受不到云的,我们顶多在手机上有一个什么cloud。其实这个东西非常关键,它是基础。在这个云之上,就是大数据,在大数据之上才产生智能,这三者本质上我觉得它就是三位一体的。有一个专家说得特别好,说人工智能不过就是一种高级的现代统计学。就是你之所以有智能,是根据大量的数据汇聚以后分析、提炼出来的,所以它是一种统计学。
THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论