大数据预测也会遭遇不测

快资讯
佚名
最近社交媒体上刮起的世界杯“预测风”赚足了眼球。早在一个月前,知名投资银行瑞银在利用传统计量经济学工具评估后,发布了2018年世界杯的首份预测。随着这场全民狂欢的正式开启,“野猪马库斯&rdqu...

最近社交媒体上刮起的世界杯“预测风”赚足了眼球。早在一个月前,知名投资银行瑞银在利用传统计量经济学工具评估后,发布了2018年世界杯的首份预测。随着这场全民狂欢的正式开启,“野猪马库斯”“聋猫阿基利斯”“稳健马高尔”此类世界杯结果预测“神兽”频频抢头条、上热搜,摇身一变,就成了当下自带流量的“爆款”。“寻找章鱼保罗的继承者”无疑加注了世界杯的影响力。真伪球迷们似乎第一次对“预测”展现出如此大的热情。

如果把这种“热情”单纯归咎于互联网浪潮下的“集体无意识”,确是有失事实的。我们对于预测未来的能力从来无法抗拒,无论是在数千年前形而上学的宗教社会,还是如今科技主导的理性主义社会。稍有差别的是,21世纪的技术洪流正极大加深着人类对未来的洞见。平行世界、吸引力法则、薛定谔的猫、黑天鹅……这些近年来的热门话题无不揭示着一点:我们已经进入了预测时代!

在这个“Google即答案”的时代,人们似乎对“在线”数据有着更多的信任感。这种可量化、可视化、可调配的非自然资源抗衡着无形的占卜力量,事实证明,支持前者的呼声更高一些。“除了上帝外,我只信数据。”质量管理大师威廉·爱德华兹·戴明显然是其中一位。大数据时代已经来临,我们对大数据的“赋能”正不断促成新的融合和创新。当然,在预测领域,备受瞩目的大数据也从未缺席。一般来说,在互联网时代,科技热点的涌现往往伴随着一个新名词的诞生,你看,“大数据预测”就来了。

什么叫大数据预测?这和解释“什么是网红”“什么是互联网精神”一样,得到的只能是各执己见、众说纷纭的答案。在笔者看来,与其舍本逐末明确“定义”,不如稍加归纳,便于思考。所谓“大数据预测”,即计算机根据极近过去的原始大数据总结一般规律,并延伸到样本外极近未来的预测情况的过程。数据科学家埃里克·西格尔在《大数据预测:告诉你谁会点击、购买、死去或撒谎》一书中曾指出:“在商业、工业以及政府管理等‘真实世界’里,大数据预测有其固定的名称:预测分析(PA)。”说到底,大数据预测就是一项通过学习数据来预测未来行为的技术,而作出更好的决策才是最终目的。

不管定义如何,大数据预测渗透到生活中的例子不胜枚举。职场社交网站Linkedln(领英)会预测你未来的职业选项;惠普公司对其全球30万名员工进行“离职风险”评估,从而及时采取应对措施。以上种种颇具“操纵感”的预测力,皆源于大数据。如果这时你仍然觉得这项技术的应用是“空中楼阁”,不够“接地气”的话,不如打开常用的购物或是视频软件主页看看。为什么自己的喜好总能够被精准地捕捉,并且会源源不断接收到难以抗拒的内容推送呢?“始作俑者”正是大数据。正如埃里克所言:预测未来似乎有违自然规律:人不能知晓未来,因为未来尚未到来,但通过严谨的方法整理“已知”数据信息,就可越来越精准地预见未来之事。

毫无疑问,只要把现在与未来间的迷雾拨开一些,就有机会作出更合适的决策、创造巨大的价值。而目前看来,大数据则是我们用以对抗未来的有效工具和武器。

不妨接着谈论一下“有效”这个问题。既然这项将数学与科技融合的事业,正“润物细无声”地涉及着我们熟悉或陌生的各种领域,并已取得卓有成效的进展。那么,这是否意味着在数据品质确定的前提下,实践领域的预测力一定能得到保证?大数据预测本身的科学气质要更胜于“预测”本身的艺术气质,但仍有其边界和局限之处。传统的经济学预测是以理论为基础,注重因果性,而大数据预测则是以数据为基础且止步于相关性。而对相关性问题的研究基于的是典型的归纳逻辑(从大量的特殊到一般),因此不可避免地受到“黑天鹅”事件的威胁——一旦小概率案例发生,如政策变动,自然灾害,整个陈述将会瞬间崩溃。令人无可奈何的是,唯一不变的就是变化本身,提取数据过程中“去噪”的效果也仅是相对的,而非绝对。换句话说,给这项技术不断造血的“心脏”(数据),本身就是一个充满了不确定因素的变量。

不过,也有人是这项技术的坚实拥护者,理由为:世界上的天鹅大多数都是白色的。由此便有了门派之别。那么问题来了:你是狂热于现代科技力量的数据极客,还是信奉由逻辑推理得出结论的传统保守派?

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论