本文来自极客网(www.fromgeek.com),作者 | 小刀。
极客网·极客观察5月26日如果能精准预测未来,就能在生活中占尽先机,无论是预判房价涨跌,还是捕捉下一个产业风口,预测的魅力都无人可挡。随着AI技术的蓬勃发展,一个核心问题开始引发思考:人工智能能否成为超越人类的超级预测者?
在这一思潮的推动下,预测领域正加速构建AI预测机器人。事实上,这类技术早就已经出现在金融市场,比如DeepSeek就是凭借算法交易模型起家的。但目前业界的共识是:顶尖人类预测者仍全面领先于机器。
以专业预测平台Metaculus为例,它定期举办季度预测锦标赛。最开始时赛事只允许人类参与,近年新增AI机器人组别。观察2024年三季度、四季度及2025年一季度的预测结果,我们可以发现人类超级预测者优于机器。
不过Metaculus CEO德格・图兰(Deger Turan)指出一个关键趋势:人类预测的能力基本稳定,而AI的进步肉眼可见,两者的差距正在缩小。
能否优化AI的预测能力
预测能力蕴含着巨大价值:律师想预判对手是否接受和解,建筑项目要估算竣工时间,电影制片人想押中爆款剧本,甚至单身者都想知道约会对象更爱咖啡还是啤酒。毫无疑问,人人都想成为预测大师。
从技术本质看,AI预测的逻辑并不复杂:通过海量数据训练大模型,使其具备对未知场景的推演能力。预测已经形成独特的知识体系,比如“基础率”(某现象的历史发生概率,以避免过度乐观或悲观的预测偏差)、“布里尔分数”(用于衡量概率预测准确性的评估指标)、“校准度”(模型预测的概率与实际事件发生概率之间的一致性)已经成为预测学的基石。人类将终极目标指向“超级预测者”,它们的准确率远超平均水平,预测结果具有持续可靠性。
2024年10月,国际AI领域非营利组织人工智能安全中心(Center for AI Safety)宣称,仅通过大语言模型抓取新闻就能实现“超人级”预测,但这一结论很快因“数据污染”崩塌,模型误将本不该获取的信息纳入其中,导致结果无法复现。
相比之下,加州大学伯克利分校的方案更具参考价值,它的预测模型也是基于大模型开发的,但增加了许多限制,比如,不允许机器人自动运行,而是按特定顺序执行系列任务。具体来说就是增加的特定框架,首先要求模型制定一系列问题,根据问题获取相关新闻内容;第二步,新闻服务给出回应,大语言模型判断哪些回应最实用;然后根据相关度最高的回应进行汇总。
实验数据显示,若直接调用大语言模型进行预测,不做结构化处理,其准确率经常接近甚至低于随机猜测水平,这表明单纯依赖大模型难以有效捕捉复杂逻辑关系。而经过结构化训练后,AI机器人的预测准确率显著提升。
尽管近年来AI能力取得显著进步,但在预测领域仍未能超越人类,更无法企及"超级预测者"水平。展望未来,预测模型将更趋"结构化"发展,人机协作的深度与广度也将进一步提升。
预测的难点在哪里
开发AI预测工具的FutureSearch公司CEO丹・施瓦茨指出:“从学术层面看,至今没有成果能超越加州大学伯克利分校的论文,而那篇研究已发布超一年。”在AI领域,一年时光足以见证技术迭代。这一现状既印证了伯克利团队的突破性,也暴露了AI预测的深层困境:语言模型在定量分析与逻辑推理上存在天然缺陷,面对复杂问题时,大模型的预测能力更糟糕。
但伯克利研究团队仍保持乐观。他们强调,尽管AI存在局限性,但从ChatGPT问世至今不过数年,当前AI预测能力已逼近人类平均水平。若能将专业预测概念深度植入AI系统,其表现完全有可能超越人类顶尖预测团队。
回望历史,人类本就是极不擅长预测的物种,无论是经济危机还是技术变革,无数误判早已证明这一点。
想拥有良好的预测能力,需要诚实面对错误,不断汲取教训,要不断调整观点,不能被新闻评论或者别人的讨论干扰,还要对所有信息都给予恰当重视,这本来就反人性的。如果让AI来处理,可能效果会更好。
几年前,美国曾出版过一本名叫《超级预测》的书,作者是宾夕法尼亚大学心理学家Philip Tetlock,虽然本书曾引起热议,但几乎没多少人认为有明确的预测策略存在。一个耐人寻味的现象是:当印巴冲突升级或中美关税谈判胶着时,鲜见“超级预测者”在媒体头条发表观点;在白宫政策制定过程中,也难觅他们的身影;就连最依赖预测的投资机构也极少将“超级预测者”纳入决策链条。
如此现状引出另一个问题:世界对人类超级预测者的需求并不强,但如果是由机器来预测呢,情况会不会改变?
从当前各大科技公司的研发方向看,"超级AI预测工具"尚未成为重点研发领域。即便成功研发出强大的AI预测工具,如何获取决策者的信任仍是一大难题。
现代大语言模型本质上是一个"黑箱"系统:当人们提出问题并让其预测时,实际上无法知晓大模型是如何通过计算得出最终答案的。
未来,人类可能会要求AI对预测结果进行解释,而决策者往往只会在解释合理的情况下才采纳其建议。当工具出现时,我们最开始肯定会保持怀疑态度,随着时间推移,AI需要用令人信服的预测成绩征服人类,然后才能改变人类的决策方式。(小刀)