专访丨文因互联CEO鲍捷:连接一切,建起金融数据的高速公路

赖燕芳
当我们谈到智能金融的技术基石时,更多的人会说机器学习、自然语言理解等,但很少有人会提到知识图谱。但是在众多的智能金融应用场景中,如智能风控、智能投顾、智能投研、智能监管等,很多时候都是机器学习和知识图谱共同发挥作用的结果。

新一代科技革命蓬勃发展,不断催生新的产业形态和商业模式。金融行业在历经电子化、移动化之后,也进入了金融与科技相结合的新阶段-智能金融时代。因为与数据高度相关,金融行业也一直被认为是人工智能落地最好、最快、最有商业价值的场景。

2018年12月14至16日,由中国人工智能学会、永泰县人民政府主办,中国科学技术出版社协办的第二期全球高校《人工智能导论》师资培训班在福州永泰县召开。文因互联CEO鲍捷在现场带来了关于知识图谱的报告。会后,亿欧就智能金融和人工智能等相关问题专访了鲍捷。

文因互联是一家智能金融解决方案提供商,主要利用自然语言处理和知识图谱技术,对金融数据进行结构化提取和智能化分析。整合金融机构内外部数据,从而利用银行、监管机构,基金证券等持有的海量数据,实现监管、获客、风控等场景的自动化。累计服务了招商银行、平安银行、南京银行、普华永道、天风证券等多家金融机构。目前,文因互联正在进行下一轮的融资。

知识图谱-催化剂、浓缩轴和打折卡

当我们谈到智能金融的技术基石时,更多的人会说机器学习、自然语言理解等,但很少有人会提到知识图谱。但是在众多的智能金融应用场景中,如智能风控、智能投顾、智能投研、智能监管等,很多时候都是机器学习和知识图谱共同发挥作用的结果。

知识图谱最早由Google公司在2012年提出。从学术的角度,我们可以对知识图谱给一个这样的定义:知识图谱本质上是一种叫做语义网络的知识库。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图。

鲍捷从1998年开始从事人工智能方面的研究,主要聚焦在语义网/知识图谱。鲍捷表示,他对具体算法过程不感兴趣,如何解决问题才是他的兴趣所在。他本人有个穷尽一生想要解决的目标,那就是将世界所有的知识联系在一起,而知识图谱能帮助他完成这一目标。

知识图谱可以说是一种应用于诸多人工智能相关领域的关键技术,它主要应用于数据结构化处理、解析、关联和后续的分析与推理。按照鲍捷的话说,知识图谱是一种催化剂,浓缩轴和打折卡。一方面它能加速价值的产生,在数据聚合中产生新的数据,例如本体映射;另一方面它可以提炼大量知识和数据,是一种流动性好,摩擦力特别小的数据,例如百科数据;它同时也是能降低成本,利用先验知识大幅提高价值的数据,例如基因本体。

“目前国内做智能金融的企业主要聚焦在智能投顾和智能投研方面,人工智能应用在金融行业应用的切入点不应该是这样的。”鲍捷表示,我们所讲的金融大工业化,增强的不应该只是一两个人的能力,而是多人协作的能力。它的核心问题是如何实现金融知识结构的沉淀和业务流程的自动化。

这个难点在于怎样做到用机器理解文档,并且让机器理解金融知识。前一项技术涉及自然语言处理技术,后一项技术涉及知识图谱技术。文因互联所做的事情就是结合这两项技术,在金融行业进行落地。这就要求企业具备全链条的数据结构化能力,包括财务报表的公开化提取能力,还有公告、研报、法规的解析,解析后再进行实体链接,映射到知识图谱上,之后是规则建模与推理、语义搜索、自然语言问答。

鲍捷告诉亿欧,希望能在5年时间内,在所有的金融机构、政府、研究机构间构造出一个巨大的近乎实时的数据分发网络,即“金融数据高速公路”,加快各金融机构间的信息流通速度。

实现AI,不一定需要先了解人脑

历史上,人工智能经历了三起两落。鲍捷表示,未来30年,人工智能会也会继续呈现这种上下波动的趋势。但是这次的热潮肯定跟前几次的不一样,鲍捷给出了以下几点理由:

首先,AI已经结合很多具体场景落地到产业上,有些行业已经创造了几十亿的产值;其次,从投资上看,之前的AI发展主要靠政府和军方在做支撑,而这次资本的入驻已经给AI的发展提供了大量的助推器;此外,人工智能的发展,离不开其他技术的支持,如大数据、云。举个简单的例子,假设我们想造一辆车,光拥有AI这么一块内燃机是不够的。云、大数据、运维系统,这一整套相当于我们车的轮子,传送机制,保险机制。只有结合这些东西,才能造出一辆车,在公路上飞速驰骋。

“我们现在的AI就好像一个破破烂烂的车子,经常漏气漏油,但起码还能用。”鲍捷笑着说道。

事实上,现在在人工智能领域已经产生了一条特别长的产业链条。比如上游有上百万的数据标注师,下游有各种各样的应用场景。一个产业的成熟一定是建立在产业链完善的基础上的。任何行业都会存在泡沫,AI继续崩盘的情况也有可能会出现。但是当浪潮退去,剩下一地鸡毛后,能留下来的都是人才,都是好的企业。

现在很多人都认为要实现AI,需要建立在先了解大脑机制的基础上。鲍捷并不赞成这样的观点。举个简单的例子,飞机飞上天时,我们还没有空气动力学这样的理论;在蒸汽机出现的时候,也还不存在热力学这一理论。AI也是如此。只有当产业界做出产品并开始盈利后,才能形成持续回馈科学的机制,带动学界去给我们解释为什么,然后再靠科学带我们冲出这片“无人区”。

“产业界讲究成本。工程师们往往需要混合使用几百种方法,去不断地试错来完成项目,就像用浆糊把各种零件贴在一起一样。在缺乏足够理论知识下,我们今天做的事跟当年的阿波罗登月项目差不多,就是要用落后的技术实现20年后的效果。”鲍捷说。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论