TigerGraph创始人兼CEO许昱博士:我为什么还是认为“图数据库猛于虎”?

2019-06-06 10:22:25 文/信软网 作者/ 韬哥 访谈

TigerGraph创始人兼CEO许昱博士介绍,从事数字货币交易的客户的需求比较特殊,交易本身就可以用一张交易图解析,所以他们对图数据库的理解、应用比很多传统行业走得早、走得快。

“如今,图数据库技术正越来越广泛地应用于各类商业场景中。”TigerGraph创始人兼CEO许昱博士谈起图分析的应用和需求如数家珍,“客户主动找上门来,主要有两类需求,一是对时间有要求,希望快速分析并得到结果;二是对分析深度有要求,比如一些做区块链的金融客户希望对数字货币交易可追踪的深度不是几十步,而是上百步甚至上千步。”

笔者与TigerGraph的第一次亲密接触还要回溯至2018年的杭州云栖大会,那时TigerGraph刚刚开始在中国拓展业务。在会议期间,笔者采访了许昱博士,也有了“图数据库猛于虎”的最初印象。

TigerGraph创始人兼CEO许昱博士

最近笔者再次对他进行了采访,他坦言:“TigerGraph现在最想做的就是让更多的行业客户了解图数据库、使用图数据库。”据他介绍,从事数字货币交易的客户的需求比较特殊,交易本身就可以用一张交易图解析,所以他们对图数据库的理解、应用比很多传统行业走得早、走得快。例如,TigerGraph已经尝试与普华永道、埃森哲合作,在预防金融犯罪上应用其图数据库技术。

“但是最近几年,传统行业也对图数据库有了更强烈和迫切的需求,因为有了图数据库,许多以前不能做的事现在都变成了可能。”许昱如是说。

图数据库可以做得更多

2018年,TigerGraph实现了预计中的快速增长,收入增长300%,客户数量增长400%,全球员工数量增长67%,全球最大的三家银行、Intuit、Zillow和VISA,以及中国的金融、电信、电力等行业的头部客户都是TigerGraph的客户。作为业界首个实时原生并行图数据库,与那些在业界成名已久、但仍然是单机版的产品相比,TigerGraph的增长后劲儿十足,也显示出足够强大的颠覆性。

图是一种数据结构,最核心的是点和边,点就是实体,边就是将实体进行关联的关系。图数据库在本质上与关系数据库是很类似的,只不过关系数据库用表来做存储和计算的模型,而图数据库是用图来做存储和计算的模型。图分析与传统的BI分析也类似,传统的分析是基于表状的数据进行分析,而图分析是基于图关联的数据做新的分析。与关系数据库和NoSQL数据库相比,图数据库具有十分明显的优势,比如可以实现更好、更快地查询和分析,更简化、更自然地数据建模,由点及面地挖掘知识体系,面向对象的思维,以及更强大的问题解决能力等。

“在大数据时代,数据是新的石油,而基于图的数据分析就是新的炼油厂。”许昱 说,“图分析可以把复杂数据关联起来,提供许多新的洞察力。”Gartner也认为,对数据驱动进行运维和决策的企业来说,图分析可能是单一最有效的竞争性优势。2019年1月,Gartner在一份研究报告中指出,从现在到2020年,图数据库市场的年复合增长率为100%,2020年保守估计市场规模将达到80亿美元。

以前,企业客户就很喜欢图数据库,但以前的产品不能扩展到多机,也不能处理大数据,导致应用只能处于研发阶段或者根本不能上线。拥有唯一可扩展的企业级图数据库,TigerGraph只用了一年时间就从默默无闻到赢得了全球很多行业大型企业的青睐,凭借的就是技术上的领先和不可替代性。

“我们的愿景是做图数据库市场的第一,赋能数据科学家、开发者和商业用户,将复杂的数据关联起来,并从关联的数据中获得深度洞察力。”许昱表示,“TigerGraph可以把企业的所有数据,包括历史数据和客户信赖的数据全部综合起来,并基于关联的图做各种各样新的应用程序。另外,图与机器学习、AI天生就具有互补关系。”

图数据库必不可少

为什么有些分析采用图数据库的效果会更好?有两种情况:第一种,数据量非常大,同时又要求做实时的多步分析,这是传统关系数据库根本做不到,而这却是图数据库最擅长的;第二种,在一些业务查询中,采用传统关系数据库根本无法描写或表达其中人与人、人与社区或社区之间的关系等。

用户是否要采用图数据库,其实有两个简单的判断标准:一是该任务是否要达到亚秒级,而且涉及多机多跳;二是某些任务是否无法用SQL描述。遇到上述两种情况,用户可以首选图数据库。

谈到公司未来的发展,许昱概括说:“第一,聚焦产品,继续技术创新,保持在企业级图数据库市场的领导地位;第二,发力云服务,比如2018年底推出的TigerGraph Cloud可以在云中运行可扩展、更简单、更强大的图分析,用户可以利用TigerGraph的可自定义图算法库为人工智能和机器学习提供强劲动力;第三,在图的可视化工具方面不断创新,目前TigerGraph内部已经有了一个可视即可得的版本,只要通过拖拽的方式,系统就可实时反馈结果。”随着技术的创新和产品快速的迭代,TigerGraph也在一些领域实现了新的突破,比如医疗保健行业、零售行业,TigerGraph与这些行业的客户正在尝试新的合作。

如今,通过图分析来优化是最热门的研究方向。TigerGraph今年也会投入更多研发力量,改进查询语言、更新算法库并在年中推出新版本TigerGraph 2.4。新技术将图模式匹配与实施深度链接分析相结合,这一组合特别适用于提高机器学习与欺诈检测、风险分析以及个性化推荐。许昱表示:“我们是个炼油厂,能把原始数据加工成新的、质量更高的‘油’。用户可以将这些高质量的数据、显性的数据之间的关系,用于机器训练或设计模型,那么训练的效果会更好,模型的质量也会非常高。”

人才很重要

当前,在所有类型的数据库中,图数据库是发展最快的。许昱认为,图数据库在发展过程中遇到的最大挑战只有一个,就是因为技术本身比较新,需要培养更多的专业技术人才,在中国尤其如此。所以,TigerGraph将在中国开展更多培训和认证工作。

TigerGraph成立的前5年一直埋头开发,并没有开展商业销售。当TigerGraph开始市场销售后,许昱对公司的产品相当自信,基于C++从底层核心开始做起,利用分布式技术,可支持万亿级别的节点,具备高性能和高可扩展高性,而且操作界面十分简单。“原生、并行,这是我们产品的差异化竞争优势。”许昱进一步解释说,“原生,表明我们打造了一套专门针对图数据库管理的信息系统;并行,表明我们的产品可以基于多CPU核心进行并行处理,性能非常高。 ”

TigerGraph是典型的厚积薄发,产品上市的一年时间里就吸引了众多行业头部客户,业务呈现加速增长态势。在中国,平安科技、招商银行、中国移动、中国联通等都采用了TigerGraph的产品。TigerGraph正在与国内的多个商业银行洽谈进一步合作。“不论数据量大或小,只要涉及复杂关联分析,就可以采用TigerGraph的产品。”许昱表示,“我们不仅可以做金融行业的反欺诈、反洗钱,而且以AI和机器学习、地理空间分析,以及时间序列分析等为基础,还可以广泛应用于企业知识图谱、产品实时推荐、智能供应链、网络IT和云资源优化等场景中,帮助企业洞悉深度关联的商业价值。”

为了进一步推动图数据库应用的落地,TigerGraph做了几件事:第一,编写并行图原生电子书,旨在培养和教育图数据库专业人才;第二,通过举办在线研讨会以及GSQL专家面对面活动,提升用户对图数据库的认识,普及并帮助用户使用GSQL查询语言,推动相关应用的发展;第三,更新了开源算法库,做更多内嵌的算法,让用户可以直接拿来使用,同时还会持续推出一些可视化工具,降低图数据库应用的门槛。

还是那句话“图数据库猛于虎”,图数据库正展现出越来越广阔的市场前景。

免责声明:凡注明为其它来源的信息均转自其它平台,由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。联系邮箱:leixiao@infoobs.com