分布式数据库崭露头角 亟须构建产业生态环境

中国软件评测中心 吕韬
根据目前我国分布式数据库技术现状,我们认为分布式数据库是具备分布式事务处理能力、可平滑扩展、分布于计算机网络且逻辑上统一的数据库。

分布式数据库是传统数据库技术与计算机网络的有机结合,相比于传统的单机或主备模式的集中式数据库,分布式数据库在平滑扩展、高性能、高可靠、高可用、低成本等方面具有优势,特别是在性能方面可突破集中式数据库的瓶颈,具有很强的研究和应用价值,目前很多数据库企业研发了分布式数据库产品,并在金融、电信、互联网等重点行业进行了成功应用,具有良好的发展前景。

互联网及金融领域对分布式数据库需求迫切

分布式数据库最早于20世纪80年代提出,受限于当时的计算机软硬件及网络发展水平,数据库专家M.TamerÖzsu和Patrick Valduriez在经典著作《分布式数据库系统原理(第3版)》中,把分布式数据库定义为一群分布在计算机网络上、逻辑上相互关联的数据库。随着信息技术的发展,集中式数据库也正向基于网络的共享集群路线发展,而市场上的分布式数据库也不仅限于网络分布、逻辑关联等特性,经典的分布式数据库定义显然已不能体现分布式数据库当前技术特点,难以满足数据库种类区分要求。

根据目前我国分布式数据库技术现状,我们认为分布式数据库是具备分布式事务处理能力、可平滑扩展、分布于计算机网络且逻辑上统一的数据库。

相比于集中式数据,分布式数据库具有平滑扩展、高可靠、高可用、低成本等关键特性和显著优点。目前部分分布式数据库实现了分布式事务的强一致性,保证分布式事务的ACID(原子性、一致性、隔离性、持久性)要求,为分布式数据库在关键领域的领域奠定了基础,而且成熟的分布式数据库透明性较好,上层应用系统可以像使用集中式数据库一样使用分布式数据库事务,无需关注分布式数据库的内部细节。

互联网是分布式数据库首先被重点应用的领域。从成本考虑,随着数据量和系统访问量增加,依赖纵向扩展的传统数据库架构,采用小型机、磁阵和商用数据库软件的购买和维护成本会越来越高。而采用廉价PC服务器、使用本地存储的分布式数据库,成本显著下降,同时还带来良好的系统成长性。另外,互联网应用,包括各种大促、春节抢票、秒杀等场景,都有短时间内并发量激增的情形。如果按照业务峰值提前采购计算资源,必然会导致资源浪费。借助分布式数据库的弹性扩缩容的能力,能更好满足业务场景的需求,并避免资源浪费。

金融领域是使用分布式数据库的另一个重要场景,分布式数据库可以满足金融核心领域高安全、高性能、低成本及高质量等要求。目前金融核心业务架构普遍采用“大/小机+Oracle/DB2”集中式数据库系统。一方面随着我国经济和科技,尤其是移动支付的发展,现有系统已无法满足金融类企业高安全、高性能、低成本及高质量等要求;另一方面随着国际形势的变化,现有系统可能会面临服务下降甚至断供的风险。所以逐步以自主可控的分布式数据库替换现有集中式数据库成为金融行业的必然选择之一。

分布式数据库将向云化方向发展

一是分布式数据库的产品化日趋成熟。随着国产分布式数据库在金融、互联网等重点行业中的应用,促使产品技术不断迭代,兼容性、易用性、可扩展性等问题将一一克服。未来随着分布式数据库等的标准体系及评价体系的健全,分布式数据库产品的生态体系也将逐渐完善,在运维保障、数据迁移、运行监测等方面的配套工具也将逐步成熟。

二是与人工智能等新技术融合实现高效运维。在数字经济的推动下,数据的全生命周期管理尤为重要,而分布式数据库数据通常由几十台至数千台服务器组成,数据库的运维显得尤为重要。随着人工智能技术的发展,将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈,是未来发展的必然趋势。另外,在交易、分析和混合负载场景下,可以通过人工智能的学习算法,实现数据库的自动调优。

三是分布式数据库的服务方式将向云化发展。云计算技术已在我国各行业信息化建设中大规模应用,为适应未来信创领域信息化建设技术方向,降低数据库运维成本,灵活调度资源,国内数据库厂商积极布局云数据库产品及服务。阿里云、腾讯云、华为等已经发布了基于自有云平台的云数据库产品,传统数据库厂商达梦也推出云数据库产品。总体上,国内云数据库与国际先进水平基本持平,为未来信创云数据库发展提供良好基础。

大力发展分布式数据库的技术产品

目前,国内绝大部分数据库企业均推出了分布式数据库产品,我国分布式数据库发展基本与国际同步,在一些技术指标和应用层面处于领先水平,而且互联网、金融等领域应用场景对分布式数据库具有切实需求,当前应大力发展分布式数据库的技术产品,加快行业应用,促进数据库产业高质量发展。

首先,政策引导,形成分布式数据库的典型案例。

客观地说,分布式数据库不是传统集中式数据库的更新换代,而是充分结合分布式计算技术,使得在一定规模的节点和付出一定规模的成本后,实现了较高的性能水平,并不是所有的应用场景都适合使用分布式数据库,既没有必要神话分布式数据库的作用,也不应该去贬低其作用。因此我们希望在政产学研用等多方努力下,共同打造分布式数据库的最佳实践,树立一批典型的行业解决方案,并加以宣传推广

其次,产用协同,提升分布式数据库产品成熟度。

分布式数据库作为数据库领域的创新,目前其产品化程度不高,甚至目前的一些所谓分布式数据库产品,其实更像是产品与应用融合后的解决方案,并不利于市场推广。因此我们建议充分利用好数据库以及基础软件领域的创新中心、适配基地及重点实验室等机构,加强供需双方的产用协同,形成良性的问题反馈机制,共同解决一些共性的技术和产品问题,逐步打磨优秀的分布式数据库产品。

最后,营造环境,打造分布式数据库的生态体系。

从产业发展角度来看,相比于集中式数据库,分布式数据库还处于发展的初期,技术体系、标准规范、测评机制、产品推广等方面尚不健全。建议第三方研究和服务机构前牵头,联合推进技术标准、测评认证、迁移验证、示范试点等工作,共同营造良性的分布式数据库生态体系。目前华为、PingCAP等企业发起了分布式数据库的开源社区,并形成了部分商业发行版产品,这可能也是建设分布式数据库生态体系的新思路。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论