浪潮云溪陈磊:浪潮云溪数据库研发副总经理兼产品负责人 陈磊

ITPUB
高博
国产数据库现在应该能够挑起国内高端市场的大梁,只是这些高端的应用对国产数据库厂商需要有一个验证、建立信任的过程,应用也需要改造,这个过程可能比较长或成本比较高。我觉得可能用不了五年,就能够有些成功的案例。

“国产数据库现在应该能够挑起国内高端市场的大梁,只是这些高端的应用对国产数据库厂商需要有一个验证、建立信任的过程,应用也需要改造,这个过程可能比较长或成本比较高。我觉得可能用不了五年,就能够有些成功的案例。”浪潮云溪数据库研发副总经理兼产品负责人陈磊在参加第十二届DTCC中国数据库技术大会时发出了这样的看法。

作为一款由浪潮集团自主研发的国产化云原生分布式数据库,浪潮云溪数据库已经是第二次亮相DTCC的大会舞台,云溪数据库自立项发布以来就声音不断,尤其在今年更是捷报不断:今年3月份,浪潮云溪数据库成功中标国家工业互联网分布式数据库项目;4月份西电-浪潮数据库创新实验室正式成立;今年上半年云溪数据库也进行了开源...

在刚刚结束的DTCC大会现场,浪潮云溪数据库研发副总经理兼产品负责人陈磊以《浪潮云溪分布式数据库3.0》为题发表了精彩分享,又透露出一个大消息:浪潮云溪数据库3.0版本将于明年年初正式发布。

11.png

浪潮云溪数据库研发副总经理兼产品负责人陈磊

很多朋友也比较关心浪潮云溪数据库近两年的市场动向、未来的发展规划以及对于数据库市场的独特见解,为此小编也趁此机会对陈磊进行了简单的采访,以下为访谈实录:

IT168:云溪数据库从2019年研发立项至今有两年多的时间,在这两年多的时间中我们都得到了怎样的市场反馈?取得了怎样的成绩?

陈磊:在市场方面,我们正式的推向外部市场是在2020年开始,在2020年之前,2019年作为研发主要在浪潮内部单位使用,2019年到2020年时市场反馈还是比较强烈的。市场用户对我们产品的可用性、扩展性比较认可,我们本身产品的扩展性以及可用性就很好,目前在政府、健康医疗、工业互联网等方面获得一些客户,反馈比较好。

IT168:去年贵司发布了云溪数据库的1.0版本,今年推出了2.0版本,并将在明年推出3.0版本,基本上保持一年一个大版本的迭代速度,相比友商来讲,迭代速度还是很快的,简单概括下每个版本都有哪些侧重点?即将推出的3.0版本又有哪些亮点?

陈磊:我们的1.0版本主要是实现了分布式数据库基础的能力,比如对数据库协议的支持,实现分布式事务、计算、存储、副本调度等核心功能,具备在线弹性伸缩、高可用等特性。

2.0版本对产品做了一些完善,在分区、索引等方面进行了开发,做了一些性能的增强,譬如在并行计算、矢量计算等层面。

3.0版本,主要是我们推向市场之后,2020年下半年定下了物联网以及工业互联网的主要方向,我们决定要进一步增强对于大数据量的分析,所以开发了列存的引擎、海量数据的写入、单一集群的异地分布式部署。目前我们一套集群可以在全国多个中心部署,实现数据的互相访问、就近访问,对大数据生态进行了集成,如Spark和Kafka。

IT168:未来产品的迭代速度是会一直保持这种速度(一年一个大版本)还是会随着产品的逐步完善而逐步放缓?

陈磊:首先我们是定立了敏捷开发和devops的研发模式,这也得益于我们浪潮本身的研发基础设施,因为你快速的开发就涉及到快速的验证,这要求有很强的持续集成的能力以及足够验证的环境。虽然我们发布的版本比较快,但每个版本都要经过大量的测试,包括自动化的功能的测试、混沌测试、场景测试、疲劳测试等。

后续我觉得可能会放慢一些。因为随着我们做的东西越来越深入,相对来讲它对于技术的挑战会越来越大,可能不太会保持每年都这样的节奏。

IT168:这几年,大家都在谈云原生,贵司资料显示,云溪的3.0版本是物联时代的云原生数据库,贵司的云原生的架构演进之路与竞品有什么不同?真正的云原生和伪原生之间如何区分,有没有什么评判标准?

陈磊:首先说数据库云原生的演进,我们数据库一开始立项目时就是要做云原生的东西,面向于浪潮的公有云、私有云,因为云环境可能不稳定,如基础资源经常发生变化,能不能很好的容错。还有扩展性,因为云给用户带来的便利是资源随着弹性的收缩,我的数据库在收缩的时候会不会对用户获得连续性造成影响,能够实现不停机的在线的伸缩。

另一方面,除技术之外从部署上也能很容易的分辨出来,你的数据库部署的时候是在云上的部署还是说你可以提供非云的方式的部署。首先我们数据库也支持非云的部署,但是我们默认会把它部署在K8S里。

IT168:有人说目前的所谓的云原生数据库都算不上真正的云原生数据库,您怎么看?

陈磊:只要是它在设计的时候,可能刚开始没有考虑过云的生态或者说做得比较早的时候没有考虑过云的环境,后面比如它进行了改造了,针对云进行改造,这时它在说自己是云原生的时候,我们也可以称它为云原生,但可能不是那么彻底。因为毕竟它有些组件在云上的时候不能实现完全的伸缩。

如有的数据库必须要有一个中心节点,不能进行扩展,而且是它不挂掉,它挂载完就把集群挂掉了。有的伸缩只能针对存储或SQL计算节点,并且扩展节点极限较底。而我们数据库所有的节点都能够大规模扩展,能够大于2000节点。

IT168:工业互联网是云溪数据库的主赛道,您认为面向工业互联网领域的数据库产品和其他行业的数据库相比有哪些差异化?

陈磊:先说相同的地方,就是都要求海量数据管理、高可用、HTAP。因为业互联网来讲,首先它对于业务的连续性要求很高,如数据库断掉可能就不能生产了,甚至有些工业场景需要进行工业控制的,比如火车、飞机的信号,要判断要哪个信号开,哪个信号关的时候,也是很关键的业务场景,所以它对业务的连续性要求很高。

不同的地方在于工业互联网没有过重的负担和历史包袱。当有一个新的底层技术时可以针对底层技术长出来一个更新型的应用,能够更好的去服务工业互联网。

这也是我们现在把主要赛道定位在工业互联网的原因。

IT168:云溪数据库在工业互联网领域以及数字能源市场的优势体现在哪些层面?

陈磊:有几方面,首先从技术方面来讲,我们的定位是分布式数据库,工业互联网和数字能源的场景它大部分是分布式的,最起码我们看到分布式居多,比如农村的光伏发电,各地的风力发电。你可以不是分布式的,各个单点都是独立的数据库,再做数据集成也可以,但是对于工业互联网或者工业场景来讲,我们认为它就是分布式的场景,它不是集中性的场景,所以更加适合于分布式数据库,这个是从技术角度来讲。

从集团角度来讲,本身浪潮也会做很多的数字能源的业务,比如会有独立的做数字能源的公司,浪潮内部兄弟单位本身就提供了很多解决方案,对于我们内部适配或者推荐起来更加便捷、容易。

IT168:除了工业互联网和数字能源市场外,还有哪些市场领域是云溪数据库未来的进击方向?

陈磊:后期我们当然也会进行扩展,但目前可能不是我们的主要方向,所谓扩展主要是依靠于我们的合作伙伴,我们合作伙伴如果在某个方向上比较擅长,我们就去鼓励它去做,但是说我们自己的团队,市场也好、技术也好,或者研发也好,主要面向的是数字能源场景的需求去做。

我们认为随着合作伙伴技术的发展或者本身业务方向的发展,可能也慢慢会走向分布式,两条线互相会有交点,我们本身在分布式场景以及技术上会不断去完善。其他的方向或市场上,他们本身对分布式的需求可能会越来越旺盛,这时可能会互相走到一起。包括刚才提到的银行或者一些传统行业,可能他们未来也会随着技术的发展,也会去做这种分布式的改造,他们系统有新的需求以后,双方的点就能合到一起了。

IT168:今年4月份,西电-浪潮数据库创新实验室正式揭牌成立,推动了产学研的发展进程,目前实验室的工作有哪些新进展?

陈磊:首先我们与西电的合作属于双方的强强联合,我们最开始本着生态建设的意愿,促进产学研的合作。西电后来和我们也达成了更广大的愿景,希望能够成立一个实验室,老师们能够更加深入的参加。

目前来讲,我们已经组建了老师、学生、博士、硕士大概30人左右的团队。现在已经开始进入正常的开发阶段,我们这边有什么技术点,他们那边认为这个东西是有价值的,他们就会去进行开发。目前双方的合作已经度过磨合期开始步入正轨,双方的合作包括开发、沟通交流都比较顺利。

IT168:实验室能够为云溪数据库提供哪些便利条件?未来实验室的主攻方向有哪些?

陈磊:实验室的主攻方向和云溪数据库团队的方向是一致的,目前来讲主要做的是SQL的优化器、软硬件的结合,以及数据库自治的开发。这些方向,我们本身团队要做,他们也要做,双方会进行频繁的沟通交流,和我们异地研发中心是一个意思。

当然他们未来的主要侧重点不能像我们公司一样完全去做开发。他们还是要去关注数据库前沿的方向,包括一些核心技术的突破,我们再去吸收引入进来。未来这个实验室的定位就是服务核心的重大技术攻关。

IT168:很多人都认为目前是国产数据库发展最好的时代,您认为目前国产数据库的市场机遇在哪里?

陈磊:数据库市场的发展机遇与技术的发展相关,比如云计算出现之后云数据库算一个机遇,当大数据发展起来之后像数仓、数据中心也是一种机遇,所以我认为随着数字能源的发展,能源行业分布式场景也是一种机遇,未来数据量一定是越来越大,中国地大物博,我们认为分布式的技术,分布式的场景就是未来的市场发展机遇之一。

IT168:如今国产数据库虽然落地应用越来越多,但在高端市场的核心业务应用还特别少,因此,我的问题是,国产数据库能不能挑起高端市场的大梁?如果能?那你认为需要多久?

陈磊:国产数据库现在应该能够挑起国内高端市场的大梁,只是这些高端的应用对国产数据库厂商需要有一个验证、建立信任的过程,应用也需要改造,这个过程可能比较长或成本比较高。我觉得可能用不了五年,就能够有些成功的案例。

当然,国产数据库在满足非功能需求方面还有差距,如可靠性,但我认为可以通过应用和基础计算资源去弥补,核心业务应用支撑不仅仅是数据库的事情,也需要给与我们更多机会。

我觉得高端的应用需要去更加大胆进行一些适配,或者是针对于数据库的技术特点去改造它的一些应用。因为它之前所做的那些业务系统,是根据当时的技术底座做出来的。现在,我们有了新的技术之后,如分布式、云计算、微服务等,我觉得如重新做应用,来去适配新的底层技术,应该能完全满足高端市场业务需求,从应用或计算环境弥补国产数据库非功能需求的差距,只是成本有点大或者说过程风险比较大。

目前我看到了很多高端应用的厂商或者说客户,他们也开始去适配或者说去改造,包括与数据库厂商进行联合的开发。我觉得可能用不了五年,2至3年的适配与改造,在2年验证,应该能够有些成功的案例。

IT168:云溪数据库未来在产品层面又有怎样的发展规划?

陈磊:虽然我们现在支持了工业数据的写入,但是它对于数据的压缩还是有一定的空间,还包括数据入库的效率,所以我们要着手去完善数据库的时序数据引擎。还有支持图数据库方面,因为支持工业数据的挖掘,包括实时的计算,我认为图计算还有图的存储也是很重要的一些点。

此外要完善我们数据库本身对于AI的能力,在分布式的场景下AI也很重要,通过AI能够更好的去做资源的调度,还有各种参数的优化、故障的处理等。

IT168:您怎样看待DTCC大会?对于DTCC您有哪些想说的?

陈磊:我认为这个大会做得很好,因为我们能看到这么多的友商坐在一起去交流,沟通彼此研发的方向,一些技术点包括一些解决方案。还有很多的客户来现身说法,讲一讲他们的需求,他们看重厂商的哪些点,我觉得这些都很好。无论是对于我们产品研发还是对于客户的需求,我觉得都是有很大的帮助的,希望DTCC能够越来越好!

IT168:感谢陈总对我们大会的肯定,也感谢您能够在百忙之中参加我们的大会并接受我们的采访。我们也期待明年2月份3.0版本的正式推出能够更好的满足用户更多的需求!

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论