阿里云李飞飞:数据库未来的发展趋势

2021-09-13 11:49:54
李飞飞
访谈
全文共约 4473 字,阅读约需 9~15 分钟。
过去几十年,IT基础设施的规模正在发生巨变,从早期的大型机、小型机,再到X86服务器,到互联网,再到云+端的演进,底层的设备数量出现了从几十台到几百万台指数级的增长。

2345截图20210719174729.png

李飞飞说,云数据库已经成为数据库最重要的发展方向,从国际国内数据库产业的发展来看,这个趋势已经非常明显。在他看来,在新技术大变革时期,中国数据库市场也一定会发生一系列显著的变化。

具体到阿里云的发展策略,他表示,作为中国排名第一的数据库厂商,阿里云已经做好了全面服务政企市场的准备,并会在这个市场上持续发力。

以下为李飞飞演讲的核心内容:

数据库的未来:云原生+分布式

首先回顾整个数据库的发展历程。

过去几十年,IT基础设施的规模正在发生巨变,从早期的大型机、小型机,再到X86服务器,到互联网,再到云+端的演进,底层的设备数量出现了从几十台到几百万台指数级的增长。

这种基础设施的变化,为上层数据库的演进提供了坚实的基础。就像物种会随着环境的变化而演进一样,当基础设施——计算、存储、网络这些基础的计算资源不断演进的时候,这些基础设施之上的数据库系统,也需相应地持续演进。

不同的基础设施对应了不同的应用场景,以及数据库发展的不同历史阶段。

过去几十年,数据库经历了从早期的关系型数据库,到后来的数据仓库和关系型数据库配合,OLTP和OLAP两个领域的细分,到后面开源数据库,再到今天云数据库的一个发展历程。

DB-Engines对数据库领域有深入的跟踪分析。目前,这个网站上有近400款不同的数据库的产品,这个数字直白地说明数据库市场竞争非常激烈。

DB-Engines网站上的数据库分为不同类型,有关系型数据库、图、文档、分析型数据库等,分别对应不同行业特点和客户需求的细分市场。除了传统商业化数据库,开源社区的数据库发展也非常迅猛。

DB-Engines有一个指数——Popularity Trend,这是通过各种指标计算出的。该指数显示开源数据库和商业数据库之间的流行差距已经快速缩小。

2345截图20210719174729.png

这一切都表明了数据库行业正在发生新的变化。权威市场研究机构Gartner在相关报告中阐述了几个非常重要的趋势:

第一,数据规模爆炸性增长。我们处在一个大数据时代,毋庸置疑。

第二,数据生产和处理的实时化需求越来越强。这也是为什么阿里云今天提出云原生数据库2.0,提供一站式数据管理与服务。

第三,生产和数据处理的智能化。现在用户对数据的处理不再停留在传统的事务处理、交易以及简单或聚合类的分析查询,而是希望能从数据中得到更多洞察,利用数据驱动智能的业务决策。这对我们数据库后续的发展也提出了新的挑战。

最后,数据在加速上云。这是非常明显的行业趋势,虽然有公共云、混合云、私有云等各种形态,但是各行业对云化的部署方式已是深信不疑。根据Gartner预测,到2023年,全世界75%的数据库都会以云的方式在运行。

数据库系统架构也在快速演进。最早数据库是单节点架构,传统的商业数据库和开源数据库都是这个架构。

在实际的应用部署中,这种数据库的优点是部署简单,开发简单。但是也有缺点,首先无法提供高可用能力、主备的运维、高可用切换、非常复杂且面对非常大的技术挑战;其次,无法快速扩容。就比如自己家后院的小仓库,当数据量或者并发处理的要求超过容量的时候,没有办法快速扩容。

为了解决弹性扩展、高可用等问题,业界衍生出两个核心技术路线,一个是云原生的技术路线,一个是分布式数据库的技术路线。

云原生技术路线

云原生的本质就是将资源池化,就像以前家家户户在后院挖个水井,今天不会再在后院挖个水井,而是会打开水龙头,按需按量使用,弹性计费使用水的资源,有一个大的池子,这就叫资源池化,其实和云计算使用计算存储网络资源是一样的道理。

云原生数据库核心的理念就是利用云计算的本质,运用虚拟化的技术,将数据库里面的核心资源进行池化处理,以此解决资源弹性、高可用的挑战。这里面还有一个核心的理念——存储计算分离,通过将存储和计算解耦,分别灵活弹性地满足客户业务需求。

分布式技术路线

通过分布式的方式,可以将计算和存储进行水平拓展,满足业务的大数据量以及高并发的需求。当然这也有挑战,分布式的事务处理,数据库仍需要满足ACID原子性、一致性、隔离性、持久性等特性。在分布式架构下,保证读写的高效处理非常有挑战。

数据库未来的发展趋势一定是将云原生能力和分布式能力合二为一,既提供分布式的水平拓展能力,也提供云原生的弹性高可用能力。将两者结合起来,也是阿里云以PolarDB为代表的云原生数据库,进一步去探索和发展的方向。

云计算改变数据库市场格局

阿里云数据库在云原生领域持续进行了多年的耕耘和积累,我们取得了一些进展。Gartner预测在2023年75%的数据库都会以云的方式来运行。

Gartner每年都会做魔力象限,对云计算IT领域重要赛道进行评估。2013年之前,数据库领导者象限基本是被传统的几个巨头占据,Oracle、微软、IBM的DB2,还有SAP。

到2020年,市场发生了翻天覆地的变化,在海外市场有一个明显的特点是,除了传统数据库巨头,AWS、谷歌、微软等云厂商也进入领导者象限。

值得一提的是现在的微软和当年的微软完全不同,微软此次进入领导者象限是由于其云数据库的服务能力快速提升,极具竞争力。结合其线下数据库和云数据库两个赛道的优势,微软已经实现了在整体市场份额上对Oracle的反超。

阿里云数据库在2020年首次进入了全球数据库领导者象限,这也是Gartner在产品成熟度、技术先进性、客户满意度,以及市场占有率等多个维度深度评估后给出的高度认可。

2345截图20210719174729.png

图片来源:特大号

上图是十年前和2020年最新的全球数据库市场份额排名对比。全球数据库市场份额列表包含了云数据库的市场份额以及传统线下数据库的市场份额,两者结合分析,过去Oracle一直占据第一,2020年微软第一次反超Oracle。

这其实是微软利用SQL Server以及Azure云数据库的快速成长,两个赛道结合实现了对Oracle的反超,这是非常具有历史意义的里程碑事件,再次凸显了云数据库在新的环境下,对各个厂商及数据库市场的重要性。

另外,在过去几年,阿里云的市场份额持续提升,已经到了全球第七位。如果只看云数据库赛道,阿里云排名全球第四,位列AWS、微软、谷歌之后。

数据库产业的历史新机遇

虽然数据库是一个发展了四十年的赛道,但它并不是一个墨守成规的赛道。我认为在今天这个时间节点,数据库还是一个非常有活力的赛道,孕育着大量新的市场机遇和新的爆发点。

第一,数据库是基础软件类目的第一大赛道,基础软件有很多,但数据库是基础软件里最为核心的类目,也是市场体量最大的一个类目。

第二,从开发者的角度看,超过一半的开发者都需要使用数据库,其重要性毋庸置疑。

2345截图20210719174729.png

中国数据库的产业发展有几个新的机遇,可以称之为四新——新政策、新面孔、新技术、新机遇。

图片第一,新政策。这主要是国家出台了系列政策,将对基础软件的重视程度提升到了前所未有的高度。国家非常鼓励我们中国的企业,通过开放、公平的市场竞争方式,提升国产数据库的竞争力,从技术水位、市场份额来看,国家也提供了非常好的环境。

图片第二,新面孔。传统的上一代国产数据库厂商叫四小龙,衍生到今天国产数据库的赛道百花齐放,出现了更多的新面孔,包括以阿里云为代表的云服务厂商,还有专门做企业级数据库软件的厂商等。

图片第三,新技术。今天之所以我们有这个机遇去挑战传统数据库厂商市场第一的地位,并且实现了超越,本质上是我们所处的环境发生了巨大变化。

如同达尔文的《进化论》,物种要快速进化的前提是周围的环境发生变化,新物种适应环境的能力比具有统治地位的老物种更快,它的进化速度就会更快。

新技术的产生,像云原生、分布式、智能化,面向物联网的多模数据的处理、安全可信、新硬件、以及开源,这些维度是今天以及未来很长一段时间,各个数据库厂商会展开激烈竞争的赛道。

图片最后,新机遇。越来越多的企业级用户会选择云的部署方式,这个为我们进入传统政企市场提供了非常好的机遇。

阿里云数据库不仅在公共云市场处于领导者地位,也做好了全面为线下传统政企市场服务的准备,事实上我们已经服务了大量传统政企客户,并且用云原生、云计算的方式,为他们带来了以前传统部署方式享受不到的技术红利,不仅仅是从IT降成本,保障稳定运行,更是带来了新的业务价值,新的业务机遇。

云原生数据库2.0:一站式数据管理

回顾阿里巴巴数据库的发展历程:

2005年-2009年,电商高速发展时期,阿里巴巴集团拥有亚洲最大的Oracle集群;

2010年-2013年,阿里巴巴成功用自主开源的AliSQL替换了传统商业数据库;

2014年,阿里巴巴开始布局自研数据库,因为业务推着我们往前走,比如双十一电商场景,有异地多活、热点打卡、秒杀的需求,让我们看到了自研数据库的价值,于是我们坚定投入到数据库这个基础软件的自主研发中去;

2017年到今天,通过多年积累的数据库技术,我们提供了丰富的数据库的服务,比如云数据库的托管服务RDS、云原生数据库PolarDB和分布式版本PolarDB-X、以及云原生数据仓库AnalyticDB,这些核心产品形成了我们数据库产品和服务的矩阵。

通过技术迭代,云原生数据库2.0时代,我们希望提供一站式的数据管理与服务。

阿里云数据库已经毫无争议的来到了中国数据库市场第一的位置,在全球舞台上,具备了向更高台阶、更高市场份额竞争和挑战的能力,进入了Gartner全球数据库领导者象限。

另外,根据IDC最新的中国关系型数据库市场份额的研究报告,公共云加线下合起来统计,阿里云数据库的市场份额占比28%,超越了第二名十个百分点。在Forrester最新数仓报告中,云原生数仓AnalyticDB也进入了全球的强劲领导者象限,在业界的标准基准测试里面,取得多项性能及性价比第一的结果。

我们不仅在商业市场上取得巨大的突破和成就,还得到了国家的高度认可。云原生最核心的产品,云原生数据库PolarDB去年获得中国电子学会的科技进步一等奖,这是中国电子学会最高的奖项。我们的数据库也是唯一入选的数据库的产品,体现了从国家层面,从科研的角度,对我们的新技术、新科研实力的认可。

云原生数仓AnalyticDB也获得了浙江省科技进步一等奖,我们进行了对x86、ARM等多种硬件以及操作系统的适配,这样可以更好的服务中国的企业级市场和客户。

2345截图20210719174729.png

展望未来

我认为云原生数据库已经发展到了Gartner提到的市场发展阶段,开始直面数据的实时性、在线交易分析一体化、数据智能化处理等新需求。

因此,我们提出云原生数据库2.0,提供一站式数据管理与服务的能力,通过数据生产和集成,到数据实时处理、存储,再到数据分析和发现,最后到数据开发和管理,提供全链路数据生命周期的管理。

在这个基础上,我们为客户提供面向行业的解决方案,也就是面向不同客户且能产生行业价值的解决方案,最后联合我们的生态合作伙伴一起服务客户,从分销生态到ISV被集成,再到服务生态,再到开发者,形成一整套的数据全链路的管理和服务的能力。

2345截图20210719174729.png

图片

收藏
免责声明:凡注明为其它来源的信息均转自其它平台,由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本站联系,我们将及时更正、删除,谢谢。联系邮箱:leixiao@infoobs.com