2020:下一个十年,存储发展的趋势是什么?

2020-02-11 17:14:45 文/浪潮服务器 作者/ 叶毓睿 存储

目前,软件定义存储最显著的特征是呈现分布式,根据近年来IDC的报告,软件定义存储按照访问方式,分为三类:分布式块存储、分布式文件存储、分布式对象存储。未来十年,分布式存储的相对市场份额将不断增长,预计将超过集中存储的市场份额,然而两者将长期并存。

下一个十年,存储发展的趋势是什么?

简而言之,存储如何以更高效、更低成本的方式,围绕着数据的产生、存放、保护、优化、利用,直至数据成为资产,满足数据对存储提出的要求。

相关的关键词有十个:软件定义和分布式、云存储、容器存储、全闪存、AI存储、区块链存储、边缘存储、量子存储、生物存储或基因存储等等。

我们先回顾一下历史,过去十年(2010-2019)存储发生了什么事件?

2010年

EMC收购Isilon,22.5亿美元 ;

惠普收购3Par,23.5亿美元 ;

2011年

戴尔收购Compellent,9.6亿美元 ;

希捷收购三星硬盘,13.75亿美元 ;

西部数据收购日立GST,48亿美元 ;

2012年

VMware提出SDDC(软件定义数据中心)和SDS(软件定义存储)的概念,之后推出SDS产品 – Virtual SAN的预览版 ;

2013年

Avago收购LSI,66亿美元 ;

2014年

闪迪收购Fusion-io,11亿美元 ;

2015年

戴尔收购EMC,630亿美元 ;

西部数据收购闪迪,160亿美元 ;

2016年

IBM收购对象存储,约13亿美元 ;

HCI(超融合)概念提出者Nutanix上市;

博通收购博科,59亿美元 ;

OpenText收购Dell EMC企业内容部门(包括Documentum等),16.2亿美元 ;

2017年

HPE收购Nimble Storage,10.9亿美元 ;

2018年

微软收购混合云数据存储公司Avere Systems ;

2019年

AWS收购E8 Storage,估计在5000万美元至6000万美元之间 ;

谷歌收购存储企业Elastifile, 2亿美元 ;

IBM收购 RedHat, 340亿美元,RedHat有两款开源存储产品:Ceph和Gluster。

站在企业存储系统的角度,有几件事值得注意:HCI、SDDC、SDS的相聚出现,戴尔收购EMC,西部数据收购闪迪,HPE收购3Par和Nimble Storage,以及云计算厂商微软、AWS和谷歌的收购……这些事件体现了全球存储发展的几大趋势:分布式、云化、闪存化、智能等。

软件定义(以分布式存储为主)

软件定义存储,为云而生。软件定义存储就是将硬件的可操控成分按需求,分阶段的,通过编程接口或者以服务的方式逐步暴露给前端应用,分阶段地满足应用对资源的不同程度、不同方面的灵活调用。软件定义存储其实是一个过程,不是一蹴而就的目标,它分成不同阶段:抽象、池化和自动化。目前,软件定义存储最显著的特征是呈现分布式,根据近年来IDC的报告,软件定义存储按照访问方式,分为三类:分布式块存储、分布式文件存储、分布式对象存储。未来十年,分布式存储的相对市场份额将不断增长,预计将超过集中存储的市场份额,然而两者将长期并存。

浪潮存储G2/G5的InRAID、戴尔Compellent、HP 3Par、华为存储OceanStor的Raid 2.0实现了基于数据块的智能虚拟化,将数据块和硬盘解耦;浪潮存储G2/G5的NPIV、戴尔Compellent的虚拟WWN将控制器前端卡的物理唯一ID抽象出来,也是一种解耦;VMware Virtual SAN(现命名为vSAN)、Nutanix、Ceph有别于以往的专用存储,将存储软件与专用存储硬件解耦,采用标准的商用服务器……分别体现了软件定义存储征程中的不同阶段。

浪潮存储G2/G5的InRAID示意图

回顾一下Gartner 在2015年7月发布的技术成熟度曲线,彼时处于曲线的最高点,也即阶段二(过高期望的峰值,Peak of Inflated Expectations)。四、五年左右的时间,被市场广泛认可,但迄今离占据市场主流份额还需一段时间。好消息是,目前软件定义存储的主要部分——分布式存储发展非常迅猛,远超平均值。

云化 (含容器、超融合、混合云)

据报道,全球云存储市场2017年为307亿美元,预计到2022年889.1亿美元,CAGR为23.7%;中国云存储市场2017年规模为88.68亿人民币,同比增长71.8%,2018年同比增长率将上升至72.8%,市场规模为158.5亿元人民币。

Gartner在2019年的报告中显示:到2024年,40%的企业将实施至少一种混合云存储方式,高于2019年的10% 。

上述提到的云存储主要是以AWS S3、EBS、阿里云块存储、OSS为代表的公有云存储。在本篇文章里,云化的概念更广泛,包括了公有云和私有云。

云的特点包括弹性灵活、按需交付、按用付费等,除了众所周知的公有云之外,还要看到私有云。AWS CEO Andy Jessy在AWS 2019 re:Invent大会上分享了如下消息:公有云的总支出只占到总IT支出的3% 。也就是说,全球IT总支出,私有云仍占绝大多数。我曾在2017年看到一篇文章提到:预计到2040年,公有云大约占整个IT开支的1/3和1/2之间。如果真是如此,也就是说即使二十年后,私有云仍占半壁江山。

01. 私有云的云化对接

存储如何更好的服务私有云,成为企业级存储的一个重要课题。除了存储自身的池化、自动化之外,向上提供API,方便私有云管理平台按需驱动存储资源的创建、调整、优化甚至回收,将逐渐成为必备配置。云化对接包含两大块,一是对接开源的云管理平台,例如OpenStack的块接口Cinder、文件接口Manila、对象接口Swift和几乎成为标准的AWS S3接口;二是对接商业的云管理平台,首当其冲的是能够被主流Hypervisor识别,再被相关的商业云管软件调度,如VMware ESXi、Microsoft Hyper-V。国内存储厂商中,浪潮的分布式存储AS13000在云化对接中做得更齐全。

容器对接也可以视为云化对接的一部分,我们看到越来越多的用户,包括互联网、金融、电信等行业,开始部署容器技术。因此存储支持CSI(Container Storage Interface)接口也将逐渐成为企业级存储的必备配置。

超融合可以视为私有云的一种部署形态,当计算资源池和存储资源池在初次采购以及后续扩容的过程中,计算和存储的比例比较适中,也即,不会出现少量计算资源需要搭配大量存储空间;也不会出现大量计算资源需要搭配很少的存储空间,此时超融合是不错的选择。

02. 公私相互渗透

在云计算领域,开始出现To C和To B的融合。

早期公有云的用户主要是一些C端,或者小B的用户,随着云计算的深入和普及,云巨头开始希望吸引大B用户。但是,出于隐私保护、安全性、政府合规、管理、兼容性、惯性、迁移成本等多种因素的考虑,原有大B用户迁移到公有云的进展比预期要缓慢。

因此,云巨头早在几年前就开始通过构建混合云或者私有云的方式来瓜分B端IT市场的大蛋糕。AWS收购E8和推出Outposts,微软收购混合云数据存储公司Avere,阿里云推出混合云存储方案,腾讯云、金山云、京东云也不甘人后。

另外,因为成本、空间、能耗等因素,逐渐有更多用户希望To B的存储厂商,能够支持将历史数据备份或归档到公有云存储上。

闪 存 化

根据IDC 在2019年12月31日的报道:“2019前三个季度,中国企业级全闪存存储阵列市场同比增长超过60%。IDC预测, 2019年全闪存存储市场仍将达到近50%的增长”。

据报道,闪存颗粒价格逐年下降(按照30%~40%的降幅),如下图所示。

国内的长江存储或将加速闪存颗粒下降趋势,不过2020年1月武汉爆发的新型肺炎疫情对此或有影响。

当全闪存相比机械盘价格差距不大时,更多用户愿意为延时缩短而买单(目前和15k转、10k转的机械盘价格相差不多;7.2k转的机械盘当下价格还有一些优势);

机械硬盘逐渐退化成类似磁带地位的介质。

而且在当前的大背景下,因为机械硬盘的核心技术欠缺的原因,中国大力发展和推进闪存落地具有重要的意义。国内大的存储厂商中,华为和浪潮都推出了自己的NVMe闪存盘。

闪存化的过程中,必然催生全闪存阵列的发展,其中的相关技术NVMe Over Fabric(简称NVMe-oF)借助RDMA等超低延时的传输协议,可远程访问SSD,解决了下一代数据中心在横向扩展 (Scale-Out) 时所遭遇的性能、功能、容量三者之间难以取舍的权衡问题。

下图可以看到NVMe和NVMe-oF列入2018年7月Gartner的技术成熟度曲线图中。

智 能

这里包括两个方面,一是存储的智能化;二是存储如何为智能应用进行优化,也即AI存储应该如何优化。

01. 存储智能化

存储智能化所希望达到的就是能够根据业务负载、运维管理等的历史记录,预测未来可能会发生什么,再据此动态地调整存储资源池,做到物尽其用;以及提供预警信息和执行动作,做到防患于未然。然而这个道路非常漫长,因为厂商需要在安全性稳定性和性价比(也即动态调整存储资源)之间做取舍;另外要想取得根据负载自动调整存储,其实不亚于将AI算法植入存储系统之中,难度不小。目前,存储厂商中,做得比较好的有浪潮的InView智能管理和HPE的Infosight。

02. AI存储

Gartner报告显示,到2022年,企业高管中将有半数以上会规划AI技术的部署,而这一数字在2018年的时候仅有4% 。

根据IDC数据,2018年上半年,中国AI基础架构市场销售额和出货量分别同比增长176%和129% 。

AI所需存储,可以分为准备、训练、推理和归档等阶段,每个阶段的IO特征不一样,对于存储的要求也不一样。例如,在推理阶段,IO的特征是读写混合,并且要求存储的延时低,能快速响应。

下图列出了AI各个阶段的IO特征,及其对存储的要求。

国内的AI公司针对不同行业不同细分场景,通过AI训练导出的模型,销售给最终用户。为了增加营收,降低部署难度,有不少AI公司将模型以及所需的软硬件打包,以一体机的方式销售。其中的存储系统应采用OEM或者转售的方式,因为AI公司的主业是它的算法以及针对场景不断优化,AI公司自研存储并负责存储的售后,性价比不高。

总结而言,过去的这些年,解决了数据的存放、保护和优化,尤其是在数字宇宙迅猛膨胀的过程中,如何低成本、高效率地存放。

免责声明:凡注明为其它来源的信息均转自其它平台,由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。联系邮箱:leixiao@infoobs.com