软件定义存储适用场景及对现有存储架构优化案例

存储功能的实现完全依赖于软件组件,而与硬件无关,这样天然为云计算管理平台实现对存储资源的自动化调度管理和用户自服务提供了可能性。同时在架构上实现了软件自愈性,只要系统可用容量具备,存储系统的组件故障就可以被自主修复。

本文来自微信公众号“twt企业IT社区”,【作者】昼者,某省农信社资深技术经理、经济学博士、高级经济师,银行从业17年,在全行数字化转型变革中,参与了科技发展规划、组织架构调整、管理流程设计和重大项目建设,为业务与科技的融合之路,进行了有益的探索。带领团队获得了10项发明专利和7项软件著作权,2项作为第一发明人,多次获得监管部门科技奖项。出版了个人经济学学术专著并在《金融电子化》、《金融科技时代》、《中国金融电脑》、《中国农村金融》等期刊发表多篇金融科技文章。多次受邀参加金融科技峰会及专题会作主题分享,为头部金融同业机构授课培训金融科技创新实践。

引言

安全、便捷和可拓展的数据存储技术是发挥数据价值的前提条件。海量数据增长、业务需求迫切、运维难度加大等一系列现实问题对企业的数据存储带来了巨大的挑战。软件定义存储作为主流的云存储架构,其基于硬件解耦、软件定义、弹性扩展、资源融合的核心架构思想,具备优于传统存储架构的通用性、扩展性、性价比、一致性等相关特性,适用于需求快速更迭、空间收放频繁、混合云和大数据集群等应用场景,为企业海量数据存储应用提供了更多的技术选择。

面对数据增长带来的挑战,很多企业现有的FTP、NAS、Windows共享等存储共享方式已逐渐难以满足企业数据存储和管理的业务需求。据IDC数据显示,至2025年,全球创建、获取和复制的数据量将增至175ZB,其中,企业存储的数据量将会占据全球总数据量80%以上。这一数据表明企业正迅速成为生产数据和管理数据的主要载体,加上目前我国正处于云计算的高速发展时期,企业上云成为必然趋势。越来越多的企业选择将日常办公数据、备份数据、归档数据、静态历史数据等活动性不强的海量数据移入云存储资源池甚至直接推向云端,灵活、便捷、可拓展的软件定义存储得到了更多企业的关注。

一、软件定义存储的现状

(一)软件定义存储的定义

软件定义存储(SDS,Software Defined Storage)是指存储资源由软件自动控制,通过抽象、池化和自动化等一系列处理后,将标准服务器的内置存储、直连存储,外置存储,或者云存储等资源整合起来,实现应用无感知或者基于策略驱动的自动化部署、变更和管理,最终达到存储即服务的目标。

软件定义的思想最初来源于软件定义网络(SDN),软件定义存储的架构核心思想在于硬件解耦、软件定义、弹性扩展、资源融合。

1、硬件解耦。软件定义存储抛弃了专用定制的存储硬件产品,采用标准的通用硬件平台,使存储的发展摆脱了硬件厂商的绑定,大大降低了存储部署的复杂性和成本。

2、软件定义。存储功能的实现完全依赖于软件组件,而与硬件无关,这样天然为云计算管理平台实现对存储资源的自动化调度管理和用户自服务提供了可能性。同时在架构上实现了软件自愈性,只要系统可用容量具备,存储系统的组件故障就可以被自主修复。

3、弹性扩展。软件定义存储的分布式架构决定了存储系统可以按照资源池化管理,系统可以根据实际的容量和性能需求进行部署,同时伴随需求的变化而灵活扩展。

4、资源融合。软件定义存储在实际市场应用中结合需求进一步拓展了技术外延。如超融合架构将存储资源与计算资源进行了融合,为客户带来更加灵活便捷的基础服务能力。未来可能与网络资源进行融合,将整个基础架构的硬件资源完全模块化。

(二)软件定义存储的发展现状

根据IDC发布的2020年前三个季度中国存储市场统计数据,SDS替代传统存储的步伐开始加速。

360截图16280721588958.png

在报告期间,整个中国存储市场,各存储类别份额变化较大。传统企业存储系统TESS,市场份额从65.4%下降到59.2%,失去6.2%份额;超融合HCI,市场份额从17.4%增长到18.6%,增长1.2个百分点;软件定义存储SDS,市场份额从17.2%增长到22.2%,增长了5个百分点。

从统计信息看出,传统存储失去的份额,分别被SDS与HCI抢占了80%与20%。从绝对份额来看,SDS是22.2%,而HCI是18.6%,说明SDS市场空间相较HCI更大。

SDS的增幅最高。SDS在2020年前三个季度的整体涨幅是47.1%,其中20Q3出现井喷行情,市场增幅高达62.3%。

360截图16280721588958.png

从SDS行业使用情况来看,政府、电信、金融是其使用量的TOP3行业。金融行业虽然偏保守,但采用SDS的形态企业在增多,特别是对象存储,在帮助金融创新方面发挥了诸多作用。而且,2020年金融行业也超过了教育行业,进入前三。

360截图16280721588958.png

二、技术优势及适用场景

(一)软件定义存储的技术优势

基于软件定义存储的设计理念及其所采用的技术线路,相对传统存储架构方案主要存在以下技术优势。

1、硬件通用。使用X86服务器、SSD磁盘等通用硬件,消除了硬件锁定带来的问题,灵活性强;

2、良好的扩展性。可以通过增加存储服务器的方式便捷拓展,适应数据量不断增加的业务需求;

3、低成本。用普通X86服务器代替了专用存储硬件,大大降低了投入成本。

4、高性能。相较于传统存储架构,软件定义存储架构由多个存储服务器共同承担负载,所以拥有更高的性能,能满足高性能需求;

5、多副本的一致性。多副本备份机制在读取数据失败的时候,能通过其他副本恢复的数据恢复原副本,从而保证副本的总数固定;

6、自动化程度高。通过简化管理,降低存储基础架构的运维开销;

7、标准接口。支持API管理、发布和运维设备和相对应的服务;

8、虚拟化数据路径。支持多种标准协议,允许应用通过块存储,文件存储或者对象存储接口写入数据;

9、透明度。为用户提供管理和监控存储的可用源与开销。提供方便易用的管理界面,实现存储集群的灵活部署和监控运维。集群系统可以灵活的增加和删除节点,可以自动实现集群的故障恢复、数据均衡等功能,减低甚至无需人工干预。

软件定义存储既能提供块存储或者对象存储服务,又可以和计算节点紧密结合,提供计算存储的融合方案。在企业云架构实践中,可以提供虚拟机精确控制、与应用高度整合高性能要求、与vSphere相同级别的应用和数据移动性、快速调配零停机操作、按需动态扩展、支持VDI和大数据等新应用等优于传统存储产品的新特性。软件定义存储的兴起,简化了存储的管理、降低了总拥有成本、实现了端到端的SLA交付,为解决云化数据中心当前所面临的问题和挑战,提供了新的解决方案。

(二)软件定义存储的适用场景

在云化数据中心的管理中,软件定义存储可以最大程度地减少管理成本和管理工作,以满足具有不可预测工作负载和/或动态工作负载的应用的性能需求。结合其技术特性和优势可以用于企业中以下各种真实的业务场景。

1、快速迭代的业务环境

随着企业越来越多的参与市场活动,交互型系统显得越来越重要,当系统不再仅限于后台交易,越来越多的用户活动加入,业务迭代的速度也将越来越快,对于存储的灵活性要求越来越高,而且业务场景和压力也不可预知,对于存储的多个维度也提出了更高的要求。

2、涉及到大量存储的新分回收的环境

传统存储领域,由于涉及到光纤布线,交换机ZONE划分,存储卷映射等复杂步骤操作,存储的新分和回收流程相对复杂,且容易出现差错。软件定义存储可以运用快速的部署和数据迁移能力,简化了存储的分配回收流程。

3、混合云存储环境

在基础设施云化的IT环境中,通用云管理平台缺乏管理异构存储平台的能力,要实现存储的虚拟化和自动化管理,要求实现存储与主机的融合,从性能,敏捷度和自动化管理层面,软件定义存储为云环境提供企业的存储创造了可能。

4、大数据集群

如果大数据例如Map-Reduce等集群计算方案解决了计算能力瓶颈,软件定义存储则为数据IO瓶颈开拓了新的疆域,Hadoop等大数据结合SDF相关技术,将大大加速基于持久化大数据的处理、运算和分析。

5、数据库集群环境(例如MySQL)

开源生态下的数据库环境,可以架设在软件定义存储环境之上,并有望通过定制优化数据库代码,实现数据库集群的低成本和高效访问。

6、键值数据的分布式存储业务

对于推荐系统,搜索引擎等来说,分布式键值存储的意义越来越重要,对存储效率也提出了极高的要求。

7、灾难备份/恢复环境

目前部分厂商的软件定义存储产品已经逐渐开始兼容与传统存储的灾备连通,通过创建SDF与传统存储之间的容灾关系实现,借助存储虚拟化工具,可以实现数据级的灾备。同时也可以用来充当数据备份介质,实现数据的快速备份和恢复。

三、软件定义存储赋能业务发展

软件定义存储通过近几年的快速发展,特别是在当前企业数字化转型和云化建设的趋势之下,其使用范围不断扩大,进一步赋能业务发展。以下将以某保险企业实际案例为例,介绍软件定义存储对现有存储架构的优化和提升。

(一)项目背景

保险企业对云对象存储的需求主要来自业务系统和存储运维管理。其中业务系统方面的需求主要包括影像系统后端存储的升级改造、双录系统存储建设。而运维对云对象存储的需求则更倾向于存储安全性、容量和性能扩展性以及存储管理便捷性等方面。

(二)业务需求

在线票据影像场景主要处理小文件,实时性能要求较高,目前以集中式NAS建设为主。票据影像系统压力场景在于处理海量文件归档,性能要求不高但容量增长较快。系统需存储海量非结构化小文件,在线存储成本高,容量有限,备份和恢复效率要求很高。

在业务特性方面,业务主要发生在白天6-8小时,上传和查询比为1:3;平均每交易产生10个文件,文件平均大小100-200KB;要求批量查询耗时小于3秒;上传业务以突发性(有一定周期性)写为主(文件写操作,有一定量的写合并),4K和128K占较大比例;下载业务以持续较随机读为主,IO大小4K-32K。

在功能特性需求方面,需具备WORM、一体化备份、快照及远程复制功能。

(三)解决方案

采用软件定义存储架构方案,对现有数据进行迁移整合,实现了项目预期目标。解决方案的物理架构如下:

360截图16280721588958.png

逻辑架构如下:

360截图16280721588958.png

(四)项目成效

软件定义存储的实施给企业现有的集中式SAN和NAS存储带来了更多的活力,是对传统存储架构的有效补充,增强了企业存储系统应对日益变化的前端业务需求的灵活性。

由于软件定义存储产品普遍采用了商用x86硬件的分布式架构,因此较之于传统集中式的存储解决方案,这种新的平台可以有更灵活的横向在线扩展能力,从而可以轻松应对业务规模、数据量骤增带来的后端存储压力。

另外在软件定义存储平台解决了企业海量非结构化数据存储需求的同时,通过其分布式架构天然具有的容灾特性可以轻松构建跨多站点的灾备方案。

再者,借助软件定义存储对文件多版本的支持以及比传统存储更高的可用性、可靠性和可维护性指标,同时也成为了一个免备份的数据保护平台,从而可以进一步降低企业IT系统的TCO。

结语

随着移动互联网、云计算等技术的应用和部署,海量的数据以前所未有的增长趋势冲击着现有存储技术架构。存储设备技术不仅要应对海量数据带来的容量大幅提升,无缝地进行存储弹性无限扩展,也要适应新兴业务应用部署带来的高存储性能需求。同时,在兼顾性能的情况下,进一步降低单位存储的成本,为企业和用户带来更优质、更低廉的存储产品。软件定义存储技术架构的出现正是顺应技术发展的趋势,旨在解决当前存储技术所面临的挑战。当前,国内外各类存储和软件厂商纷纷推出具有软件定义概念的存储技术,而各大运营商和企业也都积极参与部署与实践,软件定义存储为日后存储技术的发展指明了方向。

原题:软件定义存储架构适用场景及赋能业务促进发展

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论