用云存储进行归档:改善数据保护能力

Tech Target
Tech Target
即便托管服务供应商定期备份数据并且频繁地循环离线存储数据,IT部门也并非完全没有风险。托管企业通常只有有限的备份软件和磁带技术。这意味着其备份形式(硬件、软件或者两者兼备)可能和你的IT系统并不兼容。
  当归档工作意味着把磁带上的数据转移至远程设施中供长期保存时,这项技术已与其早期形式之间产生了巨大的变化。如今的归档技术,既可以如同自动归档电子邮件信息一样轻松,又可以如同在一个外场存储站点中放置传统物理存储磁带一样负担沉重。
 
  其中,云归档是一个特别具有吸引力的选择,因为这项技术提供了可访问功能和数据保护功能,而其成本仅为构建一个现场归档基础设施的一小部分。我们将讨论评估基于云计算技术归档时需考虑的关键因素,其中包括:价格与性能、云计算归档的优缺点、服务等级、可访问性、灾难恢复选项、合规性等等。
 
  虽然“归档”一词意味着数据将被存储很长一段时间,但是其具体的时限却是随行业不同而各有差异。例如,大多数的财务数据要求的归档时间为七年,药品研究数据则要求二十年,而那些医疗记录和核记录数据则必须保存长达五十年之久。一般来说,在磁盘上保存数据长达十年甚至更长时间的的成本是非常昂贵的。同样,我们也很难预测哪一种归档技术将存在十年之久,因此,本文中用于云归档的“长时间”一词是指一年至七年的时间。
 
 
  价格与性能
 
  云归档恰恰实现了成本与可访问性之间一个“恰到好处”的平衡。存储磁带一直以来都是,甚至仍将是长时间存储数据方法中成本最低的一种。一个典型的LTO存储磁带存储数据的成本约为35美元/TB每月。即使是最便宜的云计算存储也无法在这个价格方面体现其竞争优势。而其不利的一面在于,存储磁带归档的正常检索时间为次日交付加上安装和恢复所需的时间。这就意味着用户在能够访问所要求信息之前必须等待不少于一个工作日。
 
  归档与备份
 
  虽然众多IT公司仍然考虑采用他们传统的备份磁带进行“归档”工作,但也有一些具有不同于归档、用于数据备份的特殊用例和访问需求。执行备份可保护目前正在被使用的数据;如果必须把数据从备份中恢复出来,那么该操作必然发生在完成备份工作之后不久。一般来说,备份数据的保存时间相对较短。
 
  归档数据是一组出于合规性、公司管理或知识产权等目的而将被保存相对较长一段时间的数据集合。归档数据可被不定期访问,但具有较高的易搜索性,因此可相对较快和较容易地恢复特定数据。
 
  存储网络行业协会为云备份和云归档服务的区别给出了一个定义:“对于云计算备份来说,云计算是一种备份数据的简单存储,而对于云计算归档和存储来说,云计算是执行具体操作的所在,以便于确保数据的长期存储、保存以及存在。”
 
  另一方面,云存储的价格为10美分/GB美元及以上(根据容量不同而不同)。当涉及数以百计TB时其成本就相当可观了,但是它往往仍然要比在一个中央数据中心中采购、部署和管理阵列低。而存储磁带的检索时间要以工作日为单位,而访问在基于云计算技术存储中托管的数据,其单位则是以秒来计算的。对于某些应用程序,这可能是价格与性能之间最为理想的平衡点。
 
  云归档的优缺点
 
  但是在真正实施云归档之前,IT人员需要权衡云归档和内部归档两者各自的优点。从技术角度讲,云服务商无法实现那些在内部也无法部署的系统。例如,一家公司可能会选择一个具有三层高容量SATA磁盘的层存储基础设施来实现一个更低的平均成本(每GB)。通常情况下,如果组织无法承受与远程场所连接中断的风险,那么他们往往会倾向于实施一个内部实现的解决方案,这个解决方案有监管要求,要求具备严格的数据安全监督或数据检索需求,而其中是无法接受远程延迟的。这是一个相当严格的列表,但是仍然还有众多的应用程序适用基于云计算技术的归档。
 
  即便IT组织可以把迁移至云计算的物流工作量进行量化,但是他们却不应忽视这样一个可预测而不可预见的调整:从以技术为中心的角度到一个服务等级管理角度的心态转变。之前已习惯于进行技术决策和部署的IT人员们需要更深入地了解云计算供应商的架构和“建议”产品或特定技术的实施。当供应商完全承担管理云计算基础设施的全部责任时,很少有这样保证的请求。如果合同中规定的服务等级已得到满足,那么IT部门确实不应该关心底层技术。随着经验的进一步积累,工作人员的注意力应逐渐从底层细节转移至高层次的管理。
 
 
  服务是关键要素
 
  因此,服务水平管理是是否使用云归档还是原本也运营模式的关键要素。在从云归档供应商采购服务时,你需要考虑以下服务水平方面的问题:
 
  在线时间。对于绝大多数应用,3个9或4个9的可用性就已足够应对业务所需。假如你需要5个9的高可用性,这种数据访问性的要求可能无法使用在归档层上。存储在归档层上的数据通常会定义为非关键性的。关于在线时间的要求在很大程度上决定了供应商应当具备多少基础架构,因此这会对托管的成本造成重大影响。毋庸置疑的是,需要明确数据存取的实际时间、访问模式以及宕机所会造成的损失。这些计算结论可以和各种保障系统在线所需的成本进行比较,基于这种比较可以很容易地调整或拒绝是否采用云环境。供应商通常在无法满足服务水平协议(SLA)时退回托管费用的部分款项或给予其它形式的补偿。但是,相关附加说明常以小字形式显示,所以请仔细找到并认真阅读。
 
  可访问性。可访问性和正常工作时间并不一定相同。存储可能是忙碌的,但是子组件会导致一个应用程序无法使用。例如,如果你需要实现数据链接的冗余或多个冗余,那么你必须为它们支付额外费用,但是不这么做可能带来的后果就是无法接受的应用程序中断。请确定服务等级能够确保数据的可用性。
 
  性能。量化你的应用所需的IOPS并且将其纳入到SLA之中。IOPS可以通过平均或者峰值活动状态加以测算。假如你要求峰值时刻的IOPS保障,你可能要为此支付给供应商更多的费用。有些供应商可能会提供计量计费,但是很多企业组织并不希望采用这种方式,因为其中存在着潜在的不确定性。绝大多数企业可以接受一定数量上的约束操作(尤其是针对归档层的存储)以获取成本优势。在这种情况下,SLA只保证一定的IOPS而非最终用户的性能体验。假如应用要求超过了合约规定的IOPS量,这就绝对是企业IT部门的问题了;当然可以通过购买额外IOPS的方式来满足。
 
  数据恢复。正如他们为内部应用程序所做的那样,IT组织需要为云计算归档指定恢复点对象(RPO)和恢复时间对象要求。这关系到正常运行时间,而且还覆盖诸如数据损坏这样的意外事故或不影响整体正常运行时间但有些个别应用程序的组件故障。供应商一般都有默认的RPO和RTO,对于归档层而来一般都是足够的。此外,毋庸置疑的是,需要明确业务单元所能容忍的各类的数据丢失或应用故障。在很多时候,这会比你认为的要长。
 
  灾难恢复(DR)。如果云归档是用于离线复制存储来满足数据冗余的要求,你可以不考虑该层灾难恢复的策略。不过用户仍然需要注意:绝大多数的托管存储并不包含任何灾难恢复事故的防护。如果托管数据属于混合云存储中的活动数据,灾难恢复规划是完全必要的。托管服务供应商可能定期备份所有数据,不过他们通常不会循环备份离线站点中的数据,即便做的话也是以很少的频率(比如每月一次)。虽然在数据中心中做到SAS-70合规中的灾难恢复非常困难,但也绝非不可能的事。托管企业提供的灾难恢复通常要显著地增加额外的成本,并且会快速改变托管业务的经济情况。请确保数据不会遗留在具有风险的地方。
 
  备份和恢复。即便托管服务供应商定期备份数据并且频繁地循环离线存储数据,IT部门也并非完全没有风险。托管企业通常只有有限的备份软件和磁带技术。这意味着其备份形式(硬件、软件或者两者兼备)可能和你的IT系统并不兼容。假设IT部门尝试从供应商的磁带中进行恢复,可能由于没有足够的基础架构支持而造成严重的延误。请考虑好在最坏的情况下的解决方案。
 
  合规性。要求特殊合规性对待的归档数据可能仍然是云计算托管应用的一个理想对象。如果有必要的话,你将需要确定数据是否保存在永久存储介质上。你可能还需要确保,遵循和审计严格的访问指引;SAS-70供应商就已具备了这样的程序。
 
  固定成本和可变成本。归档较之于使用自有的基础架构,其核心收益之一就是你只需支付你使用的存储。这一指标会受你使用的多少的影响,但其也有最小的固定成本。
 
 
  从磁带转向云归档
 
  很显然,对于拥有大量存储在相对昂贵内部基础设施中历史数据的公司来说,基于云计算技术的归档是具有相当吸引力的。更多的质疑在于,将基于存储磁带的归档转变为云计算归档是否真的有意义。大型企业可能通过数以百计的离线磁带实现归档操作。将所有这些磁带取出,读取数据并迁移到云归档基础架构的工作让人望而却步。这里还有一个前提,供应商需拥有必要的硬件以读取所有的存储磁带,而其中部分的数据格式可能已经过时。此外,没有哪家云供应商可以在托管这样庞大的数据的同时,接受和大型磁带库相同的成本。磁盘压缩和数据重复删除技术可能会非常有用,不过成本上的差异仍然是一个问题。
 
  即使从存储磁带归档到云计算归档的转变难度极大,云归档仍不失为一种可以考虑的方式。超过7年以上的磁带在保存上代价高昂,并且可能有各种问题。最佳实践显示,企业需要在每五年读取并重新写入磁带,来确保格式准确以及数据可以被读取,而这是一项不容小觑的任务。例如,如果一个公司拥有10,000个磁带归档,更新周期为五年,那么它就必须每年更新2000个磁带。也就是说,每个工作日更新近7个磁带,这虽然可行,但这属于年复一年而又不会带来生产效益的工作。此外,问题的关键在于检索的概率。一些企业考虑到恢复操作可能非常麻烦,允许磁带被废弃,但是需要修复的概率已低至可承受由其产生的风险本身。另一方面,如果你知道恢复是不可避免的,现在就可以考虑选择时间,预留经费来从磁带迁移到云端,这可以在以后节省下大量的时间和精力,甚至应对一些突发情况。
 
  当然,并不是说存储磁带已在归档应用中失去其地位和意义,在绝大多数情况下,它依然是最低成本的解决方案。此外,LTO线性磁带文件系统可使磁带在四层存储中承担新的角色,在云(或者数据中心)中作为额外的一层提供给存储的0、1、2、3层。在云归档环境中,这可以有效地生成混合云并为少量数据提供相对高速的访问(分钟级),但其成本却和磁带类似。磁带也会有内置的压缩技术,并支持加密和一次写入多次读出(WORM)。使用自动化的分层软件,数据可以自动化地迁移至归档层。
 
  考虑到不可避免的意外事件
 
  到目前为止,我们已描绘了云计算归档服务的一个相当正面积极的轮廓。通常,只需努力就能够实现预期的效果,但事实并不总是如此。组织应当考虑到,他们把数十TB的数据迁移至供应商所带来的可能后果,因为有可能会发生不希望发生的事件或合同违约事件。当然,赔偿可能有所心理安慰,但是小额的经济赔偿完全不能弥补对企业组织的交付声誉所带来的实际成本、恶化或损害。一旦发生意外事故,如果无法满足特定的性能等级,合同可能就会终止且无任何赔偿。因此规划中还应当包含备选的托管功能,无论是内部的备用系统或者另一家供应商。云归档并不属于高风险的方案,不过聪明的企业凡事都会准备在前。
THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论