雷暴袭击导致多家大厂数据中心瘫痪!

据媒体消息,除了服务全部离线外,这次事故还导致部分硬件被烧毁。此次事故持续将近24小时才陆续恢复,其中由于硬件损坏,部分客户的数据无法转移只能通过恢复手段进行复原。

本文来自中国IDC圈。

8月30日晚,悉尼数据中心遭遇了一场雷暴袭击,导致甲骨文云、NetSuite和微软Azure等主要云服务提供商中断服务。

据报道,短短三个小时内,该市就记录了约22,000次雷击,约30,000人因风暴而断电。

Oracle当时向客户发送了电子邮件通知他们停电情况,并告知停电时间为当地时间上午10:15。

同样,Microsoft也联系了其客户,告诉他们Azure云遇到了问题。微软表示,停电发生的时间甚至更早,即当地时间上午8:30左右,并表示该问题是由澳大利亚东部地区的“公用事业电力激增”引起的。供电原因导致数据中心的一些冷却装置关闭,从而导致微软“主动关闭”部分计算和存储装置以避免损坏。

甲骨文旗下的NetSuite也受到了此次中断的影响。该公司在其状态页面上表示,最初的原因是极端天气。“雷暴影响了悉尼数据中心的冷水机组,大多数系统被暂时关闭以降低温度。温度已经稳定,系统正在系统地启动。”受停电影响的客户包括昆士兰银行(BOQ)和捷星航空。

BOQ的应用程序存在问题,交易未正确反映在客户帐户中。悉尼时间8月31日下午2点45分,该银行的服务已恢复。同样,捷星航空发现客户无法登录、管理预订或办理航班登机手续。

根据Oracle系统状态,许多服务现已恢复并完全运行,而其他服务仍在恢复过程中。仍然受到标记的是“Oracle云基础设施数据流”,该公司表示存在“服务中断”。微软Azure的最新更新称,约99%的存储服务和受影响的虚拟机已恢复。

据媒体消息,除了服务全部离线外,这次事故还导致部分硬件被烧毁。此次事故持续将近24小时才陆续恢复,其中由于硬件损坏,部分客户的数据无法转移只能通过恢复手段进行复原。

据了解,在悉尼还有其他几家主要数据中心提供商,包括Digital Realty、Equinix、Global Switch、Macquarie Data Centers、Vocus、NextDC、NTT、Keppel、Datacom和DCI。目前尚不清楚哪个数据中心遭受了停电。

微软在事后分析报告中承认,由于数据中心规模较大,当晚只有三名工作人员无法及时处理紧急情况。微软表示已经暂时将团队规模从三人增加到七人,直到找到更好的解决方案。此外,微软还表示正在改进现有的自动化系统,以提高数据中心在发生类似事件时的恢复能力。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论