云服务宕机报告揭示故障成本

日期: 2012-06-25 作者:张培颖 来源:TechTarget中国

本月初,亚马逊的云服务宕机时间让很多AWS客户不满,但也正因此,也让云宕机时间导致的损失浮出水面。此次事件之后,名为International Working Group on Cloud Computing Resiliency (IWGCR)的研究工作组发布了第一份有效的全球云计算排名报告。这个工作组是今年三月份由两家巴黎的高等教育机构、巴黎电信学院以及十三所巴黎的大学所组成。

  这份报告的概述让人对云服务十分担忧,因为概述中预计云服务的平均不可用度为每年十小时或者更多,平均可用度预估为99.9%或者更少。报告中声明:这与关键核心系统所要求的可靠性期望值相去甚远,关键核心系统的可靠性期望值为99.999%。业内因为这些失败导致的成本总数每小时超过七千万美元。

  该报告只有两页纸,却涵盖了从2007年到现在为止发生过宕机的十三家厂商。亚马逊、贝宝、Facebook、微软、谷歌、雅虎和推特等都位列其中。

宕机厂商列表

  云服务巨头亚马逊Web Service因为24小时宕机位居第八名,但是这些宕机都发生在2009年。不过,很明显,这份报告中没有包含去年广为人知的AWS宕机事件,尽管报告声明他们追踪的只是新闻稿中发布的宕机事件。本月初AWS的这次宕机由于太接近所以就涵盖在了报告中。⊙﹏⊙b汗

  微软在列表上排名第九,其宕机事件主要是2009年的24小时以及2011年的7小时。根据报告中记录的这些宕机事件,AWS的可用度为99.954%,而微软是99.941%。另外,报告还给出了以前我们所不知的宕机成本,AWS为430万美元,微软是620万美元。

  去年,黑莓制造商RIM发生了72小时宕机,损失达到1440万美元,或者说其可用度为99.86%。

  根据这份报告,我们发现最大的败者是托管提供商OVH。这是一家法国的公司,OVH在2009年的宕机时间长达168小时,今年年初又发生了两个小时的宕机。损失为1700万美元,成为了这个一点也不光荣的榜单的状元。

  此外,报告还罗列的一些厂商,但是都没有提供更加详细的评论。那么我们不禁要问云宕机成本到底取决于什么呢?在报告下面,我们看到一些评论,一位灾难恢复专家读了报告后对工作组的数据源表示怀疑,因为我们刚才也讲到亚马逊去年的重大宕机事件就漏掉了。公平地讲IWGCR的报告确实存在技术缺陷。该组织自己也随后表示其报告未来会更多地关注改善云服务可用性的衡量,以便能提供更加可靠的数据。

  我们抛开数据源和宕机时间计算不谈,仍旧存在很多变量需要改进。比如,宕机发生的时间也可能决定宕机成本,宕机如果发生在周末晚上,其实至少AWS的宕机就有这样的情况,潜在的损失肯定是比那些在工作日峰值运作时间发生宕机要少许多。其实,即便是这份报告的方法论健全,可能不同的客户其宕机成本也是不一样的。就比如说,我们购买了单一的云端虚拟机,类似于在自己的基础架构上安装了一个单一的服务器,然而要是我们需要五个九那种级别的可用性呢,就不能只安装一个虚拟机了。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

张培颖
张培颖

云计算网站编辑

相关推荐