2014让人防不胜防的云宕机:Azure为何如此不靠谱

日期: 2015-01-28 作者:Beth PariseauTrevor Jones翻译:谈翔 来源:TechTarget中国 英文

没有什么可以万无一失

级联错误会发生,而当公有云供应商碰上大断电时,基本上都是因为人为错误,而不是硬件基础架构故障,一家位于康涅狄格州Stamford的Gartner公司的分析师Jonah Kowall说道。

“虽然他们用了所有最佳的办法来避免这些问题,但在一个不断变化的复杂系统里, [断电] 就是会发生的,”Kowall说道。企业通常来说总是反应慢了些,因为他们难免会过度设计他们的基础架构和流程,Kowall说道。云带来了一种有点像“第22条军规”那样的自相矛盾的状况,因为云的吸引人之处在于速度和敏捷性,但较短且没经过仔细审查的更新周期会带着错误,从而为顾客制造出问题,他补充道。

定期重启通常是计算停机的原因,这也暗示了一个管理不良的基础架构,Read说道。

“厂商总会有断电的时候,”Read说道。“而好的厂商会完整的调查,找出根本原因是什么,通过改变策略或软件来保证这种同样的事件不会再度发生。”

而从这些错误中学习往往会有助于跨平台,根据Paul Voccio,Rackspace Hosting的软件开发副总裁表示。

“随着这个产业的不断成熟,每个人都在互相学习要如何规模化的运营他们的服务器,并且以可提供支持的方式,”Voccio说道。

在Rackspace位于圣安东尼奥的总部,Voccio在他桌前有着两面巨大的屏幕来监测公司公有云的数据。而当其他云的新兴领域受到更多关注时,几乎没有什么能和保持运行时间在公司内部所受到的关注一样。

“顾客们是真心期待我们能够时时刻刻保持运行的状态的,”Voccio说道。“而我们也对此非常重视。”

Rackspace,声称从2009年开始就保持着在所有数据中心都有99.999%的运行时间,他们每周都举行会议来讨论系统性能并确保定期的维护不会产生冲突。这家公司非常重视他们数据中心的弹性和冗余性,并了解到隔离集群对于快速诊断问题和确保问题不会影响到其他的数据中心来说是非常关键的,Voccio说道。

Rackspace的计算云在过去一年全部区域的断电时间为7.52小时,据CloudHarmony表示。这家公司成为了焦点,当他们遇到一个Xen 虚拟机程序的bug而不得不重启的时候,外界对于他们处理该事件的方式给与了批评。

很难告诉客户我们遇上了一个必须解决的问题,但客服不能和他们说,因为公司禁止谈论,Voccio说道。

Rackspace常常拿他们所谓的狂热技术支持来做为其品牌特点,但Voccio提到,他跟同事们说,如果顾客在不用寻求技术支持的帮助前就得到他们想要的,那不是更好吗。

“虽然,是的,我们总是很乐意为大家服务,但大部分客户都希望他们永远不需要打这个电话,”Voccio说道。

透明度仍然是障碍

供应商们确实在他们的网站上提供了几周的运行信息,但是TechTarget联系到的厂商没有一家提供年同比的数据。

厂商们对于公开信息持犹疑的态度,有些连提到何时系统有小错误或者部分断电发生也不肯,Read说道。而状态页面的可靠性也可能有问题,加上如果供应商们托管他们自己的网站,一次断电将会清空供客户查看的监控仪表板。

“我们看到的部分问题是,许多著名的企业云提供商限制了你能够验证他们是否正常工作的能力,对于SaaS来说,尤其如此,”Kowall说道。

大多数人试图通过软件从世界各地每隔几分钟登录,进行几个操作来模拟用户,以确保功能正常,但厂商们不喜欢这样,因为这会增加系统额外的负担,Kowall说。厂商试图通过合约来限制这种行为,而更有可能的是,他们不希望人们让他们为稳定性负责,这就是问题所在,他补充说。

“你必须同他们协商,在他们系统内你的哪些行为是允许的,”Kowall说道。

厂商们应该要做得更多来增加云的透明度,这样顾客才知道系统里发生了什么,Rackspace的Voccio说道。

“客户想要了解更深层的信息,”Voccio说道。“这会让厂商更加犹豫,所以我们正在研究方法为整个系统提供更高的透明度。”

Google拒绝接受采访,但是发表了一个声明,称公司致力于让Google云平台可靠。

微软的发言人拒绝对此报告发表评论。

1 | 2

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Beth Pariseau
Beth Pariseau

Trevor Jones
Trevor Jones

SearchCloudComputing.com的新闻作者,2014年加入TechTarget。

相关推荐