Amazon对近期故障的处理受到用户认可

日期: 2010-04-15 作者:Carl Brooks翻译:滕晓龙 来源:TechTarget中国 英文

近日,Amazon网络服务器(AWS)改进了其对问题的响应方式,用户对此反响非常积极。今年的愚人节对Amazon来说的确是糟糕的一天, AWS所在的North Virginia数据中心发生故障,中断服务长达3小时。   在清晨时分,AWS的应用程序访问接口(API)出现了长达三个小时的中断,此次故障使用户无法与AWS通讯,最终导致AWS服务失控。对此,AWS发布了一个坦诚且详细的解释,其中包括在最初诊断问题时公司所犯的错误,该举动得到了广大用户的欢迎。

  AWS博客表示“虽然我们的部署保障本可以完全避免这个问题,但我们的团队花费了太长的时间来寻找根本原因,并予以恢复。该问题对于我们的技术团队……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

近日,Amazon网络服务器(AWS)改进了其对问题的响应方式,用户对此反响非常积极。今年的愚人节对Amazon来说的确是糟糕的一天, AWS所在的North Virginia数据中心发生故障,中断服务长达3小时。

  在清晨时分,AWS的应用程序访问接口(API)出现了长达三个小时的中断,此次故障使用户无法与AWS通讯,最终导致AWS服务失控。对此,AWS发布了一个坦诚且详细的解释,其中包括在最初诊断问题时公司所犯的错误,该举动得到了广大用户的欢迎。

  AWS博客表示“虽然我们的部署保障本可以完全避免这个问题,但我们的团队花费了太长的时间来寻找根本原因,并予以恢复。该问题对于我们的技术团队本应是极其容易理解并解决的。”AWS状态监控网站解释了问题的根源:一次对AmazonE C2服务控制层的软件升级后,并未完全测试便投入了使用,随即造成了问题的产生。

  Amazon声称故障期间运行的虚拟机不会受到影响,但是用户在故障期间无法控制他们的环境,并且无法开启或关闭服务器。Amazon对其虚拟机的快速扩展性和弹性极为推崇,众多以网络为中心的企业寄希望于该功能,并使用此功能缓解网络传输中的高峰。

  Amason的故障后果

  总体来看,三小时的故障并没有给AWS用户的业务造成太多影响。但是与过去对服务问题保持沉默相比,用户求助于Amazon的反应却有了喜人的变化。专门研究AWS的开发工程师、咨询顾问Mitch Garnaat要求公司对该问题进行处理。
  
  “系统响应引起了我的注意。”他在电子邮件中说到。

  Garnaat表示他希望在解决故障以后,Amason能提供定期的更新和提示,并做出详细的事后检查,并提供一个关于如何避免出现类似故障的信息。

  Garnaat说,Amazon做零售商起家,后来才转变为IT服务供应商,这导致其沟通模式出现问题。如同所有的零售商一样,Amazon有理由拒绝透露商业信息,并保护客户数据,如信用卡详细信息。在零售业界,消费者并不希望了解其运作过程,他们只希望设施能正常工作。

  “对零售商来说,这类信息只对竞争者有用,那还有什么必要去了解它呢?”他说。

  Garnaat认为,零售商的出发点和传统IT供应商完全不同,对于后者而言,即越高的透明度可以带来越好的效果。“AWS有一群需求不同的客户,我认为AWS正试图努力做出高效的反应。”他补充到。

  “这就是我报道此次事件想要达到的目的。”Protected Industries机构创始人John Kinsella补充到。他需要尽可能多地搜集此次故障的信息,因为AWS不工作时,它同样处于舆论的焦点。了解的越多,他也就能够越好地应对气愤的用户。

  “隐瞒信息很容易——那会造成供应商无法提供足够的信息,而人们会纷纷揣测问题从何而来。”他说。上周Kinsella经历了Terremark公司vCloud Express服务(Beta测试版)的一次故障,那次故障却给他造成了严重的影响。

  Kinsella介绍说,他经常使用EC2和AWS服务,并未受到故障的影响。

相关推荐