去年4月,华盛顿Big Canvas Inc.公司创始人Satoshi Nakajima殷切邀请新用户使用公司的旗舰产品PhotoShare,用户们可以用它免费互换iPhone照片。然而就在三个月后,Nakajima却向用户们表达了衷心的歉意。
他之所以致歉并不是因为产品出现了问题,也不是客服质量差或者新办企业经常遇到的其他问题,而是因为PhotoShare及其5万用户都沦为了云计算服务问题的受害者。7月20日亚马逊S3云服务因故中断时,PhotoShare服务中断了7个小时。那是PhotoShare服务在2008年遇到的第二次中断故障。
Nakajima每月因为亚马逊云计算服务而向亚马逊支付900美元的费用。为了获得灵活的计算能力和无限的数据存储空间,他向亚马逊申请了Elastic Compute云服务(EC2)和Simple Storage Service(S3)服务。亚马逊声称,服务中断是因为通信服务器性能太差造成的,结果Big Canvas丢失了50名客户的照片文件。Nakajima亲自向每一位用户致电表达了歉意。
Nakajima回忆说:“我们当时对那些客户说:‘你上传的最新照片丢失了,我们对此感到抱歉,请重新提交它们或原谅我们的过失。”
云服务的问责
除了Nakajima之外,其他许多企业家也被迫去收拾云计算服务中断留下的残局。在2月份的时候,谷歌Gmail电子邮件服务中断了好几个小时,大约有1.13亿用户受到了影响。上个月,由于网络流量阻塞,有14%的谷歌Apps用户在使用服务时遇到了问题。
去年7月18日,苹果的在线云服务MobileMe也中断了很长一段时间,结果引起用户们的极度不满。
但是这种混乱事故并未阻止越来越多的企业去使用云服务。市场研究公司IDC预计,到2012年的时候,全球用于云服务的IT开支将增长近2倍,达到420亿美元。 但是随着服务关联性的增长,云计算服务的可靠性问题越来越受世人关注,人们想知道象亚马逊、谷歌和苹果那样的著名厂商是否会承担服务中断的责任。
云服务的利弊
云计算服务得到普遍认可的好处有:
- 配置迅速、简单
- 不用不付费
- 减少内部人员需求,降低成本
云计算服务最大的不足:
- 安全性
- 性能
- 可用性
- 很难与企业内部IT整合
- 不能定制
客户们最想从云计算服务中获得:
- 有竞争力的价格
- 性能保证
- 对公司业务和行业的了解
- 能够将云计算服务中的数据移回本地服务
资料来源:IDC对244名首席信息官和业务经理的调查,2008年9月
IDC在2008年曾对244名首席信息官和业务经理进行过一项调查,结果超过63%的高管将性能和可用性作为云计算服务面临的三大难题中的其中两个难题。有近75%的高管声称他们认为安全是一个很严重的问题。
像Big Canvas那样遇到云计算服务缺陷的小型企业还有很多。虽然新办企业们经常很难受到服务中断故障的影响,但是当亚马逊的云计算服务在2008年2月出现中断故障时,即使是纽约时报也受到了影响。纽约时报用S3服务来保存以及从历史数据库中提取文章。
市场分析公司Info-Tech Research Group的分析师John Sloan说:“关键任务应用服务中断一会儿都可能会造成数百万美元的损失。”
对于目前的云计算服务供应商们来说,由谁来负责保证服务运行以及清理整顿混乱状况是个非常棘手的问题。因为事实上几乎所有的云服务供应商都不能保证服务等级协议(SLA)能够达到99.99%的正常运行时间,或因服务中断故障过多而降低服务费用。供应商们坚持,保证99.99%的正常运行时间的代价是相当巨大的。
Sloan表示:“要想确保99.99%的服务水准,供应商可能会向你收取更多的费用。”他补充说,其他的额外条件可能还会包括你必须与供应商签订多年的服务合同。
在划分职责和追究责任的时候,往往会出现一些咬文嚼字的现象。例如,谷歌的SLA规定了Google Apps SLA不适用于下列性能问题:由超出谷歌所能控制的范围之外的其他因素造成的性能问题。通信服务器故障或DDoS攻击是否应排除在谷歌能够控制的范畴之外一直是律师们争论的话题,小厂商们根本没法承担相关的费用。
云服务的赔偿
制定了完备的服务条款,采取了一切预防措施之后,云计算服务供应商的信誉和记录或许是体现服务可靠性的最佳指标。从好的方面来说,许多供应商可以在及时将服务中断事故通知客户上做得更好一些。例如,谷歌在2月份发布了Google Apps Status Dashboard,用户们可以通过它迅速了解到各种应用服务如Google Gmail、Video和Docs等当前的可用性。 那些应用服务中断时会以红色“X”来标记,处于正常运行状况时则以绿色对勾来标记。
有些厂商甚至愿意因为服务中断故障而向特定客户提供赔偿。例如,谷歌向Google Apps增强版付费用户提供了15天的服务时间,以补偿2008年2月因服务中断给客户们造成的损失。但是用户们收到的补偿是不同的。对于Big Canvas遇到的服务中断故障,Nakajima表示,亚马逊没有对服务中断时的七个小时收费,但是那相当于包月费不到1%的折扣。
他说:“厂商们应该向我们保证99.9%的正常运行时间,如果他们兑现不了那个承诺,它们就应该偿还我们一整月的费用。”
市场研究公司Forrester的分析师Ray Wang认为,指望服务商支付大笔的赔偿那是不可能的。
Wang指出:“现有的所有云服务协议并未涉及对客户进行赔偿的问题。 你可以获得未来服务时间的补偿,但是绝对没办法补偿你的直接损失。”
并不是所有的用户都认为云计算服务供应商的赔偿政策不合理。Peter Sanchez就是最好的例子。他是洛杉矶新办企业SmartJabber.com的创始人,他的公司主要销售自动化客户服务软件,比如为在线零售商提供的虚拟聊天代理软件。自从去年4月创立以来,SmartJabber就一直通过亚马逊的S3服务来保存图像文件、JavaScript文件和网站图像。 但是在去年7月份,S3服务发生了一次严重的中断事故,造成SmartJabber及其客户长达6个小时无法访问那些文件。
Sanchez回忆说:“服务中断的时候,客户的聊天窗和网站图像均不能正常载入,导致网站看起来相当糟糕,许多用户提出了投诉。”
尽管接到了大约15位用户的投诉,但是Sanchez出人意料地承受了严峻的考验,他说他从未考虑过要求亚马逊赔偿他的损失。Sanchez认为,服务包月费用只有35美元,因为偶尔中断而偿付的费用应该很少。如果不用亚马逊的云存储服务,而使用自己公司内部的服务器的话,他每月需要支付的费用几乎要达到500美元。
Sanchez说:“服务条款很长,厂商们并不打算隐藏什么,你要么接受协议,要么去找能够提供更高服务水准的其他厂商。”
他认为,云计算服务并不意味着用户必须交出系统的所有控制权。Sanchez说,在服务中断的时候,SmartJabber可以在几分钟内将保存在S3中的数据下载到它自己的本地存储服务器上。 他说:“这并非最佳解决方案,但是它可以让我们继续运作下去。”
Nakajima也有一个类似的应急计划。如今,作为一项预防措施,Big Canvas的EC2服务器在将用户的照片传输到S3的服务器上之前会临时将那些照片保存在高速缓存之中。
尽管存在一些抱怨,但是内部IT部门仍然会承受较大压力,因为他们必须提供服务水准在当前许多供应商提供的服务之上的内部服务。
Wang表示:“如果你想对比云供应商提供的正常运行时间和公司内部IT团队提供的正常运行时间,你会发现云服务供应商提供的服务水准相对更高一些,因为它们的审查级数更高一些。”
最后,还是由各公司自己决定愿意承受多大的风险,以及是否愿意接受云服务中断造成的损失可能会抵消云计算服务承诺的成本节省和便利方面的优势。
Info-Tech Research的Sloan表示:“如果你的公司能够承受服务偶尔出现的中断事故的话,那么云计算服务还是很可靠的,你刚刚开始创业,你并没有大量投资,你可以碰碰运气。你也许可以因此开展一项业务。”
企业在将业务迁移到云之前,应首先考虑下列5个问题:
- 你的云服务商是如何定义“良好的客户服务”的?服务本身的先进性固然重要,但是你必须弄清楚具体的某个厂商认为哪种服务才是良好的服务,以及服务中都包含了什么,比如赔偿政策、技术援助等等。
- 你对云服务商的有形设施是否满意?尽职调查(due-diligence)的部分内容包括检查厂商的有形设施,注意与厂商大楼维护有关的事务,以及厂商的设备维护计划和大楼中员工的数量等。
- 你应该清楚会出现哪种类型的服务中断事故。有时,厂商不得不关闭部分更新或升级设备,因为那些活动会严重妨碍你的云计算服务。搞清楚厂商计划多长时间进行一次例行检修,以及它会向用户们提供什么样的预先通知。
- 云服务商发展的速度有多快?你必须知道你的厂商是否有能力在不影响服务水准的前提下接受更多的新用户。
- 云服务商准备了那些后续程序?一旦服务出现中断故障,重要的是它能多快地找出问题的根源。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
谷歌云业务CEO描绘谷歌云计划 收购传言四起
行业观察人士猜测,新任谷歌云首席执行官Thomas Kurian将通过大规模收购来获取市场份额,并与竞争对手A […]
-
正确配置资源以减少云安全威胁
我们都知道,亚马逊S3数据泄露事件曾占据头条新闻,但导致该数据泄露的错误配置安全控制并非亚马逊独有的问题。事实 […]
-
Workday公司继续在亚太地区大举投资
随着亚太地区(APAC)地区越来越多的企业转向云计算来拓展其数字业务,Workday公司跻身为全球发展最快的云 […]
-
华为“一云一湖一平台”架构助力客户加速智能化进程
在第十五届华为全球分析师大会上,秉承“智IT,慧未来”的理念,华为IT产品线分享了IT基础设施在数字化转型过程 […]