云服务性能监测和评估指南

日期: 2012-07-24 来源:TechTarget中国 英文

  自从2006年Google首次提出“云计算”的概念以来,国内外各大IT公司纷纷参与进来,各家都依据自己原有的技术和产品推出各自的云计算平台,提供各种云计算服务。按需支付,便捷部署,这六年来,云计算服务已经被越来越多的企业所接受和采纳,而个人消费者也在越来越多地享受着云计算带来的快捷和便利。

  云计算服务对企业或最终消费者带来的最大好处就在于:用户无需花费太多的精力在自己不擅长的基础设施和技术上,从而可以把精力更多第集中到自己核心竞争力的业务和事情上。对于企业来说,采用云服务除了可以使用更好的软硬件基础设施之外,还可以节省时间和资源的使用,降低成本。而对于个人消费者来说,云计算让信息的获取和分享更加安全、更加快捷和便利。

  如何在众多云服务提供商中挑选性价比更高,更适合自己的云服务是每个云服务最终用户所困惑的。作为按使用量支付的服务方式,云服务的价格和支付方式肯定是用户首要考虑的。而对于云服务的使用来说,最终用户更关心的是云服务的安全、可用性以及性能。从IDC的统计报告来看,这三项也是对云服务提供商及其用户最大的挑战。

云服务性能监测和评估指南

  性能和可用性是用户在选择云服务的时候需要考虑的至关重要的因素。由于云服务的特点,云服务提供商们会大量采用虚拟化计算技术,通常会在不同的用户之间共享网络和服务器资源,并且对所有的云服务客户来说,云服务提供商的底层基础设施细节是不可见的,包括CPU,内存,存储和网络拓扑结构等等。由此,对云服务的客户来说,很难准确地在采购云服务之前准确地评估各云服务器厂商的性能和可用性,而在开始使用云服务之后,又很难监控和预测云服务的性能的变化,从而做出相应的部署调整来保证关键业务性能和可用性不受影响。

  企业选用云服务都希望以更低的运维成本来提供更好的服务体验性能。而大多数情况下,云服务用户都必须在成本控制和性能提升之间找到平衡点,这个平衡点只有通过不断地进行云服务的动态优化调整才能达到。在云服务的动态优化过程中,对云服务的周期性长期监测和评估必不可少,如果只是简单地先过度部署,然后凭借直觉来做调整的话,势必会造成成本的巨大浪费。

  但是如何才能更准确地评估各家云服务提供商的服务质量好坏以及性能差异?如何才能在使用云服务的过程中不断地进行优化和调整?针对云服务用户的此类问题,我们提供了基于基调网络分布式监测平台的云服务监测工具。使用基调网络的一系列云服务监测和基准评估系统,我们可以为云服务厂商以及云服务的用户提供客观、准确、公正的第三方云服务厂商性能对比分析报告和咨询。

  我们从多个方面来测试和评估云服务的性能和可用性,并提供优化解决方案。

  一、网络监测

  网络资源是所有云服务的基础,而网络的带宽和延迟很大程度上决定了各项云服务的总体性能和可用性。我们分布在全国各地和世界50多个国家的监测点可以实时地对各云服务提供商的机房和服务器进行网络延迟、丢包率、路由跳数、TCP建连以及网络带宽等等多种网络监测,帮助用户即时了解云服务网络的健康程度。根据云服务的类型和其服务的用户群,我们通常会建议用户选择那些到用户自己的机房以及用户自己潜在的客户或最终用户的访问终端都有比较高的带宽和低延时、低丢包率的云服务提供商。例如,如果你只有一个单线机房在中国联通,由于目前国内跨运营商网络链路所带来的高延迟,通常情况下需要选择那些同样提供了联通线路的云服务提供商。

  二、服务监测

  除了网络资源的性能之外,提供云计算服务的服务器以及其上应用的性能也是直接影响云服务质量的重要因素。通过我们分布在各地骨干机房的监测节点定期对各个云服务厂商的服务器和应用进行性能探测,测试服务器和应用的响应性能。对不同的云服务应用,需要进行不同的相应性能监测。例如对于CDN服务,需要关注其首包响应时间和缓冲命中率,而对于云存储服务,则需要对数据的上传(保存)和下载(读取)进行相应的测试。

  三、高可用性监测

  云服务的可用性也是云服务品质的一个重要组成部分。根据和用户签订的SLA条款,云服务厂商通常需要为用户提供具有非常高可用性服务系统。但各家云服务厂商能否真正达到其声称的SLA标准,是否可以做到对故障的透明切换来降低服务宕机时间从而提供真正的高可用。由于服务故障的发生通常会是非常短暂的,并且和时间段密切相关(例如:访问高峰期更容易出现服务故障),因此对云服务高可用性的准确评估要求以非常高的测试频度来做长期的实时的监测,力求覆盖到各种类型的时间段,并能够记录长期的可用性数据以供用户参考。如果服务宕机对你的业务是绝对不可接受的,那么在选择云服务上的时候,就需要重点考察各云服务提供商各项云服务的长期的可用性指标了。

  四、资源定位监测

  无论是对采用云服务的企业还是这些企业的最终用户来说,在大部分情况下,访问云服务时所处的地理位置和网络位置都会对云服务的性能和效果产生影响。这也是大部分云服务特别是CDN服务需要考虑的问题:把资源放到离用户更近的地方,即云服务的资源定位和分配。一个好的分配和定位策略将让用户更快捷地访问到需要的资源和服务,而一旦分配策略出问题,就可能导致额外的网络延迟,导致整个服务质量的下降。从分布在不同地理位置、不同运营商以及不同接入方式的监测点上对云服务进行探测访问,可以迅速了解各云服务厂商的资源定位策略是否正确有效。例如:是否存在严重的跨运营商资源访问,或者跨地域的资源访问。

  五、云服务实时监测和优化

  用户采购了云服务之后,特别是同时采购了多家云服务提供商的服务之后,更需要对使用的云服务进行不间断的实时监测,来优化对云服务资源的使用率,降低成本,提高投入产出比。使用我们部署在各地数据中心和终端用户的监测节点,可以对各类云资源包括服务器、网络、存储、数据库、应用进行实时的探测。通过对各类云资源不间断的监测,我们除了可以定期给出对云服务的优化报告和建议之外,更可以做到随时对云服务进行在线重新优化部署,以提高对云资源的利用率,改善应用性能和用户体验。例如,通过监测发现CDN厂商A在某地区的用户访问效果没有厂商B好,就可以及时地对部署策略进行调整,让该地区的用户访问厂商B提供的资源。

  除了企业云服务,面向个人用户的云服务也日益普及,近年来,国内涌现了许多家提供个人云存储(网盘)服务的网站。对于最终用户,在使用云存储的时候除了关心其容量之外,更关心的是这些云存储的可用性和下载速度。就在今年6月份,我们对国内7个比较流行的网盘进行评测。

  国内外个人云存储(网盘)服务评测

  被评测网盘:

  微盘,云诺,115网盘,华为网盘DBank,盛大网盘EverBox,酷盘,金山快盘

  评测方法:

  此次对网盘的评测主要对其下载速度和服务的可用性等进行评估。我们分别在这8家网盘上预先上传了一个2MB的测试文件,然后通过基调网络分布在全国的监测节点对各家网盘上的这个测试文件进行下载测试。

  评测范围:

  此次评测我们选择了国内47个城市的最终用户监测节点来做测试,这些城市包括了全国各省会城市以及部分网民活跃的城市。这些监测节点覆盖了国内主要的4个网络运营商:中国电信,中国联通,中国移动和中国教育科研网。测试的时间从6月8日开始到6月15日为期一周,每天进行24小时不间断的下载测试。

  评测样本:

  此次评测对每家网盘分别在7天时间内采样了1万5千多个测试样本点,覆盖了工作日和周末每天24小时的各个时间段。

  样本处理:

  由于网络下载测试的样本的长拖尾特性,我们对样本进行了数据过滤处理,舍弃了下载时间最长性能最差的5%的样本点。以便使得对样本进行算术平均值计算时更接近实际的性能。

  评测项目:

  对每家网盘进行的文件下载测试中,我们采集了各类性能指标,本次评测我们将着重评测以下的指标项。

  下载时间:成功下载完成2MB的测试文件的平均下载时间。平均的下载时间越短说明该网盘的性能越好。

  下载成功率:成功下载测试文件样本数占总样本数的百分比。下载成功率同时反映了网盘服务的性能和服务可用性。

  服务可用性:总样本数中扣除由于网盘服务器发生故障导致服务不可用的样本点后与总样本点数的百分比。服务可用性网盘服 务无故障提供服务的能力。

  稳定性:下载时间有效样本的标准差。该性能指标反映了各网盘服务的稳定程度。越小的值说明个样本越接近平均值,表明服务的稳定性越好。

  TCP建连时间:在下载测试过程中监测节点与网盘服务器建立TCP连接所需要的时间。该指标反映了各网盘服务器的网络延迟。

  节点部署:各网盘服务的机房/服务器部署情况的统计,包括在多少个城市,多少个运营商进行了服务器的部署以及服务器IP段(C段)的数量。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

相关推荐