AWS性能及成本监控没有“万能方”

日期: 2015-03-15 作者:Ofir Nachmani翻译:谈翔 来源:TechTarget中国 英文

云创造了一个复杂的IT环境,所以在监控基础架构,应用性能及成本方面,我们需要十八般兵器,一应俱全。

对于AWS,企业只需为他们使用的部分付费,而这影响了管理员对使用的监控方式。云是个高度动态的环境,因为服务器来来去去,自动扩展改变着环境的构造,以及拓扑结构的不断进化。此外,公有云是由配置管理系统来支持的,这催生了更多的日志和系统事件。

为了能理解这一切,你需要学会掌控AWS监控的功能。云监控工具通常分为以下的三大类:

  • 基础架构和实时监控;
  • 应用性能监控(APM);及
  • 成本分析和监控。

云基础架构和实时监控

自下而上的方式是从底层数据库-计算监控开始,一直到上层的应用监控。

CloudWatch,即AWS的监控层,允许你查看诸如CPU使用,内部的数据传输,磁盘使用和日志这样的指标并可以用来创建警报。管理员可以使用CloudWatch来取得实时数据指标,或者可以使用更传统的监控工具,例如Nagios、Zabbix和Cacti。

使用这些监控工具的挑战在于,找出一个可以根据环境的改变进行自动配置的方法。

比如说,当你在使用Nagios时,环境的每个改动都需要一次重启。而虽然它是个开源工具,它并不是为了支持不断变化的环境而打造的。有些云用户为了支持环境的自动变更,在这些工具的API之上又开发了一个层级。

当云计算的不断变化的环境几乎压垮了Nagios时,Sensu相比之下则显得更为简单,更可扩展。Sensu的配置功能跟Nagios和Zabbix的几乎一模一样,但在实例增加或删除的时候,Sensu的客户端会自动连上Sensu服务器。当新的实例开始运行时,Sensu客户端会自动与相应的Sensu服务器同步。

专用工具类别除了Google最近才收购的Stackdriver之外还包括了如DataDog、Sysdig和BigPanda这样的综合工具。除了聚集信息来表现云环境里发生的事件以外,这些工具也使用综合性的用户界面(UI)来支持快速的修复行动。

使用传统的工具,通常很难判断一个事件或者一个警报是否是真的。当提到这种类型的专有工具,他们事实上提供了更全面的开箱即用的功能,比如一个应用程序拓扑结构的自动显示,正在发生的不同类型的警报之间的关联发现。

使用这些方法降低了“噪音”,让你能够快速的采取必要的措施。同样重要的是要注意这些系统有强壮的API和开箱即用的集成技术支持,这将它们同上述的开源工具区别开来。

应用性能监控

监控应用程序同样很重要。除了基础架构层,CloudWatch还监控如DynamoDB这样的数据库和关系型数据库服务。它还支持自定义监控选项,这样就可以从栈的更高层获得更多的指标。然后你可以监控日志并设置警报来创建动作触发器。

商业工具更广泛的是和APM一起使用。他们能够追踪诸如应用交易这样的指标(比如,处理的交易量和响应次数),并最终对用户体验透明。

当涉及到云的应用管理和监控时,特别是对AWS,传统技术厂商远远落后于像New Relic,AppDynamics和Compuware这样的专业技术公司,根据2014年APM Gartner Magic Quadrant的研究表明。

成本分析和监控

由于云的动态性,AWS的成本监控也发生了演变。AWS的环境是通过一个API构建的,Amazon的应用程序开发者通过其API来扩展使用AWS,使得成本难以控制。比如说,一个小的应用程序bug,就可能让一个月的AWS帐单翻倍—或者甚至变成三倍。

AWS Trusted Advisor,作为亚马逊的支持计划的一部分,提供了你的环境中最近的包括成本,性能和安全方面的变化通知。与此类似的一个工具Ice,是一个由Netflix工程师开发的开源工具。Ice提供给用户一个大的视图可以看到一个环境中有多少资源正在被使用(和被谁用)。它还可以通过使用AWS Programmatic Billing Access来根据用户的帐号,区域,服务等追踪支出,使得预算分配成为可能。另外,AWS成本监控能够帮你找到正确的采购计划,比如有效利用一个适当的预留实例计划。

成本监控不光是监控最近的变更。它还意味着在时间推移的基础上识别趋势和异常状况。这使得成本监控变成主要是大数据的问题,涉及到追踪你的历史来评估当前的状态并作出成本预测。只有这样云计算的消费者才能规划预算,退款,以及成本配置过程。在成本监控这一类别上,除了老牌厂商Cloudyn和Cloudability之外还有新兴的厂商,如CloudCheckr和CloudHealth Technologies的加入。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Ofir Nachmani
Ofir Nachmani

商业技术专家、IamOnDemand.com博主。

相关推荐

  • 思科收购AppDynamics:直指应用管理

    思科技术覆盖着大部分的互联网。思科计划收购性能管理供应商AppDynamics,旨在确保应用程序高效运行。

  • 顶级APM软件大PK

    管理应用性能说起来容易做起来难。在探索很多种方式,研究很多种趋势之后,应用性能管理能够快速地从简单进化到复杂。对于APM软件而言也是如此。

  • 揭秘New Relic APM技术细节

    New Relic应性能管理(APM)套件主要用于Web软件开发。它允许用户在面向服务的架构(SOA)上跟踪关键事务性能,并且支持代码级别的可见性来评估特定代码段和SQL语句对性能的影响

  • 微服务火了 AWS可用性也提升了

    目前,一些大型企业都在AWS的基础之上部署微服务架构。这一举措能够为企业带来什么样的好处呢?