分布式数据网格:未来云计算的基础?

日期: 2010-08-24 作者:Alan Earls翻译:胡沙 来源:TechTarget中国 英文

云计算吊人胃口的一面正在改变信息技术人士思考问题的方式。有了云计算,不必再建设规模巨大、容量不断增长的数据中心便可能方便地使用处在外部什么地方(即“云”里面)的潜在意义上无穷尽的资源。当然,这些愿景已经开始成为现实,例如亚马逊的EC2和微软 Azure等云服务。然而根据分析师们和其他一些人的看法,至少对数据访问量大的应用而言,如果没有分布式数据网格这一关键性技术的支撑,云的潜能将是有限的。

  分布式数据网格,也称为分布式数据缓存,在数据库和应用程序使用的主存之间工作,提供数据的临时存储,通过改善数据访问和消除瓶颈来提高性能。   分析师Mike Gualtieri和他在Forrester R……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

云计算吊人胃口的一面正在改变信息技术人士思考问题的方式。有了云计算,不必再建设规模巨大、容量不断增长的数据中心便可能方便地使用处在外部什么地方(即“云”里面)的潜在意义上无穷尽的资源。当然,这些愿景已经开始成为现实,例如亚马逊的EC2和微软 Azure等云服务。然而根据分析师们和其他一些人的看法,至少对数据访问量大的应用而言,如果没有分布式数据网格这一关键性技术的支撑,云的潜能将是有限的。

  分布式数据网格,也称为分布式数据缓存,在数据库和应用程序使用的主存之间工作,提供数据的临时存储,通过改善数据访问和消除瓶颈来提高性能。

  分析师Mike Gualtieri和他在Forrester Research的同事John R. Rymer建议了另外的术语叫“弹性缓存”。这个名字表述了某些数据网格的一个特别有用的特征。他们在最近的一份名为《Forrester潮流:弹性缓存平台,2010年2季度》的报告中描述了这项技术和这一领域的某些主要厂商。

  Gualtieri表示重要地是要认识到数据缓存的概念之下包括许多解决方案。描述分布式缓存的最好方式是指出其跨结点工作的特性。Gualtieri称某些分布式缓存为弹性缓存因为它们在运行时能够增加或删除结点。他讲到:“而我们认为这是使数据网格得以脱颖而出的重要和更有描述力的特征。”

  对比之下,若干有影响力的分布式缓存模式是非弹性的,其中之一是广泛应用于Facebook及其他网页应用的开源缓存产品Memcached。Gualtieri解释说:“Memcached是分布式的但不是弹性的,你知道你有足够的数据于是你请求获得8个服务器或80个服务器,但如果到最后你需要多几个或少几个服务器,你不得不把系统关掉,以便能够对服务器数目做调整。”

  Gualtieri注意到,许多人把云计算和系统规模关联在一起。云计算当然允许你调整计算资源需求,但是你不能很容易地在云里改变应用和数据的规模因为应用和数据在架构设计时没有考虑到如何使用“额外的计算能力”。

  同样,考虑一个装满了客户和订单信息的关系数据库,当把它放到云当中的时候,数据库变成你的瓶颈。Gualtieri说:“如果针对这个数据库的操作越来越多,你可以尝试增加五个服务器,但是你怎么来分割数据?没办法。于是弹性缓存真的很有趣,因为它是扩展数据规模的解决方案,对云有巨大的影响。”

  正因为它的弹性,结点可以实时添加;如果开始的时候你有四个服务器,后来又添加了四个,这些平台会把数据相当均衡地分配到各个结点上去,而如果任何一个结点出了问题,系统不会停掉,因为平台复制数据。Gualtieri补充说:“弹性缓存于是提供了容错能力和高可用性,其成本要比重新设计数据库架构的成本小很多。”

  据Gualtieri所述,在实现云可扩展性的探求中也出现了其他几个变种,最著名的是NO SQL运动。他介绍:“初看上去,象是个‘对SQL说不’的企图,但名字的含义实际上是‘不仅仅SQL’。”当然,他也表示传统关系数据库在交易完整性方面棒极了;它们总是提供一致的数据。
 
  对比之下,Gualtieri认为NO SQL这帮人谈论所谓最终一致性的概念。例如,当某人在Twitter 或Facebook上做了更新时,没有必要让互联网上的所有人都在同一瞬间看到那个更新。只要他们最终能看到就行了。他说:“这和(账户中)减去100美元不一样, 你需要个关系数据库做那种事。”

  对所有那些不需要绝对即时或一致性的数据,NO SQL能够提供最终一致性。他表示:“牺牲某些交易完整性,而获取一种不昂贵的手段调整大量非交易数据的规模。”

  从历史上看,Gualtieri 觉得NO SQL出自于亚马逊和电子港湾两家公司管理系统规模的企图。“过去这些年里,这些技术以及其他类似的技术已经一点一点地进入了开源项目,”其中的一个Cassandra一个开源的NO SQL,“与弹性缓存极其类似,数据也是分布在多个结点上,也具有容错能力。”然而他又讲道一般而言,NO SQL的定义和开发都不象弹性缓存那么完善,而且大多数NO SQL产品是开源的。

  下面我们将继续为您介绍《分布式数据网格:弹性缓存产品》《分布式数据网格:数据缓存使用建议》

作者

Alan Earls
Alan Earls

Independent Writer

相关推荐