在一大三小:亚马逊,微软、谷歌、IBM ,IaaS四强争霸中,我们有报道过IaaS领域的硝烟弥漫,而Amazon在市场占有率上有着压倒性的优势——租用的计算资源是象限中其它14个供应商的5倍,IaaS霸主地位毋庸置疑。然而,区别于其IaaS的绝对优势,AWS在PaaS领域的日子似乎“没那么好过”,其领先地位受GCE、Azure、Heroku等众多劲敌窥伺。然而AWS之所以为AWS,不仅因为其数量庞大的合作伙伴,还有其独一无二的云服务,就在上月,Amazon一扫之前在PaaS领域的低调,在宣布EMR支持Impala之后,更推出了流计算服务Kinesis。
EMR支持Impala:AWS军团亮剑流计算之始
本月,Amazon宣布EMR支持Impala,Impala是专为实时、ad-hoc查询设计的开源工具,使用类SQL语言。在AmazonEMR上使用Impala,用户可以在非结构数据上执行快速的交互分析。对于许多类型的查询,比Hive快很多。Impala的性能使它成为迭代查询和许多流行BI工具一个很好的引擎。通过Amazon EMR,用户可以用Impala作一个可靠的数据仓库来执行数据分析、监控和商务智能等任务。这里是三个用例:
•取代Hive,在长期运行的集群上使用Impala来执行ad-hoc查询。Impala可以将迭代查询时间减少至秒级,使它非常适合做快速调研。用户可以在同一个集群上进行流计算和批处理,在一个长期运行的Hive和Pig分析集群上使用Impala,或者为Impala查询建立一个经过专门调优的集群。
•在短暂的Amazon EMR集群上使用Impala而不是Hive来进行批ETL作业。对于很多查询来说,Impala比Hive快,就像Hive,Impala使用SQL,所以,从Hive到Impala查询修改工作量并不大。
•结合使用Impala和第三方商业智能工具。通过给集群连一个客户端ODBC或者JDBC驱动,你可以将Impala作为强大可视化工具及监视面板的查询引擎。
Kinesis的全面可用:AWS之所以为AWS的原因
Kinesis,AWS于11月宣布的流数据服务,现已公开使用。这种服务理论上可以与流行的开源技术(比如Apache Strom)相匹敌,而当下也只有Kinesis能带来完全的管理经验,这种经验成为AWS的进程中的标准。
随着公司(尤其是基于因特网的公司)寻求超越他们倚仗已久的批处理方式,流处理正变得越来越流行。流处理主要利用数据的实时优势,而不是等待几分钟,甚至是数小时来分析收集所有(前一批正在处理之后)的数据,对这项工作而言Storm可能是最流行的工具,在发往其它地方(比如Hadoop)与历史数据进行分析之前,Storm就会在数据传输过程中进行处理。
Twitter通过2011年购买Backtype获得Strom建立者Nathan Marz,因此它应该是个典型的Storm用户。Storm帮助Twitter完成许多事情,比如让用户Timeline保持实时更新,但是该公司同样依靠了许多其他工具(Hadoop,当然名列其中)来做一些长期趋势分析和搜索引擎模型训练。
就像Storm,在将数据运输到另一个数据存储(基于AWS平台的ElasticMapReduce、Redshift或者DynamoDB)之前,Kinesis就能够进行实时处理。但是区别于Storm,Kinesis保存数据的时间可以长达24小时,同时,通过软件开发工作包或者SDK可以自动地扩展到每小时上千个TB 。Kinesis还含一个转移数据到Storm的连接器,AWS数据科学经理Matt Wood解释到,在当现存Storm用户想继续使用它来处理数据时,Kinesis可以实现自动连接。
对Kinesis来说SDK是一项关键,因为这项服务的设计宗旨就是“降低建立响应式应用程序的门槛”,AWS在一次采访中说到。早期访问用户,包括移动游戏开发商Supercell,正在使用Kinesis对游戏服务器和市场平台Bizo中的数据流进行处理,然后供给实时监控面板。 Wood说Bizo有一个异常小的研发团队,能有机会省却管理数据管道的工时,从而转移到更具价值的任务上,这得感谢AWS。
当Amazon首次公开Knesis这个产品时,我们就会发现,AWS的云服务无可比拟,这里我们不妨计算一下其他云供应商提供自己流处理服务的时间。当下企业的计算基础设施一般都包括一个完整的数据管道,用以收集和处理数据,因此如果其他云服务供应商想遏制用于疯狂涌向AWS,那么他们不可以只有一个Hadoop。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
AWS+EasyStack:混合云大战又升级
据IDC数据显示,73%的企业云用户会采用混合云战略,因为从成本优化和安全性/合规性角度来看,混合云因为兼具公有云的灵活性与私有云的安全性而日益受到企业用户的欢迎。
-
亚马逊AWS的真正对手不是谷歌和微软而是阿里!
高盛指出,阿里巴巴的云计算服务,即阿里云,到2019年营收将达到50亿美元,届时估值将达到420亿美元,而AWS届时的估值将为1780亿美元。阿里云为何会直击AWS?
-
超越托管基础架构拓展IaaS
没有什么能像公有云这样对IT规划和运营产生如此大的影响。许多企业已经采用了公有云,几乎每家企业都希望在未来可以更多地使用。
-
SAP拥抱云:满足用户对AWS和Azure的“饥渴”
SAP在Azure和AWS上的HANA云认证拓展了该软件巨头的市场范畴,并为企业提供了另一种将海量数据迁移到这两个云平台的方式。