既定的供应商和初创企业都带头使用先进技术管理PB级数据,这些如雨后春笋般从社会计算和数据分析应用中涌现的数据,俗称大数据。企业IT管理最麻烦的就是学习分类地渗透一个成长的云数据存储。 为你的大数据选择最合适的基础设施并不是件简单的事情。 目前,从根本上来说,NoSQL被应用在开源通往高可用性、可扩展性和持久耐用的数据库,这个数据库不会牵扯到传统的关系模式和SQL。
NoSQL的基要派,例如Heroku’s Adam Wiggins争论 SQL数据库从根本上来说是不可扩展的,我们任何人都不可能像变魔术一样把他们瞬间变得可扩展。 事实上,关于关系数据库的可扩展性的所有讨……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
既定的供应商和初创企业都带头使用先进技术管理PB级数据,这些如雨后春笋般从社会计算和数据分析应用中涌现的数据,俗称大数据。企业IT管理最麻烦的就是学习分类地渗透一个成长的云数据存储。
为你的大数据选择最合适的基础设施并不是件简单的事情。
目前,从根本上来说,NoSQL被应用在开源通往高可用性、可扩展性和持久耐用的数据库,这个数据库不会牵扯到传统的关系模式和SQL。
NoSQL的基要派,例如Heroku's Adam Wiggins争论 SQL数据库从根本上来说是不可扩展的,我们任何人都不可能像变魔术一样把他们瞬间变得可扩展。
事实上,关于关系数据库的可扩展性的所有讨论,Brewer的理论都有解释。这个理论第一次被详细说明是在2000年7月19日的关于分布式计算的原则的ACM研讨会上,Eric Brewer当时做了主题演讲《Toward Robust Distributed Systems》。Brewer设想:分布式系统有三个令人满意的特点,例如网页服务,其中包括数据库:
1.相容性:代表ACID test中的C, 数据存储交易的原子性、相容性、绝缘性、耐用性。
2.可用性:意味着对每一个询问和更新都能做出快速的反应。
3.分离性:耐受性是指即使在单个二级组件(如服务器和磁盘驱动器)失灵的情况下系统能够保证持续可用性。
Brewer的原理在2002年被正式的证明,在以无政府网络服务为代表的异步的网络模型中,同时实现这三个性能是不可能的。对于NoSQL的支持者来说,满足于亚马逊Dynamo数据存储展示的“最终的一致性” 是很正常的。
下面是NoSQL数据存储主要的四个分类:
1.Key-Value/Tuple Stores:包括:微软Azure桌面存储、亚马逊Dynamo、Dynomite、Project Voldemort、Membase、 Riak、Redis、BerkeleyDB和MemcacheDB。
2.Wide-Column/Column Families Store:成员是Apache Hadoop/HBase、Apache Cassandra、亚马逊mpleDB、Hypertable、loudata 和Cloudera。
3.Document Stores:CouchDB、ngoDB和avenDB.
4.Graph Databases:强调实体间的关系,对于有关系数据库模型是很困难的,Neo4j、ryad、FlockDB、yperGraphDB、llegroGraph 和Sones都是很有趣的例子。
企业级的IT管理者一般是通过NoSQL数据库商业用途的宽度和赞助来确定NoSQL数据库的稳健性,或者是通过高可见度的网页属性和赞助商。例如:AWS (SimpleDB和Amazon RDS)、Apache Foundation (Hadoop,、CouchDB 和Cassandra)、LinkedIn (Project Voldemort)、微软(Windows Azure、SQL Azure和Dryad), Twitter (Hadoop、Cassandra、Redis和FlockDB) 以及雅虎(Hadoop/Pig)。2011年中旬,Hadoop/HBase和它的MapReduce规划模型大概是使用最广泛的NoSQL成员。据报道,雅虎计划将其经验丰富的Hadoop发展团队带入一个独立性的商业冒险。
Dryad在云数据存储世界的地位
微软研究院已经研究Dryad的分布式图表数据库六年的时间了。微软研究院称:Dryad提供了常规、灵活的执行层,这个执行层使用数据流图表做为计算模型。它完全包含其他的计算框架,例如谷歌的map-reduc和关系代数。另外,Dryad掌握着提供就业机会和管理、资源管理、工作检测和虚拟化、容错、再执行、日程安排和账单。
翻译
相关推荐
-
混合云优先策略解决公共云、内部部署难题
现在,多云IT环境已经成为常态。根据笔者所在公司Enterprise Strategy Group的研究表明, […]
-
存储基础知识:三大公共云中的对象存储
大部分公共云存储是基于对象存储。块和文件在数据中心占主导地位,但在云端,对象存储才是王道,因为云端需要大量相对 […]
-
谷歌云业务CEO描绘谷歌云计划 收购传言四起
行业观察人士猜测,新任谷歌云首席执行官Thomas Kurian将通过大规模收购来获取市场份额,并与竞争对手A […]
-
混合云是云存储的重要里程碑
预计到2025年,全球存储到数据量将达到163ZB(泽字节)。尽管云计算发展迅速,但目前只有一小部分数据存储在 […]