为Big Data选择一个云数据存储(下)

日期: 2011-07-09 作者:Roger Jennings翻译:贺晶 来源:TechTarget中国 英文

DryadLINQ是一个简单的、强有力的、讲究的编制程序,这个程序针对在大型PC机群上运行的大范围的数据平行应用。   DryadLINQ结合了两种非常重要的微软技术:Dryad分布式执行引擎和LINQ。2011年五月,博主Mary Jo Foley说,HPC 2008 R2 SP2是Dryad的御用运载工具,是谷歌MapReduce和Apache Hadoop的最直接的竞争对手。   SQL和NoSQL:是相同的吗?   LINQ之父Eric Meijer 和 Gavin Bierman 宣称,与大众的想法正相反,SQL和NoSQL其实就是同一个模子刻出来的,作为对其文章A Co-Relat……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

DryadLINQ是一个简单的、强有力的、讲究的编制程序,这个程序针对在大型PC机群上运行的大范围的数据平行应用。

  DryadLINQ结合了两种非常重要的微软技术:Dryad分布式执行引擎和LINQ。2011年五月,博主Mary Jo Foley说,HPC 2008 R2 SP2是Dryad的御用运载工具,是谷歌MapReduce和Apache Hadoop的最直接的竞争对手。

  SQL和NoSQL:是相同的吗?

  LINQ之父Eric Meijer 和 Gavin Bierman 宣称,与大众的想法正相反,SQL和NoSQL其实就是同一个模子刻出来的,作为对其文章A Co-Relational Model of Data for Large Shared Data Banks的介绍 ,ACM杂志的作者用DryadLINQ做例子做了一个数学分析。

  为最通用的NoSQL模式建立一个数学模型。因为这样一个深层的联系,我们打算改NoSQL名为CoSQL。另外,单子和单子理解力(即LINQ)为SQL和CoSQL提供了一个常见的查询机制,很自然的,SQL和CoSQL的缺点和优点可以由数学运算推算出来。和大众的想法正好相反,大小数据的问题和SQL与CoSQL的问题是直交的,虽然CoSQL模式自然的支持极端的分区,实际上,并不需要强力型和标准化来使其对小数据产生吸引力。通过谨慎的分区是可以实现SQL数据库缩放的。

  这篇文章最后结论:CoSQL和SQL并不冲突,实际上他们只是同一矛盾的两个方面。作者还提到,因为普通的询问语言是基于单分体的,所以二者可以在同一原则下执行。

  最近被一小部分NoSQL用户使用的”NOSQL”,涵摄一切对“not only SQL”的缩写。这个名词还没有在企业IT管理者和Web研发者中引起太多的关注,可能是因为其太普通了。AnySQL也曾被冷遇,可能也是这个原因。

  NewSQL databases概况

  分析公司451集团最近提出了术语NewSQL,并把它形容为:“ 各种新的可扩展性、性能高的SQL数据库厂商。NoSQL是不能望文生义的:关于NewSQL供应商的新事物是供应商,而不是SQL。”

  451集团包括Akiban、Clustrix、Drizzle、CodeFutures、GenieDB、 MySQL Cluster 、NimbusDB、RethinkDB、 ScalArc,、ScaleBase、ScaleDB、 Schooner等,但是很明显的,在可预知的未来,NoSQL数据库的市场不会支持很多供应商。但是选择胜利者不是很容易的事情。

  在硅谷Under the Radar会议上展示的NimbusDB,是观众的选择,把NewSQL数据库描述为拥有 ACID语义学的SQL数据库,不同于现存的SQL数据库,NimbusDB 提供云类型环境的关键要求,这个环境包括从一个活的系统动态添加和删除节点。

  云计算数据库的更多信息

  NimbusDB的建设者有企业等级证书。IONA Technologies 的CEO Barry Norris和CTO Jim Starkey 创建了Interbase Software,后来被Ashton-Tate接手,再后来又被Borland International接手。

  Interbase是Firebird开源数据库的基础。Starkey后来又建立了Netfrastructure公司,后来又卖给了MySQL AB,MySQL AB后来变成了MySQL Falcon存储引擎的核心。

  根据Norris,Nimbus也会“快速”的进入NewSQL市场,如果 NimbusDB不辜负它的传统,那么它会成为一个NewSQL“持有者”。

  涉及到作为“NewSQL as a Service”的分类数据库,451 Group包括亚马逊的Relational Database Services、Salesforce.com的Database.com、FathomDB、微软SQL Azure 和Xeround.

  目前,Amazon RDS提供了MySQL应用,但是计划增加一个甲骨文数据库,Amazon RDS 和SQL Azure 使用回复维持数据可使用性,亚马逊和微软兜售开发者对 MySQL 或者SQL Server作为主要时间和成本保护器的熟悉度。

  2011年五月中旬,SQL Azure的一个限50GB的修复进入私有Community Technical Preview ,预计消除大小的限制。

  为你的组织的大数据选择最优化的基础设设不是在公园里散步,最重要的决定是在NoSQL和NewSQL方法之间做出选择,通常是你的数据的模式口述的。

  例如,如果映射实体层次是一个关键因素, 图表数据库像Neo4j和Dryad是一个合乎逻辑的选择。另一方面,如果交易有必要的去保证数据的一致性,考虑SQL Azure

  虽然,为一个彻底的调查和全规模的实验安装对必要资源进行重要的预算,会起到一定的作用,毫无疑问,选择你的大数据基础设施是件很伤脑筋的事情。

  相关链接:为Big Data选择一个云数据存储(上)

翻译

贺晶
贺晶

相关推荐