网格计算:空间数据基础设施的基石?

日期: 2010-08-11 来源:TechTarget中国 英文

  在20世纪90年代,一个新的概念计算方法被网格计算的领军人物Ian Foster引入,他认为网格计算已经作为一个重要的新领域而出现,与传统的分布式计算不同,网格计算致力于大规模的资源共享、创新型应用以及一些的高性能应用。在过去的几年里,地理空间行业的研究人员一直在努力研究网格计算对于空间数据基础设施(SDI)的潜能。利用网格的强大计算能力,能否有可能在处理空间领域的任务时有所突破呢?

  空间数据基础设施的数据检索和处理的标准及规范,是否同并行的网格计算以及存储基础设施相兼容?尽管将空间数据基础设施服务和网格基础设施相结合是一种必然的趋势,仍然有一些概念上的分歧需要在这个过程中得以解决。这篇文章对其中的一些分歧进行了讨论,同时介绍了由德国研究教育部资助的研究项目GDI-Grid的概况。在访问地球观测数据清单或者国内外数据中心的数据库时,传统的空间数据基础设施的资源就显得非常有限 。在处理大型数据集时,这种情况尤甚。

  例如,计算一个陆生植被指数需要数以万亿字节地图代数数据,而本地工作站一般是无法完成这样的任务的。还有一些其他处理任务也会耗尽传统空间基础设施的资源,因为它们的算法复杂,数据量又大,例如气候模型的生成或精确模拟城市中的噪声传播。

  网格基础设施给我们展示了数以千计的CPU的处理能力和存储大量数据的能力,这些性能使其成为在可接受的时间范围内、具有强可靠性的处理任务的理想平台。潜在的优势还包括:具有在所谓的虚拟组织成员中共享存储和计算资源的手段,因此降低硬件获取手段的初始成本;对存储和计算资源的增长需求可以进行安全、可靠的事务处理。

  空间数据基础设施和网格基础设施的区别

  由于传统的SDI和网格基础设施的概念相去甚远,需要一个基于网格的SDI实际安装(将传统的OGC标准SDI服务连接到一个网格基础设施的后端)来解决多种不兼容。尤其是服务描述、服务接口、服务状态和安全机制,都采用了不同的方法。

  服务描述

  网格服务总是使用WSDL(网络服务描述语言)来描述服务方式和输入参数。另一方面,对于不同的操作(例如描述要素类型、描述Coverage等),OGC网络服务使用同特定服务元数据一样的功能文件来描述。WSDL文件和功能文件差异很大并且不能够相互转换。为了在网格基础设施内部署OGC网络服务,必须要手动创建一个WSDL描述,因为目前还没有一种能够自动创建这种描述的方法。

  服务接口

  对OGC网络服务支持的一系列操作在OGC服务规范文件中定义,可以通过不同的方式来调用这些操作,但是首选的方式是通过HTTP-GET获取键值对,以及请求在XML文件中编码并通过HTTP-POST传送。此外,大多数最近的服务规范包括指示,使用SOAP来调用操作。网格服务通常是通过一个网格中间件来解决的。举例来说,Globus Toolkit 4 使用SOAP来传递服务呼叫。那些不支持SOAP或者没有WSDL描述的服务可能无法集成在一个网格工作流中。

  服务状态

  除了使用SOAP进行通讯和使用WSDL来描述外,一些网格服务还实现了由结构化信息标准促进组织(OASIS)开发的网络服务资源框架(WSRF)。传统的网络服务(即非网格服务)以及OGC网络服务都是无状态的,WSRF服务之间在调用的时候能管理各自的状态信息。这些信息当作资源存储在服务后端。每一个服务端点有都有自己的统一资源标识符(URI),这些标识符可以用来访问存储信息。对于之后的计算来说,存储计算中间结果是必须的,这在状态化服务中是很常见的。

  OGC规范(除了网络处理服务WPS)还没有任何关于服务状态的说明。WPS规范的一个可选部分引入了用于在外部资源上存储运行结果的请求参数,但是由于该部分规范是可选的,因此当前还没有得到广泛的支持。

  安全机制

  OGC规范对于涉及安全的问题仍然没有任何表述说明,通常使用安全的HTTP(HTTPS)来确保传输协议的安全性。此外,对于一种服务中如何鉴定不同的用户还没有规定。因此,传统空间数据基础设施的安全机制是根据特定的项目而建立的,不同的供应商通过不同的方式应对安全问题。对于网格基础设施,这样低层次的安全防范是不够的。

  安全机制是至关重要的,有了安全机制,每个资源就能允许特定的用户访问,否则网格基础设施的大规模计算和存储能力很可能被滥用。所以,安全是网格基础设施的一个非常重要的因素,如果在网格基础设施中使用OGC网络服务,这些服务必须要提供用户认证手段和网格资源通信加密功能。

  案例研究:GDI-Grid项目

  GDI-Grid项目(GDI是德国空间数据基础设施的缩写)是由德国研究教育部资助的一项国家研究项目,该项的目的是将标准化的空间基础设施组件与网格基础设施结合,同时解决上述的兼容性问题。结合这些技术的目的有两个:

  首先,最重要的一点是它能够帮助用户使用标准的方式访问高级存储器和网格基础设施的计算资源。此外,它使得网格技术的用户能够将地理空间服务技术融入到网格工作流中,并包含一系列的网格服务调用。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

相关推荐