发现SOA中的信息管理角色

日期: 2008-07-06 作者:Mei SelvageDan Wolfson 来源:TechTarget中国

  学习信息管理、它对面向服务的体系结构(Service-Oriented Architecture,SOA)的重要性以及信息管理和SOA之间的关系。然后我们研究将这些具有挑战性的问题和重新设计应用到SOA中的信息管理的优点。本文中(本系列文章包含两部分,本文是第一部分),作者将信息管理分为几个不同的服务,并且提供了对于这些服务的高级概述。本文的目标读者是架构师、数据建模者、数据库管理员以及那些想要利用信息管理功能的开发者,他们将该功能用于基于SOA的建模、架构、设计以及实现。


  引言


  信息管理,既包括了数据管理,还包括了内容管理,它是面向服务的体系结构(SOA)的基本构建模块。信息管理提供了一种可以在不同种类信息源(请见参考资料部分中的随需应变的操作环境的体系结构概述)之间表示、访问、维护、管理、分析以及集成数据和内容的方法。在信息管理中存在多种不同的功能,包括:


  ·Extract Transformation Load(ETL)
  ·联盟(Federation)
  ·数据放置功能(例如替换和隐藏)
  ·数据建模功能
  ·搜索功能
  ·分析功能


  可以将这些功能组合成复合组件,并且它们作为可复用的及可调用的Web服务来提供。检查这些功能是如何帮助构建SOA以及它们在SOA上下文中是如何交互的,这点非常重要。如果您对它们的意图和数值表述不清楚,那么很容易丢失大的图片,并且会错误地选择信息管理和体系结构。一个将信息管理合并成更大的、整个SOA图片的预见性计划可以帮助您解决一些常见的不足,例如数据solos(独立的数据源)、数据的不一致性以及未使用的信息资产。


  SOA多于Web服务


  信息管理服务处理SOA的信息组件。但是,当人们想到SOA的概念时,他们通常会首先想到Web服务。很少人会越过Web服务编程模型而想到信息管理的潜在方面。然而,信息管理支持SOA,因为它解决了其中一个最重要的公司资产——结构化格式和非结构化格式的信息。信息的体系结构是信息管理的关键部分,它使得SOA更加智能且可管理(请见参考资料部分中的SOA中的EII角色)。最后,如果没有坚固和强大的信息管理环境,SOA将受到局限,并且几乎没有端到端的业务集成和转换的可能性。


  SOA中的信息管理重在企业信息集成(Enterprise Information Integration,EII)——该技术集成了结构化和非结构化的信息源使它们可以如同单一的信息源一样被处理。通常,结构化信息包括了相关的、XML、或者表格数据,例如电子制表。传统上说,在数据管理的标签下,管理结构化的信息要落后些。相反,非结构化信息包括了免费的文本报告、文档、Web页面、生命科学数据、音频、视频等等。对于非结构化信息的管理一般被分类为内容管理。


  EII可以提供对数据和内容的统一观点,这样就简化了对潜在的信息服务的表现和访问。SOA中的信息管理也扩展了EII使其包括ETL、数据放置、数据恢复以及类似功能。创建声音信息的体系结构和设计的部分流程是要权衡不同方法之间的利弊,以便您可以将合适的技术应用到解决客户问题上。
  
  信息管理如何启用SOA


  SOA中的信息管理,尤其是EII,强调将服务层与数据的物理实现之间的关系分离。这种分离技术通常由中间件提供,例如IBM? WebSphere?信息集成器(以前为DB2?信息集成器)。这样的中间件可以大大减少用户所有权的总花费和信息集成的复杂度。合理使用EII可以生成潜在的不同类数据的集成化视图,服务很容易与这些数据协调工作,这样有助于从物理数据的更改中将服务层隔离出来。这种隔离层对于SOA来说非常重要,这是因为它使得数据库厂商的产品、OS平台、信息位置、数据格式以及物理数据模型透明化。


  为了从应用程序中得到信息源的松耦合视图,SOA中的信息管理访问并且聚合了不同类的数据和内容源(这种性能称为 联盟),因此当它们显示给用户时,它们就好像是单独的数据库或者内容源。因为SOA中的信息管理担当应用程序和数据源之间的中间设备层,所以集中了用于数据连通性、数据转换规则和数据映射的编程逻辑,并且许多应用程序(服务用户)可以复用它们。此外,SOA中的信息管理提供了强大的扩展性,它允许应用程序和用户不仅可以在企业内部访问信息,而且还可以穿过企业和业界边界来访问信息。这种完全端对端级的业务和信息集成赋予业务很大到灵活性和适应性,这为成为随需应变的业务铺平了道路。最后,SOA中的信息管理是基于信息标准的,这些标准的范围从数据、内容和元数据到元模型以及元-元模型(我们将在本文的后面详细讨论),例如 Unicode、XML以及Metadata Object Facility(MOF)。


  作为Web服务的提供者,IBM DB2 UDB创建了一个对SOA开发和部署非常友好的环境。例如,Web服务对象运行时框架(Web Services Object Runtime Framework,WORF)装载了用于Linux、UNIX、Windows?和z/OS的DB2 UDB,它提供了环境,在其中可以很容易创建访问DB2数据库的简单Web服务。用简单的术语来说,就是可以使用包含一系列操作的XML文件来定义对DB2数据的访问。这些操作可以是SQL操作(选择、插入、更新、删除操作,或者对存储过程的调用),也可以是XML集操作(生成或者存储XML文件)。


  作为Web服务的用户,IBM DB2 Web服务客户的用户定义的功能(UDF)启用数据库应用程序来使用SQL声明直接调用Web服务。您可以使用WebSphere Studio Application Developer来轻松地将现有的WSDL接口转换成DB2表格或者分级的UDF(请见参考资料部分中的用于DB2信息集成的XML)。


  将信息管理重新构建到SOA中


  我们已经描述了信息管理是如何启用SOA的。现在我们来看一看信息管理如何能同时从SOA的原理中获益。


  面临的挑战


  尽管出现了很多信息标准,例如XML、Unicode以及UML,但是许多数据源仍然使用私有的数据格式、元数据以及元模型,这是由我们一直以来的习惯形成的。将不同数据源集成在一起需要大量的工作,并且通常是通过构建端对端的数据和应用程序集成来实现的。为了说明该问题在行业中的严重性,目前行业中有超过250个厂商在输入端提供了用于不同种数据源的ETL工具,并在输出端提供了分析工具(请见参考资料部分中的“Java元数据接口(JMI)规范”)。ETL常用于从源系统中提取数据,将数据转换为与目标系统相兼容的格式,然后将其装载到目标系统中,例如数据仓库或者数据市场。考虑到ETL仅仅是EII的一小部分,所以您可以想象端对端集成问题的范围和严重性。


  在内容方面,这些具有挑战性的问题令人生畏。内容管理的解决方案来自不同的历史体系,而且大部分是纵向分析并且是基于部门角度分析的。例如,用于法律部门的文件管理、用于IT部门的知识管理,或者是用于营销部门的Web内容管理。在目前的内容管理市场中,经常使用来自不同厂商的产品来提供这些解决方案。即使是单独的厂商,产品之间的功能也是经常重叠的。


  随着时间的推移,分离不同种类解决方案的界限已经越来越模糊。例如,当前的业务智能需要实时性数据来获得对市场定位的完全理解,市场定位促使ETL厂商扩展实时性数据性能。另一方面,数据联盟越来越需要数据的转换性能来提高数据的质量和灵活性。在很多方面我们正在看到一种聚合趋势——一些实例是数据和内容集成的聚合(特别是在XML的上下文中)、ETL和联盟的聚合、知识管理和Web内容管理的聚合。


  当企业要做出一些改动时,需要面对巨大的挑战。以下是企业必须要考虑的一些项目:


  ·放弃从纵向和部门的角度来考虑问题
  ·将现有的信息管理功能转换为可复用的服务
  ·集成大量的不同类信息源
  ·减少开发费用
  ·扩展功能


  这些挑战并不是很容易解决的,因为厂商想保护他们当前的IT资产和用户基础。企业内部的提倡者同时也必须在内部出售SOA构想,然后向基于标准规范的方向前进。从用户的角度来看,将逐步渗透IT资产的复用作为组织文化的一部分,这是非常艰巨的任务。


  优点


  对于那些采用SOA作为信息管理的用户来说,优点非常多。在其他部分之中,基于SOA的信息管理有以下功能:


  ·允许系统的IT资产复用。数据建模、映射以及转换功能是最复杂并且是集中劳力的流程。当前的点对点信息集成不容易导致IT资产的复用。
  ·加快开发速度,并且减少了开发和维护的费用。
  ·使用更大的成本效益来提高数据和内容连接性和互用性。
  ·创建了附加的基于完全集成化信息的业务视野。例如,Gartner预言了分析非结构化内容的能力将会导致产生新的业务机会。
  ·保护用户在很不稳定的信息管理市场里的投资,在那里经常会出现合并和收购。
  ·简化了企业计算模型的总体复杂度。


  信息管理提供的服务


  前面不仅陈述了使用SOA来重新设计信息管理的挑战和益处,而且也陈述了信息管理如何启用SOA,让我们先来检查信息管理所提供的服务,例如Extract Transformation Load(ETL)、联盟、建模、搜索和分析。


  以下的清单阐述了一个信息管理堆栈,它是对信息管理所提供的服务进行分类的逻辑视图或者框架,该信息管理基于它们的价值提议:安全性、协作性、可利用性、可管理性和信息消费:


  ·安全性(Security):这是应用程序访问基于who-can-see-what策略的不同种类数据源的入口点。
  ·协作性(Collaboration):这是在开发小组环境中必不可少的部分,因此您需要工作流和版本控制。
  ·服务质量(Qualities of Service,QoS):它包括了实现信息的可用性、性能、数据吞吐量以及数据的一致性或者正确性。联盟、ETL、缓存、复制和事件的发布功能的目的都是为了与QoS的目标相匹配。
  ·可管理性(Manageability):因为信息是存储组织的智能和复杂度的方式,所以要使用(结构化和语义的)建模、(数据)概要分析和(数据和内容)质量disciples以使信息更加便于管理。
  ·消费(Consumption):此外,前面工作的全部意图是需要有操作者(包括机器)来使用它;因此信息消费位于该堆栈的顶部。


  没有单独的产品提供所有这些服务。本文最后列出了实例工具。总体上来说,这些服务在SOA下创建了一个完整的信息管理框架。理想的情况是每个服务都专门写一页来进行描述其权利,但是我们这里只提供了概述。



  图1:SOA中的信息管理
 
  SOA中的信息管理全面地观察了企业组织内部以及贯穿整个组织的信息资产。尽管多种技术可以用于不同的用途,但是信息管理并没有任意地将信息分为结构化或者非结构化的部分;也没有将解决方案划分为部门的视图。SOA中的信息管理与早期更严格的数据和内容管理方法相比,最关键的区分标志是它可以为在合适的时间、合适的地点并且有正当理由而需要它的任何用户提供服务。


  正如我们前面所述,通常由中间件提供在信息管理堆栈中所列出的服务。尽管需要抑制成本花费和部署时间,但是企业可以选择从初始状态将这些服务构建到他们的应用程序中。最好的实践就是理解业务的需求,选择一个可以提供完好的信息集成和最完备的信息管理解决方案的厂商,然后构建几个选择性的服务来弥补丢失的部分,甚至将某些的复杂服务外包给第三方信息服务提供者,如我们将在本系列文章的下一部分中的实例研究所述。


  结束语


  您已经看到了信息管理是如何在SOA的上下文中工作的,并且阐明了它们之间的关系。您同时也检查了将信息管理重新构建到SOA中的益处和随之而来的挑战。


  本文是SOA中的信息管理的系列文章(共两部分)中的第一部分,提供了这些服务的高级概述。在第二部分中,作者将会描述每个服务的详细信息,并会提出实际的用户场景。


  作者简介


  Mei Selvage从Montana的Missoula的Montana大学毕业以来,担当过IBM中多个开发小组的数据架构师、数据建模者和数据库管理员。她是SOA Compass一书的作者之一,并且对元数据和信息的体系结构、管理和集成、人员协作以及科技对社会的影响方面有浓厚的兴趣。您可以通过meis@us.ibm.com联系她。
 
  Dan Wolfson是IBM软件小组在业务集成方面的著名工程师和主要技术官员。他在分布式计算方面有超过18年的工作经验,Dan的兴趣很广泛,包括信息集成、中间件集成,元数据,消息传递以及事务系统。您可以通过dwolfson@us.ibm.com联系他。
 
  John“Boz”Handy-Bosma从Austin的Texas大学获得通信专业的博士学位。他目前是IBM Global Services和Application Management Services的高级IT架构师。Boz是Application Management Services中很多工程的项目领导,重在研究IT体系结构中的最佳实践,指导技术专家,以及在探索和协作中新兴的技术。您可以通过bosmaj@us.ibm.com联系Boz。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

相关推荐

  • 事件驱动框架和SOA在空军的应用

    空军正在利用SOA来改善数据共享,并实时跟踪战机,美国空军机动司令部的Michael Marek解释了企业可从中学习的经验。

  • 揭秘New Relic APM技术细节

    New Relic应性能管理(APM)套件主要用于Web软件开发。它允许用户在面向服务的架构(SOA)上跟踪关键事务性能,并且支持代码级别的可见性来评估特定代码段和SQL语句对性能的影响

  • 仅凭SOA和云无法解决业务数据管理风险问题

    SOA和云可以是某些恼人问题高效的解决方案;这一点我们已经知道了。但是也要记住它们并不是所有事情的直接答案,特别是当你的问题是业务数据管理风险,而不是技术问题时。

  • 联合创新,携手共赢 华为与Commvault签署全球合作联盟协议

    【中国,上海,2015年9月19日】在2015年华为云计算大会上,全球领先的信息与通信解决方案供应商华为与美国知名的数据管理软件及相关服务主要供应商Commvault签署全球合作联盟协议。基于合作协议,双方将会加大投入数据中心备份解决方案在云化环境下的“可服务化”技术研究 。Commvault公司全球业务发展副总裁Andreas May、华为IT数据中心解决方案总裁马力出席签约仪式。