您是一位解决方案架构师、软件IT架构师、BCS、系统集成师或BI专家吗?通过本学习套件就可以了解如何使用IBM的相关技术构建数据仓库解决方案。
简介
在当今的仓库环境中,具有健全架构的企业更为成功。定义这些架构是为了支持系统的功能、技术和数据需求,而这些系统将解决用户所提出的业务问题。
从20世纪90年代中期到末期,IBM引入了数据仓库的(Data Warehousing)的蓝图,用于通过持久性的数据存储(中心数据仓库或 CDW)帮助保证数据完整性和过程一致性。额外的关注集中到了分析上面,而OLAP函数则是作为解决大型机业务问题的关键策略而提供的。这一关键路线图至今仍然有效。功能架构的演化可以通过ANSI标准中最近添加的内容看到,而这种演化已经内在化(internalize)到了数据库引擎、OLAP函数和低端的数据挖掘算法(例如,回归和标准偏差度量)中。
现在的信息消费者要求对更加复杂的问题做出及时的响应,而这些问题需要处理各种各样的源中的数据。在很多情况下,分析是一种对于数据本身的研究,也许可以提供回答,也许仅仅是提出了另一问题。
本文描述了最新和最好用的工具和方法,这些工具和方法将帮助BI专家访问源数据,以及将之吸收到用于为信息消费者提供价值的信息中。参与者被邀请查看或参与演习,其中涉及用于支持BI不同阶段的一些经典的IBM产品以及新增的技术解决方案。
基于IBM DB2 Information Management Software小组所开发的参考架构(Reference Architecture),本文分成6个小节。它们是:
·第1部分 – BI架构/方法:讨论商业智能架构(Business Intelligence Framework),并介绍IBM用于在该领域启动解决方案的获奖方法。
·第2部分 – 访问:商业智能架构的访问层(Access Layer)定义了通过极少量工作就可以访问BI分析数据的函数和服务。
·第3部分 – 数据存储库:商业智能架构的存储库层(Repository Layer)定义了用于在DB2中存储结构化数据和元数据的函数和服务。
·第4部分 – 分析:商业智能架构的分析层(Analytics Layer)定义了用于提交解决方案的函数和服务,这些解决方案将解决用户即席或周期性提出的业务问题。
·第5部分 – 集成:商业智能架构的数据集成层(Data Integration Layer)定义了到源数据的函数和服务,用于将之带入仓库操作环境,提高其质量,以及定义其格式,以便在访问层通过工具获得这些数据。
·第6部分 – 数据源:数据源层(Data Source Layer)将数据分成Enterprise、Unstructured、Informational或External几类。受各个类别元数据特性的驱动,工具将用于访问和准备各个类别中的数据。
先决条件
您应该对DB2及相关服务具有中等层次的了解,并具有Oracle或其他BI解决方案的所需经验。作为一种准备,您可以学习DB2 V8.1 Family Fundamentals认证准备教程。关于更多信息,还请参阅IBM Certified Database Associate: DB2 Universal Database? V8.1 Family。
必要的资料
为了运行本教程中的例子或示例代码,您将需要:
·DB2 Universal Database V8.1
·WebSphere Information Integrator V8.1
·某些教程将需要附加软件,例如,Cube Views和Intelligent Miner?。作为一种准备,学员可以学习DB2 V8.1 Family Fundamentals认证准备教程。
第1部分 – BI架构/方法
本小节将讨论商业智能架构(Business Intelligence Framework),并介绍IBM用于在该领域启动解决方案的获奖方法。您将了解架构是什么,并了解该架构内的软件组件和功能层。本文的其余部分将说明各种各样工具的应用。
完成本小节需要大约45分钟。
主题:
·BI架构简介
·BI架构 – 搭配应用的IBM产品
商业智能架构简介
本小节包含方法的讨论、参考架构、IBM BI Analytical Framework及其作为参考架构的角色,还将说明一些行业特定的应用程序、考虑以及为使用该构架而进行的调整。
打开这里的Introduction to the BI Architecture Framework and Methods文档,或下载下面“下载”小节中的.zip文件并打开名为INT1ARCHINTRO.pdf的文件。
BI架构 – 技术层和软件解决方案
本小节将简要地查看BI架构的各个层次,并阐述架构组件以及各组件中可获得的IBM软件解决方案。
打开这里的BI Architecture: Technical Layers and Software Solutions文档,或下载下面“下载”小节中的.zip文件并打开名为INT2TECHARCH.pdf的文件。
白皮书“Framework For Business Intelligence”展示了一个简单的BI案例,并讨论了在核心数据库属性中渗入更多BI函数的DB2演化,从而使之对范围更广的应用程序可用,同时维护BI信息的有效性、完整性和可用性。其中讨论了DB2 Data Warehouse Edition和信息随需应变(Information On Demand)的语义,并将之绑定到BI架构中,用于为“数据库中的函数”、用于访问和扩展的开放式接口,以及为所有其他表示服务提供的协作提供强大的论据。
用于商业智能的DB2架构
请查看下列Web广播:Insights On Demand: Extending the Enterprise with BI。该Web广播讨论了商业智能分析应用程序,并给出了相关行业例子的地址,其中不同的分析层都给企业的底线(bottom line)带来了增值。展示了IBM BI产品的搭配,讨论了关键特性,并说明了调整解决方案以满足基本分析需求的论据。其中包括竞争分析等的行业调查讨论更加充实了针对 IBM 解决方案集的业务案例的讨论。
Insights On Demand: Extending the Enterprise with Business Intelligence请注意:这是一个到Web广播事件的链接,该事件将在您的浏览器中启动。如果您启用了弹出式拦截器,那么它可能不会启动。
第2部分 – 访问
商业智能架构的访问层(Access Layer)定义了通过极少量工作就可以访问BI分析数据的函数和服务。本小节的架构中展示了作为关键策略的访问解决方案,如通过瘦客户机、广泛可用的浏览器和门户(portal)进行访问,这些解决方案是通过筛选和组织功能来增添价值的。
完成本小节需要大约45分钟。
主题:
·访问 – 简介
·访问 – Web服务
访问 – 简介
访问层(Access Layer)向信息消费者提供了什么呢?表示视图以及与业务分析应用程序的交互。
图1. 商业智能架构:访问
访问层工具的例子包括:
·Web浏览器 -Brio、Business Objects、Cognos、MicroStrategy、SAS的基于web的前端
·门户 -WebSphere Portal、带有IBI portlet的 WebSphere Commerce、Crystal、Actuate
·设备 -PC、PDA、移动电话、KIOSK、ATM
·Web服务 – WebSphere Business Integration
访问 – Web服务
请查看红皮书DB2 Cube Views: A Primer的第14章,其中讨论了使用Cube Views的web服务。本章中所介绍的内容包括web服务功能和架构,以及用于通过web服务暴露OLAP函数的Cube Views分析。
DB2 Cube Views: A Primer
第3部分 – 数据存储库
商业智能架构的存储库层(Repository Layer)定义了用于在DB2中存储结构化数据和元数据的函数和服务。除了单个服务数据集市,还考虑了大规模的数据仓库,并制定了惟一性数据需求。其中讨论了单层和多层的数据仓库架构,以及基于分析需求定义数据的方法(ROLAP或MOLAP)。作为一种启动用于向客户交互BI分析的企业级解决方案的方法,适用于保险、银行和零售部门的IBM行业特定的业务解决方案前面打开了多扇大门。
完成本小节需要大约90 – 120分钟。
主题:
·存储库 – 简介
·数据仓库架构
·数据仓库 – 数据架构
·DB2-数据仓库配置
·DB2-数据仓库分区
·DB2-Teraplex环境中的分区
·DB2性能-多维集群
·教程:Data Warehouse Center: Information Catalog Center
·数据集市配置
·教程:Cube Views/MQT Creation
·操作性数据存储
存储库 – 简介
数据层(Data Layer)包含商业智能的数据存储。这些数据存储应被视作单个存储库,即使它们可能是作为联邦数据存储集而存在的。
图 2. 商业智能架构:数据存储库
用于支持数据存储库层的工具例子包括:
·数据库- DB2 ESE、DB2 OLAP服务器、Hyperion Essbase、Oracle、SQL Server、Informix、Red Brick
·元数据 – Data Warehouse Manager、CA Repository、MetaStage
可以利用诸如保险业模型(IIA/IIW)和银行业模型(IFW/BDW)的行业语义参考模型,以便提供跨数据存储库的一致性和集成功能。CIIS、DWL和Siebel通常为客户数据提供ODS层。
数据仓库架构
下面由Jon Rubin撰写的文章“IBM DB2 and the Architectural Imperatives For Data Warehousing”讨论了仓库平台关键特性,包括可移植性、可伸缩性、灵活性和可扩展性。
IBM DB2 and the Architectural Imperatives For Data Warehousing
数据仓库 – 数据架构
请查看红皮书“Data Modeling Techniques for Data Warehousing”,并密切关注第6、8、9章,其中介绍了仓库数据建模和考虑,以及许多为帮助项目交互数据驱动的BI解决方案而设计的方法和过程。
Data Modeling Techniques for Data Warehousing
为了看到实际解决方案,要查看IIW General Information Manual中第3章和第5章里的数据模型(Data Model)主题,该手册位于Solution页面“IBM Insurance Information Warehouse”上的Resources区域:
IBM Insurance Information Warehouse
DB2-数据仓库配置
如果您还不熟悉IBM – DB2,就请查看下面题为“DB2 UDB Fastpath Study Guide”的文档,该文档用于辅助了解和发现关于下列课程的附加信息:DB2 UDB Administration Fastpath Course for Version 8(CT28D)。
打开这里的DB2 Universal Database FastPath study guide文档,或下载下面“下载”小节中的.zip文件并打开名为FASTPATHTODB2.pdf的文件。
作为对于DB2中所提供的数据仓库解决方案的介绍,请查看演示文稿:Chat with the Lab – DB2 Data Warehouse Edition V8.2,其中Sriram讨论了DB2的数据仓库版本Stinger产品的特性。
BI Best Practices Technical Chat Program
请查看DB2 Version 8.2 Announcement中的Overview和Description小节,其中说明了版本功能、组件和升级。
IBM DB2 Universal Database for Linux, UNIX and Windows, V8.2 delivers manageability, performance, and availability for on demand business
DB2 – 数据仓库分区
请查看下面题为《对具有数据库分区功能的DB2 UDB for Linux, UNIX and Windows Version 8的生动介绍(第2部分)》的文章,这篇文章介绍了DB2 UDB Enterprise Server Edition(ESE)上的数据库分区功能(Database Partitioning Feature,DPF)。该文讨论了该功能对于仓库环境的隐含意义,并介绍了在解决OLAP和数据挖掘问题方面的应用。
对具有数据库分区功能的DB2 UDB for Linux, UNIX and Windows Version 8的生动介绍(第2部分)
请查看Bill Wilkins的文章《将DB2 UDB应用程序迁移到分区数据库中》。这篇文章讨论DB2分区是什么,概述了使用DB2分区的好处和成本,并帮助您决定是否要使用分区数据以及如何迁移至一个分区数据库。其焦点在应用程序的迁移上,但同时也介绍了针对分区数据库的设计、配置和操作考虑。文档主体中还包含了一些有用的脚本示例。
将DB2 UDB应用程序迁移到分区数据库中
DB2 – Teraplex环境中的分区
请查看下面题为“DB2 Cube Views Teraplex Case Study”的白皮书,其中通过一位SurfAid客户测试了Cube Views 在 Teraplex环境中的实现,以评估在客户数据库环境中包含该架构的可行性。
DB2 Cube Views Teraplex Case Study
DB2性能 – 多维集群
请查看下面的教程,其中介绍了多维集群(Multidimensional Clustering)这个DB2 V8.1的新功能。MDC 是一种索引化(indexing)类型,它通过减少访问数据时需要的磁盘读取次数,以及通过提高磁盘输入输出所需要的速度来提高性能。您将需要一个IBM配置文件来访问该教程。如果您还没有用户ID和密码,可以通过单击这里创建一个。
Multidimensional clusters in DB2
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
谁知道阿里云河南服务中心是干什么的?
一直接到阿里云服务中心的电话,说是阿里云的授权中心,主要提供阿里云的区域服务的?请问其他地方也有阿里云的服务中 […]
-
来之不易的0.1秒 只为离梦想更进一步
0.1秒可以做什么?弹指一挥间,什么也做不了。我们甚至感受不到它的存在。然而对于云端筑梦的人来说,0.1秒的差距,结局也许就是天壤之别。
-
BI公平化:云端数据分析
企业IT已经发现了大数据的商业智能价值,但是SMB和初创企业没有足够的资金和人员无奈错失了数据分析的利益。在本地分析艾字节的非结构数据需要显著的开支。
-
云计算和大数据和商业智能之前有怎样的关联?发展前景如何?