BI的八大误区

日期: 2009-04-19 来源:TechTarget中国 英文

  随着信息管理逐步得到认可,对信息检索、获取、组织和维护整个过程而言,良好的治理变得越来越重要。

  信息和决策过程分析中的一个关键因素就是设计思维、态度得到改善。决策人员在有限的条件下,利用良好的流程和方法作出决策,只有这样,人们对信息管理的需求和渴望才能从技术上变成可行。

  由于所有的信息最终由个人加以管理,因此只要有人们的干预,就会存在各种误读。我曾在信息管理领域遭遇以下八种误读。

  误读:绩效管理并非BI解决方案。

  毋庸置疑,绩效管理是今年的流行词汇。绩效管理与BI密切相关。实际上,任何新兴词汇都需要依赖一定的时间和特定的模式,才能真正付诸于实施和利用。

  这就好比一种新技术进入市场,必然需要宣传、承诺,也会引起一些顾虑。一些绩效管理供应商认为,绩效管理有别于BI。

  我认为这完全是一种谬论。为了解决这个问题,我们首先对商业绩效管理下个定义。商业绩效管理可以视为一种解决方案:利用特定方法,主动识别风险和问题,提升流程和进程。这就有助于主动而非被动地预测和回答“如果……将会怎样”的问题。

  但是在将绩效管理作为战略措施之前,公司需要做一些准备工作:评估绩效管理措施的真正性质和目的,以及管理环境是否可以采用绩效管理工具。只有底层系统稳定和可靠时,绩效管理工具才能有效工作。

  对绩效管理而言,底层系统就是可靠的数据仓库、BI架构和基础设施。许多公司的数据仓库看起来依然像是操作系统的镜像。这种情况下,你就无法从绩效管理投资中获取回报。最终,绩效管理供应商会为你建立完整的BI和DW,而绩效管理解决方案通常不能提供此项服务。

  误读:DW和BI是技术解决方案。

  将DW/BI解决方案视为技术解决方案是一种谬论,因为DW/BI不是产品,而是许多工具和技术的集合,从而使得公司能够以更加快速而有效的方式回答决策问题。

  实际上,DW/BI是商业解决方案。BI/DW这个术语已经存在几十年了,但是IT界依然盛传这种谬论:BI/DW 就是利用工具实现传输,不管是利用ETL工具还是报告工具。我们经常在这些方面听到BI/DW:传输了多少报告,创建了多少仪表盘,以及批处理花费了多少加载时间。

  但是我们很少在“这种方案能够解决这些商业问题”等方面听到BI/DW。关于BI/DW的成功标准(良好的设计、最好的工具、合适的员工)、BI/DW的失败缘由(数据质量、需求集中不充分),你可以找到许多文章。

  但是很少有文章会强调,你给DW引入多少数据并不重要,但是与商业价值相关。这就意味着BI/DW解决方案在产生收入和节约成本方面具有终极价值。我们很多人可能都知道这个事实,但是能定期了解基本情况总是有好处,尤其是数据仓库的基本情况,这可以保证投资、视角、方向的正确性。

  误读:你无法明确地衡量ROI和BI投资。

  衡量投资收益率有赖于各种因素,如公司情况、确定度量标准的人员、有形和无形的衡量方式、直接和间接的收益。所有的这些在BI/DW工程和项目中都真实存在。你无法管理你不能衡量的东西。因此,你可以计算ROI。

  这非常简单。但是,ROI的计算方式可不简单。好在目前BI/DW已经趋于稳定和成熟的状态,一些指导手册就可用于计算BI投资的ROI和TCO(总拥有成本)。用于完成计算的关键因素包括:基础设施成本;服务成本(软件供应商和服务供应商);员工成本(境内和境外)。

  这些因素都可以根据需求条件加以扩展,从而算出ROI。这些因素的衡量标准都可以量化。此时即为有形的衡量标准。还可以深入分析各种衡量标准,比如每个用户的成本是多少,或者每TB的成本是多少,从而获取相关信息以及下一步计划,预测数据的增长情况。

  即使如此,ROI和TCO依然非常容易受到个人和公司的影响。手册可以指导更加详细的研究和关注领域,从而形成特定的衡量标准。这些与ROI和TCO相关的细节都是有形的标准。如果投资是一定的金额,成本是别的金额,那就没有办法了,ROI和TCO都无法量化。

  误读:数据治理是一项工程。

  工程具有明确的起止日期。但是数据治理过程必须要涉及人员、过程、程序、策略和技术等,才能以安全和可控的方式处理公司数据。

  BI/DW工程的本质都是数据治理,与企业的标准相符。这些项目没有终端数据。数据治理从来都不是一项工程,但却是完整的项目。数据治理的生命周期很长,贯穿业务的运行过程,必须支持治理技术才能运行该业务。

  总而言之,数据治理项目应该系统化,公司应该持续投资。这一点非常重要,所有的公司都会经常发生变化。因此,数据治理措施应该动态地适应商业措施和技术实践带来的变化。究竟是自上而下还是自下而上地实施项目,应该由企业及其实施意愿来决定。

  数据治理项目可以自动开始解决数据质量、数据安全等其它问题,人们对这些领域的投资有所怀疑,或者至少他们不知道如何衡量这些投资收益率。

  根据我的理解,从投资角度而言,数据治理这个概念相对较新;我认为这是由于人们和公司的文化、心态发生了变化,而这种变化也对公司造成了威胁。我们都会抗拒变化,这十分正常。但是,让员工了解这些变化、重要性以及为公司带来的回报,可以解决这个问题。

  尽管数据隐私和保护的概念比较陈旧,数据治理却相对较新,能够满足流程和程序,从而达成公司的目标。只要有人干预现有的流程或协议,就应该制定相应的治理策略和控制措施。

  误读:灾难恢复预案只适用于处理关键数据的金融公司。

  实际上,灾难恢复针对所有运行关键应用程序、期待业务连续性、以及可能发生灾难的公司。

  当我提出应该拥有DR解决方案时,一位来自中等规模公司的客户说,“我们不需要DR方案或策略,因为我们并不运行任何关键信息。”我觉得这种想法非常有趣,我接着问:“你是否在乎系统今天着火,这还与公司无关吗?”

  显然,和公司有关,但是他们认为,为何要在一些可能发生也可能不发生的事情上浪费资金呢?只有当丢失的数据不会影响业务时,这种想法才有可能正确。

  我总是保留个人数据的备份。对我而言,个人数据非常重要,我只是在这种情况下才采取必要的防御措施。我确信大多数人会这么做。我们无力承担丢失个人数据的风险,因此,我认为任何公司或业务也都无力承担丢失数据的风险。

  简而言之,每个人都需要一定的灾难恢复预案。这就像备份内部和外部驱动器,或部署热站一样简单。这得根据灾难发生时,公司能够承担的数据丢失程度而定。

  直到过去几年,灾难恢复才被视作数据仓库的性能,更确切地说,直到商业开始实时捕捉交易、作出决策才如此。

  目前,各种实施场景和架构必须符合个人选择和解决方案的需求。在设计DR解决方案时,总是在成本和收益之间寻求平衡。包括在远程站点拥有热备份,连夜将磁带运输到DR中心等。

  成熟的DW系统能够认真规划和设计容量,因此DR系统可以每天使用,在发生灾难时发挥DR中心的功能。认真设计架构,你就能提高DR投资的效率,从而在日常业务中发挥作用,而不是等灾难发生时才简单地部署DR系统。一旦明确了临界状况,例如,一旦公司能够从“常规”信息中识别出“必需”信息,就可以识别服务级别,制定合适的战略。

  误读:关系数据库模型是所有决策系统的最佳数据模型,而多维数据模型只适用于特定的领域和区域。

  关系模型属于ER模型,这种设计技术能解决最小粒度的数据因素之间的关系。这是一种针对事务处理系统的完美技术,而多维模型的概念可以满足终端用户对数据的查询和检索需求。但是,两种模型的目标截然不同,应根据空间和情形分别运用。

  我认为,这两种设计模型最大的联系在于ER模型可以分解为多个多维模型。由于BI/DW系统是利用近期数据和历史数据,解决用户的分析和查询问题。因此,多维模型设计技术是唯一能实现这一目标的技术。

  许多咨询师认为,关系模型是处理数据仓库中数据的最佳方法。人们更加强调首次建立的数据仓库。

  我曾听到人们对这种方法的争论:“你并不知道自己想如何处理数据仓库,因此利用关系模型建立数据仓库就是个好主意,因为关系模型能够消除冗余,而不是一直添加数据层,否则真正需要数据时可能就无法获取。”

  对于这种争论,我认为如果你不知道想要如何处理数据库,就应该和赞助商一起回去弄清楚。然后再决定模型。在技术方面,数据仓库的ETL负载需要花费最多的精力和时间。采用关系模型时,即使只是加载少量GB,也需要耗费几个小时。

  除此之外,还能很好地理解可扩展性及相关问题。根据数据模型的复杂程度,可以对其实行标准化,不过声明关系数据模型是最佳方式,因为DW并不合适。

  对整个企业的数据仓库而言,多维模型是唯一的强大技术。业内有一些经典的例子,如P&G公司在80年代早期建立EDWard时,就实施多维模型。

  误读:如果没有汇总数据,数据仓库性能往往较低。

  一般情况下,人们的建议都是为了在针对数据仓库的多维模型中,拥有最低级别的操作数据。

  如果你认为由于没有汇总数据,DW性能将会较低,这就是一种谬论。没有具体目标或需求,就汇总或事先聚合数据仓库中的数据,是件非常危险的事。

  你必须真正理解哪些情形和条件下应该汇总数据。当然,在特定的情况下,事先聚合数据可以加快速度,但是不能忘记:汇总或事先聚合数据只是一种调整绩效的方法,而不是替换多维模型的架构。

  标准报告的报告需求是预先定义的,无需为用户制定专门的报告,此时拥有汇总后的表格可能就是个好主意。如果用户执行专门的报告,最好是掌握最详细的情形,避免在解决全新的商业需求时,陷入死胡同。

  误读:数据仓库的数据模型应该“通用”?

  我们曾碰到过许多例子,产品及其供应商都承诺:遵循常规的商业规则,输送通用的数据模型。我不知道这样如何给数据仓库传送有效价值。在数据模型中提供最小粒度的数据,有助于处理事先没有预见的商业问题。

  不过,拥有最小粒度的数据并不代表可以拥有通用的数据模型,这就意味着应用程序都能从通用数据模型中获取结果。你可以扩展数据模型,从而利用一致性数据,并根据特定的商业规则定义BI应用程序。

  数据模型应该针对应用程序而制定。拥有针对应用程序的数据模型,才能获得与该程序相关的度量标准。利润-亏损、成本-效益等度量标准不能在运行时查询或计算,这就是为什么ETL在后台准备数据,然后才呈现给使用数据的报告工具。

  如果你想建立通用的数据模型或商业规则,你就需要清楚地理解计算过程,以及报告前端的操作负载。由于设计原因,报告工具不能处理此类负载。这么做非常有利:评价应用程序以及其传输需求,使得数据模型针对某个应用程序,在需要的时候提供扩展空间。

  信息非常强大,而信息管理更像是管理学的行为科学理论,决策的关键因素在于人们利用有限的能力来处理信息,以及在限制条件下作出决策。

  新兴信息管理技术和技巧将会不断出现,现有技术将不断转型,这种情况实属正常。但是,“聪明的”决策和“平庸的”决策之间唯一的差异就是信息管理领导人员的能力。

  在不久的将来,我们需要更多的信息管理专家。领导者如果能够成功地控制信息,就能合理地利用现有信息和数据的价值。领导者应该能够清晰地区分信息管理领域每个数据点的事实和误区。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

相关推荐

  • IDC携华为发布白皮书,全面阐释数据中心云灾备

    华为是全球领先的信息与通信(ICT)解决方案供应商。作为负责任的稳健经营者、创新的信息社会使能者、合作共赢的产业贡献者,华为致力于构建更美好的全联接世界,丰富人们的沟通和生活。华为坚持围绕客户需求的持续创新,与合作伙伴开放合作,在电信网络、企业网络、终端和云计算等领域构筑了端到端的解决方案优势。通过全球专注敬业的17万名华为人,致力于为运营商客户、企业客户和消费者创造最大的价值,提供有竞争力的ICT解决方案、产品和服务。

  • 大数据风生水起 CRM如虎添翼

    随着互联网与信息技术的发展,全球数据量呈现了爆炸式的增长。移动通信技术、无线设备、社交网络、远程协作以及基于云的诸多服务都是导致数据呈几何增长的主要原因。

  • BI和真实数据分析降低云存储成本

    对于围绕云计算的所有应用来说,目前公共云服务中的应用只代表了IT总支出的一小部分。除非主流的、占企业预算大头的关键任务应用能够迁往公共云,否则这一态势将不会发生变化。

  • 渗透传统行业 云计算变革制造业九大方式

    云计算这股浪潮已经渗透到各个行业尤其是传统的生产制造领域,为何制造商也纷纷关注云计算呢?