BI的八大误区

　　随着信息管理逐步得到认可，对信息检索、获取、组织和维护整个过程而言，良好的治理变得越来越重要。

　　信息和决策过程分析中的一个关键因素就是设计思维、态度得到改善。决策人员在有限的条件下，利用良好的流程和方法作出决策，只有这样，人们对信息管理的需求和渴望才能从技术上变成可行。

　　由于所有的信息最终由个人加以管理，因此只要有人们的干预，就会存在各种误读。我曾在信息管理领域遭遇以下八种误读。

　　误读：绩效管理并非BI解决方案。

　　毋庸置疑，绩效管理是今年的流行词汇。绩效管理与BI密切相关。实际上，任何新兴词汇都需要依赖一定的时间和特定的模式，才能真正付诸于实施和利用。

　　这就好比一种新技术进入市场，必然需要宣传、承诺，也会引起一些顾虑。一些绩效管理供应商认为，绩效管理有别于BI。

　　我认为这完全是一种谬论。为了解决这个问题，我们首先对商业绩效管理下个定义。商业绩效管理可以视为一种解决方案:利用特定方法，主动识别风险和问题，提升流程和进程。这就有助于主动而非被动地预测和回答“如果……将会怎样”的问题。

　　但是在将绩效管理作为战略措施之前，公司需要做一些准备工作:评估绩效管理措施的真正性质和目的，以及管理环境是否可以采用绩效管理工具。只有底层系统稳定和可靠时，绩效管理工具才能有效工作。

　　对绩效管理而言，底层系统就是可靠的数据仓库、BI架构和基础设施。许多公司的数据仓库看起来依然像是操作系统的镜像。这种情况下，你就无法从绩效管理投资中获取回报。最终，绩效管理供应商会为你建立完整的BI和DW，而绩效管理解决方案通常不能提供此项服务。

　　误读：DW和BI是技术解决方案。

　　将DW/BI解决方案视为技术解决方案是一种谬论，因为DW/BI不是产品，而是许多工具和技术的集合，从而使得公司能够以更加快速而有效的方式回答决策问题。

　　实际上，DW/BI是商业解决方案。BI/DW这个术语已经存在几十年了，但是IT界依然盛传这种谬论:BI/DW 就是利用工具实现传输，不管是利用ETL工具还是报告工具。我们经常在这些方面听到BI/DW:传输了多少报告，创建了多少仪表盘，以及批处理花费了多少加载时间。

　　但是我们很少在“这种方案能够解决这些商业问题”等方面听到BI/DW。关于BI/DW的成功标准（良好的设计、最好的工具、合适的员工）、BI/DW的失败缘由（数据质量、需求集中不充分），你可以找到许多文章。

　　但是很少有文章会强调，你给DW引入多少数据并不重要，但是与商业价值相关。这就意味着BI/DW解决方案在产生收入和节约成本方面具有终极价值。我们很多人可能都知道这个事实，但是能定期了解基本情况总是有好处，尤其是数据仓库的基本情况，这可以保证投资、视角、方向的正确性。

　　误读：你无法明确地衡量ROI和BI投资。

　　衡量投资收益率有赖于各种因素，如公司情况、确定度量标准的人员、有形和无形的衡量方式、直接和间接的收益。所有的这些在BI/DW工程和项目中都真实存在。你无法管理你不能衡量的东西。因此，你可以计算ROI。

　　这非常简单。但是，ROI的计算方式可不简单。好在目前BI/DW已经趋于稳定和成熟的状态，一些指导手册就可用于计算BI投资的ROI和TCO（总拥有成本）。用于完成计算的关键因素包括:基础设施成本;服务成本（软件供应商和服务供应商）;员工成本（境内和境外）。

　　这些因素都可以根据需求条件加以扩展，从而算出ROI。这些因素的衡量标准都可以量化。此时即为有形的衡量标准。还可以深入分析各种衡量标准，比如每个用户的成本是多少，或者每TB的成本是多少，从而获取相关信息以及下一步计划，预测数据的增长情况。

　　即使如此，ROI和TCO依然非常容易受到个人和公司的影响。手册可以指导更加详细的研究和关注领域，从而形成特定的衡量标准。这些与ROI和TCO相关的细节都是有形的标准。如果投资是一定的金额，成本是别的金额，那就没有办法了，ROI和TCO都无法量化。

　　误读：数据治理是一项工程。

　　工程具有明确的起止日期。但是数据治理过程必须要涉及人员、过程、程序、策略和技术等，才能以安全和可控的方式处理公司数据。

　　BI/DW工程的本质都是数据治理，与企业的标准相符。这些项目没有终端数据。数据治理从来都不是一项工程，但却是完整的项目。数据治理的生命周期很长，贯穿业务的运行过程，必须支持治理技术才能运行该业务。

　　总而言之，数据治理项目应该系统化，公司应该持续投资。这一点非常重要，所有的公司都会经常发生变化。因此，数据治理措施应该动态地适应商业措施和技术实践带来的变化。究竟是自上而下还是自下而上地实施项目，应该由企业及其实施意愿来决定。

　　数据治理项目可以自动开始解决数据质量、数据安全等其它问题，人们对这些领域的投资有所怀疑，或者至少他们不知道如何衡量这些投资收益率。

　　根据我的理解，从投资角度而言，数据治理这个概念相对较新;我认为这是由于人们和公司的文化、心态发生了变化，而这种变化也对公司造成了威胁。我们都会抗拒变化，这十分正常。但是，让员工了解这些变化、重要性以及为公司带来的回报，可以解决这个问题。

　　尽管数据隐私和保护的概念比较陈旧，数据治理却相对较新，能够满足流程和程序，从而达成公司的目标。只要有人干预现有的流程或协议，就应该制定相应的治理策略和控制措施。

　　误读：灾难恢复预案只适用于处理关键数据的金融公司。

　　实际上，灾难恢复针对所有运行关键应用程序、期待业务连续性、以及可能发生灾难的公司。

　　当我提出应该拥有DR解决方案时，一位来自中等规模公司的客户说，“我们不需要DR方案或策略，因为我们并不运行任何关键信息。”我觉得这种想法非常有趣，我接着问：“你是否在乎系统今天着火，这还与公司无关吗？”

　　显然，和公司有关，但是他们认为，为何要在一些可能发生也可能不发生的事情上浪费资金呢？只有当丢失的数据不会影响业务时，这种想法才有可能正确。

　　我总是保留个人数据的备份。对我而言，个人数据非常重要，我只是在这种情况下才采取必要的防御措施。我确信大多数人会这么做。我们无力承担丢失个人数据的风险，因此，我认为任何公司或业务也都无力承担丢失数据的风险。

　　简而言之，每个人都需要一定的灾难恢复预案。这就像备份内部和外部驱动器，或部署热站一样简单。这得根据灾难发生时，公司能够承担的数据丢失程度而定。

　　直到过去几年，灾难恢复才被视作数据仓库的性能，更确切地说，直到商业开始实时捕捉交易、作出决策才如此。

　　目前，各种实施场景和架构必须符合个人选择和解决方案的需求。在设计DR解决方案时，总是在成本和收益之间寻求平衡。包括在远程站点拥有热备份，连夜将磁带运输到DR中心等。

　　成熟的DW系统能够认真规划和设计容量，因此DR系统可以每天使用，在发生灾难时发挥DR中心的功能。认真设计架构，你就能提高DR投资的效率，从而在日常业务中发挥作用，而不是等灾难发生时才简单地部署DR系统。一旦明确了临界状况，例如，一旦公司能够从“常规”信息中识别出“必需”信息，就可以识别服务级别，制定合适的战略。

　　误读：关系数据库模型是所有决策系统的最佳数据模型，而多维数据模型只适用于特定的领域和区域。

　　关系模型属于ER模型，这种设计技术能解决最小粒度的数据因素之间的关系。这是一种针对事务处理系统的完美技术，而多维模型的概念可以满足终端用户对数据的查询和检索需求。但是，两种模型的目标截然不同，应根据空间和情形分别运用。

　　我认为，这两种设计模型最大的联系在于ER模型可以分解为多个多维模型。由于BI/DW系统是利用近期数据和历史数据，解决用户的分析和查询问题。因此，多维模型设计技术是唯一能实现这一目标的技术。

　　许多咨询师认为，关系模型是处理数据仓库中数据的最佳方法。人们更加强调首次建立的数据仓库。

　　我曾听到人们对这种方法的争论:“你并不知道自己想如何处理数据仓库，因此利用关系模型建立数据仓库就是个好主意，因为关系模型能够消除冗余，而不是一直添加数据层，否则真正需要数据时可能就无法获取。”

　　对于这种争论，我认为如果你不知道想要如何处理数据库，就应该和赞助商一起回去弄清楚。然后再决定模型。在技术方面，数据仓库的ETL负载需要花费最多的精力和时间。采用关系模型时，即使只是加载少量GB，也需要耗费几个小时。

　　除此之外，还能很好地理解可扩展性及相关问题。根据数据模型的复杂程度，可以对其实行标准化，不过声明关系数据模型是最佳方式，因为DW并不合适。

　　对整个企业的数据仓库而言，多维模型是唯一的强大技术。业内有一些经典的例子，如P&G公司在80年代早期建立EDWard时，就实施多维模型。

　　误读：如果没有汇总数据，数据仓库性能往往较低。

　　一般情况下，人们的建议都是为了在针对数据仓库的多维模型中，拥有最低级别的操作数据。

　　如果你认为由于没有汇总数据，DW性能将会较低，这就是一种谬论。没有具体目标或需求，就汇总或事先聚合数据仓库中的数据，是件非常危险的事。

　　你必须真正理解哪些情形和条件下应该汇总数据。当然，在特定的情况下，事先聚合数据可以加快速度，但是不能忘记:汇总或事先聚合数据只是一种调整绩效的方法，而不是替换多维模型的架构。

　　标准报告的报告需求是预先定义的，无需为用户制定专门的报告，此时拥有汇总后的表格可能就是个好主意。如果用户执行专门的报告，最好是掌握最详细的情形，避免在解决全新的商业需求时，陷入死胡同。

　　误读：数据仓库的数据模型应该“通用”?

　　我们曾碰到过许多例子，产品及其供应商都承诺:遵循常规的商业规则，输送通用的数据模型。我不知道这样如何给数据仓库传送有效价值。在数据模型中提供最小粒度的数据，有助于处理事先没有预见的商业问题。

　　不过，拥有最小粒度的数据并不代表可以拥有通用的数据模型，这就意味着应用程序都能从通用数据模型中获取结果。你可以扩展数据模型，从而利用一致性数据，并根据特定的商业规则定义BI应用程序。

　　数据模型应该针对应用程序而制定。拥有针对应用程序的数据模型，才能获得与该程序相关的度量标准。利润-亏损、成本-效益等度量标准不能在运行时查询或计算，这就是为什么ETL在后台准备数据，然后才呈现给使用数据的报告工具。

　　如果你想建立通用的数据模型或商业规则，你就需要清楚地理解计算过程，以及报告前端的操作负载。由于设计原因，报告工具不能处理此类负载。这么做非常有利:评价应用程序以及其传输需求，使得数据模型针对某个应用程序，在需要的时候提供扩展空间。

　　信息非常强大，而信息管理更像是管理学的行为科学理论，决策的关键因素在于人们利用有限的能力来处理信息，以及在限制条件下作出决策。

　　新兴信息管理技术和技巧将会不断出现，现有技术将不断转型，这种情况实属正常。但是，“聪明的”决策和“平庸的”决策之间唯一的差异就是信息管理领导人员的能力。

　　在不久的将来，我们需要更多的信息管理专家。领导者如果能够成功地控制信息，就能合理地利用现有信息和数据的价值。领导者应该能够清晰地区分信息管理领域每个数据点的事实和误区。

我们一直都在努力坚持原创.......请不要一声不吭，就悄悄拿走。

我原创，你原创，我们的内容世界才会更加精彩！

【所有原创内容版权均属TechTarget，欢迎大家转发分享。但未经授权，严禁任何媒体（平面媒体、网络媒体、自媒体等）以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget

官方微博

TechTarget中国

取消回复

要发表评论，您必须先登录。

取消回复

相关推荐

IDC携华为发布白皮书，全面阐释数据中心云灾备

大数据风生水起 CRM如虎添翼

BI和真实数据分析降低云存储成本

渗透传统行业云计算变革制造业九大方式

BI的八大误区

取消回复

相关推荐

IDC携华为发布白皮书，全面阐释数据中心云灾备

大数据风生水起 CRM如虎添翼

BI和真实数据分析降低云存储成本

渗透传统行业 云计算变革制造业九大方式

渗透传统行业云计算变革制造业九大方式