医生常常告诫我们:"预防是最好的药物!"。对数据质量管理,这句话也是应该严格遵守的至理名言。越早发现潜在的数据问题,越有可能以较小的成本,较快的速度处理这些问题。在商业系统的应用管理方面,这也是数据质量管理的基本要求。
预防性的数据质量管理似乎是个无可辩驳的真理,但是,非常多的数据仓库和商业智能项目团队并没有在计划中体现数据质量管理的问题。如果问到"为什么在项目中没有数据质量管理的计划?"时,通常得到的回答则是,"数据质量是源系统的问题"。从某些层面上看,这是个事实,让数据仓库或商业智能团队向最终用户提供精确的数据有点吹毛求疵。
数据质量管理如此重要。那么提供数据质量的解决方案,就需要回答一个问题,数据质量管理应该体现在数据仓库/商业智能项目计划中的那些部分呢?答案是:将数据质量管理有机的集成到项目的每个阶段中,从需求到设计、一直到产品。一点具体的建议如下:
将数据质量度量作为业务需求收集和计划排程的一部分。从业务的角度,需要定义数据质量和它们的量度。一个小的Tips, 如果尚有无法进行度量的数据质量问题,暂时不要把他们放到当前的计划中。
从业务的角度思考、并决定,如何在开发和Operational过程中进行数据质量问题管理。首先,从业务的角度定义需要监控和修复问题的优先级。同时,也最重要的是,从资源、时间、和成本的角度同业务需求方在成本上达成一致 – – 较高的数据质量需求,需要付出更高的成本。
运用已有共识的质量度量,从数据起源到数据消费,在整个过程中监控数据的质量。这包括所有的数据抽取、转换和加载过程,并一直到用于报表和BI环境中的数据存储,包括:数据仓库、ODS、Data Marts、Cubes和Data Shadows Systems. 我们需要能够在数据流的所有阶段,直到这些数据在报表和分析中消费的整个过程中来监控数据的质量。
创建数据质量管理仪表盘监控数据质量。这能够帮助业务和IT人员充分了解当前的数据质量并采取恰当的行动。数据质量仪表盘需要包括数据质量的趋势报告,辅助分析数据质量的发展趋势- -正在变好,还是变的更糟。数据质量告警也能够帮助采取更加主动的方式进行纠正。不要等待业务人员发现那些错误的数字已经被用在了重要的决定中。
数据仓库和BI中数据质量活动不要 "事后诸葛亮"。但是,如果你还没来得急遵循这些关于数据质量的建议,你也并不孤独。许多的公司仍然还在争论数据质量管理的问题。最好的行动是解决目前面临的数据质量问题,来避免用漫长的、痛苦的治疗过程。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
云应急响应和取证:企业须知
很多企业已经在以一种或者另外的格式使用云,这取决于服务模型——基础架构即服务,软件即服务或者平台即服务——需要按需采用对应的应急响应和取证调查流程来支持云计算服务。
-
优化混合云性能:数据管理技巧大公开
对于许多企业来说,建立混合云是在他们2016年的首要任务。而虽然成功部署混合云的模型本身就是一个成就,只是在私有云和公有云之间拥有互操作性和稳定性仍然是不够的。
-
选择云服务提供商的五大标准
云计算市场风起云涌,已经是国内、国际厂商的兵家必争之地,根据甲骨文的观察,即使在国内用户对云计算的接受程度已经越来越高,但随着市面上云平台、云服务的种类和数量不断攀升,许多企业身处云计算的浪潮,如何精确地评估自己的需求,通过云计算的优势增强自身的核心竞争力,是目前这些企业所面临的最大难题。
-
仅凭SOA和云无法解决业务数据管理风险问题
SOA和云可以是某些恼人问题高效的解决方案;这一点我们已经知道了。但是也要记住它们并不是所有事情的直接答案,特别是当你的问题是业务数据管理风险,而不是技术问题时。