【IT专家网独家】本系列连载强调企业在发展商业智能(BI)和数据仓库(DW)能力的方法上需要“变得慎重”。在追求这一能力时,采取整体的观点以及有步骤的投资和执行很重要。要发展这一能力的未来远景,应该考虑七个相关领域:
1、战略
2、人员
3、流程
4、度量
5、应用程序
6、数据
7、架构
这是探讨“数据”重点领域的关键考虑的第二篇文章。在关于数据的专栏的第一部分讨论了获取数据来源和集成方面的考虑,但还有许多其他与数据有关的主题需要考虑。
部分最具挑战性但也是最重要的数据考虑与以下领域有关:
主数据管理
数据安全管理
数据质量管理
在行业中这些数据管理领域最近已被归入企业信息管理的庞大主题下。这主要是认可了一个事实,即实际上不仅仅BI/DW关注这些领域而且它们也非常需要在所有企业系统中加以解决并需要来自企业各个领域的业务人士的参与。
主数据管理
“为什么我不能将这些报告上卷(roll up)到同一领域?”
这一问题代表了业务用户在解决企业BI和DW问题时的共同挫折。源系统通常在互相孤立的情况下被设计,各个系统只解决特定流程或职能的需求。在试图将多个系统的数据集中到一起时,你将很快发现在你期望数据值会是一致的时候它们却并不匹配。
这种情况通常发生在主数据和参考数据上。主数据的例子如客户、产品、雇员、公司位置和供应商列表。参考数据的例子则是对主数据进行描述或分类的数据――如区域、行业、产品类型、雇员类型列表等。这些主数据和参考数据列表通常具有层级关系――比如产品家族――其在不同系统中的表示也通常是不同的。
由于在这些数据问题都被在源中加以解决时BI的报告和分析需求并不会停止,解决这一问题的有效方法是在数据被带入BI/DW数据库时建立映射/交叉参考功能。这提供了将数据映射到某种形式的企业标准的机制,这样数据就能以统一的方式被报告。另外,这一映射过程也可以用于增加新的参考数据值或新的层次上卷级别以支持特定的报告需求。
在数据源间建立主数据值映射是一个好的起点――但它也带来了自身的一些问题。例如,如果人们过去习惯于在他们最常使用的源系统产生的报告中以某种形式查看产品层级,那他们就会在来自企业BI/DW应用程序的报告中看到不同的形式――这实际上会增加他们的混乱――尽管你最初是想通过将所有数据都映射到企业标准来消除混乱。另外,你将需要指派人员在主/参考数据值发生变化时负责更新映射,同时还要指定对映射进行定期评估的业务流程。

