过失
1
:如果您创建了数据仓库,它们的用途自然显现出来了
在构造数据仓库之前,一定不能盲目自信。成功的
DW
规划必须考虑整个企业的需要并开发出一系列文档说明的需求以引导工程的设计、构造和展示。
过失
2
:遗漏了体系结构框架
全面的体系结构框架的开发和维护是成功地构建
DW
的最重要因素之一,框架必须给出构造的蓝图以及不同
DW
组件的用途。体系结构中必须考虑期望的终端用户数量、数据容量及多样性,数据的更新周期等问题。
过失
3
:理解用文档对假设进行说明的重要性
DW
相关假设和潜在数据冲突必须包含在项目体系结构的框架中,需要尽早地在项目文档中被确定和系统化,以确保在最终产品中反映出来。比如可以加载多少数据,期望数据粒度,多长时间需要对数据进行更新,在那些平台上开发和实现
DW
等问题。
过失
4
:没有使用正确的工具
DW
设计和构造在很多方面都不同于
OLTP
应用系统的构造,
DW
工程需要完全不同的工具:
(
1
)分析工具:标识数据需求,
DW
主要数据源以及数据模型的构造,比如
CASE
工具
(
2
)开发工具:负责
ETL
过程,代码生成,集成等
(
3
)实现工具:收集、处理、清洗、复制和合并仓库中所包含的数据的数据获取工具
(
4
)交付工具:进行数据转化,数据推导以及向最终的交付平台输出报表,比如查询和报表用的数据词汇表的产生和访问之用的特殊工具。
过失
5
:滥用生命周期
数据仓库生命周期(
DWLC
)和传统系统开发生命周期的最大区别在于
DWLC
永不结束,它是一个持续行为的集合,从对
DW
需求的最初研究经过数据管理再返回。一般来讲,
DW
每个阶段完成后,都会根据新的数据需求、增加的客户群和新的数据源开始一个新的阶段。
过失
6
:忽略了数据冲突问题
要设计出好的
DW
,不得不进行大量的、非常冗长的分析以及确定企业内可用的最佳数据源。标识数据源系统后,需要解决不同命名习惯,文件格式大小,值范围相关冲突等等,这个解决过程需要与数据所有人协作以对未来可能对源数据进行的计划修改或未计划的修改达成共识。如果没有用充分的时间和资源来解决数据冲突问题,将会延迟构建仓库的开始时间并可能导致危害项目成功的僵局。
过失
7
:没有从失败中吸取经验教训
最好对以往项目过程的过失和错误做下详细记录
凡是有该标志的文章,都是该blog博主Caoer(草儿)原创,凡是索引、收藏
、转载请注明来处和原文作者。非常感谢。