第一十二章 数据抽取、转换和加载
第五节 ETL的设计过程
(1)数据源和ODS之间的对应
需要记录源数据和目标数据的数据库类型、服务器IP、数据库名称、用户名和密码。
在进行ETL设计时,需要设定抽取的周期、抽取的字段和抽取的条件等。
ODS设计见表12-9。
表12-9 ODS设计
数据源和ODS之间的对应见表12-10。
表12-10 数据源和ODS之间的对应
(2)ODS和数据仓库之间的对应
需要记录源数据和目标数据的数据库类型、服务器IP、数据库名称、用户名和密码。
在进行ETL设计时,需要设定抽取的周期、抽取的字段和抽取的条件等。
数据仓库设计见表12-11。
表12-11 数据仓库设计
ODS和数据仓库之间的对应见表12-12。
表12-12 ODS和数据仓库之间的对应
(3)数据仓库和数据集市之间的对应
需要记录源数据和目标数据的数据库类型、服务器IP、数据库名称、用户名和密码。
在进行ETL设计时,需要设定抽取的周期、抽取的字段和抽取的条件等。
其中事实表的设计见表12-13。
主题描述:按时间、地区、行业、统计客户购买商品的信息进行描述,并且进行同期比较(例如对2011年1月和2010年1月进行对比)。
表12-13 事实表的设计
表12-14 地区维表
地区维表的设计见表12-15。
表12-15 地区维表的设计
行业类别维表见表12-16。
表12-16 行业类别维表
行业维表的设计见表12-17。
表12-17 行业维表的设计