本书以Kettle工具实现ETL流程为目标,将ETL知识点与项目任务相结合,配套真实的案例,按照ETL的流程,循序渐进地介绍了ETL数据整合与处理的相关内容。全书共6个项目,项目1介绍了ETL概念和ETL工具;项目2以食品销售数据为例,介绍了获取不同类型源数据的方法,并说明了它们之间的差别;项目3以整合和处理某供应链的食品销售数据为案例,从获取多份源数据开始,经过数据清洗、删除、合并、去重、排序、过滤和输出等一系列与ETL流程相匹配的任务操作,整合和处理成一份符合项目阶段目标要求的数据,能帮助读者快速理解和掌握ETL;项目4以项目3的阶段目标数据作为源数据,介绍了如何进行数据计算和统计的方法,并将统计结果输出到不同类型的数据文件中,帮助读者从业务上理解数据计算和统计的要求,以及结果输出;项目5介绍了Kettle的任务执行方式,构建任务操作流程,设定调度时间,自动执行项目3整合和处理食品销售数据的任务;项目6介绍了无人售货机ETL项目,通过项目案例的形式,帮助读者将所学知识融会贯通。
我要评论