普通高等教育软件工程“十二五”规划教材

数据仓库与数据挖掘

数据仓库、数据挖掘、大数据、大数据管理
分享 推荐 2 收藏 41 阅读 7.1K
袁汉宁 , 王树良 , 程永 , 金福生 , 宋红 (编著) 978-7-115-38827-8

关于本书的内容有任何问题,请联系 孙澍

(1)利用软件工程组织内容。
(2)讲述了数据仓库的基础知识和工具
(3)研究了数据挖掘的任务及其挑战
(4)给出了经典的数据挖掘算法
(5)介绍了数据挖掘的产品
(6)剖析了税务数据挖掘的案例
(7)探索了大数据的管理和应用问题
¥39.00 ¥33.15 (8.5 折)
教学资源仅供教师教学使用,转载或另作他用版权方有权追究法律责任。

内容摘要

本书将数据视为基础资源,根据软件工程的思想,总结了数据利用的历程,讲述了数据仓库的基础知识和工具,研究了数据挖掘的任务及其挑战,给出了经典的数据挖掘算法,介绍了数据挖掘的产品,剖析了税务数据挖掘的案例,探索了大数据的管理和应用问题。
全书深入浅出,强调基础,注重应用,是软件工程及相关专业的高年级本科生、研究生的理想教材,亦可作为相关领域的参考用书。

目录

第 1 章数据仓库和数据挖掘
概述.................................... 1
1.1 概述............................................................1
1.1.1 数据仓库和数据挖掘的目标.............1
1.1.2 数据仓库与数据挖掘的发展历程.........2
1.2 数据中心....................................................4
1.2.1 关系型数据中心.................................4
1.2.2 非关系型数据中心.............................4
1.2.3 混合型数据中心(大数据平台) .....6
1.3 混合型数据中心参考架构........................7
1.3.1 基础设施层.........................................8
1.3.2 数据源层.............................................8
1.3.3 交换服务体系.....................................8
1.3.4 数据存储区.........................................9
1.3.5 基础服务层.......................................10
1.3.6 应用层...............................................12
1.3.7 用户终端层.......................................12
1.3.8 数据治理...........................................12
1.3.9 元数据管理.......................................12
1.3.10 IT 安全运维管理............................13
1.3.11 IT 综合监控....................................14
1.3.12 企业资产管理.................................14
思考题...............................................................14
第 2 章 数据.................................. 15
2.1 数据的概念..............................................15
2.2 数据的内容..............................................15
2.2.1 实时数据与历史数据.......................15
2.2.2 事务数据与时态数据.......................16
2.2.3 图形数据与图像数据.......................16
2.2.4 主题数据与全局数据.......................17
2.2.5 空间数据...........................................17
2.2.6 序列数据和数据流...........................18
2.2.7 元数据与数据字典...........................19
2.3 数据属性及数据集..................................20
2.4 数据特征的统计描述..............................21
2.4.1 集中趋势...........................................21
2.4.2 离散程度...........................................23
2.4.3 数据的分布形状...............................24
2.5 数据的可视化..........................................24
2.6 数据相似性与相异性的度量...................27
2.7 数据质量..................................................30
2.8 数据预处理..............................................31
2.8.1 被污染的数据...................................31
2.8.2 数据清理...........................................33
2.8.3 数据集成...........................................34
2.8.4 数据变换...........................................35
2.8.5 数据规约...........................................36
思考题 ...............................................................36
第 3 章 数据仓库与数据 ETL
基础.................................. 37
3.1 从数据库到数据仓库..............................37
3.2 数据仓库的结构......................................38
3.2.1 两层体系结构...................................39
3.2.2 三层体系结构...................................39
3.2.3 组成元素...........................................40
3.3 数据仓库的数据模型..............................41
3.3.1 概念模型...........................................41
3.3.2 逻辑模型...........................................41
3.3.3 物理模型...........................................44
3.4 ETL...........................................................44
3.4.1 数据抽取...........................................45
3.4.2 数据转换...........................................46
3.4.3 数据加载...........................................46
3.5 OLAP........................................................47
3.5.1 维.......................................................47
3.5.2 OLAP 与OLTP.................................47
3.5.3 OLAP 的基本操作............................48
3.6 OLAP 的数据模型...................................49
3.6.1 ROLAP..............................................49
3.6.2 MOLAP.............................................50
3.6.3 HOLAP .............................................50
思考题 ...............................................................51
第4 章数据仓库和 ETL 工具....... 52
4.1 IBM DB2 V10..........................................52
4.1.1 自适应压缩.......................................52
4.1.2 多温度存储.......................................53
4.1.3 时间旅行查询.........................

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

王树良,男,1975年生,工学博士,双博士后,武汉大学教授,博士生导师,美国Carnegie Mellon University的 iCarnegie 教师,现任北京理工大学软件学院副院长、副书记。全国百篇优秀博士学位论文、国家测绘科技进步一等奖、湖北省自然科学优秀学术论文二等奖、“花旗集团金融信息科技教育基金”优秀奖教金、第七届“武汉大学杰出青年”等荣誉获得者。新西兰惠灵顿理工大学、澳大利亚昆士兰大学、香港理工大学等大学访问学者。担任International Journal of System Science、 International Journal of Data Mining and Data Warehousing、Lecture Notes in Artificial Intelligence等学术刊物的Guest Editor,Data Mining and Knowledge Discovery、International Journal of General System、Information Science、International Journal of Geographical Information Science、ISPRS Journal of Photogrammetric and Remote Sensing、PE&RS等学术期刊审稿人,国家863、国家自然科学基金等项目评审人,International Conference on Advanced Data Mining and Applications学术委员会合作主席,International Symposium on Multi-spectrum Image Processing and Pattern Recognition、International Conference on Supply Chain Management and Information Systems等学术委员会委员。主要研究方向包括空间数据挖掘、软件工程等,发表学术论文多篇,其中大部分为SCI、EI、ISTP所收录,在国内外出版专著6部,其中Springer出版2部、SPIE出版1部。 主要教学经历   (1)本科生:数据库系统 数据仓库与数据挖掘概论   (2)硕士研究生:高级数据库 数据仓库与商务智能 数据挖掘与知识发现 数据仓库与数据挖掘(3)博士研究生:空间数据挖掘

推荐用户

同系列书

  • 软件工程——理论与实践(附微课视频 第2版)

    吕云翔

    内容提要 本书按照典型的软件开发过程来组织内容,旨在培养读者具备软件工程思想及实际软件开发的能力...

    ¥59.80
  • IT项目管理(第2版)

    郭宁

    本书针对IT项目管理的特点,以IT项目为研究对象,对IT项目管理的主要内容进行了较为系统的研究,对项目的9个知...

    ¥49.80
  • C++程序设计(第2版)

    宋春花

    本书是为已有C程序设计基础、想学习C++面向对象程序设计的读者编写。全书共分9章:第1、2章介绍了面向对象程序...

    ¥45.00
  • C++程序设计习题解析与实践教程

    宋春花

    本书是宋春花、吕进来等老师编写的《C++程序设计(第2版)》(人民邮电出版社出版)的配套教材。内容共分三部分:...

    ¥39.80
  • 软件测试(慕课版)

    郑炜

    基础篇,第1-6章,第1章 软件测试基础,第2章 软件测试策略,第3章 黑盒测试与测试用例设计,第4章 白盒测...

    ¥49.80

购买本书用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部