【主要修订情况】
1. 在篇章设计上,全书依然分为四大部分,包括大数据基础篇、大数据存储与管理篇、大数据处理与分析篇和大数据应用篇。
2. 在内容上主要进行以下修订:
(1)对所有大数据软件的版本进行了升级,升级到了当前最新的稳定版本;
(2)由于流计算框架Storm已经逐渐被Flink取代,因此删除了Storm的详细介绍;
(3)数据可视化技术放在“大数据导论”课程中学习,不列入本书。从严格意义上来讲,数据可视化技术通常不涉及分布式特性,不需要借助于集群进行处理,因此,删除了数据可视化的内容;
(4)对大数据应用章节的内容进行了凝练,从原来的三个章节内容合并成一个章节,并精简了部分内容;
(5)数据仓库和数据湖概念对于大数据从业人员十分重要,因此,增加了一个章节介绍数据仓库和数据湖;
(6)在“Hadoop再探讨”章节中,删除了Pig、Tez和Kafka的介绍。
我要评论