大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core、Spark SQL、Spark Streaming等知识。
本书紧密结合实际应用,运用大量案例说明和实践,提炼含金量十足的开发经验。另外,本书配以多元的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等学习内容,为读者带来全方位的学习体验。
关于资源获取的问题,请读者添加QQ服务号:1934786863,咨询本书所需开发工具、素材、线上视频等资源。
资源包中涵盖教学所用PPT、教材案例、作业及答案、PPT案例代码、源文件、拓展练习、补充素材、扩充作业等146个文件,其中部分教学PPT、02教学案例和03本章作业,认证教师可以直接点击下载,对于更多完整的案例和拓展素材,订书老师可以分别联系对应区域的老师索要。联系方式见下表: