本书共11章,从Hadoop概述开始,介绍Hadoop的安装、配置与管理,并对Hadoop的生态体系架构进行介绍,包括HDFS技术、YARN技术、MapReduce技术、Hadoop I/O操作、海量数据库技术HBase、ZooKeeper技术、分布式数据仓库技术Hive,以及Hadoop与RDBMS数据迁移工具Sqoop,最后对大数据实时处理技术进行介绍,旨在让读者了解当前其他的大数据处理技术。本书还包括丰富的实践操作,实现理论与实践的有机结合。
本书除介绍Hadoop的理论外,还介绍如何使用各组件,但因为只介绍基础的使用方法,没有涉及底层的高级内容,所以本书只起引导作用。本书旨在让读者了解Hadoop并能够使用Hadoop的基本功能,并不是学习Hadoop的完整手册。
本书适合作为高等院校和职业院校大数据、物联网、云计算及其他计算机相关专业的教材,也可供云计算与大数据技术相关专业的培训班使用。
我要评论