本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoop和Flume、数据分发工具Kafka、MapReduce计算框架与应用、基于内存的计算框架Spark、Spark的安装与应用、机器学习、基于Hive的交互式数据处理、数据同步工具与数据可视化和推荐算法与应用。本书在介绍Hadoop、HBase、Sqoop和Flume、MapReduce、Hive和Spark等相关章节时安排了入门级实验,且以电子资源的方式提供给学生,以便读者更好地学习和掌握大数据的关键技术。
本书可以作为高等院校计算机类、信息管理与信息系统等相关专业的大数据课程教材,也可供从事大数据技术开发、研究和应用的研究人员和工程技术人员参考。
我要评论