Hadoop是目前比较流行的大数据框架之一,可使用简单的高级编程模型实现大型数据集的分布式存储和处理。
本书以Hadoop的概念、集群搭建、核心组件、实战案例等为主线,较为全面地介绍了Hadoop大数据存储及处理技术的相关知识。全书共10章,前9章主要讲解Hadoop基础,内容包括初识Hadoop、Hadoop的安装与配置、高可用与联邦、分布式文件系统HDFS、集群资源管理系统YARN、分布式计算框架MapRecuer、Hadoop的I/O操作、Hadoop3.x新特性、Hadoop商业发行版等;第10章是Hadoop实战案例,以实际Hadoop框架的运用为导向引入了三个实战案例:文件合并及多目录输出、网页域名分区统计以及电商平台商品评价数据分析案例。
我要评论