工业和信息化精品系列教材——大数据技术

Hadoop大数据开发基础与案例实战(微课版)

以任务为导向,全面地介绍Hadoop大数据开发
分享 推荐 0 收藏 7 阅读 448
薛明志 , 简艳英 , 唐佐侠 (作者) 978-7-115-65577-6

关于本书的内容有任何问题,请联系 人邮社-赵亮

1.项目开发与理论教学紧密结合
为了使读者能快速地掌握并按项目开发要求熟练运用相关技术,本书在主要项目的知识点介绍后面都根据实际项目设计了相关实训,且在最后一个项目引入独立的综合案例分析,引导读者进行独立的学习与训练。
2.内容充实、实用
本书的实训内容紧紧围绕着企业真实项目进行,引导读者自主学习并深入思考,以灵活掌握所学知识。本书根据需要设置了“扩展阅读”“提示”“课外拓展”“知识链接”等模块,以方便读者深入了解相关内容。对于主要组件,本书在讲解完基本原理之后都引入了相应的操作讲解,以方便读者边学边练,做到学以致用。
3.校企合作
在编写本书过程中,编者积极开展校企合作,充分发挥学校、企业各自的优势,做到“优势互补,资源共享”。
4.资源丰富
提供微课、配套习题、源代码、多媒体课件等配套资源

内容摘要

本书较为全面地介绍了Hadoop的应用与开发。全书共11个项目,主要介绍了大数据的基本概念及应用领域、Hadoop的产生及其生态系统、搭建Hadoop集群、HDFS、MapReduce分布式计算、ZooKeeper、Hive数据仓库、HBase实战、Flume实战、Kafka实战等,还提供了1个综合案例分析,通过练习和操作实践,帮助读者巩固所学内容。
本书可以作为高等院校大数据技术专业“Hadoop大数据开发”课程的教材,也可以作为Hadoop大数据开发培训的教材,也适合大数据开发人员、大数据平台运维人员和广大大数据技术爱好者自学使用。

目录

走进大数据世界 1
项目导读 1
项目目标 1
课前学习 1
任务一 认识大数据 2
一、大数据产生的时代背景 2
二、大数据概念 3
三、大数据特点 4
四、大数据的应用领域 5
五、大数据的发展历程和发展趋势 7
任务二 认识大数据计算模式 9
一、批处理计算 9
二、流计算 10
三、图计算 10
四、查询分析计算 10
任务三 认识大数据处理流程 11
一、大数据采集 11
二、大数据预处理 11
三、大数据存储 12
四、大数据分析处理 12
五、大数据可视化 12
任务四 认识大数据信息安全 13
项目小结 14
项目考核 15


走进Hadoop世界 16


项目导读 16
项目目标 16
课前学习 16
任务一 认识Hadoop 17
一、Hadoop简介 17
二、Hadoop的产生与发展 17
三、Hadoop的特性 18
四、Hadoop版本变迁 18
五、Hadoop应用现状 20
任务二 认识Hadoop生态系统 21
任务三 认识Spark 23
项目小结 25
项目考核 25


搭建Hadoop集群 26


项目导读 26
项目目标 26
课前学习 26
任务一 安装CentOS 7 27
一、创建虚拟机 27
二、安装CentOS 7 29
三、克隆虚拟机 35
任务二 配置虚拟机集群环境 37
一、设置静态IP地址 37
二、修改主机名 40
三、绑定主机名和IP地址 41
四、配置SSH免密登录 43
任务三 搭建Hadoop分布式集群 44
一、安装JDK 44
二、安装与配置Hadoop 47
三、启动Hadoop分布式集群 51
项目实训 55
项目小结 55
项目考核 55


HDFS 57


项目导读 57
项目目标 57
课前学习 57
任务一 认识分布式文件系统 58
任务二 认识HDFS 58
一、HDFS简介 59
二、HDFS的特点 59
三、块 60
四、名称节点和数据节点 61
五、第二名称节点 62
任务三 认识HDFS运行机制 64
一、副本机制 64
二、高可用集群机制 64
三、心跳机制 66
四、数据回收机制 66
五、集群安全模式 66
任务四 HDFS工作流程 67
一、启动流程 67
二、读数据流程 68
三、写数据流程 68
任务五 HDFS基本操作 69
一、HDFS命令行操作 69
二、HDFS API操作 71
项目实训 74
项目小结 75
项目考核 75


MapReduce分布式
计算 76

项目导读 76
项目目标 76
课前学习 76
任务一 MapReduce概述 77
一、分布式并行计算 77
二、MapReduce简介 78
三、MapReduce的特点 79
任务二 MapReduce框架原理 80
一、MapReduce工作流程 80
二、数据分片 82
三、Map阶段 83
四、Shuffle阶段 83
五、Reduce阶段 84
任务三 Hadoop序列化 84
任务四 单词统计分析 86
一、MapReduce编程规范 86
二、设计思路 86
三、设计过程 87
四、代码实现 88
任务五 YARN资源调度管理框架 92
一、YARN基本架构 92
二、YARN的配置 93
三、将MapReduce程序提交给
YARN运行 95
任务六 案例分析 99
一、数据清洗案例 99
二、使用MapReduce求TOPN 103
三、MapReduce开发总结 108
任务七 MapReduce性能调优 109
一、MapReduce性能 109
二、MapReduce优化方法 110
三、常用的调优参数 111
项目实训 113
项目小结 113
项目考核 114


ZooKeeper 115


项目导读 115
项目目标 115
课前学习 115
任务一 ZooKeeper概述 116
一、ZooKeeper简介 116
二、ZooKeeper工作机制 116
任务二 ZooKeeper的安装与配置 117
任务三 搭建高可用集群 120
项目实训 126
项目小结 126
项目考核 126


Hive数据仓库 127


项目导读 127
项目目标 127
课前学习 127
任务一 Hive概述 128
一、Hive应用场景 128
二、数据仓库 128
三、Hive简介 129
任务二 Hive的安装与配置 131
一、MySQL数据库的安装 131
二、安装与配置Hive 133
三、验证Hive 136
任务三 表操作 138
一、创建数据库 138
二、查询数据库 138
三、删除数据库 139
四、Hive表 139
五、数据导入 144
六、数据导出 145
七、修改表 147
八、删除表 147
九、查询 147
任务四 Hive数据类型 152
一、基本数据类型 152
二、复合数据类型 152
任务五 Hive函数 154
一、内置函数 154
二、窗口函数 155
任务六 数据迁移工具Sqoop 156
一、Sqoop简介 156
二、安装Sqoop 157
三、导入导出数据 157
任务七 案例分析 160
一、汉字统计分析 160
二、统计日志数据 161
项目实训 164
项目小结 164
项目考核 164


HBase实战 166


项目导读 166
项目目标 166
课前学习 166
任务一 HBase概述 167
一、非关系型数据库简介 167
二、HBase简介 168
三、HBase实现原理 169
四、HBase的数据模型 171
任务二 HBase的安装与配置 173
任务三 HBase Shell命令操作 176
任务四 HBase Java API操作 178
项目实训 181
项目小结 182
项目考核 182


Flume实战 184


项目导读 184
项目目标 184
课前学习 184
任务一 Flume概述 185
一、Flume简介 185
二、Flume工作机制 186
任务二 Flume的安装与配置 188
任务三 采集日志数据到HDFS 188
任务四 采集文件数据到HDFS 191
任务五 采集端口数据到HDFS 192
项目实训 194
项目小结 194
项目考核 194


Kafka实战 195


项目导读 195
项目目标 195
课前学习 195
任务一 Kafka概述 196
一、消息队列 196
二、Kafka简介 197
三、Kafka工作机制 199
任务二 Kafka的安装 201
一、安装Scala 201
二、Kafka的安装步骤 202
任务三 组件验证部署 203
任务四 Kafka API 205
一、消息发送流程 205
二、异步发送API 206
三、Consumer API 208
任务五 案例分析 211
项目实训 213
项目小结 213
项目考核 214


综合案例分析 215


项目导读 215
项目目标 215
课前学习 215
任务一 案例简介 216
任务二 数据采集 216
任务三 数据预处理 217
任务四 离线计算 227
任务五 数据分析 233

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

薛明志,男,汉族,中共党员,博士,教授。商丘职业技术学院党委书记、院长。入选河南省“三五人才工程”第三层次科研人员,被评为2004年度河南省教育厅学术技术带头人,获得商丘市首届青年科技创新杰出奖,河南省高校优秀青年骨干教师,被评为2005年商丘市十佳青年科技专家

同系列书

  • Hadoop大数据开发基础与案例实战(微课版)

    薛明志 简艳英 唐佐侠

    本书较为全面地介绍了Hadoop的应用与开发。全书共11个项目,主要介绍了大数据的基本概念及应用领域、Hado...

    ¥59.80
  • 大数据分析技术与应用(微课版)

    宿佳宁 王林 于丽娜 尹洪岩 张磊 张成勇 副主编

    本书按照大数据分析流程,以电商产品数据为例,由浅入深地讲解大数据分析的核心开发技术,以及大数据分析工具及其组件...

    ¥49.80
  • 大数据采集与预处理(微课版)

    宋磊 陈天真 崔敏 伞颖 刘莹 牛曼冰

    本书按照大数据采集与预处理的实现流程,由浅入深地讲解大数据采集与预处理的相关技术,以及如何使用不同方式对大数据...

    ¥56.00

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部