机器学习(第2版)

掌握机器学习的一本不可多得的好书,在第1版的基础上进行了更新和修订,并入选工信部“十四五”规划教材。
分享 推荐 12 收藏 191 阅读 18.3K
赵卫东 (作者) 978-7-115-59848-6

关于本书的内容有任何问题,请联系 张斌

工信部“十四五”规划教材,工信出版学术基金项目,新时代复旦大学精品教材。
详述机器学习的课程要点和发展前沿,强调基本概念和机器学习算法,丰富了深度学习、强化学习的内容。
引入真实企业实战案例,理论与实际应用场景结合,实践指导性强。
配套中国大学 MOOC 在线课程,配套资源齐全。

内容摘要

机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书涵盖机器学习和深度学习的基础知识,主要包括机器学习基础、统计分析、分类、聚类、文本分析、神经网络、贝叶斯网络、支持向量机、分布式机器学习等经典的机器学习基础知识,还包括卷积神经网络、循环神经网络、目标检测、自编码器、生成对抗网络、注意力机制等深度学习的内容。此外,本书还介绍机器学习的热门应用领域推荐系统以及强化学习等主题。
本书内容全面、案例丰富、深入浅出,部分章节提供Python程序代码和习题,供读者巩固所学知识。另外,本书还为读者提供配套的微课视频。
本书不仅适合作为高等院校本科生及研究生的机器学习、深度学习和数据挖掘等课程的教材,也可作为对机器学习感兴趣的研究人员和工程技术人员的参考资料。

前言

目前国内越来越多的高校开始设立人工智能、大数据技术与应用、智能科学与技术等专业,其中机器学习和深度学习是此类专业的核心课程。大多数高校在机器学习课程建设中,面临着教材众多,难度参差不齐,许多教材过于理论化、实用性不强等问题。因此,作者编写了这本面向应用的机器学习和深度学习教材。本书具有内容系统全面、深入浅出,并且配套资源齐全等特点。
与传统知识型教材相比,本书面向新工科的教学要求,帮助学生快速、系统地理解机器学习和深度学习的基础知识。配套的教学案例库可帮助学生将学习的知识转化为解决实际问题的技能,并在相似的场景中进行应用,进一步提高学生工程实践和创新的能力。
本书突出机器学习的课程要点和发展前沿,详细阐述机器学习和深度学习的基本内容,使用几十个典型的应用案例和 Python 代码实现,介绍机器学习和深度学习的核心内容。为了方便学生自学,本书配套中国大学 MOOC 的深度学习及其应用在线课程,难度适中,可帮助学生系统学习机器学习的专业知识,提升对实际领域问题的分析能力。
本书特别重视配套实验案例的设计。近年来,作者在与20多家企业合作的横向课题以及多项教育部产学合作协同育人项目的基础上,利用主流的机器学习开源框架和工具,原创开发了几十个配套机器学习和深度学习的案例。这些案例有效地支撑了实践教学的开展,经过几十所院校和数万名学员的使用,反馈良好。
自从2018年《机器学习》出版以来,作者多次在全国性教育研讨会议、研修班和师资培训中将之推广使用,该书对机器学习、深度学习、数据挖掘等相关课程的教学起到了重要的作用,目前已被几十所高校使用,产生了广泛的影响。
除了纸质教材外,本书配套资源齐全,且资源不定期更新,书中每章的难点和核心内容还配套对应的视频、实验及测试题,便于教师组织教学和学生自学。相关案例和实验等资料,都统一放在中国大学MOOC在线课程以及阿里云天池平台,便于教师开展实验和实训教学。读者也可登录人邮教育社区(www.ryjiaoyu.com)获取相关资源。
自第1版教材出版以来,作者广泛收集了读者的一些建议,对第1版做了如下修改。
(1)删除了第1版的第9章、第14章以及其他章节的部分内容,补充了一些案例,充实了XGBoost、神经网络算法等内容。
(2)重视引入企业真实问题的案例、充实实验教学,以加深学生对算法的理解,提升学生的应用技能。由于篇幅所限,更多案例和实验的内容可以参考作者编写的另外两本图书:《机器学习案例实战》(第2版)、《Python机器学习实战案例》(第2版)。
(3)大幅修改了第1版第11章深度学习和第12章高级深度学习等内容,补充了卷积神经网络、循环神经网络、生成对抗网络、自注意力等算法的介绍。
(4)补充了第13章,介绍了强化学习的基本内容,丰富了深度学习的内容。
本书编写的过程中,参考了一些文献的图表,研究生胥勋亮、陈孚声、张柏霖等在资料收集方面做了很多工作,在此一并表示感谢。

目录

第1章 机器学习基础 1
1.1 机器学习概述 2
1.1.1 机器学习简史 2
1.1.2 机器学习主要流派 4
1.2 机器学习、人工智能和数据挖掘 5
1.2.1 什么是人工智能 5
1.2.2 什么是数据挖掘 6
1.2.3 机器学习、人工智能和数据挖掘的关系 6
1.3 机器学习应用的典型领域 7
1.4 机器学习算法 13
1.5 机器学习的流程 19
第2章 机器学习基本方法 21
2.1 统计分析 22
2.1.1 统计基础 22
2.1.2 常见概率分布 27
2.1.3 参数估计 28
2.1.4 假设检验 30
2.1.5 线性回归 30
2.1.6 逻辑回归 34
2.1.7 判别分析 35
2.1.8 非线性模型 36
2.2 高维数据降维 37
2.2.1 主成分分析 37
2.2.2 奇异值分解 39
2.2.3 线性判别分析 40
2.2.4 局部线性嵌入 43
2.2.5 拉普拉斯特征映射 44
2.3 特征工程 45
2.3.1 特征构造 45
2.3.2 特征选择 46
2.3.3 特征提取 47
2.4 模型训练 47
2.4.1 模型训练常见术语 47
2.4.2 训练数据收集 48
2.5 可视化分析 48
2.5.1 可视化分析的作用 49
2.5.2 可视化分析的基本流程 49
2.5.3 可视化分析方法 49
2.5.4 可视化分析常用工具 51
2.5.5 常见的可视化图表 52
2.5.6 可视化分析面临的挑战 61
第3章 决策树与分类算法 63
3.1 决策树 64
3.1.1 分支处理 65
3.1.2 连续属性离散化 70
3.1.3 过拟合问题 72
3.1.4 分类性能评价 75
3.2 集成学习 79
3.2.1 装袋法 79
3.2.2 提升法 80
3.2.3 GBDT算法 82
3.2.4 XGBoost算法 82
3.2.5 随机森林算法 86
第4章 聚类分析 89
4.1 聚类分析概述 89
4.1.1 聚类算法分类 90
4.1.2 良好聚类算法的特征 91
4.2 聚类分析的度量 91
4.2.1 外部指标 92
4.2.2 内部指标 92
4.3 基于划分的聚类 94
4.3.1 k-均值算法 94
4.3.2 k-medoids算法 99
4.3.3 k-prototype算法 99
4.4 基于密度的聚类 100
4.4.1 DBSCAN算法 100
4.4.2 OPTICS算法 102
4.5 基于层次的聚类 103
4.5.1 BIRCH聚类 103
4.5.2 CURE算法 106
4.6 基于网格的聚类 108
4.7 基于模型的聚类 109
4.7.1 基于概率模型的聚类 109
4.7.2 模糊聚类 113
4.7.3 基于Kohonen神经网络模型的聚类 114
第5章 文本分析 119
5.1 文本分析概述 120
5.2 文本特征提取及表示 120
5.2.1 TF-IDF算法 120
5.2.2 信息增益 121
5.2.3 互信息 122
5.2.4 卡方统计量 122
5.2.5 词嵌入 123
5.2.6 语言模型 124
5.2.7 向量空间模型 125
5.3 知识图谱 126
5.3.1 知识图谱相关概念 127
5.3.2 知识图谱的存储 128
5.3.3 知识图谱的挖掘与计算 129
5.3.4 知识图谱的构建过程 130
5.4 词法分析 134
5.4.1 文本分词 134
5.4.2 命名实体识别 136
5.4.3 词义消歧 136
5.5 句法分析 137
5.6 语义分析 139
5.7 文本分析应用 140
5.7.1 文本分类 140
5.7.2 信息抽取 142
5.7.3 问答系统 143
5.7.4 情感分析 144
5.7.5 自动摘要 145
第6章 神经网络 147
6.1 神经网络概述 148
6.1.1 前馈神经网络 148
6.1.2 反馈神经网络 153
6.1.3 自组织神经网络 155
6.2 神经网络相关概念 156
6.2.1 激活函数 156
6.2.2 损失函数 165
6.2.3 学习率 168
6.2.4 过拟合与正则化 172
6.2.5 数据预处理 174
6.2.6 训练方式 175
6.2.7 神经网络模型训练中的问题 176
6.2.8 网络模型效果评价 182
6.3 神经网络应用 182
第7章 贝叶斯网络 188
7.1 贝叶斯定理 189
7.2 朴素贝叶斯分类模型 189
7.3 贝叶斯网络推理 192
7.4 贝叶斯网络的应用 198
7.4.1 中文分词 198
7.4.2 机器翻译 198
7.4.3 故障诊断 198
7.4.4 疾病诊断 199
第8章 支持向量机 202
8.1 线性可分支持向量机 203
8.1.1 间隔与超平面 203
8.1.2 支持向量 203
8.1.3 对偶问题求解 205
8.1.4 软间隔 206
8.2 非线性可分支持向量机 207
8.2.1 非线性可分支持向量机原理 207
8.2.2 常见核函数 207
8.3 支持向量机应用 208
第9章 分布式机器学习 213
9.1 分布式机器学习基础 214
9.2 分布式机器学习框架 215
9.3 并行决策树 220
9.4 并行k-均值算法 221
第10章 深度学习基础 224
10.1 卷积神经网络 225
10.1.1 卷积神经网络概述 225
10.1.2 卷积神经网络的结构 226
10.1.3 卷积神经网络的训练 234
10.1.4 常见卷积神经网络 236
10.2 目标检测 251
10.2.1 目标检测基本概念 251
10.2.2 目标检测典型算法 252
10.3 图像分割 257
10.3.1 全卷积神经网络 258
10.3.2 U-Net算法 259
10.3.3 Mask R-CNN 260
10.4 循环神经网络 261
10.4.1 循环神经网络基本原理 261
10.4.2 长短期记忆网络 268
10.4.3 门限循环单元 273
10.4.4 循环神经网络的其他改进 273
10.5 深度学习流行框架 277
第11章 高级深度学习 280
11.1 自注意力和BERT模型 281
11.1.1 常见词嵌入模型 281
11.1.2 自注意力 283
11.1.3 多头注意力 284
11.1.4 Transformer模型 286
11.1.5 BERT模型 288
11.2 无监督深度学习 289
11.2.1 深度信念网络 290
11.2.2 自动编码器网络 291
11.3 生成对抗网络 293
11.3.1 生成对抗网络基本原理 293
11.3.2 常见的生成对抗网络 296
11.4 迁移学习 300
11.5 对偶学习 302
11.6 知识蒸馏 303
11.7 小样本学习 305
第12章 推荐系统 307
12.1 推荐系统概述 308
12.1.1 推荐系统的应用场景 308
12.1.2 相似度计算 309
12.2 推荐系统通用模型 311
12.2.1 推荐系统结构 311
12.2.2 基于人口统计学的推荐 311
12.2.3 基于内容的推荐 312
12.2.4 基于协同过滤的推荐 312
12.2.5 基于图的推荐 315
12.2.6 基于关联规则的推荐 317
12.2.7 基于知识的推荐 322
12.2.8 基于标签的推荐 323
12.3 推荐系统评测 324
12.3.1 评测方法 324
12.3.2 评测指标 325
12.4 推荐系统常见问题 329
12.5 推荐系统实例 332
12.6 深度学习在推荐系统中的应用 339
第13章 强化学习 344
13.1 强化学习概述 345
13.2 强化学习基础 345
13.2.1 马尔可夫链 345
13.2.2 强化学习基本概念 346
13.2.3 强化学习的目标函数 348
13.2.4 价值函数 349
13.3 强化学习基本算法 352
13.3.1 蒙特卡洛强化学习 352
13.3.2 时序差分算法 353
13.3.3 SARSA算法 354
13.3.4 Q-Learning算法 354
13.4 深度强化学习 359
13.4.1 DQN算法 360
13.4.2 演员-评论家算法 366

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

复旦大学计算机科学技术学院副教授。主要负责本科生和各类研究生机器学习与深度学习、商务数据分析等课程的教学。商务智能被评为上海市精品课程,获得上海市教学成果奖一等奖和二等奖。出版教材《机器学习(第2版)》《机器学习案例实战(第2版)》《Python机器学习实战案例(第2版)》等10多部。CDA三级认证数据科学家,腾讯云、百度云机器学习认证讲师和阿里云MVP。

购买本书用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部