Python机器学习基础

一本简洁全面地论述了Python机器学习的入门书。
分享 推荐 1 收藏 96 阅读 8.0K
王鲁昆 (作者) 978-7-115-56217-3

关于本书的内容有任何问题,请联系 张斌

浪潮产学合作项目。
本书为机器学习的入门书籍,全面地论述了Python机器学习的基本概念、基础原理和基本方法,深入浅出的介绍了与Python和机器学习联系密切的内容。

内容摘要

Python是当前流行的编程语言,简单易学、应用广泛。本书以Python为基础开发语言,全面系统地讲解了机器学习的相关知识。本书共9章,主要包括机器学习的基本概念,Python及其库的入门,机器学习中常用算法的理论介绍、项目实现和优缺点分析,数据预处理,特征工程,模型评估及改进,综合实战等。
本书可作为本科院校和职业院校计算机相关专业的教材,还可作为社会培训机构的教材,也适合计算机爱好者自学使用。

目录

第 1章 概述 1
1.1 什么是机器学习 1
1.2机器学习的算法 2
1.3 监督学习 2
1.4 无监督学习 3
1.5 数据集 4
1.6 机器学习项目的流程 6
1.7 小结 7
习题1 7
第 2章 Python入门 9
2.1 Python语言介绍 9
2.2 Python平台搭建 9
2.3 Python的基本概念 11
2.3.1 数据类型 11
2.3.2 基本运算 14
2.3.3 控制语句 15
2.3.4 复杂数据类型 16
2.3.5 函数 18
2.4 Python库的使用 18
2.5 小结 24
习题2 24
第3章 分类算法 25
3.1 K近邻算法 25
3.1.1 算法介绍 25
3.1.2 算法应用 27
3.1.3 算法的优缺点 37
3.2 朴素贝叶斯算法 38
3.2.1 算法介绍 38
3.2.2 算法实现 39
3.2.3 算法的优缺点 43
3.3 逻辑回归 44
3.3.1 算法介绍 44
3.3.2 算法实现 46
3.3.3 算法的优缺点 48
3.4 支持向量机 48
3.4.1算法介绍 48
3.4.2 算法实现 53
3.4.3 算法的优缺点 55
3.5决策树 55
3.5.1算法介绍 55
3.5.2算法实现 58
3.5.3算法的优缺点 61
3.6随机森林 62
3.6.1算法介绍 62
3.6.2算法实现 63
3.6.3 算法的优缺点 65
3.7 人工神经网络 65
3.7.1 算法介绍 65
3.7.2 项目实现 68
3.7.3 算法的优缺点 71
3.8 分类器的不确定性 71
3.8.1 决策函数 72
3.8.2 预测函数 72
3.8.3 多分类的不确定性 73
3.9 小结 74
习题3 75
第4章 回归算法 76
4.1 线性回归 76
4.1.1 线性模型 76
4.1.2 线性回归 78
4.1.3 多项式回归 81
4.1.4 算法的优缺点 82
4.2 岭回归 83
4.2.1 算法介绍 83
4.2.2 算法实现 83
4.2.3 算法的优缺点 87
4.3 LASSO回归 87
4.3.1 算法介绍 87
4.3.2 算法实现 88
4.3.3 算法的优缺点 91
4.4 支持向量回归机 91
4.4.1算法介绍 91
4.4.2算法实现 93
4.4.3算法的优缺点 94
4.5 回归树 95
4.5.1 算法介绍 95
4.5.2 算法实现 96
4.5.3 算法优缺点 97
4.6 小结 98
习题4 98
第5章 聚类算法 99
5.1 K均值凝聚聚类 99
5.1.1 算法介绍 99
5.1.2 算法实现 100
5.1.3 算法的优缺点 103
5.2 层次聚类 103
5.2.1 算法介绍 103
5.2.2 算法实现 104
5.2.3 算法的优缺点 107
5.3 DBSCAN算法 108
5.3.1 算法介绍 108
5.3.2 算法实现 108
5.3.3 算法的优缺点 111
5.4 Mean Shift 111
5.4.1 算法介绍 111
5.4.2 算法实现 112
5.4.3 算法的优缺点 114
5.5 Label Propagation 114
5.5.1 算法介绍 115
5.5.2 算法实现 115
5.5.3 算法优缺点 116
5.6 小结 116
习题5 117
第6章 数据预处理 118
6.1 数据清洗 118
6.1.1 缺失值处理 118
6.1.2 异常值处理 126
6.2 数据变换 130
6.2.1 无量纲化 130
6.2.2 离散化 131
6.2.3 对类别特征编码 133
6.2.4 多项式特征 137
6.3 数据规约 142
6.4小结 143
习题6 143
第7章 特征工程 144
7.1 特征提取 144
7.1.1 字典特征提取 144
7.1.2 文本特征提取 145
7.1.3 图像特征提取 151
7.2特征选择 154
7.2.1 Filter 154
7.2.2 Wrapper 157
7.2.3 Embedded 158
7.3 降维 159
7.4 小结 164
习题7 164
第8章 模型评估及改进 165
8.1 交叉验证 165
8.1.1 K折交叉验证 165
8.1.2 分层K折交叉检验 166
8.1.3 留一交叉验证和打乱划分交叉验证 168
8.2 网格搜索 169
8.3 评估指标 177
8.3.1 分类评估指标 178
8.3.2 回归评估指标 189
8.4 小结 191
习题8 191
第9章 综合实战 192
9.1 管道模型 192
9.2 文本数据处理 197
9.2.1 扩展与深化——不同种方式的文本数据处理 197
9.2.2 文本数据的优化处理 203
9.3 泰坦尼克号数据分析 208
9.4 小结 217
习题9 217
参考文献 219

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

王鲁昆,工学博士,博士后,硕士生导师,副教授,IEEE会员,高级项目管理师。山东科技大学泰安校区计算机视觉与模式识别团队负责人,山东科技大学智能装备学院院长助理,山东科技大学三创中心主任。曾在大连古野软件公司、浪潮集团工作,获得信息系统项目管理师高级认证,系统集成项目管理师高级认证,软件设计师中级认证,ITIL V3 Foundation高级认证。2016年入职山东科技大学泰安校区。主要科研成果如下:发表论文16篇,其中SCI索引11篇,EI索引3篇,中文核心2篇。主持山东省自然基金项目1项,山东省高等学校科技计划项目1项,教育部协同育人项目3项,山东省重点实验室项目1项,人才引进项目1项,泰安市科技计划项目1项。申请并授权专利7项,申请并授权软件著作权5项。

推荐用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部