工业和信息化精品系列教材

机器学习Python实战

项目导向,案例丰富,非常适合高职学习的人工智能教材
分享 推荐 3 收藏 119 阅读 11.2K
张松慧 (作者) 978-7-115-59401-3

关于本书的内容有任何问题,请联系 刘尉

项目任务驱动,实践案例丰富;
融入职业素养教育,学习门槛低;
Python语言编写,符合主流市场;
图解式教学,让高深的技术知识寓教于乐

内容摘要

本书使用Python的机器学习算法库scikit-learn讲解机器学习重要算法的应用,内容包括机器学习认知、数据预处理、KNN算法、线性回归算法、逻辑回归算法、朴素贝叶斯算法、决策树与随机森林算法、支持向量机、k-means算法、神经网络、模型评估与优化。
本书使用通俗易懂的语言、丰富的图表和大量的案例对机器学习的重要算法进行讲解,提供一条从实践出发掌握机器学习知识的途径,读者即使没有很扎实的数学基础也可快速入门,大大降低了学习门槛。本书是项目驱动式教材,算法原理讲解深入浅出,实践案例典型,配套课件、实战案例、习题等课程资源丰富。
本书可作为高等院校人工智能、大数据等相关专业的教材,也可供人工智能领域的技术人员或研究人员学习或参考。

前言

人工智能的迅速发展正在深刻改变人类社会生活,改变世界。为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的优势,加快建设创新型国家和世界科技强国,国务院于2017年7月印发《新一代人工智能发展规划》。新一代人工智能落地和产业发展持续提速,对人工智能等相关专业人才的需求也急剧增长。机器学习是人工智能中最具智能特征、最前沿的研究领域之一,是使计算机具有“智能”的根本途径。机器学习所涉及的数学理论源于实践,要熟练掌握并非只有从理论角度出发这一条学习途径,本书提供了一条从实践出发掌握机器学习知识的途径,让读者更容易上手,大大降低了人工智能学习的门槛。
本书突破传统教材的内容体系,尝试进行以“立德树人”思维为引导的项目化教学,以项目驱动与项目拓展相结合的方式编写。本书以机器学习的重要算法为主线,以解决实际应用场景中的问题为载体,使读者掌握机器学习的基本流程及应用实践技巧,建立严谨的数据分析思维,学会分析问题、解决问题,养成规范的编码习惯,形成精益求精的科学实践精神和敢于尝试的创新精神。
本书特色如下。
— 项目驱动、实战性强。本书立足真实应用场景,按照机器学习的典型职业活动来组织内容,通过大量的项目任务,使读者能快速理解算法的基本原理,并将其应用在项目中。书中项目由项目知识准备、项目实训和项目拓展等模块组成,帮助读者建立利用科学方法分析问题、解决问题的创新思维,从而实现真正的价值。
— 图解教学、深入浅出。本书配图丰富,读者能够通过图文直观地了解各算法的原理和流程,即使没有很扎实的数学基础也能够轻松学习机器学习算法与应用。
本书提供配套的电子课件、源代码和案例数据集,读者可在人邮教育社区(https://www. ryjiaoyu.com)网站注册、登录后下载。
本书由武汉软件工程职业学院的张松慧、陈丹担任主编,由吴慧婷和泰迪科技有限公司的张良均担任副主编,何水艳、尹江山、李志刚、陈娜、梁晓娅、王寒芳参与编写,张松慧审核全文。
由于编者水平有限,书中难免存在欠妥之处,因此,编者由衷地希望广大的读者朋友和专家学者能够提出宝贵的修改建议。

目录

项目1
机器学习认知 1
1.1 项目知识准备 1
1.1.1 什么是机器学习 1
1.1.2 机器学习的应用场景 4
1.1.3 机器学习的流程 5
1.1.4 机器学习的分类 6
1.1.5 过拟合和欠拟合 8
1.1.6 衡量机器学习模型的指标 8
1.2 项目实训 10
1.2.1 搭建机器学习开发环境—
Anaconda 10
1.2.2 Jupyter Notebook的
使用操作 11
1.2.3 NumPy的基本使用 13
1.2.4 pandas的基本使用 14
1.2.5 Matplotlib的基本使用 14
1.3 项目拓展—查看机器学习常用
数据集 15
1.4 项目小结 18
1.5 习题 18

项目2
红酒数据集可视化—
数据预处理 19
2.1 项目知识准备 19
2.1.1 数据处理 20
2.1.2 数据降维 23
2.1.3 数据集拆分 24
2.2 项目实训 26
2.2.1 数据标准化处理 26
2.2.2 数据离差标准化处理 28
2.2.3 数据二值化处理 29
2.2.4 数据归一化处理 29
2.2.5 独热编码处理 31
2.2.6 数据降维处理 34
2.3 项目拓展—红酒数据集拆分、
标准化和降维处理 37
2.4 项目小结 40
2.5 习题 40

项目3
基于KNN算法的分类模型 41
3.1 项目知识准备 41
3.1.1 KNN算法的原理 41
3.1.2 KNN算法的流程 42
3.1.3 KNN算法的关键 42
3.2 项目实训 44
3.2.1 KNN算法完成分类任务 44
3.2.2 KNN算法实战—酒的分类 47
3.3 项目拓展—辅助诊断乳腺肿瘤 50
3.4 项目小结 53
3.5 习题 53

项目4
基于线性回归算法的
预测模型 55
4.1 项目知识准备 55
4.1.1 什么是线性回归 55
4.1.2 损失函数 58
4.1.3 岭回归模型 58
4.1.4 套索回归模型 59
4.2 项目实训 60
4.2.1 线性回归模型的应用 60
4.2.2 波士顿房价预测 63
4.2.3 岭回归模型的应用 65
4.2.4 套索回归模型的应用 66
4.3 项目拓展—糖尿病患者病情预测 67
4.4 项目小结 71
4.5 习题 72

项目5
基于逻辑回归算法的
分类模型 73
5.1 项目知识准备 73
5.1.1 逻辑回归算法的基本原理 73
5.1.2 LogisticRegression逻辑回归
分类器 75
5.2 项目实训 77
5.2.1 逻辑回归算法预测考试是否
及格 77
5.2.2 逻辑回归算法实现鸢尾花
分类 79
5.3 项目拓展—判断肿瘤是良性还是
恶性 80
5.4 项目小结 84
5.5 习题 84

项目6
基于朴素贝叶斯算法的
分类模型 85
6.1 项目知识准备 85
6.1.1 朴素贝叶斯原理 85
6.1.2 伯努利朴素贝叶斯算法 87
6.1.3 高斯朴素贝叶斯算法 88
6.1.4 多项式朴素贝叶斯算法 91
6.2 项目实训 94
6.2.1 伯努利朴素贝叶斯模型实现
天气预测 94
6.2.2 高斯朴素贝叶斯模型实现连续值的分类 97
6.2.3 多项式朴素贝叶斯模型实现离散特征的分类 100
6.3 项目拓展—估算个人收入等级 103
6.4 项目小结 109
6.5 习题 109

项目7
基于决策树与随机森林算法
的预测模型 110
7.1 项目知识准备 110
7.1.1 决策树的基本原理和构造 110
7.1.2 随机森林的基本原理和构造 116
7.2 项目实训 119
7.2.1 用决策树判断西瓜的好坏 119
7.2.2 决策树和随机森林实现酒
分类的对比 124
7.3 项目拓展—波士顿房价预测 126
7.4 项目小结 129
7.5 习题 129

项目8
支持向量机 130
8.1 项目知识准备 130
8.1.1 支持向量机(SVM)的概念 130
8.1.2 支持向量机的核函数与参数
选择 132
8.2 项目实训 134
8.2.1 用SVM完成鸢尾花分类
任务 134
8.2.2 SVM算法实战 135
8.3 项目拓展—波士顿房价分析 136
8.4 项目小结 138
8.5 习题 138

项目9
基于k-means算法的
聚类模型 139
9.1 项目知识准备 139
9.1.1 聚类算法 139
9.1.2 k-means算法原理 140
9.1.3 k-means算法流程 141
9.1.4 k-means算法参数选择 142
9.2 项目实训 143
9.2.1 k-means算法应用及
效果展示 143
9.2.2 k-means算法实现鸢尾花
数据的聚类 145
9.3 项目拓展—航空公司客户价值
分析 148
9.4 项目小结 155
9.5 习题 155

项目10
神经网络 156
10.1 项目知识准备 156
10.1.1 神经网络的起源 156
10.1.2 神经网络的原理 157
10.1.3 神经网络的决策过程 158
10.2 项目实训 159
10.2.1 神经网络完成鸢尾花分类
任务 159
10.2.2 神经网络实例—
手写识别 161
10.3 项目拓展—良恶性肿瘤预测 163
10.4 项目小结 164
10.5 习题 164

项目11
模型评估与优化 165
11.1 项目知识准备 165
11.2 项目实训 166
11.2.1 使用交叉验证评估模型 166
11.2.2 使用网格搜索算法进行模型
调参 168
11.2.3 分类模型的可信度评估 170
11.3 项目小结 172
11.4 习题 172

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

张松慧,女,1980年9月出生,现任武汉软件职业工程学院信息学院软件技术专业人工智能技术与应用方向教研室主任,武汉软件工程职业学院“专业带头人”,主要研究方向是软件技术、人工智能技术与应用。指导学生参加湖北省高等职业院校技能大赛,荣获一等奖,参加全国职业院校技能大赛(高职组),湖北省教育厅授予“优秀指导教师奖”称号。指导学生参加蓝桥杯全国软件和信息技术专业人才大赛全国总决赛软件开发大学C组二等奖,湖北赛区一等奖。公开发表论文11篇(中文核心2篇),主编教材5本,主持省市级课题5项,主持的课题荣获湖北省职教学会“湖北省教育教学研究成果三等奖”。

推荐用户

同系列书

相关图书

  • ECharts数据可视化

    本书是一本采用任务驱动式体例编写的ECharts数据可视化技术教材,以通俗易懂的语言和丰富实用的任务,帮助读者...

    ¥59.80
  • Python编程基础(项目式微课版)

    王健

    本书根据高等院校应用技术型人才培养的目标编写,适合案例学习和模块化教学相结合的教学方式。本书以真实企业开发案例...

    ¥56.00
  • 人工智能云平台部署与开发(微课版)

    易海博

    本书涵盖云计算和人工智能两大领域的内容,着重讲解人工智能应用在云平台上的部署与开发。全书共7个项目,分别介绍云...

    ¥49.80
  • 鲲鹏智能计算导论

    华为技术有限公司 林新华 郑骏 陈瑛 夏林中 马祥 陈炯

    本书以鲲鹏智能计算为主线,共12 章,分别为绪论、计算机与服务器、鲲鹏通用计算平台、鲲鹏openEuler操作...

    ¥59.80
  • 人工智能概论(项目式)(微课版)

    李文斌 韩提文 刘少坤

    本书系统地介绍人工智能相关技术,项目1介绍人工智能的基本概念和相关的前沿技术,项目2至项目4介绍人工智能与大数...

    ¥48.00
人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部