关于本书的内容有任何问题,请联系 祝智敏
第1章 机器学习概述 1 技能目标 1 本章任务 1 任务1.1 了解机器学习的基本概念 2 1.1.1 什么是机器学习 2 1.1.2 机器学习的起源与发展 3 任务1.2 了解机器学习的应用场景 5 1.2.1 机器学习在日常生活中的应用 5 1.2.2 机器学习在不同行业中的应用 7 任务1.3 了解机器学习的学习路径 9 1.3.1 学习机器学习的先决条件 9 1.3.2 开启你的“海绵模式” 10 1.3.3 开始动手实践 11 任务1.4 掌握机器学习的相关知识 12 本章小结 14 本章习题 14 第2章 机器学习工具的安装与使用 15 技能目标 15 本章任务 15 任务2.1 掌握Anaconda的安装与使用 16 2.1.1 下载安装Anaconda 16 2.1.2 Jupyter Notebook的使用 18 任务2.2 掌握pandas和可视化工具的基本使用方法 21 2.2.1 pandas的基本使用方法 21 2.2.2 可视化工具的基本使用方法 25 任务2.3 掌握scikit-learn的基本操作 27 2.3.1 使用scikit-learn加载并检查数据 27 2.3.2 使用scikit-learn训练模型并评估 29 2.3.3 保存和载入训练好的模型文件 30 本章小结 31 本章习题 31 第3章 线性模型 32 技能目标 32 本章任务 32 任务3.1 掌握线性模型的基本概念与线性回归的使用 33 3.1.1 线性模型的基本概念 33 3.1.2 线性回归模型的使用 35 任务3.2 掌握岭回归的原理及使用 38 3.2.1 岭回归的原理 39 3.2.2 岭回归的使用 41 任务3.3 掌握套索回归的原理及使用 43 3.3.1 套索回归的原理 43 3.3.2 套索回归的参数调节 44 任务3.4 了解逻辑回归和线性支持向量机 46 3.4.1 逻辑回归与线性支持向量机简介 46 3.4.2 训练逻辑回归模型并预测 47 3.4.3 训练线性支持向量机模型并预测 48 本章小结 49 本章习题 49 第4章 决策树和随机森林 50 技能目标 50 本章任务 50 任务4.1 初步掌握决策树算法 51 4.1.1 什么是决策树算法 51 4.1.2 决策树的基本使用方法 52 4.1.3 决策树中的max_depth参数 53 4.1.4 决策树的模型展现 59 4.1.5 决策树的优势与不足 60 任务4.2 初步掌握随机森林算法 60 4.2.1 什么是随机森林算法 60 4.2.2 随机森林算法中的参数解释 61 4.2.3 随机森林与决策树模型的差异 62 4.2.4 随机森林的优势与不足 63 任务4.3 使用决策树与随机森林实战练习 63 4.3.1 下载数据集并载入 63 4.3.2 了解数据集的特征 64 4.3.3 使用数据集训练决策树与随机森林 65 本章小结 67 本章习题 67 第5章 支持向量机 68 技能目标 68 本章任务 68 任务5.1 理解支持向量机的基本原理 69 5.1.1 “线性不可分”的数据集 69 5.1.2 将数据投射到高维空间 70 5.1.3 “不线性”的支持向量机 71 任务5.2 理解支持向量机的核函数和gamma参数 73 5.2.1 支持向量机的RBF内核 73 5.2.2 不同内核的支持向量机对比 75 5.2.3 gamma参数对模型的影响 76 5.2.4 支持向量机中的C参数 78 5.2.5 支持向量机的优势与不足 79 任务5.3 使用支持向量机算法进行实战练习 79 5.3.1 数据集准备与初步了解 80 5.3.2 探索性数据分析 81 5.3.3 初步训练支持向量机模型 83 5.3.4 对数据进行预处理并重新训练模型 84 本章小结 88 本章习题 88 第6章 朴素贝叶斯 89 技能目标 89 本章任务 89 任务6.1 了解朴素贝叶斯的基本原理和使用方法 90 6.1.1 朴素贝叶斯算法的基本原理 90 6.1.2 朴素贝叶斯用法示例 92 任务6.2 了解不同朴素贝叶斯变体的差异 94 6.2.1 伯努利朴素贝叶斯的不足 94 6.2.2 用高斯朴素贝叶斯替代伯努利朴素贝叶斯 96 6.2.3 多项式朴素贝叶斯简介 97 任务6.3 掌握朴素贝叶斯的实际应用 97 6.3.1 获取数据集并检查 97 6.3.2 数据预处理与模型训练 99 6.3.3 样本数量对朴素贝叶斯模型的影响 101 本章小结 103 本章习题 103 第7章 K最近邻算法 104 技能目标 104 本章任务 104 任务7.1 了解K最近邻算法的原理 105 任务7.2 掌握K最近邻算法在分类任务中的应用 107 7.2.1 K最近邻算法在二元分类任务中的应用 108 7.2.2 K最近邻算法处理多元分类任务 110 任务7.3 掌握K最近邻算法在回归分析中的应用 113 任务7.4 使用K最近邻算法实战练习 116 7.4.1 对数据集进行分析 116 7.4.2 生成训练集和验证集 120 7.4.3 使用K最近邻算法进行建模并调优 121 7.4.4 使用模型对新样本进行预测 124 本章小结 125 本章习题 125 第8章 神经网络 126 技能目标 126 本章任务 126 任务8.1 了解神经网络的起源与发展 127 8.1.1 了解神经网络的起源 128 8.1.2 了解神经网络的发展 129 任务8.2 掌握神经网络的原理 130 任务8.3 掌握神经网络中的激活函数 133 8.3.1 了解激活函数 133 8.3.2 使用激活函数 134 任务8.4 掌握神经网络中的参数调节 136 8.4.1 分析数据集并展现 136 8.4.2 参数调节 139 任务8.5 使用神经网络解决实际问题 143 8.5.1 分析fashion-mnist数据集 144 8.5.2 训练MLP神经网络 145 8.5.3 使用模型进行图像识别 146 本章小结 148 本章习题 148 第9章 聚类 149 技能目标 149 本章任务 149 任务9.1 了解聚类算法的原理与用途 150 9.1.1 了解聚类算法的原理 150 9.1.2 了解聚类算法的用途 153 任务9.2 掌握K均值算法的原理和使用 153 9.2.1 了解K均值算法的原理 154 9.2.2 使用K均值算法进行简单聚类分析 155 任务9.3 掌握DBSCAN算法的原理和使用 157 9.3.1 了解DBSCAN算法的原理 157 9.3.2 使用DBSCAN算法进行简单聚类分析 158 任务9.4 使用聚类算法解决实际问题 164 9.4.1 对数据集进行分析 164 9.4.2 使用K均值算法进行聚类分析 166 本章小结 172 本章习题 172 第10章 数据降维、特征提取与流形学习 173 技能目标 173 本章任务 173 任务10.1 使用PCA进行数据降维 174 10.1.1 PCA介绍 174 10.1.2 使用PCA降维以便进行可视化 176 10.1.3 PCA主成分与原始特征的关系 178 任务10.2 使用PCA中的数据白化功能进行特征提取 179 10.2.1 使用人脸识别数据集进行试验 179 10.2.2 使用PCA进行特征提取 180 10.2.3 特征提取对模型准确率的影响 182 任务10.3 使用t-SNE对数据降维并进行可视化 183 10.3.1 t-SNE简介 183 10.3.2 使用PCA降维作为Baseline 184 10.3.3 使用t-SNE降维并进行可视化 186 本章小结 187 本章习题 187 第11章 模型选择、优化及评估 188 技能目标 188 本章任务 188 任务11.1 掌握交叉验证方法对模型进行评估 189 11.1.1 交叉验证法简介 189 11.1.2 K-折交叉验证法 190 11.1.3 随机拆分和留一交叉验证法 192 任务11.2 掌握网格搜索法寻找模型的最优参数 193 11.2.1 了解及使用简单网格搜索 193 11.2.2 与交叉验证结合的网格搜索 195 任务11.3 掌握模型的不同评价标准 197 11.3.1 分类模型的评价标准 197 11.3.2 使用R平方分数评估回归模型 199 本章小结 201 本章习题 201 第12章 数据预处理与特征选择 202 技能目标 202 本章任务 202 任务12.1 掌握常用的数据标准化方法 203 12.1.1 使用StandardScaler进行数据预处理 203 12.1.2 使用MinMaxScaler进行数据标准化处理 205 12.1.3 使用Normalizer进行数据标准化处理 207 12.1.4 使用RobustScaler进行数据标准化处理 208 任务12.2 掌握常用的数据表达方法 209 12.2.1 虚拟变量 209 12.2.2 数据分箱 211 任务12.3 掌握常用的特征选择方法 215 12.3.1 单变量统计 215 12.3.2 基于模型的特征选择 218 12.3.3 迭代特征选择 219 本章小结 220 本章习题 220 第13章 处理文本数据 221 技能目标 221 本章任务 221 任务13.1 掌握文本数据的特征提取、汉语分词和词包模型 222 13.1.1 基于计数向量器的文本特征提取 222 13.1.2 对汉语文本进行分词处理 224 13.1.3 使用词包模型将文本转换为数组 224 任务13.2 文本数据的进一步优化处理 225 13.2.1 默认参数下词包模型的问题 225 13.2.2 调整n_Gram参数重新建立模型 226 任务13.3 使用真实数据进行实战练习 228 13.3.1 载入数据集并查看特征 228 13.3.2 文本数据预处理 229 13.3.3 使用朴素贝叶斯算法训练模型 230 13.3.4 使用模型判断消费者评论 232 本章小结 233 本章习题 233 第14章 未来职业发展前景与方向 234 技能目标 234 本章任务 234 任务 了解数据科学家的职业发展 235 14.1 数据科学家的养成 235 14.2 在实践中提高技能 237 14.3 未来的学习方向 238 本章小结 240 本章习题 240
本书通过不断调整与优化,形成了结构合理、循序渐进、容量适度的10个教学单元:计算机基础知识、计算机硬件基础、计...
本书是一本采用任务驱动式体例编写的ECharts数据可视化技术教材,以通俗易懂的语言和丰富实用的任务,帮助读者...
本书是面向PHP语言和MySQL数据库初学者的一本入门教材,使用通俗易懂的语言、丰富的图解和实用的案例,详细讲...
本书为Java基础入门教材,适合初学者使用。全书共13章,第1~2章主要讲解Java技术的一些基础知识,内容包...
本书全面、系统地介绍银河麒麟桌面操作系统的基础知识、WPS Office的基本操作,以及其他信息技术的相关内容...
我要评论