大数据技术精品系列教材

大数据数学基础(Python语言描述)

资深大数据专家张良均领衔畅销书作者团队,提供源代码等相关学习资源,帮助读者真正理解与消化大数据数学基础。
分享 推荐 9 收藏 127 阅读 8.6K
雷俊丽 , 张良均 (主编) 王玉宝 , 王熠 , 周东平 (副主编) 978-7-115-49921-9

关于本书的内容有任何问题,请联系 初美呈

欢迎加入人邮大数据教师服务群:669819871
全书大部分章节紧扣实际需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施,帮助读者真正理解与消化大数据数学基础。
书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。

内容摘要

本书全面地讲解了在科学领域广泛运用的微积分、概率论与数理统计、线性代数、数值计算、多元统计分析等数学基础知识。全书共6章:第1章介绍了大数据与数学、数学与Python的关系;第2章介绍了微积分的基础知识,包括极限、导数、微分、不定积分与定积分等;第3章介绍了概率论与数理统计的基础知识,包括数据分布特征、概率与概率分布、参数估计、假设检验等;第4章介绍了线性代数的基础知识,包括行列式、矩阵的运算和特征分解、奇异值分解;第5章介绍了数值计算的基础知识,包括插值法、函数逼近与拟合、非线性方程(组)求根;第6章介绍了常用的多元统计分析方法,包括回归分析、判别分析、聚类分析、主成分分析、因子分析和典型相关分析。本书示例大都结合Python进行求解分析,且每章都有课后习题,可以帮助读者巩固所学的内容。
本书可以作为高校大数据技术类及相关专业的教材,也可作为大数据技术爱好者的自学用书。

目录

第 1章 绪论 1
1.1 大数据与数学 1
1.1.1 大数据的定义 1
1.1.2 数学在大数据领域的作用 2
1.2 数学与Python 4
1.2.1 NumPy 4
1.2.2 SciPy 5
1.2.3 SymPy 5
1.2.4 StatsModels 5
小结 6
课后习题 6
第 2章 微积分基础 7
2.1 函数与极限 7
2.1.1 映射与函数 7
2.1.2 数列与函数的极限 13
2.1.3 极限运算法则与存在法则 16
2.1.4 连续函数与初等函数的
连续性 17
2.2 导数与微分 18
2.2.1 导数的概念 18
2.2.2 函数的求导法则 22
2.2.3 微分的概念 26
2.3 微分中值定理与导数的应用 30
2.3.1 微分中值定理 30
2.3.2 函数的单调性与曲线的
凹凸性 31
2.3.3 函数的极值与最值 32
2.4 不定积分与定积分 36
2.4.1 不定积分的概念与性质 36
2.4.2 不定积分的换元积分法与
分部积分法 41
2.4.3 定积分的概念与性质 43
2.4.4 定积分的换元积分法与
分部积分法 46
小结 47
课后习题 47
第3章 概率论与数理统计基础 49
3.1 数据分布特征的统计描述 49
3.1.1 集中趋势度量 49
3.1.2 离散趋势度量 57
3.1.3 偏度与峰度的度量 62
3.2 概率与概率分布 65
3.2.1 随机事件及其概率 65
3.2.2 随机变量与概率分布 69
3.2.3 随机变量的数字特征 75
3.3 参数估计与假设检验 83
3.3.1 参数估计 83
3.3.2 假设检验 85
小结 88
课后习题 88
第4章 线性代数基础 90
4.1 行列式 90
4.1.1 行列式与全排列 90
4.1.2 行列式的性质 97
4.1.3 行列式按行(列)展开 102
4.2 矩阵及其运算 104
4.2.1 矩阵的定义 105
4.2.2 特殊矩阵 106
4.2.3 矩阵的运算 110
4.2.4 矩阵的逆 114
4.2.5 向量组与矩阵的秩 115
4.2.6 协方差矩阵 119
4.2.7 相关矩阵 120
4.3 矩阵的特征分解与
奇异值分解 121
4.3.1 特征分解 121
4.3.2 奇异值分解 134
小结 137
课后习题 137
第5章 数值计算基础 140
5.1 数值计算的基本概念 140
5.1.1 误差的来源 140
5.1.2 误差分类 142
5.1.3 数值计算的衡量标准 143
5.2 插值法 143
5.2.1 Lagrange插值 143
5.2.2 Newton插值 146
5.2.3 样条插值 152
5.3 函数逼近与拟合 153
5.3.1 数据的最小二乘线性拟合 153
5.3.2 函数的最佳平方逼近 157
5.3.3 数据的多变量拟合 160
5.3.4 数据的非线性曲线拟合 162
5.4 非线性方程(组)求根 164
5.4.1 二分法求解非线性方程 164
5.4.2 迭代法求解非线性方程 167
5.4.3 Newton法求解非线性方程 169
5.4.4 Newton法求解非线性
方程组 171
小结 173







课后习题 174
第6章 多元统计分析 176
6.1 回归分析 176
6.1.1 一元线性回归 176
6.1.2 多元线性回归 184
6.1.3 Logistic回归 189
6.2 判别分析 193
6.2.1 距离判别 194
6.2.2 贝叶斯判别 197
6.2.3 费希尔判别 200
6.3 聚类分析 202
6.3.1 距离和相似系数 202
6.3.2 系统聚类法 205
6.3.3 动态聚类法 212
6.4 主成分分析 215
6.4.1 总体主成分 215
6.4.2 样本主成分 221
6.5 因子分析 224
6.5.1 正交因子模型 225
6.5.2 参数估计 228
6.5.3 因子旋转 235
6.5.4 因子得分 237
6.6 典型相关分析 238
6.6.1 总体典型相关 238
6.6.2 样本典型相关 240
6.6.3 典型相关系数的显著性检验 241
小结 243
课后习题 243
附录I t分布表 248
附录II F分布表 250
参考文献 262

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数20余篇,已取得国家发明专利12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

同系列书

  • Power BI数据分析与可视化(第2版)(微课版)

    陈翠松 张良均 潘强 曾确令 张尚佳

    本书以项目为导向,以任务为驱动,全面地介绍数据分析与可视化的流程,以及 Power BI 数据分析与可视化的应...

    ¥49.80
  • 大数据导论

    林涛 张良均 李微 葛苏慧 胡晓东

    本书以大数据处理技术涉及的主要流程为主线,深入浅出地介绍大数据相关的基础知识。本书条理清晰、重点突出,内容循序...

    ¥49.80
  • Spark大数据分析实务

    郑浩森 张荣 张良均 杨树例 陈国珍

    本书以Spark大数据分析的常用技术与真实项目相结合的方式,深入浅出地介绍Spark大数据分析的重要内容。全书...

    ¥59.80
  • PySpark大数据分析与应用

    戴刚 张良均 桂友武 李晓英 李晓丹

    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相...

    ¥69.80
  • Hive大数据存储与处理

    何煌 张良均 孙一铭 胡健 陈翠松

    本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容...

    ¥59.80

购买本书用户

相关图书

  • ECharts数据可视化

    本书是一本采用任务驱动式体例编写的ECharts数据可视化技术教材,以通俗易懂的语言和丰富实用的任务,帮助读者...

    ¥59.80
  • Python编程基础(项目式微课版)

    王健

    本书根据高等院校应用技术型人才培养的目标编写,适合案例学习和模块化教学相结合的教学方式。本书以真实企业开发案例...

    ¥56.00
  • 人工智能云平台部署与开发(微课版)

    易海博

    本书涵盖云计算和人工智能两大领域的内容,着重讲解人工智能应用在云平台上的部署与开发。全书共7个项目,分别介绍云...

    ¥49.80
  • 鲲鹏智能计算导论

    华为技术有限公司 林新华 郑骏 陈瑛 夏林中 马祥 陈炯

    本书以鲲鹏智能计算为主线,共12 章,分别为绪论、计算机与服务器、鲲鹏通用计算平台、鲲鹏openEuler操作...

    ¥59.80
  • 人工智能概论(项目式)(微课版)

    李文斌 韩提文 刘少坤

    本书系统地介绍人工智能相关技术,项目1介绍人工智能的基本概念和相关的前沿技术,项目2至项目4介绍人工智能与大数...

    ¥48.00
单击此处加入人邮社数据科学教师服务群(大数据&人工智能&区块链),共同探讨交流
人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部