关于本书的内容有任何问题,请联系 许金霞
第1章 数据分析及可视化概述 1 1.1 数据分析概述 1 1.1.1 传统的数据分析 1 1.1.2 大数据分析基础 2 1.1.3 数据分析可视化工具 5 1.2 数据的收集与管理 8 1.2.1 数据分析集的构成 8 1.2.2 数据的收集与保存 10 练习题1 12 第2章 Python数据分析基础 13 2.1 Python数据处理基础 13 2.1.1 Python的编程环境 13 2.1.2 Python的编程基础 16 2.1.3 Python的函数定义 19 2.2 Python数据处理方法 20 2.2.1 Python数据处理包 20 2.2.2 数据框的基本操作 26 2.2.3 数据框的重组与透视 31 练习题2 39 第3章 Python数据可视化方法 41 3.1 基于列表的可视化 41 3.1.1 Matplotlib的基本绘图 42 3.1.2 Matplotlib图形设置 46 3.2 基于数据框的可视化 49 3.2.1 基于pandas的可视化 49 3.2.2 基于cufflinks的可视化 58 练习题3 65 第4章 数据挖掘基础及可视化 67 4.1 数据的透视分析 67 4.1.1 透视表的构建 67 4.1.2 透视图的绘制 77 4.2 探索性数据分析 79 4.2.1 纵向数据探索性分析 79 4.2.2 横向数据探索性分析 83 练习题4 91 第5章 数据基本分析及可视化 92 5.1 数据的描述性统计分析 92 5.1.1 数据的描述统计 92 5.1.2 数据的综合统计 98 5.2 数据的聚类分析 103 5.2.1 聚类分析的思想 103 5.2.2 层次聚类分析 105 练习题5 110 第6章 数据综合评价及可视化 112 6.1 综合评价的方法及应用 112 6.1.1 单指标数据分析 112 6.1.2 综合评价指数的构建 117 6.2 综合指数的监测预警 124 6.2.1 综合指数的构建 125 6.2.2 综合指数的差异分析 126 6.2.3 综合指数的监测预警 128 练习题6 131 第7章 数据统计推断及可视化 133 7.1 随机抽样及其分布图 133 7.1.1 总体和样本 133 7.1.2 统计量的分布 135 7.2 参数的统计推断 136 7.2.1 参数的估计方法 136 7.2.2 假设检验的思想 138 7.2.3 均值比较的t检验 139 练习题7 149 第8章 数据模型分析及可视化 150 8.1 相关分析及可视化 150 8.1.1 两变量线性相关分析 150 8.1.2 多变量线性相关分析 154 8.2 线性回归模型及可视化 159 8.2.1 两变量线性回归模型 159 8.2.2 多变量线性回归模型 164 8.2.3 可线性化的非线性模型 175 8.3 一般线性模型及可视化 182 8.3.1 一般线性模型的形式 183 8.3.2 单因素方差分析模型 184 练习题8 188 第9章 文本数据挖掘及在线数据分析 190 9.1 文本数据预处理、挖掘及可视化 190 9.1.1 文本数据的预处理 190 9.1.2 文本数据挖掘及可视化 192 9.2 在线数据的获取及分析 197 9.2.1 简单数据的获取及分析 197 9.2.2 网络数据的获取及分析 204 练习题9 209 附录A Excel数据分析及工具 210 A1 Excel中的分析函数 210 A1.1 函数结构及使用 210 A1.2 函数的输入及引用 211 A2 Excel中的数据分析工具 212 A2.1 Excel数据分析工具加载 212 A2.2 数据分析工具的使用 213 附录B Python基本运算函数 215 B1 Python编程运算基础 215 B1.1 运算符及控制语句 215 B1.2 数据框的取值 217 B2 Python函数的使用 219 B2.1 内置函数 219 B2.2 库函数 219 附录C Python数据分析平台快速入门 222 C1 安装anaconda 222 C1.1 安装anaconda个人版 222 C1.2 运行anaconda个人版 222 C2 Jupyter的启动 223 C2.1 菜单模式 223 C2.2 命令行模式 224 C3 Spyder的启动 226 C3.1 Spyder编程界面 226 C3.2 Spyder设置 226 参考文献 228
随着云计算技术的飞速发展,企业对容器编排和管理的需求日益增长,Kubernetes作为领先的开源容器编排平台,...
本书全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全...
本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数...
本书详细阐述了培养具有数字素养的综合型人才所需要的相关知识。作为通识类课程教材,本书在确定知识布局时,紧紧围绕...
本书是机器学习的入门教材,讲述机器学习的主流算法原理及其应用。全书着重对线性回归、Logistic回归、朴素贝...
我要评论