关于本书的内容有任何问题,请联系 李召
第1章 数据分析概述 1 1.1 初识数据分析 1 1.1.1 为什么会有数据分析 1 1.1.2 怎样去做数据分析 1 1.2 数据分析的常用方法 3 1.2.1 5W1H分析法 3 1.2.2 逻辑树分析法 3 1.2.3 对比分析法 6 1.2.4 群组分析法 6 1.3 Python的安装与使用 6 1.3.1 Python的下载与安装 6 1.3.2 检验安装是否成功 7 1.3.3 第一个Python程序 7 1.4 数据分析工具库 8 1.4.1 NumPy 8 1.4.2 Matplotlib 8 1.4.3 Pandas 9 1.4.4 scikit-learn 9 1.5 Anaconda——最受欢迎的 开源Python分发平台 9 1.5.1 初识Anaconda 9 1.5.2 Anaconda的安装与使用 10 1.6 本章小结 14 1.7 习题 14 第2章 数据集的获取与存储 15 2.1 数据获取 15 2.1.1 内部数据的获取方法 15 2.1.2 外部数据的获取方法 15 2.2 数据存储格式 16 2.2.1 CSV格式与Excel格式 16 2.2.2 HTML格式与JSON格式 20 2.2.3 二进制格式 22 2.3 数据库 22 2.3.1 建立数据库及数据表 23 2.3.2 使用Python连接数据库 31 2.4 本章小结 32 2.5 习题 32 第3章 NumPy—数组与矩阵运算 34 3.1 初识NumPy 34 3.1.1 NumPy简介 34 3.1.2 安装NumPy 34 3.2 NumPy数组操作 35 3.2.1 数组的概念 35 3.2.2 数组的属性 35 3.2.3 创建数组 37 3.2.4 数组运算 39 3.2.5 数组的切片和索引 41 3.2.6 数组重塑 44 3.2.7 数组迭代 44 3.3 NumPy矩阵操作 45 3.3.1 矩阵的创建 45 3.3.2 矩阵的运算 46 3.3.3 矩阵的转置与求逆 47 3.4 NumPy常用统计函数 48 3.5 NumPy——随机漫步 50 3.6 本章小结 51 3.7 习题 52 第4章 Pandas—高性能的数据 结构和数据分析工具 53 4.1 初识Pandas 53 4.2 Pandas数据结构的基本操作 53 4.2.1 Series对象的创建 53 4.2.2 Series对象的属性 55 4.2.3 DataFrame对象的创建 57 4.2.4 DataFrame对象的基本操作 58 4.3 Pandas的计算与统计 61 4.3.1 DataFrame对象的基本计算 61 4.3.2 DataFrame对象与Series对象 之间的基本计算 63 4.3.3 Pandas中常用的统计方法 64 4.4 Pandas其他常用函数 67 4.4.1 Pandas数据重复值处理 67 4.4.2 Pandas数据排序 68 4.4.3 Pandas数据合并 71 4.4.4 Pandas日期数据处理 74 4.5 实战1:泰坦尼克号乘客数据 处理与分析 75 4.5.1 任务说明 75 4.5.2 任务实现 76 4.6 本章小结 79 4.7 习题 79 第5章 数据预处理 81 5.1 数据准备 81 5.1.1 数据的加载 81 5.1.2 堆叠合并数据 82 5.1.3 重叠合并数据 83 5.2 数据变换 84 5.2.1 数据分析与挖掘体系位置 84 5.2.2 数据变换的方法 85 5.2.3 常见操作 86 5.2.4 数据基本字段 87 5.2.5 数据类型转换 87 5.3 数据清洗 91 5.3.1 导入与查看数据集 91 5.3.2 缺失值处理 96 5.3.3 重复值处理 101 5.3.4 异常值处理 102 5.4 数据标准化 104 5.4.1 数据标准化的原因 104 5.4.2 数据标准化的方法 104 5.4.3 数据标准化的区别与意义 106 5.5 实战2:运动员数据分析 预处理 106 5.5.1 任务说明 106 5.5.2 任务实现 107 5.6 实战3:豆瓣读书数据预处理 113 5.6.1 任务说明 113 5.6.2 任务实现 113 5.6.3 直观数据分析 120 5.7 本章小结 121 5.8 习题 121 第6章 Matplotlib—可视化绘图 123 6.1 Matplotlib的安装 123 6.2 Matplotlib的绘制流程 124 6.2.1 绘图结构—Figure、Axes、Axis、Artist 124 6.2.2 绘图流程 126 6.2.3 第一个交互式图表 126 6.2.4 其他常用操作 129 6.3 Matplotlib基础图表的绘制 134 6.3.1 散点图的绘制 134 6.3.2 直方图的绘制 136 6.3.3 折线图的绘制 138 6.3.4 饼图的绘制 140 6.3.5 箱线图的绘制 142 6.3.6 正弦图和余弦图的绘制 144 6.3.7 误差条形图的绘制 145 6.3.8 玫瑰图的绘制 146 6.3.9 词云的绘制 147 6.4 Matplotlib高级图表 147 6.4.1 等值线图 147 6.4.2 风杆图 149 6.4.3 多序列条形图 150 6.4.4 多序列堆积条形图 151 6.4.5 多面板图 153 6.5 实战4:我国地区生产总值数据 可视化 156 6.5.1 任务说明 156 6.5.2 任务实现 156 6.6 实战5:餐厅小费赠予情况数据 可视化 160 6.6.1 任务说明 160 6.6.2 任务实现 161 6.7 本章小结 163 6.8 习题 164 第7章 机器学习与数据挖掘 165 7.1 机器学习概述 165 7.2 监督学习——分类与回归 166 7.2.1 k近邻算法 166 7.2.2 决策树 167 7.2.3 回归分析 170 7.2.4 其他常见的分类与 预测算法 172 7.3 聚类与关联分析 172 7.3.1 k均值聚类分析 173 7.3.2 Apriori关联分析 174 7.4 数据结构与算法 176 7.4.1 树结构 176 7.4.2 排序 179 7.5 本章小结 186 7.6 习题 186 第8章 综合实战:就业分析 188 8.1 研究背景 188 8.2 分析目标 188 8.3 数据获取 189 8.4 数据处理 191 8.5 数据分析 194 8.6 本章小结 200 第9章 综合实战:电商数据分析 201 9.1 电商平台用户行为数据 分析 201 9.1.1 研究背景 201 9.1.2 分析目标 202 9.1.3 数据处理 202 9.1.4 数据分析 205 9.2 网店商品售卖数据分析 209 9.2.1 研究背景 210 9.2.2 分析目标 210 9.2.3 数据处理 210 9.2.4 数据分析 214
本书通过不断调整与优化,形成了结构合理、循序渐进、容量适度的10个教学单元:计算机基础知识、计算机硬件基础、计...
本书是一本采用任务驱动式体例编写的ECharts数据可视化技术教材,以通俗易懂的语言和丰富实用的任务,帮助读者...
本书是面向PHP语言和MySQL数据库初学者的一本入门教材,使用通俗易懂的语言、丰富的图解和实用的案例,详细讲...
本书为Java基础入门教材,适合初学者使用。全书共13章,第1~2章主要讲解Java技术的一些基础知识,内容包...
本书全面、系统地介绍银河麒麟桌面操作系统的基础知识、WPS Office的基本操作,以及其他信息技术的相关内容...
我要评论