Python数据分析与可视化(微课版)

Python数据分析与可视化(微课版)
分享 推荐 0 收藏 65 阅读 5.0K
千锋 (作者) 978-7-115-62656-1

关于本书的内容有任何问题,请联系 李召

1.涵盖数据分析的各种常用技术与主流工具,实例代码丰富。
2.围绕基本知识、主要方法、数据预处理、可视化以及数据挖掘基础进行讲解,综合实战贯穿所讲知识点。
3.配套资源丰富,还配有教学辅助平台,提高教学质量。

内容摘要

本书讲解数据分析基础知识,针对数据分析与可视化的初学者介绍相关方法及概念。
全书共分9章,内容包含数据分析概述、数据集的存储与读取、NumPy数组与矩阵运算、Pandas高性能的数据结构和数据分析工具、数据预处理、Matplotlib可视化绘图、机器学习与数据挖掘以及就业分析综合实战和电商数据分析两项综合实战。
本书可作为高等院校计算机、大数据相关专业的教材,也可作为数据分析从业人员的参考用书。

诚邀您加入【人邮社大数据教师交流群】

目录

第1章 数据分析概述 1
1.1 初识数据分析 1
1.1.1 为什么会有数据分析 1
1.1.2 怎样去做数据分析 1
1.2 数据分析的常用方法 3
1.2.1 5W1H分析法 3
1.2.2 逻辑树分析法 3
1.2.3 对比分析法 6
1.2.4 群组分析法 6
1.3 Python的安装与使用 6
1.3.1 Python的下载与安装 6
1.3.2 检验安装是否成功 7
1.3.3 第一个Python程序 7
1.4 数据分析工具库 8
1.4.1 NumPy 8
1.4.2 Matplotlib 8
1.4.3 Pandas 9
1.4.4 scikit-learn 9
1.5 Anaconda——最受欢迎的
开源Python分发平台 9
1.5.1 初识Anaconda 9
1.5.2 Anaconda的安装与使用 10
1.6 本章小结 14
1.7 习题 14
第2章 数据集的获取与存储 15
2.1 数据获取 15
2.1.1 内部数据的获取方法 15

2.1.2 外部数据的获取方法 15
2.2 数据存储格式 16
2.2.1 CSV格式与Excel格式 16
2.2.2 HTML格式与JSON格式 20
2.2.3 二进制格式 22
2.3 数据库 22
2.3.1 建立数据库及数据表 23
2.3.2 使用Python连接数据库 31
2.4 本章小结 32
2.5 习题 32
第3章 NumPy—数组与矩阵运算 34
3.1 初识NumPy 34
3.1.1 NumPy简介 34
3.1.2 安装NumPy 34
3.2 NumPy数组操作 35
3.2.1 数组的概念 35
3.2.2 数组的属性 35
3.2.3 创建数组 37
3.2.4 数组运算 39
3.2.5 数组的切片和索引 41
3.2.6 数组重塑 44
3.2.7 数组迭代 44
3.3 NumPy矩阵操作 45
3.3.1 矩阵的创建 45
3.3.2 矩阵的运算 46
3.3.3 矩阵的转置与求逆 47
3.4 NumPy常用统计函数 48
3.5 NumPy——随机漫步 50
3.6 本章小结 51
3.7 习题 52
第4章 Pandas—高性能的数据
结构和数据分析工具 53
4.1 初识Pandas 53
4.2 Pandas数据结构的基本操作 53
4.2.1 Series对象的创建 53
4.2.2 Series对象的属性 55
4.2.3 DataFrame对象的创建 57
4.2.4 DataFrame对象的基本操作 58
4.3 Pandas的计算与统计 61
4.3.1 DataFrame对象的基本计算 61
4.3.2 DataFrame对象与Series对象
之间的基本计算 63
4.3.3 Pandas中常用的统计方法 64
4.4 Pandas其他常用函数 67
4.4.1 Pandas数据重复值处理 67
4.4.2 Pandas数据排序 68
4.4.3 Pandas数据合并 71
4.4.4 Pandas日期数据处理 74
4.5 实战1:泰坦尼克号乘客数据
处理与分析 75
4.5.1 任务说明 75
4.5.2 任务实现 76
4.6 本章小结 79
4.7 习题 79
第5章 数据预处理 81
5.1 数据准备 81
5.1.1 数据的加载 81
5.1.2 堆叠合并数据 82
5.1.3 重叠合并数据 83
5.2 数据变换 84
5.2.1 数据分析与挖掘体系位置 84
5.2.2 数据变换的方法 85
5.2.3 常见操作 86
5.2.4 数据基本字段 87
5.2.5 数据类型转换 87
5.3 数据清洗 91
5.3.1 导入与查看数据集 91
5.3.2 缺失值处理 96
5.3.3 重复值处理 101
5.3.4 异常值处理 102
5.4 数据标准化 104
5.4.1 数据标准化的原因 104
5.4.2 数据标准化的方法 104
5.4.3 数据标准化的区别与意义 106
5.5 实战2:运动员数据分析
预处理 106
5.5.1 任务说明 106
5.5.2 任务实现 107
5.6 实战3:豆瓣读书数据预处理 113
5.6.1 任务说明 113
5.6.2 任务实现 113
5.6.3 直观数据分析 120
5.7 本章小结 121
5.8 习题 121
第6章 Matplotlib—可视化绘图 123
6.1 Matplotlib的安装 123
6.2 Matplotlib的绘制流程 124
6.2.1 绘图结构—Figure、Axes、Axis、Artist 124
6.2.2 绘图流程 126
6.2.3 第一个交互式图表 126
6.2.4 其他常用操作 129
6.3 Matplotlib基础图表的绘制 134
6.3.1 散点图的绘制 134
6.3.2 直方图的绘制 136
6.3.3 折线图的绘制 138
6.3.4 饼图的绘制 140
6.3.5 箱线图的绘制 142
6.3.6 正弦图和余弦图的绘制 144
6.3.7 误差条形图的绘制 145
6.3.8 玫瑰图的绘制 146
6.3.9 词云的绘制 147
6.4 Matplotlib高级图表 147
6.4.1 等值线图 147
6.4.2 风杆图 149
6.4.3 多序列条形图 150
6.4.4 多序列堆积条形图 151
6.4.5 多面板图 153
6.5 实战4:我国地区生产总值数据
可视化 156
6.5.1 任务说明 156
6.5.2 任务实现 156
6.6 实战5:餐厅小费赠予情况数据
可视化 160
6.6.1 任务说明 160
6.6.2 任务实现 161
6.7 本章小结 163
6.8 习题 164
第7章 机器学习与数据挖掘 165
7.1 机器学习概述 165
7.2 监督学习——分类与回归 166
7.2.1 k近邻算法 166
7.2.2 决策树 167
7.2.3 回归分析 170
7.2.4 其他常见的分类与
预测算法 172
7.3 聚类与关联分析 172
7.3.1 k均值聚类分析 173
7.3.2 Apriori关联分析 174












7.4 数据结构与算法 176
7.4.1 树结构 176
7.4.2 排序 179
7.5 本章小结 186
7.6 习题 186
第8章 综合实战:就业分析 188
8.1 研究背景 188
8.2 分析目标 188
8.3 数据获取 189
8.4 数据处理 191
8.5 数据分析 194
8.6 本章小结 200
第9章 综合实战:电商数据分析 201
9.1 电商平台用户行为数据
分析 201
9.1.1 研究背景 201
9.1.2 分析目标 202
9.1.3 数据处理 202
9.1.4 数据分析 205
9.2 网店商品售卖数据分析 209
9.2.1 研究背景 210
9.2.2 分析目标 210
9.2.3 数据处理 210
9.2.4 数据分析 214

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

千锋教育 1.千锋教育采用全程面授高品质、高成本培养模式,教学大纲紧跟企业需求,拥有全国一体化就业保障服务,成为学员信赖的IT职业教育品牌。 2.获得荣誉包括:中关村移动互联网产业联盟副理事长单位、中国软件协会教育培训委员会认证一级培训机构、中关村国际孵化软件协会授权中关村移动互联网学院、教育部教育管理信息中心指定移动互联网实训基地等。

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部