关于本书的内容有任何问题,请联系 李召
第1章 数据分析概述 1 1.1 初识数据分析 1 1.1.1 为什么会有数据分析 1 1.1.2 怎样去做数据分析 1 1.2 数据分析的常用方法 3 1.2.1 5W1H分析法 3 1.2.2 逻辑树分析法 3 1.2.3 对比分析法 6 1.2.4 群组分析法 6 1.3 Python的安装与使用 6 1.3.1 Python的下载与安装 6 1.3.2 检验安装是否成功 7 1.3.3 第一个Python程序 7 1.4 数据分析工具库 8 1.4.1 NumPy 8 1.4.2 Matplotlib 8 1.4.3 Pandas 9 1.4.4 scikit-learn 9 1.5 Anaconda——最受欢迎的 开源Python分发平台 9 1.5.1 初识Anaconda 9 1.5.2 Anaconda的安装与使用 10 1.6 本章小结 14 1.7 习题 14 第2章 数据集的获取与存储 15 2.1 数据获取 15 2.1.1 内部数据的获取方法 15 2.1.2 外部数据的获取方法 15 2.2 数据存储格式 16 2.2.1 CSV格式与Excel格式 16 2.2.2 HTML格式与JSON格式 20 2.2.3 二进制格式 22 2.3 数据库 22 2.3.1 建立数据库及数据表 23 2.3.2 使用Python连接数据库 31 2.4 本章小结 32 2.5 习题 32 第3章 NumPy—数组与矩阵运算 34 3.1 初识NumPy 34 3.1.1 NumPy简介 34 3.1.2 安装NumPy 34 3.2 NumPy数组操作 35 3.2.1 数组的概念 35 3.2.2 数组的属性 35 3.2.3 创建数组 37 3.2.4 数组运算 39 3.2.5 数组的切片和索引 41 3.2.6 数组重塑 44 3.2.7 数组迭代 44 3.3 NumPy矩阵操作 45 3.3.1 矩阵的创建 45 3.3.2 矩阵的运算 46 3.3.3 矩阵的转置与求逆 47 3.4 NumPy常用统计函数 48 3.5 NumPy——随机漫步 50 3.6 本章小结 51 3.7 习题 52 第4章 Pandas—高性能的数据 结构和数据分析工具 53 4.1 初识Pandas 53 4.2 Pandas数据结构的基本操作 53 4.2.1 Series对象的创建 53 4.2.2 Series对象的属性 55 4.2.3 DataFrame对象的创建 57 4.2.4 DataFrame对象的基本操作 58 4.3 Pandas的计算与统计 61 4.3.1 DataFrame对象的基本计算 61 4.3.2 DataFrame对象与Series对象 之间的基本计算 63 4.3.3 Pandas中常用的统计方法 64 4.4 Pandas其他常用函数 67 4.4.1 Pandas数据重复值处理 67 4.4.2 Pandas数据排序 68 4.4.3 Pandas数据合并 71 4.4.4 Pandas日期数据处理 74 4.5 实战1:泰坦尼克号乘客数据 处理与分析 75 4.5.1 任务说明 75 4.5.2 任务实现 76 4.6 本章小结 79 4.7 习题 79 第5章 数据预处理 81 5.1 数据准备 81 5.1.1 数据的加载 81 5.1.2 堆叠合并数据 82 5.1.3 重叠合并数据 83 5.2 数据变换 84 5.2.1 数据分析与挖掘体系位置 84 5.2.2 数据变换的方法 85 5.2.3 常见操作 86 5.2.4 数据基本字段 87 5.2.5 数据类型转换 87 5.3 数据清洗 91 5.3.1 导入与查看数据集 91 5.3.2 缺失值处理 96 5.3.3 重复值处理 101 5.3.4 异常值处理 102 5.4 数据标准化 104 5.4.1 数据标准化的原因 104 5.4.2 数据标准化的方法 104 5.4.3 数据标准化的区别与意义 106 5.5 实战2:运动员数据分析 预处理 106 5.5.1 任务说明 106 5.5.2 任务实现 107 5.6 实战3:豆瓣读书数据预处理 113 5.6.1 任务说明 113 5.6.2 任务实现 113 5.6.3 直观数据分析 120 5.7 本章小结 121 5.8 习题 121 第6章 Matplotlib—可视化绘图 123 6.1 Matplotlib的安装 123 6.2 Matplotlib的绘制流程 124 6.2.1 绘图结构—Figure、Axes、Axis、Artist 124 6.2.2 绘图流程 126 6.2.3 第一个交互式图表 126 6.2.4 其他常用操作 129 6.3 Matplotlib基础图表的绘制 134 6.3.1 散点图的绘制 134 6.3.2 直方图的绘制 136 6.3.3 折线图的绘制 138 6.3.4 饼图的绘制 140 6.3.5 箱线图的绘制 142 6.3.6 正弦图和余弦图的绘制 144 6.3.7 误差条形图的绘制 145 6.3.8 玫瑰图的绘制 146 6.3.9 词云的绘制 147 6.4 Matplotlib高级图表 147 6.4.1 等值线图 147 6.4.2 风杆图 149 6.4.3 多序列条形图 150 6.4.4 多序列堆积条形图 151 6.4.5 多面板图 153 6.5 实战4:我国地区生产总值数据 可视化 156 6.5.1 任务说明 156 6.5.2 任务实现 156 6.6 实战5:餐厅小费赠予情况数据 可视化 160 6.6.1 任务说明 160 6.6.2 任务实现 161 6.7 本章小结 163 6.8 习题 164 第7章 机器学习与数据挖掘 165 7.1 机器学习概述 165 7.2 监督学习——分类与回归 166 7.2.1 k近邻算法 166 7.2.2 决策树 167 7.2.3 回归分析 170 7.2.4 其他常见的分类与 预测算法 172 7.3 聚类与关联分析 172 7.3.1 k均值聚类分析 173 7.3.2 Apriori关联分析 174 7.4 数据结构与算法 176 7.4.1 树结构 176 7.4.2 排序 179 7.5 本章小结 186 7.6 习题 186 第8章 综合实战:就业分析 188 8.1 研究背景 188 8.2 分析目标 188 8.3 数据获取 189 8.4 数据处理 191 8.5 数据分析 194 8.6 本章小结 200 第9章 综合实战:电商数据分析 201 9.1 电商平台用户行为数据 分析 201 9.1.1 研究背景 201 9.1.2 分析目标 202 9.1.3 数据处理 202 9.1.4 数据分析 205 9.2 网店商品售卖数据分析 209 9.2.1 研究背景 210 9.2.2 分析目标 210 9.2.3 数据处理 210 9.2.4 数据分析 214
随着云计算技术的飞速发展,企业对容器编排和管理的需求日益增长,Kubernetes作为领先的开源容器编排平台,...
本书基于《高等职业教育专科信息技术课程标准(2021年版)》相关要求,并根据相关专业学习需求和典型工作岗位需求...
本书将Python程序设计的知识按由易到难、由浅入深的规律精心设计为12个模块,包括程序开发环境构建与数据输入...
本书是《信息技术(基础模块)(第3版)》一书的上机指导与习题集,共两部分。第一部分是上机指导,该部分从计算机的...
本书注重零基础商科类专业读者实现Python数据分析的学习,加强读者基于数据分析而非常用的编程基础,本书是Py...
我要评论