大数据技术精品系列教材

R语言编程基础

大数据专家张良均领衔畅销书作者团队,全部采用企业真实项目案例,提供源代码等相关学习资源。
分享 推荐 4 收藏 81 阅读 6.8K
林智章 , 张良均 (主编) 李博文 , 杨惠 , 麦国炫 (副主编) 978-7-115-49611-9

关于本书的内容有任何问题,请联系 初美呈

欢迎加入人邮大数据教师服务群:669819871
全书大部分章节紧扣实际需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施,帮助读者真正理解与消化R语言编程基础。
书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。

内容摘要

本书以理论结合示例操作的方式,全面介绍了R语言编程基础及其知识的应用,讲解了利用R语言解决部分实际问题的方法。全书共7章:第 1章为R语言概述,包括学习R语言的优势、R语言的编译环境、R包的获取及加载、R包的内置数据等;第 2~6章主要介绍R语言的数据对象与数据读写、数据集基本处理、函数与控制流、初级绘图、绘图;第7章主要介绍可视化数据挖掘工具Rattle。本书的每章都包含了课后习题,通过练习帮助读者巩固所学的内容。

目录

第 1章 R语言概述 1
1.1 认识R语言 1
1.1.1 R语言的基本信息 1
1.1.2 获取与安装R语言 2
1.1.3 介绍R语言的编辑窗口 6
1.2 认识R语言的编译环境 7
1.2.1 认识R语言的编译器RStudio 7
1.2.2 获取R语言的帮助 11
1.2.3 了解R语言的工作空间 11
1.3 使用R包 13
1.3.1 认识R包 14
1.3.2 安装与加载R包 14
1.3.3 掌握常用的R包 14
1.4 了解R包的内置数据集 16
1.5 小结 19
课后习题 20
第 2章 数据对象与数据读写 21
2.1 查看数据类型 21
2.1.1 基本数据类型 21
2.1.2 查看与转换对象类型 22
2.2 判断数据结构 24
2.2.1 向量 24
2.2.2 矩阵 30
2.2.3 数组 36
2.2.4 数据框 38
2.2.5 列表 42
2.2.6 数据结构的判别与转换 46
2.3 读写不同数据源的数据 48
2.3.1 从键盘导入数据 48
2.3.2 读写带分隔符的文件 49
2.3.3 读写Excel文件 50
2.3.4 导入其他统计软件文件 51
2.3.5 导入数据库数据 52
2.3.6 导入网页数据 53
2.4 小结 53
课后习题 54
第3章 数据集基本处理 56
3.1 新增数据属性列 56
3.1.1 访问数据框变量 56
3.1.2 创建新变量 57
3.1.3 重命名变量 58
3.2 清洗数据 61
3.2.1 处理缺失值 61
3.2.2 处理日期变量 62
3.2.3 数据排序 66
3.2.4 合并数据集 68
3.3 选取变量及数据 69
3.3.1 选取变量 69
3.3.2 删除变量 70
3.3.3 使用subset函数选取数据 71
3.3.4 随机抽样 71
3.4 整合数据 74
3.4.1 使用SQL语句操作数据 74
3.4.2 汇总统计数据 75
3.4.3 重塑数据 77
3.5 处理字符数据 80
3.5.1 正则表达式 81
3.5.2 字符串处理函数 81
3.6 小结 85
课后习题 85
第4章 函数与控制流 87
4.1 使用常用函数及apply函数族处理数据 87
4.1.1 掌握处理数据的常用函数 87
4.1.2 使用apply函数族批量处理数据 93
4.2 编写条件分支语句 97
4.2.1 掌握if…else判断语句 97
4.2.2 使用switch分支语句 99
4.3 编写循环语句 99
4.3.1 使用for循环语句 99
4.3.2 掌握while循环语句 100
4.3.3 使用repeat-break循环语句 100
4.4 编写自定义函数 101
4.4.1 掌握自定义函数的方法 101
4.4.2 实现两个矩阵的乘积 103
4.5 小结 104
课后习题 104
第5章 初级绘图 106
5.1 绘制基础图形 106
5.1.1 分析数据分布情况 107
5.1.2 分析数据间的关系 112
5.1.3 绘制其他图形 118
5.2 修改图形参数 122
5.2.1 修改颜色 123
5.2.2 修改点符号与线条 128
5.2.3 修改文本属性 134
5.2.4 设置坐标轴 136
5.2.5 添加图例 138
5.3 绘制组合图形 140
5.3.1 par函数 140
5.3.2 layout函数 143
5.4 保存图形 144
5.5 小结 145
课后习题 145
第6章 绘图 148
6.1 使用lattice包绘图 148
6.1.1 lattice包绘图特色 148
6.1.2 使用lattice包 155
6.2 使用ggplot2包绘图 171
6.2.1 qplot函数 171
6.2.2 理解ggplot2包的语言逻辑 174
6.2.3 ggplot绘图 174
6.3 认识交互式绘图工具 186
6.3.1 使用rCharts包生成网页动态图片 186
6.3.2 利用googleVis包实现数据动态可视化 190
6.3.3 利用htmlwidgets包实现绘图的网页化分享 190
6.3.4 利用shiny包实现可交互的Web应用 195
6.4 小结 203
课后习题 204
第7章 可视化数据挖掘工具Rattle 206
7.1 了解并安装Rattle 206
7.1.1 认识Rattle 206
7.1.2 安装Rattle 207
7.1.3 使用Rattle功能 207
7.2 导入数据 208
7.2.1 导入CSV数据 209
7.2.2 导入ARFF数据 212
7.2.3 导入ODBC数据 213
7.2.4 R Dataset——导入其他数据源 215
7.2.5 导入RData File数据集 216
7.2.6 导入Library数据 218
7.3 探索数据 219
7.3.1 数据总体概况 219
7.3.2 数据分布探索 222
7.3.3 相关性 223
7.3.4 主成分 227
7.3.5 交互图 228
7.4 构建模型 230
7.4.1 聚类分析 230
7.4.2 关联规则 234
7.4.3 决策树 236
7.4.4 随机森林 238
7.5 评估模型 241
7.5.1 混淆矩阵 241
7.5.2 风险图 241
7.5.3 ROC图及相关图表 241
7.5.4 模型得分数据集 243
7.6 小结 244
课后习题 244
参考文献 246

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

张良均,信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数20余篇,已取得国家发明专利12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

推荐用户

同系列书

  • Power BI数据分析与可视化(第2版)(微课版)

    陈翠松 张良均 潘强 曾确令 张尚佳

    本书以项目为导向,以任务为驱动,全面地介绍数据分析与可视化的流程,以及 Power BI 数据分析与可视化的应...

    ¥49.80
  • 大数据导论

    林涛 张良均 李微 葛苏慧 胡晓东

    本书以大数据处理技术涉及的主要流程为主线,深入浅出地介绍大数据相关的基础知识。本书条理清晰、重点突出,内容循序...

    ¥49.80
  • Spark大数据分析实务

    郑浩森 张荣 张良均 杨树例 陈国珍

    本书以Spark大数据分析的常用技术与真实项目相结合的方式,深入浅出地介绍Spark大数据分析的重要内容。全书...

    ¥59.80
  • PySpark大数据分析与应用

    戴刚 张良均 桂友武 李晓英 李晓丹

    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相...

    ¥69.80
  • Hive大数据存储与处理

    何煌 张良均 孙一铭 胡健 陈翠松

    本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容...

    ¥59.80

购买本书用户

相关图书

  • ECharts数据可视化

    本书是一本采用任务驱动式体例编写的ECharts数据可视化技术教材,以通俗易懂的语言和丰富实用的任务,帮助读者...

    ¥59.80
  • 区块链技术及应用(微课版)

    郝兴伟 梁志勇

    为了适应Web 3.0时代下区块链技术发展的新趋势,同时培养高素质的区块链技术人才,编者精选了区块链的相关内容...

    ¥69.80
  • Python编程基础(项目式微课版)

    王健

    本书根据高等院校应用技术型人才培养的目标编写,适合案例学习和模块化教学相结合的教学方式。本书以真实企业开发案例...

    ¥56.00
  • 人工智能云平台部署与开发(微课版)

    易海博

    本书涵盖云计算和人工智能两大领域的内容,着重讲解人工智能应用在云平台上的部署与开发。全书共7个项目,分别介绍云...

    ¥49.80
  • 云计算导论(微课版)

    荆于勤 石慧霞 吴锡微 龚秀波 姚骏屏

    本书是一本全面介绍云计算基本概念、常用技术与应用的项目化教材。本书分为3篇,分别是初识云计算、体验云计算和业务...

    ¥59.80
单击此处加入人邮社数据科学教师服务群(大数据&人工智能&区块链),共同探讨交流
人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部