数据可视化——基于R语言

图文并茂;资源丰富
分享 推荐 7 收藏 182 阅读 6.9K
贾俊平 (作者) 978-7-115-53381-4

关于本书的内容有任何问题,请联系 古显义

1.实现方式多样。同一种图形尽可能地使用不同的R包和不同的函数实现。除R软件基础安装中自带的包及其函数外,本书还使用了50多个绘图包,涉及150多个绘图函数和80多个与绘图有关的函数。
2.实例丰富,可操作性强。本书绘制了200多幅不同的图形,每幅图形均列出了相对独立的绘制代码,并标有注释,直接运行即可得到相应的图形;每幅图形均结合实际数据做出了详尽解读,以帮助读者更好地理解和应用。
3.配套资源丰富。本书提供PPT、教学大纲、例题数据等配套资源,便于教师授课。
4.本书内容印刷精美,全彩印刷。

特别说明

1.代码资源需确认用书后,与作者或编辑索取!代码资源仅限于用书教师使用,不能随意转发或给学生使用。
2.本书相关资源请到数据科学与统计教学交流QQ群:1056931673免费下载。

内容摘要

本书以R语言为实现工具,以数据可视化分析为导向,结合实际案例介绍了数据可视化的方法。全书共8章,其中:第1章介绍数据可视化的基本问题以及R语言数据处理的基本技能;第2章介绍R语言绘图基础,重点介绍R语言传统绘图包graphics中的绘图函数及基本使用方法;第3章介绍类别数据的可视化方法;第4章介绍数据分布特征的可视化方法;第5章介绍变量间关系的可视化方法;第6章介绍样本相似性的可视化方法;第7章介绍时间序列的可视化方法;第8章介绍其他特殊的可视化图形以及出版物中图表的使用技巧。附录列出了本书使用的R包和R函数。

前言

数据可视化是数据分析的基础,也是数据分析的重要组成部分。可视化本身既是对数据的展示过程,也是对数据信息的再提取过程,它不仅可以帮助我们理解数据,探索数据的特征和模式,还可以提供数据本身难以发现的额外信息。数据可视化的重要性不言而喻!对使用者而言,可视化分析需要清楚数据类型、分析目的和实现工具 3 个问题。数据类型决定你可以画出什么图形 ;分析目的决定你需要画出什么图形 ;实现工具决定你能够画出什么图形。
本书是为满足数据科学人才培养的需要而编写的,与其他图书相比,具有以下特色。
1.立足点不同
与其他数据可视化教材不同,本书立足数据类型和数据可视化的目的对图形进行分类,如类别数据的频数图形、数值数据的分布图形、多变量的关系图形、多样本的相似性图形、时间序列图形等。
2.实现方式多样
本书的同一种图形尽可能地使用不同的 R 包和不同的函数来实现。除 R 软件基础安装中自带的包及其函数外,本书还使用了 50 多个绘图包,如 ggiraphExtra、ggplot2、ggpubr、plotrix、sjPlot 等,这些绘图包涉及 150 多个绘图函数和 80 多个与绘图有关的函数。
3.实例丰富,可操作性强
本书绘制了 200 多个不同的图形,每个图形均列出了相对独立的绘制代码,并标有注释,直接运行即可得到相应的图形 ;每个图形均结合实际数据做出了详尽解读,以帮助读者更好地理解和 应用。
4.配套资源丰富
本书提供 PPT、教学大纲、例题数据等配套资源,便于教师授课。
R 语言是个永远也挖不完的金矿,其中的更多资源还需要读者自己挖掘。因作者水平有限,书中提供的数据可视化方法也只是冰山一角,难免存在诸多不当之处。只要能起到抛砖引玉的作用,就达到了编写本书的目标。

正文样图

正文样图

目录

第 1章 数据可视化与R语言
1.1 数据可视化概述 001
1.1.1 数据可视化及其分类 001
1.1.2 数据可视化的数据类型 002
1.1.3 数据可视化的实现工具 003
1.1.4 数据可视化注意事项 003
1.2 R软件的初步使用 003
1.2.1 R软件的下载与安装 004
1.2.2 对象赋值与运行 004
1.2.3 编写代码脚本 005
1.2.4 查看帮助文件 005
1.2.5 包的安装与加载 006
1.3 创建R格式数据 006
1.3.1 向量、矩阵和数组 007
1.3.2 数据框 009
1.3.3 因子和列表 013
1.4 R语言数据处理 014
1.4.1 数据读取和保存 014
1.4.2 随机数和数据抽样 015
1.4.3 生成频数分布表 015
1.4.4 数据类型的转换 022
习题 026
第 2章 R语言绘图基础
2.1 R语言的基本绘图函数 027
2.1.1 高级绘图函数 027
2.1.2 低级绘图函数 030
2.2 图形参数与图形控制 032
2.2.1 绘图参数 032
2.2.2 图形控制 034
2.2.3 图形颜色 037
2.3 页面布局与图形组合 041
2.3.1 用par函数布局页面 041
2.3.2 用layout函数布局页面 042
2.3.3 同时打开多个绘图窗口 044
习题 045
第3章 类别数据可视化
3.1 条形图及其变种 046
3.1.1 简单条形图和帕累托图 046
3.1.2 并列条形图和堆叠条形图 049
3.1.3 不等宽条形图和脊形图 053
3.2 树状图 056
3.2.1 条形树状图 056
3.2.2 矩形树状图 058
3.3 马赛克图及其变种 059
3.3.1 马赛克图 059
3.3.2 马赛克图的变种 061
3.4 关联图和独立性检验的P值图 064
3.4.1 关联图 064
3.4.2 独立性检验的P值图 066
3.5 气球图和热图 067
3.5.1 气球图 067
3.5.2 热图 070
3.6 南丁格尔玫瑰图 072
3.7 金字塔图 075
3.8 饼图及其变种 077
3.8.1 饼图和扇形图 077
3.8.2 环形图 079
习题 081
第4章 分布特征可视化
4.1 直方图与核密度图 082
4.1.1 直方图 082
4.1.2 核密度图 089
4.2 箱线图和小提琴图 096
4.2.1 箱线图 097
4.2.2 小提琴图 102
4.3 点图、带状图和太阳花图 105
4.3.1 点图 105
4.3.2 带状图和太阳花图 107
4.4 海盗图 109
4.5 分布概要图 111
4.6 正态概率图 112
习题 115
第5章 变量间关系可视化
5.1 散点图与散点图矩阵 116
5.1.1 散点图 116
5.1.2 散点图矩阵 121
5.1.3 相关系数矩阵 123
5.1.4 相关系数网状图 128
5.2 条件散点图 129
5.3 大数据集的散点图 134
5.4 3D散点图和气泡图 136
5.4.1 3D散点图 136
5.4.2 气泡图 138
5.5 广义配对图 140
习题 142
第6章 样本相似性可视化
6.1 轮廓图和雷达图 144
6.1.1 轮廓图 144
6.1.2 雷达图 148
6.2 星图和脸谱图 151
6.2.1 星图 151
6.2.2 脸谱图 154
6.3 聚类图和热图 156
6.3.1 聚类图 156
6.3.2 热图 160
习题 167
第7章 时间序列可视化
7.1 变化模式可视化 168
7.1.1 折线图与面积图 168
7.1.2 蒸汽图与风筝图 174
7.1.3 表格图 177
7.1.4 日历图 179
7.2 变动特征可视化 181
7.2.1 时间序列的瀑布图 181
7.2.2 两个时点间的斜率图 183
7.2.3 序列的改变点 185
7.2.4 时间序列的动态交互图 187
7.3 序列成分可视化 188
7.3.1 成分分解 189
7.3.2 随机成分平滑 193
习题 194
第8章 其他可视化图形
8.1 瀑布图 196
8.2 和弦图 198
8.3 桑基图 200
8.4 平行集图 202
8.5 3D透视图 203
8.6 词云图 205
8.7 出版物中的图表 209
8.7.1 绘制表格 209
8.7.2 绘制带有表格和注释文本的图形 211
8.7.3 绘制带有检验信息的图形 214
8.8 为图形添加背景图片 215
习题 216
附录 本书使用的R包和R函数 217
参考文献 224

读者评论

  • 代码资源仅限于用书教师授课使用,网店读者或学生均不能索取,望理解!

    孙燕燕发表于 2020/8/17 9:33:01
  • 确认选书后的老师,可向编辑索取代码资源!

    孙燕燕发表于 2020/7/13 9:39:23

我要评论

作者介绍

贾俊平 中国人民大学统计学院副教授。研究方向:统计方法在经济各领域的应用,统计教学方式和方法。主要著作有:《统计学》《描述统计》《工商管理统计》《市场调查与分析》等。主持研究的“非统计学专业本科公共基础课——统计学教学改革”项目获2001年***教学成果二等奖、2001年北京市教学成果一等奖。2001年荣获北京市经济技术创新标兵称号,2003年荣获宝钢优秀教师奖等。

推荐用户

购买本书用户

相关图书

人邮微信
本地服务
教师服务
教师服务
读者服务
读者服务
返回顶部
返回顶部