智能数据分析:基于R语言

数据分析,R语言
分享 推荐 0 收藏 10 阅读 519
艾新波 (编著) 978-7-115-66935-3

关于本书的内容有任何问题,请联系 孙澍

🌟 国家级一流本科课程配套教材,萃取十余年教学智慧的结晶之作
🌟 思政内容与专业知识自然融合,问道、执具、博术三阶递进
🌟 传统笔调阐释主流算法模型模型 ,引领学习者实现数据分析的境界升华
¥79.80 ¥67.83 (8.5 折)

内容摘要

        本书分为问道、执具、博术三个篇章,分别介绍智能数据分析的方法论、编程工具及算法模型。问道篇介绍数据分析的核心理念、一般过程及思维方式,旨在阐扬数据分析的哲理;执具篇介绍R语言环境配置、基础编程、数据对象,旨在阐述数据分析的先进工具;博术篇介绍数据可视化、关联规则、分类、聚类等主流技术,旨在阐明数据分析的算法模型及其R语言实现。
        本书可作为高等学校数据科学、数据计算及应用、智能科学与技术、人工智能等专业的教材,也可供数据分析领域的技术人员学习使用。

丛书序

目录

【章名目录】

上篇 · 问道
第 1 章 绪论:气象万千,数以等观
第 2 章 方法论:所谓学习,归类而已

中篇 · 执具
第 3 章 基础编程:工欲善其事,必先利其器
第 4 章 数据对象:万法归宗,数据为本

下篇 · 博术
第 5 章 认识数据:观数以形,辨形以识数
第 6 章 关联:相随相伴,谓之关联
第 7 章 分类:既是世间法,自当有分别
第 8 章 聚类:方以类聚,物以群分


【详细目录】

上篇 · 问道
第 1 章 绪论:气象万千,数以等观
1.1 从等号说起 ………………………… 003
1.1.1 人类历史上第一个被发现的定律… 003
1.1.2 等号对比…………………………… 004
1.1.3 神奇的等号………………………… 004
1.1.4 智能时代的等号…………………… 006
1.2 智能数据分析中的等号 …………… 008
1.2.1 智能数据分析……………………… 008
1.2.2 画等号与构建模型………………… 010
1.2.3 从等于到约等于…………………… 012
1.3 画等号,观世界 …………………… 012
1.3.1 永葆好奇与热情…………………… 012
1.3.2 机理模型与数据模型……………… 013
1.4 等号之外,下文分解 ……………… 014
1.4.1 等号之外…………………………… 014
1.4.2 下文分解…………………………… 015
1.5 本章小结 …………………………… 016
1.6 习题 ………………………………… 016

第 2 章 方法论:所谓学习,归类而已
2.1 从数据中学习知识 ………………… 018
2.1.1 通用流程…………………………… 018
2.1.2 任务分类…………………………… 020
2.1.3 算法模型概览……………………… 021
2.1.4 从结果到结论……………………… 023
2.2 学习的核心任务——归类 ………… 023
2.2.1 类的发展史………………………… 023
2.2.2 归类的一般含义…………………… 024
2.2.3 归类与认知………………………… 025
2.2.4 学习的核心任务是归类…………… 026
2.3 学习的结果——关系结构 ………… 029
2.3.1 机器能学到什么…………………… 029
2.3.2 几种典型的关系结构……………… 030
2.4 学习的方法—选择而非构建 …… 031
2.4.1 过程描述…………………………… 031
2.4.2 基本要素…………………………… 036
2.4.3 多视角解读………………………… 039
2.4.4 与其他过程的对比………………… 040
2.5 推理方式—归纳而非演绎 ……… 041
2.5.1 科学推理的两种方法……………… 041
2.5.2 学习的主要方法是归纳…………… 042
2.5.3 学习是一种似真推理……………… 042
2.6 本章小结 …………………………… 044
2.7 习题 ………………………………… 045

中篇 · 执具
第 3 章 基础编程:工欲善其事,必先利其器
3.1 R是什么 …………………………… 049
3.1.1 R是智能时代最先进的工具之一 … 049
3.1.2 R是一种重要的学习和研究方式 … 050
3.1.3 R是一种语言 ……………………… 050
3.1.4 R是一种编程语言 ………………… 050
3.2 R语言的设计理念 ………………… 051
3.3 R代码的运行机制 ………………… 051
3.3.1 环境配置…………………………… 051
3.3.2 运行机制…………………………… 054
3.4 情境案例 …………………………… 055
3.4.1 问题情境…………………………… 055
3.4.2 案例代码…………………………… 056
3.4.3 数据流转过程……………………… 058
3.4.4 代码组成…………………………… 059
3.5 包和函数的查找 …………………… 060
3.5.1 扩展包的查找……………………… 061
3.5.2 利用好帮助文档…………………… 066
3.6 控制结构 …………………………… 067
3.6.1 顺序结构…………………………… 068
3.6.2 分支结构…………………………… 071
3.6.3 循环结构…………………………… 073
3.6.4 提升循环的执行效率……………… 076
3.7 函数 ………………………………… 079
3.7.1 什么是函数………………………… 079
3.7.2 什么时候需要函数………………… 079
3.7.3 如何编写函数……………………… 080
3.7.4 函数的参数………………………… 083
3.7.5 特殊的函数………………………… 085
3.8 异常处理 …………………………… 093
3.9 本章小结 …………………………… 095
3.10 习题………………………………… 096

第 4 章 数据对象:万法归宗,数据为本
4.1 数据对象概览 ……………………… 098
4.1.1 面向数据对象学习R语言………… 098
4.1.2 数据对象地图……………………… 098
4.1.3 数据的材质—数据类型………… 100
4.1.4 数据对象的两种视角……………… 102
4.2 向量 ………………………………… 103
4.2.1 创建向量…………………………… 103
4.2.2 向量的四种下标…………………… 106
4.2.3 向量的常见操作…………………… 109
4.2.4 数学视角下的向量………………… 110
4.3 因子 ………………………………… 112
4.3.1 测量的尺度………………………… 112
4.3.2 因子的基本操作…………………… 113
4.3.3 有序因子…………………………… 115
4.3.4 数据分箱操作……………………… 116
4.4 矩阵 ………………………………… 118
4.4.1 矩阵的基本操作…………………… 119
4.4.2 矩阵的数学运算…………………… 122
4.5 数组 ………………………………… 123
4.5.1 数组与图像………………………… 123
4.5.2 图像数组的基本操作……………… 124
4.6 列表 ………………………………… 125
4.6.1 列表的创建………………………… 125
4.6.2 访问列表的子集…………………… 126
4.6.3 列表的基本操作…………………… 127
4.6.4 三种操作符[、[[和$的对比……… 128
4.7 数据框 ……………………………… 130
4.7.1 数据框概述………………………… 130
4.7.2 数据框的基本操作………………… 131
4.7.3 人人都爱tidyverse ………………… 134
4.7.4 最美不过数据框…………………… 145
4.8 本章小结 …………………………… 147
4.9 习题 ………………………………… 148

下篇 · 博术
第 5 章 认识数据:观数以形,辨形以识数
5.1 数与形 ……………………………… 151
5.2 单变量描述 ………………………… 152
5.2.1 茎叶图……………………………… 152
5.2.2 直方图……………………………… 154
5.2.3 概率密度图………………………… 157
5.2.4 小提琴图…………………………… 161
5.2.5 箱线图……………………………… 161
5.2.6 组合图形…………………………… 163
5.2.7 少量数字描述分布特征…………… 164
5.3 变量之间的关系 …………………… 167
5.3.1 矩形树图…………………………… 168
5.3.2 散点图……………………………… 169
5.3.3 相关系数及其可视化……………… 171
5.3.4 分组绘图…………………………… 173
5.4 高维数据空间的形态 ……………… 176
5.4.1 三维散点图………………………… 176
5.4.2 切尔诺夫脸谱图…………………… 177
5.5 本章小结 …………………………… 179
5.6 习题 ………………………………… 179

第 6 章 关联:相随相伴,谓之关联
6.1 情境案例 …………………………… 181
6.1.1 啤酒与尿布的故事………………… 181
6.1.2 打印机与A4纸 …………………… 181
6.1.3 算法设计者面临的问题…………… 182
6.2 算法原理 …………………………… 183
6.2.1 基本概念…………………………… 183
6.2.2 Apriori算法 ……………………… 184
6.2.3 模型评估…………………………… 190
6.2.4 算法概要…………………………… 192
6.3 R语言实现 ………………………… 192
6.3.1 业务理解…………………………… 192
6.3.2 扩展包的选取……………………… 193
6.3.3 数据预处理………………………… 193
6.3.4 规则挖掘…………………………… 199
6.3.5 规则评估…………………………… 202
6.3.6 规则可视化………………………… 203
6.4 关联关系再思考 …………………… 207
6.4.1 一言以蔽之………………………… 207
6.4.2 新算法能否带来更多有趣的规则… 208
6.5 本章小结 …………………………… 208
6.6 习题 ………………………………… 209

第 7 章 分类:既是世间法,自当有分别
7.1 分类概览 …………………………… 211
7.1.1 分门别类…………………………… 211
7.1.2 分类与回归………………………… 213
7.1.3 有意义的预测……………………… 214
7.1.4 算法脉络图………………………… 215
7.1.5 有生于无…………………………… 217
7.2 模型评估 …………………………… 218
7.2.1 评估方法…………………………… 218
7.2.2 评估指标…………………………… 220
7.3 近邻法 ……………………………… 223
7.3.1 环顾四周…………………………… 223
7.3.2 算法原理…………………………… 224
7.3.3 加权近邻法………………………… 225
7.3.4 R语言实现 ………………………… 227
7.3.5 算法精要…………………………… 230
7.4 决策树 ……………………………… 231
7.4.1 IF-THEN规则与决策树 ………… 231
7.4.2 算法设计者面临的问题…………… 233
7.4.3 决策树归纳法……………………… 233
7.4.4 R语言实现 ………………………… 238
7.4.5 算法精要…………………………… 242
7.5 随机森林 …………………………… 243
7.5.1 最初的灵感与直觉………………… 243
7.5.2 道法自然…………………………… 244
7.5.3 算法原理…………………………… 246
7.5.4 R语言实现 ………………………… 248
7.5.5 算法精要…………………………… 248
7.6 朴素贝叶斯 ………………………… 249
7.6.1 重温贝叶斯………………………… 249
7.6.2 算法原理…………………………… 250
7.6.3 R语言实现 ………………………… 252
7.6.4 算法精要…………………………… 252
7.7 逻辑斯谛回归 ……………………… 253
7.7.1 概率值函数………………………… 253
7.7.2 极大似然估计……………………… 255
7.7.3 R语言实现 ………………………… 256
7.7.4 算法精要…………………………… 257
7.8 人工神经网络 ……………………… 258
7.8.1 扩充计算单元……………………… 258
7.8.2 误差反向传播……………………… 259
7.8.3 R语言实现 ………………………… 264
7.8.4 算法精要…………………………… 269
7.9 支持向量机 ………………………… 270
7.9.1 内积与分类超平面………………… 270
7.9.2 线性可分支持向量机……………… 272
7.9.3 线性支持向量机…………………… 276
7.9.4 非线性支持向量机………………… 277
7.9.5 R语言实现 ………………………… 279
7.9.6 算法精要…………………………… 281
7.10 本章小结…………………………… 281
7.11 习题………………………………… 282

第 8 章 聚类:方以类聚,物以群分
8.1 基本概念 …………………………… 284
8.1.1 什么是聚类………………………… 284
8.1.2 簇的类型…………………………… 284
8.1.3 距离或相似度……………………… 285
8.1.4 聚类方法概览……………………… 287
8.1.5 聚类的结果………………………… 289
8.2 模型评估 …………………………… 289
8.2.1 数据是否具有聚类的趋势………… 289
8.2.2 模型评估指标……………………… 290
8.3 K均值聚类 ………………………… 292
8.3.1 形式化描述………………………… 292
8.3.2 情境案例…………………………… 292
8.3.3 算法原理…………………………… 294
8.3.4 R语言实现 ………………………… 296
8.4 层次聚类 …………………………… 303
8.4.1 算法概述…………………………… 303
8.4.2 算法原理…………………………… 304
8.4.3 R语言实现 ………………………… 305
8.5 算法创新 …………………………… 311
8.5.1 风云际会,始唤创新……………… 311
8.5.2 如何开展算法创新………………… 312
8.5.3 一个算法创新的例子……………… 312
8.6 本章小结 …………………………… 314
8.7 习题 ………………………………… 314

参考文献…………………………………… 316

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

艾新波
北京邮电大学教授、博士生导师,国家级一流本科课程负责人,北京市安全生产领域学
科带头人。长期致力于机器学习与数据挖掘的基础理论及前沿应用研究,提出了比著名
的 Cauchy-Schwarz 不等式更紧致的不等式系列、对 Pearson 相关系数进行了非线性推广;在安全生产智能监测与大数据分析方面取得多项成果,获省部级以上科技奖 4项;获北京高校第十二届青年教师教学基本功比赛三等奖、北京邮电大学第十五届教学观摩评比一等奖;获评北京邮电大学首届优秀研究生育人导师;曾指导学生获 CCF 大数据与智能计算大赛冠军,获 CCF 优秀指导教师奖。

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部