大数据人才培养规划教材

大数据数学基础(R语言描述)

资深大数据专家张良均领衔畅销书作者团队,提供源代码等相关学习资源,帮助读者真正理解与消化大数据数学基础。
分享 推荐 0 收藏 19 阅读 946
程丹 , 张良均 (主编) 叶提芳 , 柳扬 , 刘晓玲 (副主编)

关于本书的内容有任何问题,请联系 左仲海

全书大部分章节紧扣实际需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施,帮助读者真正理解与消化大数据数学基础。
书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。

内容摘要

本书全面地讲解了在科学领域运用广泛的数据微积分、线性代数、统计学、数值计算、多元统计分析等数学基础知识。全书共6章:第1章介绍了大数据与数学、数学与R语言的关系;第2章介绍了微积分的基础知识,包括函数、极限、导数、微分、不定积分与定积分及其应用;第3章介绍了线性代数的基础知识,包括矩阵的运算、行列式、特征分解、奇异值分解;第4章介绍了统计学的基础知识,包括数据分布特征、概率论、随机变量的数字特征、参数估计、假设检验;第5章介绍了数值计算的基础知识,包括插值方法、函数逼近与拟合、非线性方程(组)求根;第6章介绍了常用的多元统计分析方法,包括回归分析、聚类分析、判别分析、主成分分析、因子分析和典型相关分析。本书中的几乎所有实例都结合R语言进行求解分析,所有章后都有课后习题,可以帮助读者巩固所学的内容。

目录

第 1章 绪论 1
1.1 大数据与数学 1
1.1.1 大数据的定义 1
1.1.2 数学在大数据领域的作用 2
1.2 数学与R语言 4
1.2.1 base 5
1.2.2 stats 5
小结 6
课后习题 6
第 2章 微积分基础 8
2.1 函数与极限 8
2.1.1 映射与函数 9
2.1.2 数列与函数的极限 14
2.1.3 极限运算法则与存在法则 17
2.1.4 连续函数的运算与初等函数的连续性 18
2.2 导数与微分 19
2.2.1 导数的概念 19
2.2.2 函数的求导法则 24
2.2.3 微分的概念 26
2.3 微分中值定理与导数的应用 30
2.3.1 微分中值定理 30
2.3.2 函数的单调性与曲线的凹凸性 31
2.3.3 函数的极值与最值 34
2.4 不定积分与定积分 39
2.4.1 不定积分的概念与性质 40
2.4.2 换元积分法与分部积分法 44
2.4.3 定积分的概念与性质 46
2.4.4 定积分的换元法与分部积分法 50
2.4.5 不定积分与定积分的实际应用 51
小结 53
课后习题 54
第3章 线性代数基础 56
3.1 矩阵及其运算 56
3.1.1 矩阵的定义 56
3.1.2 特殊矩阵 57
3.1.3 矩阵的运算 61
3.1.4 矩阵行列式 65
3.1.5 矩阵的逆 78
3.1.6 矩阵的秩 80
3.2 矩阵的特征分解与奇异值分解 84
3.2.1 特征分解 84
3.2.2 奇异值分解 96
小结 100
课后习题 101
第4章 概率论与数理统计基础 103
4.1 数据分布特征的统计描述 103
4.1.1 集中趋势度量 103
4.1.2 离散趋势度量 110
4.1.3 偏度与峰度的度量 115
4.2 随机事件及其概率 117
4.2.1 随机事件的定义 117
4.2.2 随机事件的概率 119
4.3 随机变量与概率分布 122
4.3.1 随机变量的定义 122
4.3.2 随机变量的分布函数 122
4.4 随机变量的数字特征 127
4.4.1 随机变量的数学期望 127
4.4.2 随机变量的方差 130
4.4.3 协方差与相关系数 132
4.4.4 协方差矩阵与相关矩阵 134
4.5 参数估计与假设检验 137
4.5.1 参数估计 137
4.5.2 假设检验 139
小结 142
课后习题 142
第5章 数值计算基础 144
5.1 数值计算的基本概念 144
5.1.1 误差的来源 144
5.1.2 误差分类 146
5.1.3 数值计算的衡量标准 147
5.2 插值法 147
5.2.1 Lagrange插值 147
5.2.2 线性插值 150
5.2.3 样条插值 152
5.3 函数逼近与拟合 153
5.3.1 数据的最小二乘线性拟合 153
5.3.2 函数的最佳平方逼近 155
5.3.3 数据的多变量拟合 158
5.3.4 数据的非线性曲线拟合 160
5.4 非线性方程(组)求根 162
5.4.1 二分法求解非线性方程 163
5.4.2 Newton法求解非线性方程 165
5.4.3 Newton法求解非线性方程组 166
小结 169
课后习题 170
第6章 多元统计分析 172
6.1 回归分析 172
6.1.1 一元线性回归 172
6.1.2 多元线性回归 178
6.1.3 Logistic回归 184
6.2 聚类分析 189
6.2.1 距离和相似系数 189
6.2.2 系统聚类法 193
6.2.3 动态聚类法 198
6.3 判别分析 200
6.3.1 距离判别 200
6.3.2 贝叶斯判别 204
6.3.3 费希尔判别 205
6.4 主成分分析 206
6.4.1 总体主成分 207
6.4.2 样本主成分 209
6.5 因子分析 211
6.5.1 正交因子模型 212
6.5.2 参数估计 214
6.5.3 因子旋转 218
6.5.4 因子得分 220
6.6 典型相关分析 222
6.6.1 总体典型相关 222
6.6.2 样本典型相关 223
6.6.3 典型相关系数的显著性检验 228
小结 229
课后习题 230
附录I t分布表 236
附录II F分布表 238
参考文献 250

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数20余篇,已取得国家发明专利12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

同系列书

  • Python数据分析与应用

    黄红梅 张良均 张凌 施兴 周东平

    本书以任务为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际...

    ¥49.80
  • Python编程基础

    张健 张良均 何燕 张敏 姜鹏辉

    本书采用以任务为导向的编写模式,全面地介绍了Python编程基础及其相关知识的应用,讲解了如何利用Python...

    ¥39.80
  • Hadoop大数据开发基础

    余明辉 张良均 高杨 陈浩 樊哲

    本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、...

    ¥39.80
  • Spark大数据技术与应用

    肖芳 张良均 汪作文 胡大威 樊哲

    本书以任务为导向,较为全面地介绍了Spark大数据技术的相关知识。全书共9章,具体内容包括Spark概述;Sc...

    ¥49.80
  • R语言编程基础

    林智章 张良均 李博文 杨惠 麦国炫

    本书以理论结合示例操作的方式,全面介绍了R语言编程基础及其知识的应用,讲解了利用R语言解决部分实际问题的方法。...

    ¥49.80

相关图书