大数据技术精品系列教材

R语言商务数据分析实战

资深大数据专家张良均领衔畅销书作者团队,全部采用企业真实项目案例,提供源代码等相关学习资源。
分享 推荐 2 收藏 94 阅读 7.3K
韩宝国 , 张良均 (主编) 林柳琳 , 何展鸿 , 施兴 (副主编) 978-7-115-47448-3

关于本书的内容有任何问题,请联系 初美呈

欢迎加入人邮大数据教师服务群:669819871
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,最后落实在任务实现环节。
全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化R语言数据分析。
书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握R语言数据分析相关技能。

内容摘要

本书以任务为导向,较为全面地介绍了商务领域中R语言数据分析的应用。全书共9章,介绍商务领域不同方向项目的数据分析方法,具体内容包括R语言数据分析概述、商品零售购物篮分析、航空公司客户价本书以任务为导向,较为全面地介绍了商务领域中R语言数据分析的应用。全书共9章,介绍商务领域不同方向项目的数据分析方法,具体内容包括R语言数据分析概述、商品零售购物篮分析、航空公司客户价值分析、财政收入预测分析、金融服务机构资金流量预测、P2P信用贷款风险控制、电子商务网站智能推荐服务、电商产品评论数据情感分析、餐饮企业综合分析。除第1章外,本书各章都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。值分析、财政收入预测分析、金融服务机构资金流量预测、P2P信用贷款风险控制、电子商务网站智能推荐服务、电商产品评论数据情感分析、餐饮企业综合分析。本书的每个章节都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。

目录

第 1章 R语言数据分析概述 1
任务1.1 认识数据分析 1
1.1.1 掌握数据分析的概念 1
1.1.2 熟悉数据分析的流程 2
1.1.3 了解数据分析应用场景 4
任务1.2 熟悉R语言数据分析工具 5
1.2.1 了解数据分析常用工具 6
1.2.2 了解R语言数据分析的优势 6
1.2.3 了解R语言数据分析常用的Packages 7
小结 10
课后习题 10
第 2章 商品零售购物篮分析 12
任务2.1 了解购物篮分析 12
2.1.1 分析商品零售企业现状 12
2.1.2 了解某商品零售企业基本数据情况 13
2.1.3 熟悉购物篮分析的步骤与流程 13
任务2.2 分析商品销售状况 14
2.2.1 分析热销商品 14
2.2.2 分析商品结构 15
2.2.3 任务实现 17
任务2.3 使用Apriori关联规则构建购物篮分析模型 18
2.3.1 了解Apriori算法的基本原理与使用方法 18
2.3.2 分析结果 23
2.3.3 任务实现 24
小结 24
实训 使用Apriori算法对西饼屋订单进行关联分析 25
课后习题 25
第3章 航空公司客户价值分析 28
任务3.1 了解航空公司现状与客户价值分析 28
3.1.1 了解航空公司现状 28
3.1.2 了解客户价值分析 30
3.1.3 熟悉航空客户价值分析的步骤与流程 30
任务3.2 预处理航空客户数据 31
3.2.1 处理数据缺失值与异常值 31
3.2.2 构建航空客户价值分析的关键特征 31
3.2.3 标准化LRFMC的5个特征 35
3.2.4 任务实现 36
任务3.3 使用K-Means算法进行客户分群 37
3.3.1 了解K-Means聚类算法 37
3.3.2 分析聚类结果 38
3.3.3 模型应用 41
3.3.4 任务实现 42
小结 43
实训 43
实训1 处理信用卡数据异常值 43
实训2 构造信用卡客户风险评价关键特征 45
实训3 构建K-Means聚类模型 45
课后习题 46
第4章 财政收入预测分析 48
任务4.1 了解财政收入预测的背景与方法 48
4.1.1 分析财政收入预测背景 48
4.1.2 了解财政收入预测的方法 50
4.1.3 熟悉财政收入预测的步骤与流程 51
任务4.2 分析财政收入数据特征的相关性 51
4.2.1 了解相关性分析 51
4.2.2 分析计算结果 52
4.2.3 任务实现 53
任务4.3 使用Lasso回归方法选取财政收入预测的关键特征 53
4.3.1 了解Lasso回归方法 53
4.3.2 分析Lasso回归结果 54
4.3.3 任务实现 54
任务4.4 使用灰色预测和SVR构建财政收入预测模型 55
4.4.1 了解灰色预测算法 55
4.4.2 了解SVR算法 56
4.4.3 分析预测结果 58
4.4.4 任务实现 60
小结 61
实训 61
实训1 求取企业所得税各特征间的相关系数 61
实训2 选取企业所得税预测关键特征 62
实训3 构建企业所得税预测模型 62
课后习题 62
第5章 金融服务机构资金流量预测 64
任务5.1 了解金融服务机构现状与资金流量预测 64
5.1.1 分析金融服务机构现状 64
5.1.2 认识资金流量预测 65
5.1.3 熟悉金融服务机构资金流量预测的步骤与流程 66
任务5.2 检验数据的平稳性 67
5.2.1 检验平稳性 67
5.2.2 处理非平稳序列 69
5.2.3 任务实现 71
任务5.3 检验数据的纯随机性 72
5.3.1 了解纯随机性检验 73
5.3.2 检验纯随机性 73
5.3.3 任务实现 74
任务5.4 建立ARIMA模型 74
5.4.1 了解ARIMA模型 74
5.4.2 识别模型阶数 75
5.4.3 建立ARIMA模型 76
5.4.4 任务实现 81
小结 83
实训 83
实训1 检验资金赎回数据的平稳性与纯随机性 83
实训2 识别资金赎回数据集的阶数 83
实训3 构建ARIMA模型 83
课后习题 84
第6章 P2P信用贷款风险控制 85
任务6.1 认识P2P信贷行业的风险控制 85
6.1.1 分析P2P信贷行业的现状 86
6.1.2 了解某P2P平台数据情况 86
6.1.3 熟悉用户逾期预测的步骤与流程 87
任务6.2 探索P2P信贷用户逾期的相关因素 88
6.2.1 分析用户信息完善程度与逾期率的关系 88
6.2.2 分析用户信息修改情况与逾期率的关系 89
6.2.3 分析用户所在区域经济发展情况与逾期率的关系 90
6.2.4 分析借款月份与逾期率的关系 91
6.2.5 任务实现 92
任务6.3 预处理P2P信贷用户数据 95
6.3.1 使用第三方平台信息构建新特征 95
6.3.2 对登录信息表与更新信息表进行长宽表转换 95
6.3.3 清洗P2P信贷数据 97
6.3.4 任务实现 98
任务6.4 构建用户逾期还款概率预测模型 107
6.4.1 了解GBM算法 107
6.4.2 评价GBM模型 108
6.4.3 分析结果 109
6.4.4 任务实现 109
小结 111
实训 111
实训1 探索某银行贷款数据规律 111
实训2 预处理某银行贷款数据 111
实训3 使用GBM算法构建信贷审批模型 111
课后习题 112
第7章 电子商务网站智能推荐服务 113
任务7.1 了解某网站现状与智能推荐系统 113
7.1.1 分析某网站现状 113
7.1.2 了解智能推荐服务 115
7.1.3 熟悉网站智能推荐的步骤与流程 116
任务7.2 使用R连接数据库并提取数据 117
7.2.1 访问数据库 117
7.2.2 任务实现 118
任务7.3 统计网页整体流量状况 118
7.3.1 分析网页类型 119
7.3.2 分析网页点击次数 122
7.3.3 分析网页排名 123
7.3.4 任务实现 124
任务7.4 预处理网页浏览数据 130
7.4.1 删除不符合规则的网页 130
7.4.2 还原翻页网址 131
7.4.3 划分正确的网页类别 131
7.4.4 选择用户和用户访问网页记录 132
7.4.5 任务实现 133
任务7.5 构建智能推荐模型 136
7.5.1 了解协同过滤算法 136
7.5.2 评价智能推荐模型 139
7.5.3 分析模型结果 142
7.5.4 任务实现 142
小结 144
实训 实现MovieLense电影数据的智能推荐 144
实训1 清洗MovieLense原始数据 144
实训2 构建MovieLense智能推荐模型 144
实训3 评估推荐系统模型 145
课后习题 145
第8章 电商产品评论数据情感分析 147
任务8.1 了解电商企业现状与文本情感分析流程 147
8.1.1 分析电商企业现状 147
8.1.2 了解电商产品评论数据 148
8.1.3 实现电商评论数据情感分析的步骤与流程 149
任务8.2 获取电商产品评论数据 149
8.2.1 了解R语言获取网络数据的方法 149
8.2.2 了解数据获取的方法 151
8.2.3 任务实现 153
任务8.3 对电商产品评论数据进行预处理 156
8.3.1 去除评论数据中的重复数据 156
8.3.2 清洗评论数据 156
8.3.3 对评论数据进行分词 157
8.3.4 去除停用词 158
8.3.5 提取有意义的评论 159
8.3.6 绘制词云查看分词效果 160
8.3.7 任务实现 162
任务8.4 评论数据情感倾向分析 163
8.4.1 匹配情感词 164
8.4.2 修正情感倾向 164
8.4.3 检验情感分析效果 164
8.4.4 任务实现 165
任务8.5 使用LDA模型进行主题分析 169
8.5.1 了解LDA主题模型 169
8.5.2 寻找最 优主题数 171
8.5.3 进行LDA主题分析 171
8.5.4 评价主题分析结果 172
8.5.5 任务实现 173
小结 176
实训 176
实训1 清洗酒店评论原始数据 176
实训2 对酒店评论数据进行预处理 176
实训3 使用LDA模型建模并分析酒店评论 177
课后习题 177
第9章 餐饮企业综合分析 179
任务9.1 了解餐饮企业分析需求 179
9.1.1 分析餐饮企业现状与需求 180
9.1.2 了解餐饮企业数据基本状况 181
9.1.3 熟悉餐饮企业数据分析的步骤与流程 183
任务9.2 统计餐饮菜品数据 184
9.2.1 统计每日用餐人数与销售额 184
9.2.2 统计菜品热销度 190
9.2.3 统计菜品的毛利率 191
9.2.4 任务实现 192
任务9.3 使用ARIMA算法预测销售额 194
9.3.1 检验平稳性和纯随机性 194
9.3.2 构建ARIMA模型 196
9.3.3 任务实现 198
任务9.4 使用协同过滤算法实现菜品的智能推荐 201
9.4.1 选取特征 202
9.4.2 使用基于物品的智能推荐算法进行推荐 202
9.4.3 了解基于用户的智能推荐算法 203
9.4.4 分析协同过滤结果 203
9.4.5 任务实现 204
任务9.5 使用Apriori算法实现菜品的关联分析 207
9.5.1 构建Apriori模型 207
9.5.2 分析关联规则结果 209
9.5.3 任务实现 210
任务9.6 使用K-Means算法进行客户价值分析 214
9.6.1 构建关键特征 214
9.6.2 构建K-Means模型 214
9.6.3 分析K-Means模型结果 215
9.6.4 任务实现 217
任务9.7 用决策树算法实现餐饮客户流失预测 219
9.7.1 了解客户流失 219
9.7.2 了解决策树算法 220
9.7.3 构建客户流失特征 221
9.7.4 分析决策树模型结果 223
9.7.5 任务实现 223
小结 226
实训 226
实训1 使用ARIMA模型预测网站访问量 226
实训2 使用决策树算法实现运营商客户流失预测 227
实训3 使用协同过滤算法实现网站的智能推荐 227
实训4 使用Apriori算法实现网站的关联分析 227
实训5 使用K-Means算法实现运营商客户价值分析 228
课后习题 228

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数20余篇,已取得国家发明专利12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

推荐用户

同系列书

  • Python数据分析与应用

    黄红梅 张良均 张凌 施兴 周东平

    本书以任务为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际...

    ¥49.80
  • Python中文自然语言处理基础与实战

    肖刚 张良均 郑鑫标 罗惠琳 陈晓娜

    本书以Python自然语言处理的常用技术与真实案例相结合的方式,深入浅出地介绍Python自然语言处理的重要内...

    ¥59.80
  • Python网络爬虫技术

    江吉彬 张良均 詹增荣 戴华炜 郭信佑

    本书以任务为导向,较为全面地介绍了不同场景下Python爬取网络数据的方法,包括静态网页、动态网页、登录后才能...

    ¥39.80
  • Python编程基础

    张健 张良均 何燕 张敏 姜鹏辉

    本书采用以任务为导向的编写模式,全面地介绍了Python编程基础及其相关知识的应用,讲解了如何利用Python...

    ¥39.80
  • Spark大数据技术与应用

    肖芳 张良均 汪作文 胡大威 樊哲

    本书以任务为导向,较为全面地介绍了Spark大数据技术的相关知识。全书共9章,具体内容包括Spark概述;Sc...

    ¥49.80

购买本书用户

相关图书

  • PySpark大数据分析与应用

    戴刚 张良均 桂友武 李晓英 李晓丹

    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相...

    ¥69.80
  • Hive大数据存储与处理

    何煌 张良均 孙一铭 胡健 陈翠松

    本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容...

    ¥59.80
  • 商务数据分析与应用(微课版)

    秦军昌

    本书共8个项目,系统介绍商务数据分析的理论知识和实际操作,内容包括商务数据分析概述,商务数据分析的思维、模型和...

    ¥49.80
  • 电商客户关系管理(微课版 第2版)

    苏朝晖

    本书借鉴和吸收了国内外电商客户关系管理领域的研究成果,内容分为四篇,分别为导论、电商客户关系的建立、电商客户关...

    ¥49.80
  • 新媒体概论(第2版 慕课版)

    张晓莲 陈陶 李兰青 宋巍 罗立明 沈静

    本书系统介绍与新媒体相关的理论及实践知识。全书共8章,主要内容包括新媒体概述、新媒体技术、新媒体用户研究、新媒...

    ¥49.80
单击此处加入人邮大数据教师服务群,共同探讨交流。
人邮微信
本地服务
教师服务
教师服务
读者服务
读者服务
返回顶部
返回顶部