人工智能与大数据技术精品系列教材

Python数据分析与挖掘实战(第2版)(微课版)

“十四五”职业教育国家规划教材改版
分享 推荐 1 收藏 7 阅读 408
翟世臣 , 张良均 (主编) 张奥多 , 李婷妹 , 余祖伟 (副主编) 978-7-115-69834-6

关于本书的内容有任何问题,请联系 曹严匀

 将理论与实战相结合。本书全面贯彻党的二十大精神,以社会主义核心价值观为引领,加强基础研究、发扬斗争精神。本书以知识点为主线,将Python数据分析与挖掘的常用技术和基于项目的真实案例相结合,介绍使用Python进行数据分析与挖掘的主要方法。
 以应用为导向。本书讲解从知识点到算法,再到具体的案例,让读者明白如何利用所学知识来解决问题。另外,本书通过实训和课后习题帮助读者巩固所学知识,从而使读者能够真正理解并应用所学知识。
 注重启发式教学。本书围绕数据挖掘的流程展开,不堆积知识点,着重于思路启发与解决方案实施。通过对从任务需求到任务实现这一完整工作流程的体验,读者将真正理解并掌握Python数据分析与挖掘技术。
立即购买 申请样书

内容摘要

本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共10章,分为基础篇(第1~5章)和实战篇(第6~10章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理和数据挖掘算法基础等基础知识;实战篇包括5个案例,分别为商超客户价值分析、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预测,以及基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测。本书大部分章包含实训和课后习题,通过练习和操作实践,可帮助读者巩固所学的内容。
本书可作为高校数据科学或人工智能相关专业的教材,也可作为数据挖掘爱好者的自学用书。

目录

基 础 篇
第1章 数据挖掘基础 1
1.1 数据挖掘发展史 2
1.2 数据隐私安全 2
1.2.1 伦理困境与法律法规 3
1.2.2 数据隐私与合规性 4
1.3 数据挖掘的常用方法 4
1.4 数据挖掘的通用流程 5
1.4.1 目标分析 5
1.4.2 数据抽样 5
1.4.3 数据探索 6
1.4.4 数据预处理 6
1.4.5 分析与建模 6
1.4.6 模型评价 7
1.5 常用数据挖掘工具 7
1.6 Python数据挖掘环境配置 8
小结 10
课后习题 10

第2章 Python数据挖掘编程基础 11
2.1 Python使用入门 12
2.1.1 基本命令 12
2.1.2 判断与循环 15
2.1.3 函数 16
2.1.4 库的导入与安装 18
2.2 Python数据挖掘建模的常用库 19
2.2.1 NumPy 20
2.2.2 pandas 20
2.2.3 Matplotlib 21
2.2.4 scikit-learn 21
2.2.5 其他 22
2.3 深度学习框架 23
2.3.1 TensorFlow 23
2.3.2 Keras 23
2.3.3 PyTorch 24
2.3.4 PaddlePaddle 24
2.3.5 Caffe 25
小结 25
实训 判断、函数、类型转换的使用 25
课后习题 26

第3章 数据探索 27
3.1 数据校验 28
3.1.1 一致性校验 28
3.1.2 缺失值校验 31
3.1.3 异常值校验 33
3.1.4 数据漂移校验 36
3.2 数据特征分析 38
3.2.1 描述性统计分析 38
3.2.2 分布分析 43
3.2.3 对比分析 47
3.2.4 周期性分析 49
3.2.5 贡献度分析 50
3.2.6 相关性分析 52
小结 55
实训1 分布分析、描述性统计分析和贡献度分析 55
实训2 对比分析、相关性分析和周期性分析 55
课后习题 56

第4章 数据预处理 58
4.1 数据清洗 59
4.1.1 重复值处理 59
4.1.2 缺失值处理 62
4.1.3 异常值处理 64
4.2 数据变换 64
4.2.1 简单函数变换 65
4.2.2 数据标准化 65
4.2.3 数据离散化 67
4.2.4 独热编码 69
4.3 数据合并 71
4.3.1 多表合并 71
4.3.2 分组聚合 77
4.4 自动化预处理 84
4.4.1 自动化预处理的概念 84
4.4.2 常用的自动化预处理工具 84
4.4.3 自动化预处理流程 85
4.4.4 自动化预处理的优势与注意事项 85
小结 86
实训 86
实训1 数据清洗 86
实训2 数据变换 88
实训3 数据合并 88
课后习题 88

第5章 数据挖掘算法基础 90
5.1 分类与回归 91
5.1.1 常用的分类与回归算法 91
5.1.2 分类与回归模型评价 92
5.1.3 线性模型 95
5.1.4 决策树 99
5.1.5 最近邻分类 103
5.1.6 支持向量机 105
5.1.7 神经网络 108
5.1.8 集成算法 113
5.2 聚类 118
5.2.1 常用的聚类算法 118
5.2.2 聚类模型评价 119
5.2.3 K-Means算法 120
5.2.4 密度聚类 125
5.2.5 层次聚类 127
5.3 关联规则 129
5.3.1 常用关联规则算法 129
5.3.2 Apriori算法 129
5.3.3 FP-Growth算法 133
5.4 时间序列 135
5.4.1 时间序列算法 135
5.4.2 时间序列的预处理 136
5.4.3 平稳序列分析 137
5.4.4 非平稳序列分析 140
5.5 智能推荐 148
5.5.1 常用智能推荐算法 148
5.5.2 智能推荐模型评价 149
5.5.3 协同过滤推荐算法 149
5.5.4 基于流行度的推荐算法 150
5.6 深度学习 151
5.6.1 深度学习的常用算法 151
5.6.2 深度学习与机器学习的区别 152
实训 153
实训1 使用分类算法实现客户流失预测 153
实训2 使用k均值聚类算法实现超市顾客聚类分析 154
实训3 使用Apriori算法挖掘网址间的相关关系 154
实训4 使用ARIMA模型实现温度预测 155
课后习题 155

实 战 篇
第6章 商超客户价值分析 158
6.1 背景与目标 159
6.1.1 背景 159
6.1.2 数据说明 159
6.1.3 目标 160
6.2 数据探索与预处理 161
6.2.1 数据质量评估与预处理 161
6.2.2 可视化分析 163
6.2.3 相关性分析 172
6.3 分析与建模 174
6.3.1 指标选取 174
6.3.2 模型构建 176
6.4 结果分析 179
6.4.1 客户分群 179
6.4.2 客户群体对比分析 180
小结 183
实训 使用K-Means聚类算法实现运营商客户价值分析 183
课后习题 184
操作题 184

第7章 餐饮企业菜品关联分析 185
7.1 背景与目标 186
7.1.1 背景 186
7.1.2 数据说明 186
7.1.3 目标 188
7.2 数据探索 188
7.2.1 分析每日用餐人数和营业额 188
7.2.2 分析菜品热销度 190
7.3 数据预处理 192
7.3.1 数据清洗 192
7.3.2 属性构造 193
7.4 分析与建模 194
7.4.1 构建Apriori模型 194
7.4.2 训练模型 195
7.5 模型评价 196
小结 199
实训 西饼屋订单关联分析 199
课后习题 200
操作题 200

第8章 金融服务机构资金流量预测 201
8.1 背景与目标 202
8.1.1 背景 202
8.1.2 数据说明 203
8.1.3 目标 203
8.2 数据探索与预处理 204
8.2.1 属性构造 204
8.2.2 截取平稳部分数据 206
8.2.3 周期性差分 207
8.2.4 平稳性检验和白噪声检验 208
8.3 分析与建模 209
8.3.1 ARIMA模型的定阶 209
8.3.2 模型检验 210
8.4 模型评价 210
小结 213
实训 构建ARIMA模型预测资金赎回量 213
课后习题 214
操作题 214

第9章 O2O优惠券使用预测 215
9.1 背景与目标 216
9.1.1 背景 216
9.1.2 数据说明 217
9.1.3 目标 217
9.2 数据探索 218
9.2.1 描述性统计分析 218
9.2.2 分析优惠形式信息 219
9.2.3 分析用户消费行为信息 221
9.2.4 分析商户投放优惠券信息 223
9.3 数据预处理 226
9.3.1 数据清洗 226
9.3.2 数据变换 227
9.4 分析与建模 230
9.4.1 决策树分类模型 230
9.4.2 梯度提升分类模型 232
9.4.3 XGBoost分类模型 232
9.5 模型评价 234
小结 237
实训 运营商客户流失预测 238
课后习题 238
操作题 238

第10章 基于TipDM大数据挖掘
建模平台实现金融服务
机构资金流量预测 240
10.1 快速构建金融服务机构资金
流量预测模型 241
10.1.1 数据源配置 242
10.1.2 属性构造 244
10.1.3 数据筛选 247
10.1.4 周期性差分 249
10.1.5 序列检验 250
10.2 分析与建模 252
小结 254
实训 构建ARIMA模型预测航空公司乘客量数据 255
课后习题 255
操作题 255

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

翟世臣,男,专业技术讲师,高级工程师,软件工程硕士,研究方向:数据分析与可视化、知识图谱与智能问答,主要讲授课程: Java EE,Python,MySQL,自然语言处理基础以及人工智能导论等,申请实用新型、发明专利3项,软件著作权5项;曾荣获校级青年教师技能大赛一等奖,指导学生参加计算机设计大赛、蓝桥杯等获奖多项。

推荐用户

同系列书

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部