机器学习(第3版)

一本真正面向应用的机器学习实践指南,清晰脉络+丰富案例+立体资源,打通从理论到应用的完整闭环。
分享 推荐 4 收藏 44 阅读 2.1K
赵卫东 (作者) 978-7-115-68992-4

关于本书的内容有任何问题,请联系 张斌

(1)内容系统精良,难易梯度科学
教材难度适中、逻辑严密,系统覆盖了机器学习的核心理论与主流算法。内容紧跟技术前沿并持续更新,编排上深入浅出,特别适合初学者构建完整的知识体系,实现从入门到精通的平滑过渡。
(2)代码驱动教学,降低学习门槛
注重理论落地,每章核心算法均配备Python案例代码。将抽象的算法原理与具体的编程实践紧密结合,通过“边学边练”的模式,帮助读者直观理解模型机制,有效提升动手能力与代码实现水平。
(3)实战案例丰富,源自企业一线
深度融合产业实践,结合与20多家知名企业的真实合作项目,精心提炼40余个实战案例与300余道原创习题。通过真实业务场景驱动,大幅提升读者解决实际问题的工程实践能力。
(4)配套资源立体,覆盖教学全场景
教学资源包含PPT课件、完整数据集、全部程序源码、习题库及配套微课视频。全方位的资源支持,既满足了教师多样化的备课授课需求,也为学生自主学习与实验实训提供了保障。
(5)名校名师打造,权威规划认证
作者来自复旦大学,具有深厚的学术积淀与行业影响力。教材入选工信部“十四五”规划教材,其学术价值与教学质量获得了高度认可。

特别说明

头歌实践教学平台 https://www.educoder.net/paths/ygpm7bqe

内容摘要

机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书涵盖机器学习的基础知识,主要包括机器学习基础、机器学习基本方法、决策树与集成学习、聚类分析、文本分析、神经网络、贝叶斯网络、支持向量机、分布式机器学习等。此外,本书还介绍机器学习的高级应用领域——推荐系统和强化学习。
本书内容全面、案例丰富,提供Python程序代码和习题,供读者巩固所学知识。另外,本书还为读者提供配套的微课视频及相关资源。
本书适合作为高等学校本科生、研究生的机器学习和数据挖掘等课程的教材,也可作为对机器学习感兴趣的研究人员和工程技术人员的参考资料。

目录

【章名目录】
第1章 机器学习基础
第2章 机器学习基本方法 
第3章 决策树与集成学习 
第4章 聚类分析 
第5章 文本分析 
第6章 神经网络 
第7章 贝叶斯网络 
第8章 支持向量机 
第9章 分布式机器学习 
第10章 推荐系统 
第11章 强化学习 
实验1 二手车价格预测 
实验2 基于强化学习的倒立摆实验 
实验3 超市销售数据分析 

【详细目录】
第1章 机器学习基础 1
1.1 机器学习概述 2
1.1.1 机器学习简史 2
1.1.2 机器学习主要流派 4
1.2 人工智能、机器学习和数据挖掘 5
1.2.1 什么是人工智能 5
1.2.2 什么是数据挖掘 6
1.2.3 机器学习和人工智能、数据挖掘的关系 6
1.3 机器学习的典型应用领域 7
1.4 机器学习算法 12
1.5 机器学习的流程 17
习题 19
第2章 机器学习基本方法 20
2.1 统计分析 21
2.1.1 统计基础 21
2.1.2 常见概率分布 26
2.1.3 参数估计 27
2.1.4 假设检验 29
2.1.5 线性回归 29
2.1.6 逻辑回归 33
2.1.7 判别分析 35
2.1.8 非线性模型 36
2.2 高维数据降维 37
2.2.1 主成分分析 37
2.2.2 奇异值分解 39
2.2.3 线性判别分析 40
2.2.4 局部线性嵌入 43
2.2.5 拉普拉斯特征映射 44
2.3 特征工程 45
2.3.1 特征构造 45
2.3.2 特征选择 46
2.3.3 特征提取 47
2.4 模型训练 47
2.4.1 模型训练常见术语 47
2.4.2 训练数据的收集 48
2.5 可视化分析 49
2.5.1 可视化分析的作用 49
2.5.2 可视化分析的基本流程 49
2.5.3 可视化分析方法 50
2.5.4 可视化分析常用工具 51
2.5.5 常见的可视化图表 52
2.5.6 可视化分析面临的挑战 61
习题 61
第3章 决策树与集成学习 63
3.1 决策树 64
3.1.1 分支处理 65
3.1.2 连续属性离散化 71
3.1.3 过拟合问题 72
3.1.4 分类性能评价 75
3.2 集成学习 79
3.2.1 装袋法 79
3.2.2 自适应提升法 80
3.2.3 GBDT算法 82
3.2.4 XGBoost算法 85
3.2.5 随机森林算法 88
习题 90
第4章 聚类分析 91
4.1 聚类分析概述 92
4.1.1 聚类算法分类 92
4.1.2 良好聚类算法的特征 93
4.2 聚类分析的度量指标 93
4.2.1 外部指标 94
4.2.2 内部指标 94
4.3 基于划分的聚类 96
4.3.1 k均值算法 96
4.3.2 k-medoids算法 101
4.3.3 k-prototypes算法 101
4.4 基于密度的聚类 102
4.4.1 DBSCAN算法 102
4.4.2 OPTICS算法 104
4.5 基于层次的聚类 105
4.5.1 BIRCH算法 105
4.5.2 CURE算法 108
4.6 基于网格的聚类 110
4.7 基于模型的聚类 110
4.7.1 基于概率模型的聚类 110
4.7.2 模糊聚类 116
4.7.3 基于Kohonen神经网络模型的聚类 116
习题 118
第5章 文本分析 119
5.1 文本分析概述 120
5.2 文本特征提取和表示 120
5.2.1 TF-IDF算法 120
5.2.2 信息增益 121
5.2.3 互信息 122
5.2.4 卡方统计量 122
5.2.5 词嵌入 123
5.2.6 语言模型 124
5.2.7 向量空间模型 125
5.3 知识图谱 127
5.3.1 知识图谱相关概念 127
5.3.2 知识图谱的存储 128
5.3.3 知识图谱的挖掘与计算 129
5.3.4 知识图谱的构建过程 130
5.4 词法分析 134
5.4.1 文本分词 134
5.4.2 命名实体识别 136
5.4.3 词义消歧 137
5.5 句法分析 137
5.6 语义分析 139
5.7 文本分析应用 140
5.7.1 文本分类 140
5.7.2 信息抽取 142
5.7.3 问答系统 143
5.7.4 情感分析 144
5.7.5 自动文摘生成 145
习题 146
第6章 神经网络 147
6.1 神经网络概述 148
6.1.1 前馈神经网络 148
6.1.2 反馈神经网络 153
6.1.3 自组织神经网络 155
6.2 神经网络相关概念 156
6.2.1 激活函数 156
6.2.2 损失函数 165
6.2.3 学习率 169
6.2.4 过拟合与正则化 172
6.2.5 数据预处理 174
6.2.6 训练方式 175
6.2.7 神经网络模型训练中的问题 176
6.2.8 网络模型效果评价 180
6.3 神经网络应用 180
习题 182
第7章 贝叶斯网络 183
7.1 贝叶斯定理 184
7.2 朴素贝叶斯分类器 184
7.3 贝叶斯网络推理 187
7.4 贝叶斯网络的应用 193
7.4.1 中文分词 193
7.4.2 机器翻译 193
7.4.3 故障诊断 193
7.4.4 疾病诊断 194
习题 196
第8章 支持向量机 197
8.1 线性可分SVM 198
8.1.1 间隔与超平面 198
8.1.2 支持向量 198
8.1.3 对偶问题求解 200
8.1.4 软间隔 201
8.2 非线性可分SVM 202
8.2.1 非线性可分SVM原理 202
8.2.2 常见核函数 202
8.3 SVM应用 203
习题 206
第9章 分布式机器学习 207
9.1 分布式机器学习基础 208
9.2 分布式机器学习框架 208
9.3 并行决策树算法 213
9.4 并行k均值算法 214
习题 216
第10章 推荐系统 217
10.1 推荐系统概述 218
10.1.1 推荐系统的应用场景 218
10.1.2 相似度计算 219
10.2 推荐系统通用模型 221
10.2.1 推荐系统结构 221
10.2.2 基于人口统计学的推荐 221
10.2.3 基于内容的推荐 221
10.2.4 基于协同过滤的推荐 222
10.2.5 基于图的推荐 225
10.2.6 基于关联规则的推荐 226
10.2.7 基于知识的推荐 232
10.2.8 基于标签的推荐 233
10.3 推荐系统评测 234
10.3.1 评测方法 234
10.3.2 评测指标 235
10.4 推荐系统常见问题 238
10.5 推荐系统实例 241
10.6 深度学习在推荐系统中的应用 249
习题 252
第11章 强化学习 253
11.1 强化学习概述 254
11.2  强化学习基础 254
11.2.1 马尔可夫链 254
11.2.2 强化学习基本概念 255
11.2.3 强化学习的目标函数 257
11.2.4 价值函数 257
11.3 强化学习基本算法 261
11.3.1 蒙特卡洛强化学习算法 261
11.3.2 时序差分算法 262
11.3.3 SARSA算法 262
11.3.4 Q-Learning算法 264
11.4 深度强化学习 269
11.4.1 DQN算法 270
11.4.2 DDQN算法 275
11.4.3 Dueling DQN算法 275
11.4.4 基于策略的强化学习 276
11.4.5 演员-评论家算法 278
11.4.6 A2C算法 284
11.4.7 A3C算法 286
11.4.8 TRPO算法 287
11.4.9 PPO算法 289
习题 293
实验1 二手车价格预测 294
实验2 基于强化学习的倒立摆实验 309
实验3 超市销售数据分析 319

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

赵卫东,复旦大学计算机科学技术学院副教授,主要负责本科生和各类研究生机器学习、深度学习应用等课程的教学。商务智能被评为上海市精品课程(2012年)、获得2013年高等教育上海市教学成果奖二等奖和2022年一等奖,获得2024年第四届上海市教师教学创新大赛一等奖。入选2023-2024年度高校计算机专业优秀教师奖励计划,获得2022年复旦大学教师教学创新大赛一等奖。获得2022年教育部-华为智能基座项目深度学习课程优秀课件,入选2024年教育部-华为‘智能基座’优秀教师奖励计划,2024年CCF教学案例大赛一等奖,第7届CCF开源大赛案例赛道特等奖。深度学习及其应用国家一流课程负责人。主持国家自然科学基金2项、国家重点研发计划子课题、上海市浦江人才以及企业合作课题等40多项。已在Knowledge and Information Systems ,Information Processing & Management等国内外刊物发表论文100多篇。出版著作《智能化的流程管理》以及教材《商务智能(第5版)》《机器学习(第2版)》(十四五工信部规划教材、复旦大学精品教材)《机器学习案例实战(第2版)》《Python机器学习实战案例(第2版)》《数据挖掘实用案例分析(第2版)》《深度学习实战案例》等10多部。获得上海市2015年上海市科技进步二等奖。

推荐用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部