机器学习与Python实践-图书-人邮教育社区

内容摘要

本书是一本机器学习入门的书籍。全书系统地讲解了机器学习的理论以及在实际数据分析中使用机器学习的基本步骤和方法；介绍了进行数据处理和分析时怎样选择合适的模型，以及模型的估计和优化算法等，并通过多个例子展示了机器学习的应用和实践经验。不同于很多讲解机器学习方法的书籍，本书以实践为导向，使用 Python 作为编程语言，强调简单、快速地建立模型，解决实际问题。读者通过对本书内容的学习，可以迅速上手实践机器学习，并利用机器学习解决实际问题。

本书可作为机器学习课程的教材，也适合于有意从事使用机器学习分析财经数据的分析师，以及经管类的本科生和研究生阅读。

前言

随着信息技术的蓬勃发展和大数据时代的来临，学习和掌握分析处理数据的方法日益成为一种迫切的需求，甚至成为一种时尚。业界需要大量数据科学人才进行数据分析，数据科学人才需要能够掌握并灵活运用各个相关领域的方法，包括机器学习、数据挖掘、人工智能、计算机和统计学等。其中，机器学习处在这几个交叉学科中心的位置，深入了解和掌握机器学习方法和应用技巧是进入大数据分析领域的一个很好的切入点。

本书是作者多年教学和科研的结晶，全面介绍了机器学习理论及相关的实践知识，并对机器学习相关知识进行了系统介绍、分类和梳理，从理论、案例分析和动手编程多个角度来帮助读者学习、理解和掌握机器学习的各种理论方法和实践技巧。全书共 12 章，主要内容包括机器学习概述、Python 科学计算简介、无监督学习、线性回归和正则化方法、分类、局部建模、模型选择和模型评估、统计推断基础、贝叶斯方法、树和树的集成、深度学习、强化学习。本书内容丰富，讲解通俗易懂，非常适合本科生、研究生，以及对机器学习感兴趣或者想要使用 Python 语言进行数据分析的广大读者使用。

本书面向应用导向，加入编程元素和模拟仿真练习，读者在学习的过程中可以提高动手编程能力和分析数据能力。同时，本书的每一章均有实际案例数据分析来支持方法的学习，加深对方法的理解和掌握。本书使用 Python 语言作为示例和分析数据的工具，并对很多方法配有相应的 Python 实现程序，包括模拟仿真和真实案例。本书所有的数据集和相关代码可以在相关网页中下载，适合作为配套学习资料和参考资料，辅助加深读者对所学方法的理解。对于机器学习的理论，本书也有全面介绍，并在重要之处均给出相关参考资料，供有能力的读者自行查阅学习。

与同类教材相比，本书加入了新的统计学习、深度学习和深度强化学习等内容，更加侧重程序实现和数据分析应用。本书的许多实际例子涉及与经济金融和投资相关的数据分析，更适合经管类相关专业学生学习数据挖掘和机器学习，特别是面向经济、金融科技和量化投资方向的学生，既可以作为相关专业高年级本科生的教材，也可以作为研究生的教材或参考资料。

机器学习涵盖的内容十分广泛，作者也不可能对每个分支方向都有深入见解，有不少机器学习相关的内容（如概率图模型、关联规则和文本挖掘等）没有放到本书中。此外，书中必定会有很多不足之处，一些错误在所难免。如读者能批评指正则不胜感激，我将虚心接受并加以改进。

黄勉
2020 年 6 月 1 日

详情页

第 1 章机器学习概述 1
1.1 引言 1
1.1.1 问题导向框架 1
1.1.2 数据挖掘和机器学习 3
1.1.3 人工智能和机器学习 3
1.2 机器学习的分类 4
1.2.1 无监督学习、有监督学习和
强化学习 4
1.2.2 深度学习和浅层学习 5
1.2.3 统计学习 6
1.3 机器学习的发展历程及应用 7
本章习题 7
第 2 章 Python 科学计算简介 9
2.1 基础变量类型 9
2.1.1 数字 (Number) 9
2.1.2 字符串 (String) 10
2.1.3 列表 (List) 12
2.1.4 元组 (Tuple) 13
2.1.5 字典 (Dictionary) 14
2.2 控制语句和函数 15
2.2.1 控制语句 15
2.2.2 函数 17
2.3 用于科学计算和数据处理的库 19
2.3.1 NumPy 19
2.3.2 SciPy 23
2.3.3 Pandas 23
2.4 作图和可视化 25
2.4.1 plot() 函数与
saveˉg() 函数 26
2.4.2 标题、图例和坐标 26
2.4.3 散点图与直方图 27
2.4.4 Image Plot 28
2.5 输入和输出 28
2.5.1 标准输入和输出函数 28
2.5.2 第三方库的输入输出函数 29
2.5.3 案例分析：读取并处理
股票行情数据 29
2.6 面向对象编程 30
2.6.1 面向过程编程 31
2.6.2 案例分析：面向对象
编程示例 31
2.7 Python 常用工具库 33
本章习题 34
第 3 章无监督学习 36
3.1 描述性统计 36
3.1.1 描述性统计分析工具 36
3.1.2 案例分析：指数收益率的
描述性统计 39
3.2 核密度估计 40
3.2.1 核密度估计方法 40
3.2.2 核密度估计的目标函数 42
3.3 k 均值算法 42
3.4 主成分分析 44
3.4.1 最大投影方差和
最小重构误差 45
3.4.2 特征分解和奇异值分解 46
3.4.3 案例分析：手写数字 3
特征分析 47
3.4.4 案例分析：利率期限结构 50
3.4.5 案例分析：股票收益率的
协方差矩阵分解 52
3.5 混合模型和隐马尔可夫模型 54
3.5.1 混合模型 54
3.5.2 隐马尔可夫模型 55
本章习题 59
第 4 章线性回归和正则化方法 60
4.1 回归分析流程 60
4.1.1 回归分析流程的主要步骤 61
4.1.2 案例分析：宏观违约率预测 65
4.2 变量选择基础 66
4.2.1 变量选择方法简介 66
4.2.2 案例分析：指数跟踪 68
4.2.3 Forward Stagewise 回归 69
4.3 正则化方法 70
4.3.1 L2 正则 71
4.3.2 L1 正则 72
4.3.3 惩罚函数和稀疏性 78
4.4 回归估计和矩阵分解 80
4.4.1 奇异值分解和线性回归 80
4.4.2 QR 分解和 QR 算法 83
本章习题 85
第 5 章分类 86
5.1 判别分析 86
5.1.1 线性判别分析 87
5.1.2 二次判别分析 89
5.1.3 朴素贝叶斯 89
5.2 逻辑回归 89
5.2.1 模型估计 90
5.2.2 与交叉熵的关系 93
5.2.3 案例分析：股票涨跌预测 94
5.3 支持向量机 96
5.4 分类的评判 99
5.4.1 混淆矩阵和常用度量 99
5.4.2 F1 Score 100
5.4.3 ROC 和 AUC 101
5.4.4 数据不平衡的处理 104
本章习题 105
第 6 章局部建模 106
6.1 样条方法 106
6.1.1 三阶样条 106
6.1.2 自然三阶样条 107
6.2 核技巧 108
6.3 局部回归 111
6.3.1 K 邻近估计 111
6.3.2 局部常数估计 113
6.3.3 局部多项式估计 114
6.3.4 案例分析：期权隐含
分布估计 115
6.3.5 局部似然估计 117
本章习题 118
第 7 章模型选择和模型评估 120
7.1 模型评估 120
7.1.1 泛化误差 120
7.1.2 交叉验证 121
7.1.3 Bootstrap 123
7.2 模型选择 124
7.2.1 AIC 准则 124
7.2.2 BIC 准则 126
7.3 估计的自由度 128
7.4 案例分析：期权隐含
分布估计（续 1） 129
本章习题 131
第 8 章统计推断基础 132
8.1 极大似然估计 132
8.2 置信区间和假设检验 134
8.2.1 置信区间 134
8.2.2 假设检验 134
8.3 Bootstrap 方法 136
8.4 KL 距离和信息论相关概念 139
8.4.1 KL 距离和熵 140
8.4.2 KL 距离和互信息 141
8.5 EM 算法 142
8.5.1 EM 算法与变分推断和
MM 算法 143
8.5.2 高斯混合模型的 EM 算法 143
8.5.3 隐马尔可夫模型的
EM 算法 146
8.5.4 案例分析：收益率序列隐
状态预测 149
本章习题 152
第 9 章贝叶斯方法 153
9.1 贝叶斯定理 153
9.1.1 事件的贝叶斯公式 153
9.1.2 随机变量的贝叶斯公式 154
9.2 贝叶斯视角下的频率方法 155
9.3 抽样方法 157
9.3.1 拒绝抽样法 157
9.3.2 案例分析：期权隐含
分布估计（续 2） 158
9.3.3 Metropolis-Hastings
抽样算法 159
9.3.4 重要性抽样 164
9.3.5 蒙特卡洛标准误 165
9.4 变分推断 166
9.4.1 基于平均场的变分推断 166
9.4.2 变分推断算法示例 167
本章习题 171
第 10 章树和树的集成 173
10.1 回归树和分类树 173
10.1.1 回归树 173
10.1.2 分类树 175
10.2 Bagging 和随机森林 179
10.2.1 Bagging 179
10.2.2 随机森林 180
10.3 提升树 Boosting Trees 182
10.3.1 AdaBoost 182
10.3.2 梯度提升树 GBDT 183
10.3.3 XGBoost 184
10.3.4 案例分析：股票涨跌
预测（续 1） 186
本章习题 188
第 11 章深度学习 189
11.1 前馈神经网络和梯度下降算法 189
11.1.1 神经元 189
11.1.2 前馈神经网络 191
11.1.3 梯度下降算法 191
11.1.4 反向传播算法 192
11.1.5 随机梯度算法的改进 193
11.1.6 激活函数和梯度消失问题 194
11.1.7 案例分析：股票涨跌
预测（续 2） 197
11.2 网络结构 198
11.2.1 卷积神经网络 CNN 198
11.2.2 循环神经网络 RNN 202
11.2.3 Dropout 203
11.2.4 Batch Normalization 203
11.2.5 残差网络 204
11.3 自编码和生成模型 205
11.3.1 自编码 205
11.3.2 案例分析：手写数字 3
特征分析（续） 207
11.3.3 逐层特征学习 208
11.3.4 生成对抗网络 209
11.3.5 变分自编码 210
11.4 揭开深度学习的黑箱 212
本章习题 214
第 12 章强化学习 215
12.1 基于值函数的强化学习 215
12.1.1 强化学习的基础概念 215
12.1.2 值函数和 Bellman 方程 216
12.1.3 策略迭代和值迭代 218
12.1.4 基于值函数的无模型
强化学习 219
12.2 值函数近似和深度 Q 网络 222
12.2.1 值函数的近似 222
12.2.2 深度 Q 网络 DQN 223
12.2.3 案例分析：DQN 智能交易
机器人 225
12.3 策略梯度和 Actor-Critic 方法 226
12.3.1 策略梯度定理 226
12.3.2 强化学习和有监督学习
的对比 228
12.3.3 Actor-Critic 算法 228
12.4 学习、推演和搜索 231
12.4.1 “记忆式”学习 231
12.4.2 推演和搜索 231
12.4.3 蒙特卡洛树搜索 232
12.4.4 不完全信息决策简介 233
本章习题 234
参考文献 235