Python数据分析基础教程(微课版)(第2版)

数据分析基础教程
分享 推荐 0 收藏 20 阅读 1.4K
郑丹青 (编著) 978-7-115-65723-7

关于本书的内容有任何问题,请联系 范博涛

1.以基础入门为主线,满足职业院校学生对数据分析课程的需要;
2.突出动手实践,各个章节设计了实训环节,全书最后设计了综合实训项目——电影数据分析,带领读者全面掌握全书内容。
3.本书配套丰富的教学资源,包括PPT、教学大纲、源代码、数据集、教案、教学视频。

内容摘要

本书详细讲解Python数据分析的相关内容,共10章,第1~9章分别讲解数据分析概述、Python与数据分析、Python基础、NumPy数组与矢量计算、用NumPy进行简单的统计分析、数据可视化工具——Matplotlib、pandas数据分析基础、用pandas进行数据预处理、机器学习库scikit-learn入门;第10章用一个综合案例——电影数据分析项目,带领读者灵活掌握本书所讲内容。
本书可作为高等教育本、专科院校计算机相关专业的教材,也可作为Python数据分析爱好者的自学参考书。

目录

第1章 数据分析概述 1
1.1 数据 1
1.1.1 数据的概念 1
1.1.2 数据的类型 2
1.2 数据分析 2
1.2.1 数据分析的概念 2
1.2.2 数据分析的过程 3
1.2.3 数据分析的作用 5
1.2.4 数据分析的常用工具 6
本章小结 6
思考练习 7
第2章 Python与数据分析 8
2.1 Python简介 8
2.1.1 Python的特点 8
2.1.2 Python解释器 9
2.2 Python与数据分析的关系 9
2.3 Python数据分析常用的库 10
2.4 Python开发环境的搭建 11
2.5 Python集成开发环境的搭建 13
2.5.1 PyCharm的安装与使用 13
2.5.2 Jupyter Notebook的安装与使用 17
项目实践 23
本章小结 24
思考练习 24
第3章 Python基础 25
3.1 Python的基础语法 25
3.1.1 Python的语法规则 25
3.1.2 常量、变量与标准数据类型 29
3.1.3 编写Python程序 30
3.2 Python的数据类型 31
3.2.1 数字 31
3.2.2 字符串 32
3.2.3 Python的数据结构 36
3.2.4 列表 36
3.2.5 元组 41
3.2.6 字典 44
3.2.7 集合 49
3.3 Python的流程控制语句 51
3.3.1 if语句 51
3.3.2 while语句 52
3.3.3 for语句 53
3.3.4 range()函数的作用 54
3.3.5 break、continue、pass语句 55
3.4 Python的函数 56
3.4.1 自定义函数 56
3.4.2 设置函数参数 56
3.4.3 函数返回值 58
3.4.4 调用自定义函数 58
3.4.5 局部变量和全局变量 58
3.4.6 函数嵌套 60
3.4.7 匿名函数 61
项目实践 61
本章小结 63
思考练习 63
第4章 NumPy数组与矢量运算 65
4.1 NumPy概述 65
4.1.1 NumPy简介 65
4.1.2 NumPy的测试与安装 66
4.1.3 SciPy简介及其测试与安装 67
4.1.4 NumPy的简单应用:一维数组
相加 68
4.2 NumPy数组 69
4.2.1 创建数组 69
4.2.2 选取数组元素 70
4.2.3 数组的属性 70
4.2.4 创建数组的其他方法 71
4.2.5 NumPy的数据类型 72
4.3 NumPy数组操作 73
4.3.1 数组的索引和切片 74
4.3.2 修改数组形状 76
4.3.3 数组的展平 77
4.3.4 数组的转置和轴对换 78
4.3.5 数组的连接 79
4.3.6 数组的分割 80
4.3.7 数组转换 81
4.3.8 添加/删除数组元素 81
4.4 NumPy数组的矢量运算 83
4.4.1 数组的运算 83
4.4.2 通用函数 85
4.5 NumPy矩阵的创建、运算及操作 87
4.6 随机数的生成 89
项目实践 91
本章小结 92
思考练习 92
第5章 用NumPy进行简单的统计
分析 94
5.1 文件读写操作 94
5.1.1 使用NumPy读写文本文件 94
5.1.2 使用NumPy读写二进制文件 96
5.1.3 使用NumPy读写多维数据
文件 97
5.2 NumPy常用的统计函数 97
5.3 使用NumPy函数进行统计分析 102
5.3.1 NumPy的排序函数 102
5.3.2 NumPy的去重函数与重复函数 103
5.3.3 NumPy的搜索函数和计数函数 105
5.4 简单的统计分析 106
项目实践 109
本章小结 110
思考练习 110
第6章 数据可视化工具——
Matplotlib 112
6.1 Matplotlib概述 112
6.1.1 Matplotlib简介 112
6.1.2 Matplotlib的测试、安装与
导入 113
6.2 使用pyplot创建图表 114
6.2.1 创建简单的图表 114
6.2.2 创建子图 118
6.3 Matplotlib参数配置 119
6.3.1 matplotlibrc配置文件 119
6.3.2 设置动态rc参数 120
6.4 分析变量间关系 121
6.4.1 绘制散点图 121
6.4.2 绘制折线图 123
6.5 分析变量数据分布和分散状况 125
6.5.1 绘制直方图 125
6.5.2 绘制柱形图 127
6.5.3 绘制饼图 129
6.5.4 绘制箱线图 131
项目实践 132
本章小结 134
思考练习 135
第7章 pandas数据分析基础 136
7.1 pandas概述 136
7.1.1 pandas简介 136
7.1.2 pandas的测试、安装与导入 137
7.2 pandas的数据结构及常用操作 138
7.2.1 Series对象及常用操作 138
7.2.2 DataFrame对象及常用操作 142
7.3 pandas的索引 149
7.3.1 Index对象 149
7.3.2 Index对象的属性和方法 150
7.3.3 重新索引 152
7.3.4 层级索引 153
7.4 pandas数据结构之间的运算 156
7.4.1 算术运算和数据对齐 156
7.4.2 算术运算函数 158
7.4.3 DataFrame与Series对象之间的
运算 158
7.5 pandas的函数应用 159
7.5.1 数据筛选函数 159
7.5.2 apply()函数 160
7.5.3 统计函数 161
7.5.4 DataFrame格式化函数 162
7.5.5 排序和排名 162
7.6 数据的读取与写入 164
7.6.1 读写文本文件 164
7.6.2 读写Excel文件 166
7.6.3 读写数据库文件 168
7.6.4 读写JSON文件 170
7.7 数据分析方法 171
7.7.1 描述性统计分析 172
7.7.2 分组分析 172
7.7.3 分布分析 173
7.7.4 交叉分析 174
7.7.5 结构分析 177
7.7.6 相关分析 178
项目实践 179
本章小结 180
思考练习 180
第8章 用pandas进行数据
预处理 181
8.1 数据清洗 181
8.1.1 重复值的处理 181
8.1.2 缺失值的处理 182
8.1.3 异常值的处理 185
8.2 数据合并 187
8.2.1 按键合并数据 187
8.2.2 沿轴连接数据 189
8.2.3 合并重叠数据 192
8.3 数据抽取 193
8.3.1 字段抽取与拆分 193
8.3.2 记录抽取 195
8.4 重塑层级索引 195
8.5 映射与数据处理 197
8.5.1 用映射替换元素 197
8.5.2 用映射添加元素 198
8.5.3 重命名轴索引 199
8.6 排列与随机抽样 200
8.7 日期转换、日期格式化和日期
抽取 201
8.8 字符串处理 202
8.8.1 内置的字符串处理方法 203
8.8.2 正则表达式 205
8.8.3 矢量化的字符串函数 209
项目实践 211
本章小结 212
思考练习 213
第9章 机器学习库scikit-learn
入门 214
9.1 机器学习概述 214


9.2 scikit-learn概述 216
9.2.1 scikit-learn简介 216
9.2.2 scikit-learn的测试、安装和
导入 217
9.3 第一个机器学习程序 218
9.4 使用scikit-learn进行机器
学习 219
9.4.1 Seaborn绘图 219
9.4.2 准备数据集 224
9.4.3 选择模型 229
9.4.4 调整参数并训练和测试模型 232
项目实践 235
本章小结 237
思考练习 237
第10章 电影数据分析项目 239
10.1 项目描述 239
10.2 准备数据 240
10.3 数据清洗 241
10.4 数据分析与数据可视化 241
本章小结 247
思考练习 247
参考文献 248

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

郑丹青,教授、高级工程师,湖南省计算机应用技术省级专业带头人,具有多年的计算机教学工作经验,有着近20年的企业软件项目开发经验,获得过株洲市科委的奖励。

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部