Python数据分析任务驱动教程

分享 推荐 0 收藏 23 阅读 507
王宇翔 杨顺 (主编) 张士兵 王佳丽 (副主编) 黑马程序员 (组编) 978-7-115-66557-7

关于本书的内容有任何问题,请联系 范博涛

1.本书采用任务驱动式写作,更加突出对读者动手能力的培养;
2.本书配套丰富的教学资源,包括教学大纲、教学设计、教学PPT、源代码等,为帮助初学者更好地学习本书内容,作者还提供了在线答疑。
¥59.80 ¥50.83 (8.5 折)
立即购买

内容摘要

本书以Anaconda为主要开发工具,采用任务驱动的编写方式,系统、全面地介绍Python在数据分析中的应用。本书共9个单元,单元1介绍数据分析的基本概念、开发工具的安装方法以及基础操作等;单元2~单元6深入讲解Python提供的可用于数据分析的核心库及其应用,涵盖NumPy和pandas在数据处理方面的应用技巧,以及如何利用Matplotlib、Seaborn和pyecharts进行数据可视化;单元7~单元8则进一步讲解时间序列分析与机器学习的相关知识;单元9围绕前面所学的知识进行实战演练,完整呈现数据从加载、预处理、分析到展现的过程。
本书配套丰富的教学资源,包括教学PPT、教学大纲、教学设计、源代码、课后习题及答案等。为帮助读者更好地学习本书中的内容,编写团队还提供了在线答疑服务。
本书既可作为高等教育本、专科院校计算机相关专业的教材,也可作为Python数据分析爱好者的自学参考书。

目录

单元1 搭建开发环境 1
【任务1-1】 安装Anaconda工具 1
任务描述 1
知识储备 2
1.什么是数据分析 2
2.数据分析的应用领域或行业 3
3.数据分析的基本流程 4
4.为什么选择Python做数据分析 5
5.Anaconda工具简介 6
任务分析 6
任务实现 6
【任务1-2】 使用Anaconda工具
安装库 10
任务描述 10
知识储备 10
1.使用Conda管理环境 10
2.使用Conda管理包或库 11
3.常见的Python数据分析库 13
任务分析 14
任务实现 14
【任务1-3】 使用Jupyter Notebook
编写程序 14
任务描述 14
知识储备 14
1.启动Jupyter Notebook 14
2.Jupyter Notebook界面详解 15
3.Jupyter Notebook的基本使用方法 17
任务分析 19
任务实现 19
【拓展任务】 19
【知识梳理】 19
【课后习题】 19
单元2 科学计算库NumPy 21
【任务2-1】 创建象棋和围棋的棋盘 22
任务描述 22
知识储备 22
1.NumPy数组的相关概念 22
2.NumPy数组的属性 23
3.数组的数据类型 25
4.创建数组 25
任务分析 27
任务实现 27
【任务2-2】 填色小游戏 28
任务描述 28
知识储备 29
1.数组的索引方式 29
2.整数索引和切片 29
3.花式索引 31
4.转换数组的数据类型 31
任务分析 32
任务实现 32
【任务2-3】 评选优秀员工 33
任务描述 33
知识储备 33
布尔索引 33
任务分析 34
任务实现 35
【任务2-4】 计算同比增速 35
任务描述 35
知识储备 36
1.形状相同的数组的算术运算 36
2.形状不同的数组的算术运算 37
3.数组与标量的算术运算 38
4.数组的统计运算 38
任务分析 39
任务实现 40
【任务2-5】 随机漫步 41
任务描述 41
知识储备 41
1.随机数模块 41
2.数组的通用函数 42
3.条件逻辑 44
任务分析 45
任务实现 45
【任务2-6】 转换销售数据 46
任务描述 46
知识储备 46
1.数组的重塑 46
2.数组的转置 47
3.数组的垂直堆叠 47
任务分析 48
任务实现 48
【任务2-7】 分店销售信息汇总 49
任务描述 49
知识储备 49
1.数组的排序 49
2.检索数组元素 50
任务分析 50
任务实现 50
【任务2-8】 兴趣班调查 51
任务描述 51
知识储备 51
1.查找数组的唯一元素 51
2.数组的展开 52
任务分析 52
任务实现 52
【拓展任务】 53
【知识梳理】 53
【课后习题】 54
单元3 数据分析库pandas基础知识 55
【任务3-1】 生成课程目录 55
任务描述 55
知识储备 56
1.Series 56
2.DataFrame 57
任务分析 60
任务实现 60
【任务3-2】 扫雷游戏 61
任务描述 61
知识储备 61
1.索引对象 61
2.通过索引和切片获取数据 62
3.通过loc和iloc属性获取数据 64
任务分析 67
任务实现 67
【任务3-3】 读写会员交易数据 69
任务描述 69
知识储备 69
1.读写文本文件的数据 69
2.预览部分数据 72
3.读写Excel文件的数据 73
4.重置索引 75
5.数据排序 76
任务分析 78
任务实现 79
【任务3-4】 向数据库存储高考本科
批分数线数据 80
任务描述 80
知识储备 80
1.读取网页表格的数据 80
2.读写数据库 81
3.重命名索引 84
任务分析 85
任务实现 85
【任务3-5】 统计产品盈利情况 86
任务描述 86
知识储备 86
1.算术运算 86
2.统计运算 87
3.统计描述 88
任务分析 89
任务实现 89
【任务3-6】 分析汽车销售数据 90
任务描述 90
知识储备 91
1.创建分层索引 91
2.创建有分层索引的对象 92
3.使用分层索引获取数据 94
4.交换索引层级的顺序 95
5.分层索引排序 96
6.获取某层级索引的值 97
任务分析 97
任务实现 97
【拓展任务】 99
【知识梳理】 99
【课后习题】 99
单元4 数据预处理 101
【任务4-1】 清洗二手房数据 102
任务描述 102
知识储备 102
1.缺失值的检测 102
2.缺失值的处理 104
3.重复值的检测 107
4.重复值的处理 108
5.异常值的检测 108
6.异常值的处理 111
7.转换数据类型 112
8.查看摘要信息 114
任务分析 115
任务实现 115
【任务4-2】 合并员工、部门和薪资
数据 120
任务描述 120
知识储备 121
1.堆叠合并 121
2.主键合并 123
3.根据索引合并 126
4.合并重叠数据 129
5.设置索引 130
任务分析 130
任务实现 131
【任务4-3】 重塑学生信息 133
任务描述 133
知识储备 133
重塑分层索引 133
任务分析 136
任务实现 136
【任务4-4】 调整产品订单数据的展示
方式 137
任务描述 137
知识储备 138
轴向旋转 138
任务分析 139
任务实现 139
【任务4-5】 划分用户群体 140
任务描述 140
知识储备 140
1.面元划分 140
2.遍历DataFrame的行 141
任务分析 142
任务实现 142
【任务4-6】 统计电影类型 144
任务描述 144
知识储备 144
哑变量处理 144
任务分析 145
任务实现 145
【拓展任务】 147
【知识梳理】 147
【课后习题】 147
单元5 数据的分组与聚合 149
【任务5-1】 统计咖啡店店铺数量 149
任务描述 149
知识储备 150
1.分组与聚合简介 150
2.通过groupby()实现数据分组 150
3.获取分组的信息 155
4.通过统计计算方法实现数据聚合 156
任务分析 157
任务实现 157
【任务5-2】 分析平台学生学习情况 159
任务描述 159
知识储备 159
通过agg()实现数据聚合 159
任务分析 162
任务实现 162
【任务5-3】 减肥比赛 164
任务描述 164
知识储备 164
数据转换 164
任务分析 166
任务实现 166
【任务5-4】 找出店铺热销商品 168
任务描述 168
知识储备 168
数据应用 168
任务分析 170
任务实现 170
【拓展任务】 171
【知识梳理】 171
【课后习题】 171
单元6 数据可视化 173
【任务6-1】 绘制直播热度指数的
折线图 173
任务描述 173
知识储备 174
1.什么是数据可视化 174
2.常见的图表类型 174
3.创建画布 177
4.添加绘图区域 178
5.绘制折线图 179
6.设置坐标轴的标签 181
7.添加注释文本 182
8.添加图例 183
9.展示图表 185
任务分析 185
任务实现 186
【任务6-2】 绘制旅游景点Top10的
柱形图 187
任务描述 187
知识储备 187
1.绘制柱形图 187
2.添加标题 189
任务分析 190
任务实现 190
【任务6-3】 绘制游客量占比的饼图 193
任务描述 193
知识储备 193
绘制饼图 193
任务分析 194
任务实现 194
【任务6-4】 绘制App价格分布的
直方图 196
任务描述 196
知识储备 196
1.Seaborn的数据集 196
2.使用Seaborn绘制直方图 197
3.获取当前的绘图区域 198
任务分析 199
任务实现 199
【任务6-5】 绘制不同类别App价格
分布的箱形图 200
任务描述 200
知识储备 201
使用Seaborn绘制箱形图 201
任务分析 202
任务实现 202
【任务6-6】 绘制数据分析师职位热门
城市Top10的柱形图 203
任务描述 203
知识储备 204
1.认识pyecharts 204
2.认识ECharts 205
3.pyecharts初体验 206
4.pyecharts的图表类 207
5.pyecharts的配置项 208
6.使用pyecharts渲染图表 209
7.使用pyecharts绘制柱形图 210
任务分析 211
任务实现 211
【任务6-7】 绘制工作年限占比的饼图 213
任务描述 213
知识储备 213
使用pyecharts绘制饼图 213
任务分析 214
任务实现 215
【拓展任务】 217
【知识梳理】 218
【课后习题】 218
单元7 时间序列分析 219
【任务7-1】 创建不同的时间序列 219
任务描述 219
知识储备 220
1.时间序列简介 220
2.创建时间序列 220
3.创建固定频率的时间序列 222
4.时间序列的频率和偏移量 224
任务分析 225
任务实现 226
【任务7-2】 分析网页浏览量的变化率 227
任务描述 227
知识储备 228
1.时间序列的移动 228
2.滑动窗口 229
任务分析 231
任务实现 232
【任务7-3】 分析用户活跃度 234
任务描述 234
知识储备 234
1.重采样 234
2.获取时间序列的子集 236
任务分析 237
任务实现 238
【任务7-4】 了解销售情况 239
任务描述 239
知识储备 239
1.时期的数学运算 239
2.创建带时期索引的时间序列 241
3.时期的频率转换 241
任务分析 242
任务实现 242
【拓展任务】 244
【知识梳理】 245
【课后习题】 245
单元8 机器学习入门 247
【任务8-1】 预测鸢尾花种类 247
任务描述 247
知识储备 247
1.什么是机器学习 247
2.机器学习的基本概念 248
3.机器学习算法的分类 250
4.机器学习解决问题的工作流程 251
5.机器学习库scikit-learn 251
6.KNN算法的基本思想 253
7.使用scikit-learn实现KNN算法 253
任务分析 256
任务实现 257
【任务8-2】 预测签到位置 258
任务描述 258
知识储备 258
1.超参数 258
2.网格搜索与交叉验证 261
3.归一化 263
4.使用scikit-learn实现数据归一化 265
任务分析 267
任务实现 267
【知识梳理】 270
【课后习题】 270
单元9 实战演练:用户行为分析 272

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

王宇翔,副教授,高级“双师型”教师,拥有13年企业实践经验及22年高等职业院校教学经验,上海市高等学校信息技术水平考试命题教师,上海市高等职业院校电子与信息类专业教学指导委员会委员,主持上海市首批职业教育产教融合型专业建设(大数据技术)。

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部