Python数据分析与可视化教程(微课版)

Python大数据分析、提供丰富配套资源
分享 推荐 1 收藏 23 阅读 2.1K
夏敏捷 (作者) 978-7-115-62684-4

关于本书的内容有任何问题,请联系 刘博

1.本书通过编写经典、有趣的案例来教授Python数据分析与可视化,并且采用可视化展示效果。通过实例来解释数据分析的原理和方式。
2.列出完整的案例代码,对源代码进行了详细解说。并且每章都有实训内容。
3.每款案例均提供详细的设计思路、关键技术分析以及具体的解决步骤方案,让读者进入Python数据分析的大门,真正了解数据分析设计的秘密同时掌握相应技巧。

内容摘要

本书以Python 3.9为编程环境,从Python编程基础到扩展库,再到数据分析,逐步展开Python数据分析与可视化教学。本书首先简要介绍数据分析与可视化的相关概念,并介绍Python基础知识;然后按照数据分析的主要步骤,重点介绍与数据获取、数据处理、数据分析、数据可视化以及机器学习建模过程相关的扩展库,包括Pandas、Beautiful Soup、NumPy、sklearn、Matplotlib、seaborn、pyecharts等;最后通过股票数据量化分析和销售业客户价值数据分析两个案例实战演示Python和相关扩展库的应用,将Python数据分析与可视化知识和实用案例有机结合。
本书适合作为高等院校本科生的数据分析等课程的教材,也适合作为数据分析初学者的自学用书,还适合从事数据分析相关工作的工程师和爱好者阅读。

诚邀您加入【人邮社大数据教师交流群】

目录

1.1 数据与大数据 1
1.2 数据分析 2
1.3 数据可视化 3
1.3.1 数据可视化的目标 3
1.3.2 数据可视化的作用 4
1.3.3 数据可视化的优势 5
1.4 数据分析流程 5
1.5 Python数据分析与可视化 6
1.5.1 为什么选择Python做数据分析 6
1.5.2 Python数据分析与可视化常用类库 7
1.6 Jupyter Notebook的安装和使用 8
1.6.1 Jupyter Notebook的安装 8
1.6.2 Jupyter Notebook的使用 9
1.7 PyCharm的安装和使用 11
习题 13
实验一 熟悉Python开发环境 13
2.1 Python语言简介 15
2.2 Python语言基本语法 16
2.2.1 Python基础数据类型 16
2.2.2 Python数据结构 17
2.2.3 Python控制语句 26
2.2.4 Python函数与模块 31
2.3 Python面向对象程序设计 36
2.3.1 定义和使用类 36
2.3.2 构造函数 37
2.3.3 析构函数 38
2.3.4 实例属性和类属性 38
2.3.5 私有成员与公有成员 39
2.3.6 方法 40
2.3.7 类的继承 41
2.4 Python图形用户界面设计 43
2.4.1 创建Windows窗口 43
2.4.2 几何布局管理器 44
2.4.3 Tkinter组件 47
2.4.4 Python事件处理 58
2.4.5 图形用户界面设计应用案例 62
2.5 操作常用文件 65
2.5.1 操作CSV文件 65
2.5.2 操作Excel文件 67
2.5.3 操作JSON文件 70
2.6 Python的第三方库 72
习题 73
实验二 基于Tkinter的GUI程序开发 74
3.1 NumPy数组的使用 81
3.1.1 NumPy数组说明 81
3.1.2 NumPy数组中的元素访问 85
3.1.3 NumPy数组的运算 86
3.1.4 NumPy数组的形状操作 89
3.2 NumPy中的矩阵对象 91
3.3 NumPy中的数据统计分析 92
3.3.1 排序 92
3.3.2 数据去重与数据重复 94
习题 96
实验三 NumPy数据分析应用 97


4.1 Pandas 102
4.1.1 Series 102
4.1.2 DataFrame 105
4.2 Pandas统计 112
4.2.1 基本统计 112
4.2.2 分组统计 113
4.3 Pandas排序和排名 114
4.3.1 Series的排序 114
4.3.2 DataFrame的排序 115
4.3.3 Series和DataFrame的排名 116
4.4 Pandas筛选和过滤 118
4.4.1 筛选 118
4.4.2 按筛选条件进行汇总 120
4.4.3 过滤 121
4.5 Pandas数据透视表和交叉表 122
4.5.1 数据透视表 122
4.5.2 交叉表 125
4.6 Pandas数据导入导出 126
4.6.1 导入CSV文件 126
4.6.2 导入其他格式文件 127
4.6.3 导出Excel文件 127
4.6.4 导出CSV文件 128
4.6.5 读取和写入数据库 128
4.7 Pandas日期处理 129
4.8 Pandas数据运算 133
4.8.1 简单算术运算 133
4.8.2 应用函数运算 134
4.9 Pandas数据分析应用案例——学生成绩统计分析 136
习题 140
实验四 Pandas数据分析应用 141

5.1 HTTP与网络爬虫相关知识 145
5.2 urllib库 146
5.2.1 urllib库简介 146
5.2.2 urllib库的基本使用 147
5.3 BeautifulSoup库 155
5.3.1 BeautifulSoup库概述 155
5.3.2 BeautifulSoup库的四大对象 156
5.3.3 BeautifulSoup库解析文档树 158
5.4 requests库 161
5.4.1 requests库的使用 161
5.4.2 requests库的应用案例 165
5.5 动态网页爬虫 168
5.5.1 AJAX动态网页爬取 168
5.5.2 动态网页爬虫——爬取今日头条新闻 171
5.6 Selenium实现AJAX动态加载 172
5.6.1 安装Selenium 172
5.6.2 Selenium详细用法 174
5.6.3 Selenium应用案例 177
5.6.4 Selenium处理滚动条 179
5.6.5 Selenium动态加载——爬取今日头条新闻 180
5.7 爬虫应用案例——Python爬取新浪国内新闻 181
5.8 爬虫应用案例——Python爬取豆瓣电影TOP 250 184
习题 187
实验五 Python爬取网页信息 187
6.1 数据处理 192
6.1.1 数据清理 192
6.1.2 数据集成 195
6.1.3 数据变换与数据离散化 195
6.2 Pandas数据清理 196
6.2.1 处理缺失值 197
6.2.2 处理重复值 201
6.2.3 处理格式错误 202
6.2.4 处理错误数据 202
6.2.5 处理异常值 203
6.3 Pandas数据集成 204
6.3.1 SQL合并/连接 204
6.3.2 字段合并 206
6.3.3 记录合并 206
6.4 Pandas数据变换与数据离散化 211
6.4.1 简单函数变换 211
6.4.2 数据标准化 212
6.4.3 数据离散化 213
6.5 Pandas数据分析 214
6.5.1 描述性分析 214
6.5.2 分布分析 215
6.5.3 相关分析 217
习题 218
实验六 数据处理与数据分析 218
7.1 机器学习基础 225
7.1.1 机器学习概念 225
7.1.2 机器学习分类 225
7.1.3 机器学习流程 226
7.1.4 机器学习库sklearn的安装 227
7.2 机器学习库sklearn的应用 228
7.2.1 sklearn常用数据集 229
7.2.2 聚类 230
7.2.3 分类 232
7.2.4 回归 233
7.2.5 主成分分析 235
7.2.6 鸢尾花相关的分类、预测及降维 236
习题 240
实验七 sklearn机器学习应用 240



8.1 Matplotlib绘图可视化 244
8.1.1 Matplotlib.pyplot模块——快速绘图 244
8.1.2 绘制直方图、条形图、散点图、饼图 250
8.1.3 交互式标注 254
8.2 seaborn绘图可视化 254
8.2.1 seaborn安装和内置数据集 254
8.2.2 seaborn设置背景与边框 255
8.2.3 seaborn绘制散点图 256
8.2.4 seaborn绘制折线图 258
8.2.5 seaborn绘制直方图 260
8.2.6 seaborn绘制条形图 263
8.2.7 seaborn绘制线性回归模型 263
8.2.8 seaborn绘制箱线图 264
8.3 pyecharts绘图可视化 267
8.3.1 安装pyecharts 267
8.3.2 体验图表 268
8.3.3 常用图表 271
8.4 Pandas数据分析应用案例——天气数据分析和展示 277
8.4.1 爬取数据 277
8.4.2 Pandas处理分析数据 279
8.4.3 数据可视化展示 279
8.5 数据可视化应用案例——学生成绩分布条形图展示 281
8.5.1 程序设计的思路 282
8.5.2 程序设计的步骤 282
习题 284
实验八 数据可视化 284
9.1 股票数据量化分析的背景与功能 291
9.2 程序设计的思路 291
9.3 程序设计的步骤 292
10.1 销售业客户价值数据分析的意义 305
10.2 程序设计的思路 305
10.3 程序设计的步骤 306
参考文献 320


读者评论

赶紧抢沙发哦!

我要评论

作者介绍

夏敏捷 中原工学院教师,主要研究项目及领域:计算机、可视化、游戏开发等。 个人荣誉:2019年度被评为校级师德标兵,2020年度被评为校级教学名师。 出版图书: 《Python项目案例开发从入门到实战》清华大学出版社,2019年, 年销量8000册。 《Python程序设计——从基础开发到数据分析(微课版)》清华大学出版社,2020年,年销量8000册。 《Python基础入门-微课视频版》清华大学出版社,2021年,年销量5000。

推荐用户

相关图书

人邮微信
本地服务
教师服务
教师服务
读者服务
读者服务
返回顶部
返回顶部