Python商务数据分析(微课版)

本书采用Python 3.11.2,兼容Python 3.X,提供28个微课+3大综合案例+8个实训,手把手教学实现Python商务数据分析
分享 推荐 0 收藏 8 阅读 399
高广尚 (编著) 978-7-115-64624-8

关于本书的内容有任何问题,请联系 人邮-王迎

(1)内容系统:对 Python 的数据分析进行全面介绍,适合初学者从入门到进阶。
(2)结合实例:大量实例加深读者对知识点的理解,提高读者知识运用能力。
(3)案例实战:使读者能够在实践中巩固知识,提升解决实际问题的能力。

内容摘要

本书分为Python基础知识、数据分析基础知识和综合案例三个部分共10章。Python基础知识部分系统讲解Python语法、开发工具、编程方式、函数、模块等基础知识。数据分析基础知识部分重点介绍NumPy、Pandas、Matplotlib和Seaborn中的数据处理与可视化方法。综合案例部分通过案例驱动的方式,指导读者运用所学知识完成数据处理与模型建立。书中每章末均配有习题和实训供读者练习,以巩固所学知识。

本书配有PPT课件、教学大纲、电子教案、课后习题答案、模拟试卷及答案等教学资源,用书老师可在人邮教育社区免费下载使用。

本书内容通俗易懂,案例丰富,注重知识的实际应用。本书适合作为高等院校计算机、统计、数学等专业相关课程的教材,也可供数据分析领域的技术人员、数据科学家和相关研究人员参考。

前言

目录

第一部分 Python基础知识
第1章 初识Python 2
1.1 Python简介 2
1.2 Python开发环境 3
1.3 Python解释器 4
1.3.1 安装Python 4
1.3.2 测试Python是否安装成功 5
1.4 编写Python源代码 5
本章习题 6
实训 7

第2章 Python开发工具 8
2.1 安装VS Code编辑器 8
2.1.1 什么是VS Code 8
2.1.2 下载VS Code 9
2.1.3 安装VS Code 9
2.2 配置VS Code环境 11
2.2.1 安装Python插件 11
2.2.2 配置中文环境 12
2.2.3 利用VS Code开发Python程序 13
2.2.4 使用Jupyter Notebook 16
本章习题 18
实训 19

第3章 Python编程基础 21
3.1 Python基础语法 21
3.1.1 Python标识符 21
3.1.2 Python关键字 22
3.1.3 缩进 22
3.1.4 多行语句 23
3.1.5 Python引号 23
3.1.6 Python注释 23
3.1.7 Python空格和空行 24
3.1.8 Print输出 24
3.2 Python变量与数据类型 24
3.2.1 变量 24
3.2.2 数据类型 25
3.3 Python运算符 28
3.3.1 算术运算符 28
3.3.2 一元运算符 29
3.3.3 关系(比较)运算符 29
3.3.4 赋值运算符 30
3.3.5 逻辑运算符 30
3.3.6 成员运算符 31
3.3.7 身份运算符 31
3.3.8 位运算符 32
3.3.9 运算符优先级 33
3.4 Python数据结构 33
3.4.1 列表 34
3.4.2 元组 38
3.4.3 字典 39
3.4.4 集合 42
3.5 Python选择结构 44
3.5.1 if语句 44
3.5.2 多分支选择结构 45
3.5.3 短路计算和强制类型转换 45
3.5.4 try...except...语句 46
3.6 Python循环结构 47
3.6.1 for循环 47
3.6.2 while循环 48
3.6.3 生成式 49
3.6.4 高阶函数 50
3.6.5 向量化 51
3.6.6 循环控制 51
3.7 Python函数 52
3.7.1 定义函数 52
3.7.2 向函数传递信息 53
3.7.3 形参和实参 53
3.7.4 传递实参 53
3.7.5 返回值 54
3.7.6 递归函数 55
3.7.7 匿名函数 55
3.7.8 闭包函数 56
3.7.9 将函数存储在模块中 56
3.8 Python模块和包 57
3.8.1 导入模块 57
3.8.2 定义模块 58
3.8.3 定义包 59
3.8.4 安装第三方模块 59
本章习题 60
实训 61

第二部分 数据分析基础知识
第4章 NumPy数据分析 63
4.1 NumPy库简介 63
4.2 NumPy库安装与使用 64
4.3 创建数组对象 64
4.4 数组数据类型 65
4.4.1 数据类型 65
4.4.2 创建数组时指定数据类型 66
4.4.3 查询数据类型 66
4.4.4 修改数据类型 67
4.5 多维数组结构 67
4.5.1 数组维度查询 67
4.5.2 数组形状查询 67
4.5.3 数组元素个数及大小 68
4.6 数组索引 68
4.6.1 下标索引 68
4.6.2 切片索引 69
4.6.3 花式索引 70
4.6.4 布尔索引 71
4.7 数组元素值的替换 71
4.7.1 利用索引替换 71
4.7.2 利用条件索引替换 72
4.7.3 利用where()函数替换 72
4.8 数组的广播机制 72
4.8.1 数组的广播原则 73
4.8.2 数组与数字运算 74
4.8.3 数组与数组运算 74
4.9 数组形状的操作 75
4.9.1 数组形状的改变 75
4.9.2 数组的叠加 76
4.9.3 数组的切割 78
4.9.4 矩阵的转置 79
4.10 数组的轴 80
4.10.1 轴的应用 80
4.10.2 三维数组 82
本章习题 82
实训 83

第5章 Pandas数据分析 84
5.1 Pandas简介 84
5.2 Pandas库安装与使用 85
5.3 Pandas数据结构 85
5.3.1 Series 85
5.3.2 DataFrame 88
5.4 Pandas数据分析基础 92
5.4.1 数据读取与保存 92
5.4.2 数据的信息 93
5.4.3 数据选择 95
5.4.4 位置计算 95
5.4.5 统计计算 96
5.5 Pandas常用操作 98
5.5.1 apply()函数 98
5.5.2 applymap()函数 99
5.5.3 排序 99
5.5.4 逻辑运算 100
5.6 Pandas高级操作 104
5.6.1 替换操作 104
5.6.2 映射操作 107
5.6.3 运算工具 107
5.6.4 基于排序实现随机抽样 109
5.6.5 数据库数据读取 110
5.7 Pandas缺失值处理 111
5.7.1 默认的缺失值 111
5.7.2 缺失值的判断 111
5.7.3 缺失值的填充 112
5.7.4 缺失值的删除 113
5.8 Pandas数据分组 114
5.8.1 单类分组 114
5.8.2 多类分组 115
5.8.3 时间分组 116
5.9 Pandas数据合并 117
5.9.1 数据准备 117
5.9.2 concat()函数 118
5.9.3 merge()函数 119
5.9.4 append()函数 119
5.9.5 join()函数 120
5.9.6 combine()函数 120
5.10 Pandas时间序列 121
5.10.1 时间戳 121
5.10.2 时期 122
5.10.3 时间间隔 122
5.10.4 重采样 123
5.10.5 移动、滑动与扩展窗口 124
5.11 Pandas透视表与交叉表 126
5.11.1 透视表 126
5.11.2 交叉表 128
本章习题 129
实训 130

第6章 Matplotlib数据绘图 132
6.1 Matplotlib简介 132
6.1.1 Matplotlib中的对象 133
6.1.2 Matplotlib中图形的构成 133
6.1.3 Matplotlib库安装与使用 134
6.2 matplotlib.pyplot的常用绘图方法 134
6.2.1 绘图方法 134
6.2.2 pyplot.figure() 135
6.2.3 pyplot.subplot() 135
6.2.4 pyplot.subplots() 137
6.2.5 pyplot.subplot2grid() 137
6.3 图形的基本设置 138
6.3.1 常用的颜色、线型和标记 138
6.3.2 中文显示及负数显示 140
6.4 Matplotlib绘图实战 140
6.4.1 折线图 141
6.4.2 散点图 144
6.4.3 柱状图 146
6.4.4 饼图 149
6.4.5 直方图 150
6.4.6 箱线图 152
6.4.7 热力图 154
6.4.8 雷达图 154
本章习题 156
实训 157

第7章 Seaborn数据绘图 158
7.1 Seaborn简介 158
7.2 Seaborn库安装与使用 159
7.3 Seaborn绘图流程 159
7.3.1 导入绘图模块 160
7.3.2 导入数据 160
7.3.3 设置画布大小 160
7.3.4 输出图形 160
7.3.5 保存图形 160
7.4 Seaborn绘图实战 160
7.4.1 数据准备 160
7.4.2 导入相关库 161
7.4.3 直方图 161
7.4.4 散点图 162
7.4.5 热力图 163
7.4.6 回归图 163
7.4.7 小提琴图 164
本章习题 165
实训 166

第三部分 综合案例 167
第8章 咖啡销售情况分析 168
8.1 准备数据 168
8.2 数据清洗 169
8.2.1 缺失值查询 169
8.2.2 重复值处理 170
8.3 数据分析 170
8.3.1 查看数据集维度 170
8.3.2 描述性分析 170
8.3.3 排序分析 171
8.3.4 数据分组 171
8.3.5 数据查询 172
8.3.6 复杂条件查询 173
8.3.7 新增数据列 173
8.4 数据可视化 174
8.4.1 产品类别利润额可视化 174
8.4.2 产品利润额分布区间可视化 174
本章习题 175
实训 175

第9章 员工离职风险预测 177
9.1 Scikit-Learn简介 177
9.2 安装Scikit-Learn库 177
9.3 分类和回归预测步骤 178
9.4 读取数据集 178
9.5 类别特征转换为二进制特征 179
9.6 数据集划分为训练集和测试集 180
9.7 Min-Max归一化预处理 181
9.8 构建和训练逻辑回归模型 182
9.9 预测和评估 182
本章习题 183
实训 183

第10章 航班乘客数预测 185
10.1 PyTorch简介 185
10.2 安装PyTorch库 186
10.3 导入相关库 187
10.4 PyTorch基础知识 187
10.4.1 张量 187
10.4.2 自动微分 189
10.4.3 神经网络 189
10.4.4 数据加载 190
10.4.5 GPU加速 190
10.5 读取数据 191
10.6 数据预处理 191
10.7 定义神经网络模型 192
10.8 定义优化器和损失函数 193
10.9 训练模型 193
10.10 测试模型 194
本章习题 195
实训 196

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

高广尚,博士,现任广西民族大学人工智能学院副教授、硕士生导师。2020年开始担任《系统工程理论与实践》期刊评审专家,同年成为国家自然科学基金项目(地区项目)通讯评审专家。2022年成为教学部硕士学位论文评审专家(管理科学与工程、工商管理专业)。2009年至2022年获评广西桂林理工大学A类屏风学者。 2003年7月毕业于国防科技大学计算机学院,获得计算机应用学士学位。2009年毕业于桂林电子科技大学计算机与控制学院,获得计算机应用硕士学位。2016年毕业于中国科学院大学中国科学院情报中心,获得管理学博士学位。 主要从事智能推荐与预测,大数据管理与技术,用户画像,消费者行为分析研究。在《系统工程理论与实践》、《情报学报》、《系统工程》、《计算机工程与应用》等权威期刊公开发表论文20多篇,其中EI论文4篇,2篇被人大系列丛书选登。主持国家自然科学基金项目等科研项目5项。参与燕京啤酒公司管理模式优化项目。出版学术专著1部,教材2部。独立开发多个信息系统,智能推荐研发中心APP平台(网址: http://8.138.94.129),以及微信小程序(小程序昵称:尚桂科技),这些项目涉及使用了Python,Java,Vue,ExtJS,Mysql,VS CODE等技术。

相关图书

  • 鲲鹏智能计算导论

    华为技术有限公司

    本书以鲲鹏智能计算为主线,共12 章,分别为绪论、计算机与服务器、鲲鹏通用计算平台、鲲鹏openEuler操作...

    ¥49.80
  • Kubernetes集群实战(微课版)

    王雅静 成安霞 申永芳 段莎莉 钟小平

    ...

    ¥79.80
  • 云计算网络技术教程(项目式微课版)

    杨运强 吴进 冯颖 马玥桓 张春校 陈辉

    随着计算机网络技术和云计算技术的快速发展,企业对相关领域人才的要求进一步提高,网络虚拟化技术成为传统网络工程师...

    ¥59.80
  • AIGC基础与应用

    黄源 张莉

    本书深入浅出地讲解AIGC基础知识与实际应用。全书共8章,包括认识AIGC、AIGC的使用方式、AIGC助力高...

    ¥49.80
  • 财务管理实务

    李延喜

    本书根据应用型高等院校人才培养的要求和财务管理工作岗位的任职要求,以财务管理价值观念为基础,围绕筹资、投资、分...

    ¥49.80
人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部